阿尔法狗又升级了,100比0完胜原版
来源:中国日报 更新时间:
2017-10-20
现在的它叫做Zero
据新华社 10月18日电人工智能“阿尔法围棋”在几次世界瞩目的人机大战后站在了围棋之巅,现在它又以一种新的方式超越了自己:新版本“从零开始”学习围棋,仅用3天就击败其前辈版本,成为新的王者。
英国“深度思维”公司开发出了“阿尔法围棋”,该公司团队在新一期英国《自然》杂志上发表题为《在没有人类知识条件下掌握围棋游戏》的论文,介绍了最新版的“阿尔法围棋-零(Zero)”。
该公司将“阿尔法围棋”的发展分为四个阶段:第一个版本是“阿尔法围棋-樊”,它在2015年战胜欧洲围棋冠军樊麾,标志着人工智能首次战胜人类职业棋手;第二个版本是“阿尔法围棋-李”,它在2016年战胜曾多次夺得世界冠军的韩国棋手李世乭,标志着人工智能战胜人类顶级棋手;第三个版本是“阿尔法围棋-大师”,在今年战胜现在世界排名第一的柯洁,并在与多位有世界冠军头衔的人类棋手“群战”中完胜。
但是,这些版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下法,然后再开始自己学习。
第四个版本,即最新的“阿尔法围棋-零”摆脱了这个限制,研究人员没有给它除棋盘和棋子之外的任何输入,它完全是“从零开始”,自己与自己对弈,通过更为优秀的算法,取得飞速进步。
开始学习围棋3天后,“阿尔法围棋-零”就以100比0的成绩战胜了“阿尔法围棋-李”;40天后,它又战胜了在所有人类高手看来已不可企及的“阿尔法围棋-大师”。
研究人员认为,从需要预先输入人类知识,到能完全依靠自己摸索,“阿尔法围棋”的进步标志着人工智能的巨大突破,因为这意味着人工智能可以更好地进入对它来说本是一片空白的领域。
“深度思维”公司首席执行官哈萨比斯说,他希望人工智能的这种进步能够被用于分析蛋白质结构、设计新材料等领域,为人们的生活带来积极有益的影响。
Zero让人工智能不再是模仿游戏
2014年,由本尼迪克特·康伯巴奇、凯拉·奈特莉主演的英国电影《模仿游戏》获得了第87届奥斯卡金像奖最佳改编剧本奖。电影中,康伯巴奇饰演的“计算机科学之父”艾伦·图灵制造了一部可以破解密码的原始计算机——“图灵机”。这部原始计算机利用高强度的运算能力成功破译了号称“无解”的恩格玛密码。
问题是,图灵机需要人类“输入公式”才能进行密码的破译运算,这也是人类一直认为人工智能无法超越人类的理由。所谓“输入公式”,就是必须要把相关的已知数据输入计算机,计算机才能按照规则进行运算。反之,在无任何已知条件的情况下,让计算机自行寻找规律并加以运算,《模仿游戏》中的图灵机运算不了,大多数的人工智能(Artificial Intelligence,简写:AI)似乎也没有这种能力。这种情况让人类产生了一种自以为是的认知——所谓AI,不过就是模仿游戏。
AlphaGo问世之初,舆论一致认为以围棋的深奥与繁复,围棋程序仅凭“暴力运算”是无法破解的。在人类的认知中,围棋根本不是计算题,而是一道推理题。人类认为,围棋要因地制宜、随机应变,AI无法单凭计算就预料到未来几十甚至上百手后的N种情况。
去年,当第一代阿尔法狗击败李世乭的时候,大家认为这是因为它存储了人类对弈4000年的经验;今年春天,当第二代阿尔法狗——Master“虐哭”柯洁的时候,大家认为这是因为它提高了运算速度;昨天公布的Zero则根本没有存储棋谱,只是凭借和第一代AlphaGo“实战”3天,Zero就在完全学到围棋技艺的同时还完成了超越,以100∶0取胜!
随着Zero的诞生,似乎人工智能已经不再仅仅是模仿游戏了。
从只是了解围棋规则,到3天后完胜阿尔法狗,Zero的学习能力十分恐怖。对人类来说,Zero毫无疑问是个非常好的围棋老师,它有助于启发人类对围棋的理解。尽管Zero只是个围棋程序,并不能代表一切,但至少说明了AI是可以自我完善、自我修复的。美国围棋协会的安迪·奥昆和安德鲁·杰克逊在点评Zero时认为,“之前,人类总是认为与AI对话将非常遥远,甚至像科幻小说,但现在对于围棋选手来说,对话已经发生了,就在这里。”
不管你是否同意,围棋的AI时代真的来了!