来自“深度思维”内部的声音
- 发布时间:2016-04-01 02:30:56 来源:科技日报 责任编辑:罗伯特
■今日视点
本报驻英国记者 郑焕斌
谷歌“深度思维”(DeepMind)公司“阿尔法狗”(AlphaGo)团队科学家戴维·席尔瓦近日在伦敦大学学院(UCL)演讲时,对前不久“阿尔法狗”与李世石的“世纪五局”之战逐一点评。他表示,从“阿尔法狗”成就中获得的启示是:直接利用数据进行增强学习的方法或将更有优势;人工智能的最终目的是服务于人类,其前景非常乐观。
低调的“深度思维”公司
“阿尔法狗”团队在韩国的远征吸足了全球媒体的目光,而在伦敦本部的该公司却表现得出奇低调。“世纪五局”刚刚落下帷幕,公司新闻联络官就对科技日报记者表示“近期不会安排采访”。不仅如此,公司还规定需经批准才能在公共场合举办与“阿尔法狗”有关的活动,旅英华人学者原计划举办的一场研讨会也因此被迫取消。
幸好,记者获悉并参加了席尔瓦在UCL的专题演讲。席尔瓦曾担任公司顾问,并于2013年成为其全职一员,是《自然》杂志该研究论文的第一作者。据UCL官网资料显示,席尔瓦目前仍为该校计算机科学系讲师,只不过“现在无限期请假,不在UCL,目前不接收任何新学生”。
率领团队远征韩国之后,重新回到昔日熟悉讲台的席尔瓦,面对挤满整个阶梯大教室的数百名热心听众,比在记者招待会上的表现更加轻松和自信。在题为《阿尔法狗:围棋“大师”背后的神经网络与树搜索算法》的演讲中,席尔瓦对“世纪五局”大战的逐局点评风趣幽默,不时引来听众的阵阵笑声和热烈鼓掌。
“世纪五局”局局精彩
在演讲过程中,当席尔瓦把话题切入“世纪五局”,并在PPT中展示出世界冠军李世石和“阿尔法狗”相关信息的瞬间,现场听众不约而同地发出了会心的笑声。
他介绍说,第一局比赛“阿尔法狗”获胜归因于比赛前半段“毫无人性”的下法,在开局后20分钟内便取得主导优势,这为其打开了局面。事实上,世界冠军李世石在第一次交手后也称,“‘阿尔法狗’前半段的下法,是任何人类围棋手都很难企及的”。
在第二局比赛中“阿尔法狗”更是“赢得毫无疑问”。它的第19步和第37步下法在当时落子后便引起很大争议,这两步看似没有逻辑的落子被许多专业围棋手称为“反常”决策。席尔瓦的解释是,这看似“反常”的两步棋背后,实际上是“阿尔法狗”的强大决策运算系统在对局面进行综合考量后做出的决定,它是“精心设计且极其正确的”,也是决定胜利的关键性两步。
席尔瓦认为第三局是“阿尔法狗”向人类真正展示其强大决策系统之优越性的一局。他评价李世石在这局棋中的整体下法都显得较为保守,这正是因为“阿尔法狗”以其难以预测却步步有力的进攻,使李世石难有回旋余地。
在“阿尔法狗”唯一落败的第四局中,第79至87步的下法导致了其败局。席尔瓦坦言这其中暴露了“树搜索”的典型缺点:在树搜索算法中,系统为了提高其决策准确性往往会“修剪”一些不相关的序列数据。然而对于围棋实战而言,被系统“修剪”的不相关数据有时往往起着决定性的作用。
“阿尔法狗”在第五局获胜也被认为不出所料。席尔瓦介绍,尽管前半局“阿尔法狗”处于劣势,但在第90步中,“阿尔法狗”采取了首局中曾用过的占据角落策略,以此追平了比分,并使得局面逐渐好转,取得了最终胜利。
席尔瓦介绍,在“世纪五局”大战前,团队已对“阿尔法狗”进行了无数次与机器对决实验,在与其他围棋程序的比赛中,胜率可高达99.8%。而在与人类围棋手的对决方面,今年1月28日,“阿尔法狗”便以5∶0击败欧洲围棋冠军樊麾。
增强学习方法或更有优势
席尔瓦毫不掩饰“深度思维”公司对“阿尔法狗”巨大成就的激动,但更看重的是,这一成就是基于直接运用数据的机器学习原理。团队从中获得的启示是:这种学习方法不仅能够利用可获得的人类数据进行学习,甚至更为明显的是直接利用增强价值学习,而且这种直接利用学习经验的学习方式效果或许更好。
展望未来,席尔瓦表示,“阿尔法狗”拥有基于神经网络和树搜索运算的强大数据分析、学习能力,以及作出决策的综合考量系统,这使它具有非常广阔的潜在应用前景。目前“深度思维”团队已开始与英国国家医疗服务体系开展合作。凭借海量数据分析能力,“阿尔法狗”未来在医疗领域将很可能会扮演“医生”的角色,与传统医生相比,它能够利用患者个人病史和具体症状等大量数据,作出更加准确的诊断。此外,在金融、智能机器人、智能手机助手和环境监测等诸多领域,“阿尔法狗”未来都有可能大显身手。
近年来人工智能的迅猛发展,引发了包括著名物理学家史蒂芬·霍金在内的很多人的担忧。对此席尔瓦向科技日报记者表示,人工智能始终以服务于人类为目的,他对人工智能的未来非常乐观。
(科技日报伦敦3月31日电)
- 股票名称 最新价 涨跌幅