我的新闻

分享到:
徐宗本:“人机大战”背后的冷思考
发布者: 徐宗本 | 2016-03-15 | 26299

 

       近日,美国谷歌公司人工智能“阿尔法围棋(AlphaGo)”三连胜世界围棋冠军李世石,“人机大战”引全社会热烈关注,科技又一次展示了爆炸性的发展速度和力量,对此有人惊奇,有人恐慌,更有人忿忿不平。“人机大战”到底说明了什么?带给我们怎样的启示?刚刚在天府脑科学论坛——脑信息科学发展研讨会上做了“基于视觉认知模拟的数据建模”报告的西安交通大学徐宗本院士,3月14日接受《中国科学报》记者采访,为我们“冷静”揭秘“人机大战”的神秘面纱。

AlphaGo的胜出是“大数据”的胜利

“人机对决实际上是一个人与历史的对决,也是一个人与群体的对决,一个生物人与“人与机器混合生物”之间的对决。所以我认为AlphaGo的胜利本质上是当代信息技术综合运用的胜利,是大数据的胜利、也是机器学习的胜利。”徐宗本院士一语道破AlphaGo胜利的“秘诀”。

他从人和机器的下棋原理从策略上进行了分析对比,“人下棋是从当前的局部出发,通过思考此后少数几步的可能性,并凭直觉判断对全局的影响来行棋。”而AlphaGo与人采用了完全不同的两种策略解决问题,他说:“AlphaGo是从整体出发,棋法是整体性的步骤,它追求全局而不是局部优,所以容忍局部走法上的似乎“幼稚”的举棋,因此人机大战的任何一方都有输嬴的可能性。”在他看来,机器的输赢决定于程序设计的缺陷程度以及所使用算法中随机性的作用,人则取决于临场发揮水平及心理因素等。

由此可见,AlphaGo程序设计的精密度和使用算法先进性是其致胜关键。从其工作原理可见“大数据”的关键作用。因为AlphaGo是一个由高级搜索树与深度神经网络相结合的程序。神经网络包含12个处理层,用以描述棋盘及棋法,每一层则包含数百万个人工神经元,各层神经元之间的联结通过训练确定。其中的“决策网络”负责选择走棋策略,“价值网络”部分负责评估态势并预测环境。谷歌方面用收集的人类围棋高手的3000万步围棋走法,并用这些经验数据来训练神经网络。与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局对局,生成新的经验数据以对所训练的神经网络进行强化学习。由于它可以利用Google云平台不停地练习、练习、再练习,每一秒都在进步,永不停歇,由此所生成的训练数据无穷无尽,一个典型呈现“流”特征的大数据。所有算法训练通过Google云平台完成。

因此,AlphaGo的算法与架构的创新并不是最突出的,至于它为什么还会赢?徐宗本从技术上分析到:“AlphaGo的胜利,一靠强大的计算机,尤其云平台与超算的结合支持大数据的学习,二靠有大数据,有收集到的和不间断自对局产生的用于训练机器性能的数据,三靠能够指导机器学懂大数据的机器学习算法。”此外,他认为与人相比,机器的稳定性相对人类的心态来说,具有无可比拟的最大优势。

AlphaGo的“技术胜利”具有可借鉴性

对于大多数人来说“人机大战”更多关注的是输赢,然而在徐宗本院士看来,这只是一个表象。我们应该透过输赢的表象,理性认识AlphaGo的胜利说明了什么和没有说明什么,不必过于兴奋或恐惧。

徐宗本认为,AlphaGo的胜利并不能说明人工智能就比人更聪明,更不说明机器智能已超越或能超越人类,AlphaGo程序并不能直接用于解决其它搜索问题,但有很强的可借鉴性,所以它的胜利并没有说明什么,不必为人机大战兴奋或恐惧。

他说:“人的智能与人工智能是是整体呈现与单项突出的关系。人的智能承载感知、想像、分析、学习、记憶、推理、直觉、幻觉、灵感、顿悟、情感等多种多样的特质,这其中可被模拟的难易程度、广深度都是完全不一样的,人的智能是受意识支配的整体功能相互配合的整体呈现。而机器通常只能模拟人智能的某一、二个方面,只能实现人之智能的一部分。虽然在单项的模拟结果会导致机器某方面能力对人类的超越,如在计算机的记忆、计算能力、机器人对恶劣环境的忍耐能力、计算机对图像的检测与识别能力等方面都远超过人类,但正如曼彻斯特大学计算机科学教授凯文·柯伦所认为的:人类能够辨认并区分现实世界中的事物、明确理解对话内容,但最优秀的人工智能也只能在理想的应用情境中实现以上功能的一部分。”因此人的一些智能难能被模拟,人工智能在可预期的时间内不可能全方位超越人的智能。

他进一步分析认为,AlphaGo既使看成是模拟人的学习、推理能力的一个人工智能产品,它是在“有大数据,有好初值、有导师”的“三有”环境下完成学习任务的。既使AlphaGo的学习能力在特定场景下超过了人,但并不说明它的学习能力超过了人。比如人可通过很少的实例来学习识别,但是机器就不行,而AlphaGo只能在“大数据、有监督”下学习能力超过人,不可能在“小样本、无监督”下学习能力超越人。

说到AlphaGo实际上是一个数学的组合优化问题时,他说:“下围棋任务是可建模、结构化的信息处理问题,这只是一个困难的数学问题,并不是一个严格意义上的人工智能问题。该问题的解能用数学表达式表示,最优解还能用数学的组合优化问题严格刻画。从数学角度和从信息处理的角度看,一个组合优化问题,求解的难度只在于搜索规模的巨大,而搜索规模问题多年来已为计算机计算能力的提升而获得一步步突破,所以AlphaGo的胜利只能说是溶入学习机制解决组合优化问题的成功,而不能成为机器智能就超越人类智能的例证。”

以“人机大战”正确审视人类智慧壁垒

透过硝烟弥漫的“人机大战”,我们更应该看到AlphaGo现实存在的意义和价值,它带给人类未来发展的怎样的深刻启示。

谈到“人机大战”将带给我们怎样的启示,就得从AlphaGo的胜利说明了什么谈起。徐宗本说:“AlphaGo的胜利首先说明人工智能中的机器学习取得了重大进展,展示了机器学习和大数据的价值与力量,再次展示了学习是可模拟的,而且可达到令人难以置信的程度,由此人们可期望一个陪护机器人会在人的培养下,可以变得‘越来越像人样’;其次,说明人工智能技术的核心是算法,更加凸现算法的核心作用和理论的巨大价值,展现了人工智能技术的性态特征;最后由于围棋一直被认为是人工智能领域一个非常具有标志性的大挑战,AlphaGo的胜利点燃和将推动人工智能领域实现人类级别能力任务的希望和进步。”谈到AlphaGo胜利的意义,徐宗本院士如是说。

在他看来,AlphaGo胜利背后的最大价值在于,它激励人们持续不断地探索过去人工智能领域一直看似难以实现的人类智能级别的任务,特别对于像优化布局、合成设计、管理决策等能够被抽象为“围绕一个整体目标,须从当前很多的可能中做出选择来实施决策”这类组合选择问题。其次启示人类探索解决组合选择问题的新方法论,如使得在选择中溶入学习机制并利用已有数据指导选择、利用计算机的分布式并行方式处理、利用大数据思维简化近似算法设计等。再次启发人类更深入地思考人工智能发展的一些关键问题,推动该领域的科学快速发展。

“人机大战”带给我们的启示是人工智能研究只有结合问题才能取得突破。他认为,类脑技术是实现人工智能的重要途径,但应更加强调“脑启发”技术,不应“类”而类,应坚持“应用驱动”导向。人工智能的本质性突破会来自人们对大脑自身和智能本质理解的突破。类脑技术是从这一观点出发的实现人工智能方式的总称。如果接受“人和机器名自有各自特长方面”的话,人工智能的发展就不必拘泥于其技术与真实人类智能对等相同的程度,否则人工智能和人类都不会彼此超越。

其次,徐宗本认为脑科学与认知科学是人工智能发展的源动力,应从战略高度认识,人工智能应朝着“扩充和延伸人的功能来完成人很难完成的任务”之方向发展。人工智能的目标应该是:综合运用最新技术,在某一或更多方面超越人类智能。脑科学研究应关注“机器还没有达到人类水平但应该能够达到甚至超过的认知机理的揭示上”,也应关注人之“弱项致因”的研究上;而人工智能研究,要强化先进技术的综合运用,任何人工智技术的成功一定是当代最新技术综合运用的成功,片面说成是“谁战胜谁”是不公平的,也是无意义的,说人类智慧的最后壁垒被攻破,这都是无稽之谈。

徐宗本认为,“人机大战”后我们更应该清晰地认识到人工智能的发展应是坚持应用驱动的导向,类脑应更加强调“脑启发”技术, 而不应为“类”而“类”,人工智能要立志超越人类,并走为人类服务的发展线路。  

 

来源:《中国科学报》