围棋人“狗”大战 李世石首盘认输

来源: 2016年03月10日

北京时间3月9日12:00,一场举世瞩目的围棋“人机大战”在韩国首尔上演。比赛一方为谷歌公司研制的人工智能程序AlphaGo(音译“阿尔法狗”),另一方则是围棋世界冠军、韩国名将李世石九段。

经过三个半小时的鏖战,李世石九段投子认输,输掉了这五番棋中的第一场。

关于这场世纪大战,有8个问题你需要知道:

1.为什么要研究围棋AI(人工智能)?

有一个游戏始终是人类大脑的专利——古老的围棋。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。

2.研究下棋AI,需要研究人员下棋水平很高吗?

不需要。“阿尔法狗”背后是一群杰出的计算机科学家,确切地说,是机器学习算法领域的专家。科学家利用“神经网络”算法,将棋类专家的比赛记录输入计算机,并让计算机自己与自己进行比赛,在这个过程中不断学习训练。某种程度上讲,“阿尔法狗”的棋艺不是开发者教给它的,而是自学成才。

3.“阿尔法狗”算法里的“神经网络”是个啥?

“阿尔法狗”的核心是两种不同的深度“神经网络”:“值网络”和“策略网络”。“阿尔法狗”利用这两个工具来分析局面,判断每种下子策略的优劣。

4.“阿尔法狗”和深蓝谁更厉害?

深蓝是专门制造出来下国际象棋的。它评估盘面的标准完全依赖于国际象棋本身的规则,除了下象棋它就干不了别的了,连五子棋都不会!但“阿尔法狗”不同,围棋只是它的一个测试平台,它的能力将来会运用到各个领域。

5.“阿尔法狗”可能在哪些方面“进化”?

改进“阿尔法狗”的“神经网络”;额外训练“阿尔法狗”的投骰策略;在比赛中投入更大的运算量。

6.“阿尔法狗”的学习能力有上限吗?

来自南京大学计算机系的两位专家周志华和俞扬都认为,上限是客观存在的。周志华表示,“强化学习”奏效的关键,是两个模型都不错,而且有足够大的“差异”。当模型性能提升以后,其差异会显著下降,到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本(相当于真实李世石水平棋手的棋局)的数量。

俞扬的观点是,上限不仅存在,而且已经和“阿尔法狗”当下的水平极其接近。

7.若在全部5局中,“阿尔法狗”以5:0战胜李世石,对人工智能而言意味着什么?

无论最终的结果如何,都无法阻止更多的人类终于开始用警惕的目光打量AI。

8.最后一个问题:各位人类,你们觉得这五番棋最终结果如何?

■观点对对碰

赛后,中国围棋队领队华学明和时越、芈昱廷两位世界冠军对比赛进行了点评。

华学明:电脑程序赢了是件好事。从大的层面来说,科技的发展本质上都是为人类服务的。我平时不太接触电脑,由于“阿尔法狗”的出现,我现在也开始关注人工智能。我认为世界上有很多人也会因为这件事关心围棋。从小的层面来说,我们以后也可以用计算机作为一个培训工具。

时越:李世石开局有点想去试探电脑,用了一些非常规下法,而电脑应对得也比较正确。后来,有一个局部电脑亏损了很多,那时明显是李世石要赢。但是,之后电脑有一个点入下得很犀利(白102),李世石没有处理好亏了很多,丧失了优势。李世石这盘棋发挥得很差,现在还不能说电脑的水平是顶尖的。

芈昱廷:机器也有犯错的地方,但我觉得它想完全压倒人类只是时间问题。电脑的优点在于没有太大波动和失误,而李世石在后面有的地方下得不知所云。虽然电脑程序首次战胜了顶尖职业棋手,但是这对职业棋界不会有太大冲击。

■比赛规则(部分)

1.采用贴7.5目的中国规则(比赛结束时,后走棋的棋手贴目)。每位棋手各有两个小时布局时间,3次60秒的读秒,每场比赛预计需要4-5个小时。

2.即使出现3比0和3比1已分出胜负,也将下满五盘棋,让“阿尔法狗”有更多学习机会。

3.比赛分先进行,共下五盘,五盘对局取三胜以上为优胜。

4.比赛时,李世石在棋盘上落子,“阿尔法狗”助手将手数输入电脑传送给“阿尔法狗”,“阿尔法狗”输出,再由助手摆到李世石落子的棋盘上。综合新华社等


打开东方今报微信报阅读每天报纸