文/心缘
来源:智东西(ID:zhidxcom)
智东西7月11日报道,自在国际围棋、国际象棋战胜顶尖棋手后,上周DeepMind又在《雷神之锤III竞技场》发威,双人组队击败顶级人类玩家,小组胜率高达到74%。
对于关注人工智能(AI)领域的人而言,DeepMind绝不是个陌生的名字。自2016年AlphaGo首次击败韩国围棋冠军李世石,DeepMind AI展开了在游戏领域对顶尖玩家的长期挑战。
然而,在一次次刷新人类纪录的表面风光之后,DeepMind面临的是亏损严重、人员流失和可能被谷歌抛弃的生存危机。换句话讲,DeepMind每一次刷的存在感,背后都是泪。
又打败人类,对游戏上瘾的AI公司
自2016年AlphaGo以4:1打败韩国围棋冠军李世石以来,DeepMind在游戏领域越战越勇,不断研发出新的AI系统,挑战人类的极限。2016年6月,DeepMind训练的AI系统在雅达利游戏《 Montezuma’s revenge》达到了大师技巧。半年后, 在中国奕城围棋网和野狐围棋网快棋对决数十位中日韩围棋高手、连续60局无一败绩的Master被曝出是DeepMind的作品,这个新AlphaGo系统在2017年以3:0战胜排名世界第一的职业围棋选手柯洁。
▲AlphaGo和李世石对战
如果你在去年12月之前问任何一个专业国际象棋选手,市场上最强大的商用国际象棋软件是什么?你可能听到最多的答案就是Stockfish、Houdini和Komodo,这三个软件可以比任何专业棋手都有更出色的下棋表现。
不过到了12月6日,一切都改变了。在AlphaGo退役5个月后,DeepMind推出AlphaGo系列的新版本——AlphaGo Zero,只用4个小时的训练时间就从零开始学会了国际象棋的规则,并在100场比赛中取得28胜72平的极佳战绩,其突出表现已然超过Stockfish。国际象棋游戏使用Elo进行评级,专业玩家评分在1800到2000之间,大师级别玩家的评分在2500以上,Stockfish的评分在3300左右,而AlphaGo Zero经评估后可能在4000左右。此外,AlphaGo Zero还有训练3天打败旧版AlphaGo、训练40天打败Master、训练2小时打败最强日本将棋程序Elmo的战绩。
▲AlphaGo和Stockfish国际象棋大战复盘除了名满天下的AlphaGo系列,DeepMind训练智能体通过观看Youtube等视频自主学习超级玛丽等游戏。
上周,DeepMind的游戏征途有了新的里程碑——在《雷神之锤III竞技场(Quake III Arena)》夺旗游戏中和人类随机组队打团战,击败了人类玩家。