AlphaGo Zero的启示:企业正在创新游戏中失败?
MNews 主题讯10月27日消息,据金融时报报道,我们很难不对人工智能(AI)产生深刻印象,甚至有点儿警惕。1997年,当IBM超级计算机“深蓝”击败了世界上最伟大的国际象棋选手加里·卡斯帕罗夫 (Garry Kasparov)时,它还是非常昂贵的硬件设备,并需要人类的密切关照和指导。
而对于计算机来说,围棋是比国际象棋更难掌握的游戏。可是,当萨龙网络在2016年低调地出现时,并经过短短几个月的训练后,它轻松地击败了世界上最优秀的围棋选手。上周,AI研究公司DeepMind推出了AlphaGo Zero。它的速度更快,使用更少的硬件,曾以100:0的绝对优势击败其前身AlphaGo。更值得关注的是,它完全是自学成才,而且只经历了72小时的练习就取得了这样的成就。
AlphaGo Zero的研究取得令人震惊的进展,已经引发了人们对机器人导致大规模失业的担忧。然而,这种焦虑与美国、英国令人不安的高就业率和令人失望的生产率息息相关。虽然目前还有大量的工作存在,但显然没有太多创新。对于这一悖论,有多种可能的解释,但最简单的解释就是:AlphaGo Zero是个异常值。与其相关的生产力和技术进步都是毫无意义的,因为AlphaGo Zero背后的研究并不是我们试图创造新想法的典型方式。
卡斯帕罗夫对这个问题的看法让人着迷。他在最近的著作《深度思考》(Deep Thinking)中,引用了已故计算机科学家阿兰·珀利斯(Alan Perlis)的名言,即“优化过程阻碍了进化!”在计算机象棋的例子中,珀利斯的格言可以解释为:研究人员选择实用的捷径方式来获得快速结果,而更深入、更危险的研究却被忽略掉。IBM“深蓝”的重点不是获得知识,而是取得胜利,但胜利的终点在科学上往往意味着进入“死胡同”。
这是一个耻辱。像阿兰·图灵(Alan Turing)和克劳德·香农(Claude Shannon)这样的计算机先驱们认为,国际象棋可能是一个可以在更有意义的领域发展AI的研究课题。这种希望很快被残酷的力量所排挤,这种方法只会教我们很少的知识,但却在国际象棋中表现得很强大。
很容易看出,为什么商业公司对如今由AlphaGo所提炼的早期模式识别技术几乎不感兴趣的原因。卡斯帕罗夫描述了在国际象棋中使用这种模式的方式:机器认为,当它们牺牲了自己的皇后时,很快就赢得了比赛。这台机器由此得出结论,争取每次获胜机会都要牺牲自己的皇后。
然而最终,这些模式识别技术已被证明,远比最好的象棋程序所使用的方法更加强大和普遍适用。问题是,我们是否希望改变自己的世界,或者仅仅是想要赢得一场国际象棋比赛。这不仅仅是一个关于国际象棋的警示故事。在其他方面,企业似乎也正在收敛野心。企业研究实验室曾经资助过许多最重要的基础研究,比如曾在索尼和IBM工作的江崎玲于奈(Jack Kilby)赢得了诺贝尔物理学奖,德州仪器的杰克·基尔比(Jack Kilby)也是如此,通用电气公司的欧文·朗缪尔(Irving Langmuir)赢得诺贝尔化学。贝尔实验室有太多的诺贝尔奖得主,还有香农本人。
这是一个公司敢于投资基础科学的时代。然而,这种情况已经改变了,正如三位经济学家阿希什·阿罗拉(Ashish Arora)、沙隆·莎朗·贝伦佐(Sharon Belenzon)以及安德烈·帕塔科尼(Andrea Patacconi)研究报告所显示的那样:企业仍在大力投资创新,但重点放在实际应用上,而非基础科学上。研究往往外包给更小的机构,而这些机构的知识产权很容易被买卖。
企业研究人员提出更多专利,但在学术期刊上却不那么显眼。正如阿罗拉教授所言,研究和开发已经变得“研究更少、开发更多”。他说,AlphaGo的研究是一个例外。这很重要,因为大多数基础研究最终都被应用在商业上。我们喜欢“金蛋”,但我们可能会饿死“金鹅”。
如果像大学这样的研究机构填补了这个空白,所有这些都不应该是灾难性的。然而,这并不是理所当然的事情。正如经济学家本杰明·琼斯(Benjamin Jones)所记录的那样,新的想法很难找到。其中一个迹象就是研究团队的复杂性,他们的规模更大,充满了越来越专业研究人员,而且成本越来越高。
或许,简单地劝说公司在基础研究上投入更多资金是幼稚的,但总得有人去做。一个有趣的方法是政府为“创新突破”提供奖励。这样的奖项调动了公共资金,制定出公共目标,同时也调动了私营部门的灵活性和多样性。但是这种奖励只在特定的情况下起作用。
举例来说,职业体育已经成为“边际收益”的流行趋势,即快速优化以寻找最微小的优势。事实证明,几十年前,企业研究也出现了同样的转变。边际改善并没有什么错,但决不能允许它们进行更多的投机研究。科学是一种比体育运动更深入、更混乱的实践。我们必须继续把时间、空间和资金投入到更大、更危险的飞跃上。