智东西(公众号:zhidxcom)
编 | 云鹏

智东西12月5日消息,据外媒报道,美国通用人工智能研究组织OpenAI近日推出了ProcGen测试,该测试包括16种游戏,可以帮助研究人员了解AI对游戏的“概括(generalizing)”能力。

用于测试的16种游戏,每一种都可以通过细微调整生成新的版本,测试AI在新环境种的表现。比如大家熟悉的《超级马里奥》,研究人员可以通过改变人物行走的方向生成新的版本,玩过“向左走”版本的AI在“向右走”版本中表现如何,就是研究人员要了解的。

一、AI像人类一样学会“概括”

弄清楚AI擅长什么是了解它们最难的事情之一。为了弄清这件事,OpenAI已经设计了一套游戏,可以帮助研究人员了解他们的机器学习系统是在学习基本技巧,还是已经掌握了操纵系统的方法。

有一点是在AI研究领域一直令人欣喜的:AI不管是通过绕过还是打破规则的方式,都会努力表现出擅长研究人员要求它们做的任何事情。有一种可以检查他们是否真的掌握了此类游戏的方式,就是对规则做一点点调整,看看AI还能不能顺利完成。

研究人员可以将AI置于一个新环境中,一个对AI来说只有部分了解的新环境,然后观察AI是否能将学到的技能应用于这个新的环境中去解决问题,从而了解AI到底学到了什么。

OpenAI扔出16款游戏!测试AI能否举一反三

▲其中三种游戏的不同修改版

比如,假设你想了解一个AI是否学会了玩类似于《马里奥》的游戏,一种通过行走和跨越障碍来完成的游戏。你可以改变行走的方向,你也可以更改障碍的顺序,或者你可以完全改变游戏,让AI在行走过程中必须射击挡在前面的怪物。

如果AI真的掌握了游玩这类游戏的技巧,那么相较于玩一个全新的游戏来说,它应该能够更快速的掌握此类游戏的修改版本。这就是所谓的“总结概括”能力——将现有知识应用于新的情况,这种能力就是人类一直以来所拥有的。

二、16款游戏轮番考验

OpenAI研究人员为了测试具有概括能力的AI的基础水平,设计了一系列的AI游戏。在这些各种各样游戏概念部分重叠的游戏中,AI需要证明自己的能力。

他们设计的16款游戏跟当下热门的小游戏很类似,例如《吃豆人》、《超级马里奥兄弟》、《小行星》等。不同之处在于,游戏环境是从底层上为AI设计的,比如操控方式、游戏奖励以及图形都是简化的。每种游戏都会考验AI的不同能力。

OpenAI扔出16款游戏!测试AI能否举一反三

▲16种不同的测试游戏

三、成为游戏“通才”比较困难

可以想象,一个擅长Heist、Maze、Chaser这类网格游戏的AI,并不会很擅长Jumper、Coinrun、Bossfight这类游戏。因为这涉及到不同的技能,就跟人类是一样的。

不过这些游戏之间也有共通的地方,比如AI都需要理解玩家角色和移动物体之间会产生相互作用,都需要理解游戏的部分区域是无法进入的。这种具备概括能力的(generalize)AI会比普通AI更加快速的掌握所有这些游戏。

这些用于观察、评估AI表现的游戏和方法统称为ProcGen测试,这些游戏都是程序化的,可以在该项目的GitHub页面上阅读有关它们的更多信息,甚至你也可以自己构建AI游戏。

结语:OpenAI新方法助力通用型AI研究

通用型AI是目前AI研究的重要方向,此次OpenAI推出的ProcGen测试,为研究人员了解AI在相似环境中的学习总结能力提供了一种有效途径。

“举一反三”这种能力,对于人类来说很容易,而目前对于AI来说仍然是不断探索的方向,也是通用型AI所需要的重要能力之一。

目前这种测试方式已经在GitHub中开源,相信会有更多研究人员通过游戏开发出更加强大的AI,推动AI在现实世界具体任务中的应用。

文章来源:Techcrunch