这个人工智能软件会研究2D视频游戏的画面,包括图形、物件和玩家移动等诸多方面,理解游戏的玩法,再自己着手克隆完整的游戏引擎。
该团队带着这个AI软件进入《超级马里奥兄弟》(Super Mario Brothers)1级,以两种不同玩家的类型训练它。一种是“探索型”边打边研究的打法,另一种则是以“快跑”风格直奔目标。人工智能观察游戏的各帧画面,预测未来事件,包括玩家要走的路径和对手的反应。观看了2分钟,人工智能就“胸有成竹”地开始建立自己的游戏模型。
“我们的AI在创建预测模型的过程中并没有访问游戏代码,只是看游戏的视频画面,建立其中所有子图形的视觉词典,理解物体位置和移动速度等基本概念。而它对未来事件的预测,则比传统的卷积神经网络准确得多。”项目首席研究员马修·古兹迪阿尔说,“当然,单看一段视频还不能克隆出完美的游戏引擎,如果多用几个视频训练AI,它交出的东西接近完美。”
游戏引擎建立后,团队让另一个AI来通同一关,以测试系统在自建的该级别上的实际游戏能力。研究者报告,克隆的引擎几可乱真,尽管曾经有些小瑕疵,如丢失某些帧、主角暂时消失等。
“这项技术借助相对简单的搜索算法,搜索最能预测帧转换的可能规则集,”项目合作者、佐治亚理工互动计算副教授马克·里德尔说,“就我们所知,能学习游戏引擎、并用游戏画面模拟游戏世界的AI技术,这是第一个。”
试过《超级马里奥兄弟》后,团队开始训练它玩其他2D游戏,比如《洛克人》(Mega Man)和《刺猬索尼克》(Sonic the Hedgehog)。团队说,对那些屏幕外有动作的复杂游戏,如《部落冲突》(clash of clans),该技术可能力不从心。不过它还是能加快某些游戏的开发速度,提供更多试验空间。
古兹迪阿尔说,“如果要将智能代理推进到不同的技术应用,它们必须能预测所在的环境。这个模型现在可用于许多培训或教育任务,我们将不断进步,扩展到多种类型的游戏。”稼正