ChatGPT 的基础技术不仅仅只是说说而已。 芯片制造商 Nvidia 的 AI 研究员 Linxi “Jim” Fan 与一些同事合作,设计了一种方法来设置强大的语言模型 GPT-4(ChatGPT 和越来越多的其他应用程序和服务背后的“大脑”)。 块状视频游戏《我的世界》。
Nvidia 团队(包括该公司机器学习总监、加州理工学院教授 Anima Anandkumar)创建了一个名为 Voyager 的 Minecraft 机器人,它使用 GPT-4 来解决游戏内的问题。 语言模型生成帮助代理探索游戏的目标,以及随着时间的推移提高机器人游戏技能的代码。
Voyager 不像人一样玩游戏,但它可以通过 API 直接读取游戏的状态。 例如,它可能会在其库存中看到一根钓鱼竿和附近的一条河流,并使用 GPT-4 来建议钓鱼以获得经验的目标。 然后,它将使用这个目标让 GPT-4 生成角色实现该目标所需的代码。
该项目最新颖的部分是 GPT-4 生成的用于向 Voyager 添加行为的代码。 如果最初建议的代码不能完美运行,Voyager 将尝试使用错误消息、游戏反馈以及 GPT-4 生成的代码描述来完善它。
随着时间的推移,Voyager 构建了一个代码库,以便学习制作日益复杂的事物并探索更多游戏内容。 研究人员创建的图表显示了它与其他《我的世界》代理相比的能力。 Voyager 获得的物品数量是原来的三倍以上; 探索的距离是两倍多; 构建工具的速度比其他 AI 代理快 15 倍。 范表示,未来可能会改进该方法,为系统添加一种整合游戏视觉信息的方法。
尽管像 ChatGPT 这样的聊天机器人以其口才和明显的知识让世界惊叹不已(即使它们经常编造故事),但 Voyager 展示了语言模型在计算机上执行有用操作的巨大潜力。 以这种方式使用语言模型也许可以自动化许多日常办公任务,这可能是该技术最大的经济影响之一。
Voyager 与 GPT-4 结合使用来弄清楚如何在 Minecraft 中执行操作的过程可能适用于软件助手,该软件助手可以了解如何通过 PC 或手机上的操作系统自动执行任务。 创建 ChatGPT 的初创公司 OpenAI 已向机器人添加了“插件”,使其能够与杂货配送应用 Instacart 等在线服务进行交互。 拥有 Minecraft 的微软也在训练人工智能程序来玩它,该公司最近发布了 Windows 11 Copilot,这是一种操作系统功能,将使用机器学习和 API 来自动执行某些任务。 在《我的世界》这样的游戏中尝试这种技术可能是个好主意,因为有缺陷的代码造成的危害相对较小。
当然,视频游戏长期以来一直是人工智能算法的测试平台。 AlphaGo 是一个机器学习程序,它在 2016 年就掌握了极其微妙的棋盘游戏围棋,通过玩简单的 Atari 视频游戏而崭露头角。 AlphaGo 使用了一种称为强化学习的技术,该技术通过给予正反馈和负反馈(例如游戏内的得分)来训练算法来玩游戏。
这种方法在《我的世界》等开放式游戏中指导智能体更加困难,因为在这种游戏中没有分数或目标集,玩家的行为可能要到很晚之后才会得到回报。 无论你是否认为我们现在应该准备好遏制人工智能带来的生存威胁,《我的世界》似乎是该技术的一个绝佳游乐场。