人工智能目前是一个流行词,比如谷歌的 Gemini 在互联网上寻找答案,或者模仿摩根·弗里曼的语音发生器。如果你想要一张 2056 年骑独轮车的小丑的看起来有点奇怪的图像,可能有一个人工智能工具可以帮助你完成这项任务。
但这一切似乎都相当还原,就像把古罗马专家玛丽·比尔德教授放在《推销日落》的一集中一样。
人工智能的用途不仅仅是制定平庸的婚礼致辞——我们可能还没有看到它最好的一面。
在我们的赛车电子游戏和赛车运动泡沫中,玩家早已熟悉“人工智能”——对我们来说,基本概念并不新鲜。几十年来,我们一直在“与计算机对抗”,因为游戏和运行它的硬件使竞争对手与你在同一条赛道上行驶。
毫无疑问,有些人比其他人做得更好。对游戏或模拟的一个相对直接的批评是“AI 很糟糕”,缺乏意识,在第一圈就挤在一起,或者在同一点反复崩溃。
这是因为,从根本上来说,他们从来没有真正学习过。他们无法理解自己何时犯了错误,并且根据周围发生的事情努力改变自己的行为。
当 Gran Turismo Sophy 于 2023 年底在 Gran Turismo 7 中向公众推出时,人工智能驱动的代理是一个启示。你的对手可以以更自然的方式攻击、防御和避免可能发生的事件。
许多人习惯使用的预编程“人工智能”与 GT Sophy 等代理之间的一个关键区别在于其适应环境的能力。
到目前为止,这是近五年工作的顶峰,2024 年 7 月的《Gran Turismo 7》更新扩大了它可以比赛的赛道名单。

索尼新的人工智能赛车代理,有眼睛
但是,对于索尼人工智能的全球团队来说,这还不够。它一直在努力开发探索性人工智能代理,与 GT Sophy 并行。
另请阅读:Gran Turismo 开发商将为索尼和本田的量产 Afeela 1 赛车创作声音
再次使用 Gran Turismo 作为测试平台,而且仍然处于原型阶段,它接收和解释信息的方式是不同的 - 它可以“看到”。
“当你或我玩游戏时,我们当然会查看用户界面,并以我们认为合理的方式解析该信息,并使用该输入来驱动,”索尼 AI 高级研究科学家 Kaushik Subramanian 解释道。
他与 Takuma Seno 一起工作,Takuma Seno 是一名研究科学家,也是最近出版的一篇论文的主要作者之一研究论文涵盖最新进展。

“然而,当我们训练 GT Sophy 时,我们会为其提供非常精确的信息,包括它在赛道上的位置、赛道形状、准确的速度、加速度以及其他车辆的位置。
“所以苏菲所接受的内容和人类玩家所接受的内容是有区别的。
“我们想要探索的是,我们是否可以训练一个处理图像输入的代理。”
“如果我拍摄游戏的图像——一辆汽车在有轨道线、障碍物、树木和云的赛道上行驶——并尝试用它作为输入来训练赛车代理,这可能吗?”
这正是探索代理所使用的。想象一下汽车内的相机或一双眼睛(用索尼人工智能的说法,以自我为中心的相机视图)。新的人工智能从车辆“观察”并解释它所“看到”的东西,结合精确速度形式的数据来体验速度。
因此,我们的目标是匹配人类在玩游戏时可以访问的内容,并通过图像帮助解释赛道的形状。与 GT Sophy 不同的是,它不会获得精确的赛道形状、轮胎滑移角(和滑移率)或车轮负载等信息。

“我们的内部动机之一是尝试看看我们可以在多大程度上放松对代理的一些数据输入,”这位佐治亚理工学院的博士毕业生继续说道,他自 2019 年以来一直在索尼 AI 工作,并从一开始就从事与 Gran Turismo 相关的项目。
“这一点的有趣之处在于,我们不必控制它关注的内容。我们提供图像,人工智能方法会学习关注什么,以获得我们感兴趣的结果。
“我们告诉人工智能,它的目标是尽可能快地行驶、保持在正轨上并避免与障碍物相撞。
“经过一段时间的训练,算法会学会专注于图像的相关部分来满足这一目标。在直线路段上,人工智能会专注于远处出现的东西。
“而如果它看着一个角落,粉红色标记点(用于确定其焦点)可能会排列在赛道边缘,以帮助它保持在路线限制内。”
世界上第一个模拟赛车学习代理
目前,新模型仅适用于计时赛情况,尽管“现在采取这项工作并改进其他情况(包括与对手赛车的比赛)似乎是合理的下一步,”萨勃拉曼尼安理论道。
人工智能快速跑完赛道是一项壮举,帮助它理解赛车礼仪则是另一项壮举。
就目前而言,这是一辆车,一条赛道,在这种情况下,它已经学会了比大多数人类玩家快得多。它每次都能取得毫米级完美的最佳线条。

这是在可访问 Gran Turismo 7 的 PlayStation 集群上进行的持续 10-14 天的测试之后的结果 - 这款新模型绝不能保证会成为零售版本,并且仍处于探索阶段。
在此期间,人工智能使用强化学习来加快速度。这本质上是一种尝试和错误的形式,开始时很随意,但最终成为大师。
“最后,结果就是我们所说的政策,一个充当控制器的政策,”萨勃拉曼尼亚解释道。他居住在德国,与人合着了两篇关于赛车的研究论文和一篇关于自动驾驶的研究论文。
“经过两周的训练,控制器已经准备就绪,并学会了如何驾驶最佳单圈。我按下开始按钮。它只是在第一次尝试时给了我那圈时间。”
到目前为止,最终结果是代理可以提供与现有 GT Sophy 大致相似的时间,但不需要外部仪器。这是第一个具有本地传感器输入的超人类模拟赛车代理的创建。
然而,你会情不自禁地感觉到索尼人工智能团队希望进一步突破界限。

“就我们而言,有几个目标,包括几个内部研究问题,我们正在努力突破极限,”这位经验丰富的强化学习专家解释道。
“将视野扩展到其他情况肯定是我们感兴趣的。我们将尽力在该领域尽我们所能。
“当然,游戏中也部署了 GT Sophy,这是我们心中一个令人兴奋的想法,以确保玩家对游戏中的版本感到满意。
“当我们开始这个项目时,我们不太确定它是否真的可以学习,因为我们知道人类可以做到这一点,但问题是,人工智能也能做到吗?我们花了一段时间、几年的时间才达到现在的水平,到目前为止的结果非常有希望。”
- 索尼 AI 团队使用 PlayStation 和 Gran Turismo 7 来评估探索性代理,但尚未确认是否公开发布
- 与 Gran Turismo Sophy 不同的 AI 代理,目前正处于研究阶段
- 首款基于视觉的超人模拟赛车智能体
- 它可以在单圈内超越世界上最好的 Gran Turismo 车手
- 与 GT Sophy 不同的是,GT Sophy 依赖于外部仪器,例如精确的赛道形状信息、滑移角、滑移率和车轮负载(等等),新代理可以通过“以自我为中心的摄像机视图”“看到”像素(“图像”),同时接收速度和加速度信息。
