索尼 AI 通过 Gran Turismo Sophy 探索“我们能做什么”及其新的“第四技能领域”——策略

在繁忙的阿姆斯特丹剧院内等待,冠军争夺战前的紧张气氛显而易见。但在赛道上的比赛开始之前,考希克·萨布拉曼尼亚 (Kaushik Subramanian) 坐在沙发上讨论一项扩展的研究项目,中间夹杂着激烈的比赛和有争议的结局。

这一点意义重大,因为每当索尼 AI 的高级研究科学家出现时,Gran Turismo 玩家都会密切关注。

Gran Turismo 世界系列赛世界总决赛有每年宣布令人兴奋的新内容和游戏开发的传统。

上周的活动也不例外,一辆现代电动车和一辆自然吸气 V12 单座赛车首次在 Gran Turismo 7 中驾驶。

索尼 AI 代表到场展示了其强大的 Gran Turismo 人工智能代理的重大发展。

近三年前首次公开讨论,目前正在《Gran Turismo 7》中推出(本月早些时候更新了两条兼容赛道),在幕后,索尼 AI 一直致力于将《Gran Turismo Sophy》的功能扩展到短距离比赛之外。

它现在拥有一种新发现的、正在进行中的能力——战略策略。

“正如你可能在最初的 GT Sophy 愿景论文中看到的那样,我们正在尝试探索可以用 AI 代理做什么,而出现的问题之一就是尝试看看我们是否可以采取措施,尝试向它传授赛车策略,”Subramanian 向 Traxion 解释道。

“过去,当你看到我们发表的论文时,很多都是关于汽车控制、赛车技巧,也许还有礼仪。但是,我们并没有真正关注策略。

“所以我们问自己,‘我们可以朝这个方向迈出一步吗?’

“我们与 [Gran Turismo 开发商] Polyphony Digital 密切合作,试图了解如何训练 GT Sophy 使其在该领域具备能力。”

在上述赛段,周末早些时候,有消息称 12 名 Gran Turismo 世界系列赛车手进行了一场测试赛,但他们并未实际驾驶。

它让我想起了一种古老的游戏模式 B-Spec,最后一次出现是在 2013 年的《Gran Turismo 6》中,玩家扮演车队经理或战略家的角色,而不是坐在方向盘后面。

对于许多人来说,B-Spec 的一个根本缺陷是驱动器可能有点……比如说,不稳定。

另一方面,GT Sophy 已被证明擅长人文行为,理论上,这可以转化为更引人入胜的管理式游戏体验。

为了进入荷兰的探索阶段,利用马焦雷湖场地周围的 Red Bull X2019 竞赛,索尼 AI 团队进行了一些重大调整。

“对于这个特殊的展览,我们当然必须做出一些改变,特别是让它能够处理轮胎磨损、燃油消耗以及对战略重要的方面,”索尼 AI 研究科学家帕特里克·麦卡尔平 (Patrick MacAlpine) 向 Traxion 解释道。

“但此外,作为增加参与度并允许测试策略的一种方式,是让人类能够动态地改变轮胎的使用方式。

“例如,玩家能够改变汽车的速度,这主要是控制它使用的轮胎数量。”

在荷兰展览中,玩家可以要求GT Sophy在五个级别的直接速度之一之间切换,再加上一个额外的攻击模式——这可能会影响超车,但也可能导致诸如失去控制或AI冲出赛道等错误。他们还选择了它访问维修站的时间。

屏幕上的签名表情符号显示了客服人员对其请求的操作的感受。

“以前我们专注于赛车控制、体育精神和赛车战术。但这是 GT Sophy 的新的更高水平、第四个通用技能领域,”MacAlpine 继续说道。

“为了让 GT Sophy 做出相应的反应,一项主要更新是对代理的输入功能进行更新。我们必须告诉它还剩下多少燃料以及每个角落的轮胎磨损程度。

“此外,我们还必须更新一些奖励函数,使其足够敏感,能够了解消耗和磨损情况,从而可能因使用过多其中之一而受到惩罚。”

“我们希望确保代理能够体验我们在比赛中可能看到的轮胎磨损分布情况。例如,您可能会看到汽车一侧的轮胎磨损比另一侧更多。”

那么,《Gran Turismo 7》什么时候可供在家测试呢?很快就会有一种使用 GT Sophy 的额外管理风格模式吗?

好问题。索尼人工智能尚未承诺会发生这种情况。目前,这是其不断扩大的探索性研究的另一条线——目前包括创建第二种可以“看见”的智能体。

“我们没有任何此类支持或发布的时间表,”Subramanian 回应道。

“我们绝对想象你可以拥有一个具有这些能力的代理。这将使玩家更容易尝试一些不同的策略,看看比赛在 10 或 15 圈内会如何进行,然后迭代这个过程。

“但是关于玩家是否能够获得访问权限,同样没有固定的时间表。

阅读更多:Gran Turismo 7 的三月更新增加了三辆新车和 Sophy 2.1

“从网上的反馈来看,我们可以看到玩家希望在游戏的不同部分使用更多技术,我们将与 Polyphony Digital 合作,看看我们可以为此做些什么。”

这就引出了一个问题,下一步是什么?萨勃拉曼尼亚声称,在策略要素进一步发展之前,从世界大赛车手反馈中学习是首要任务。

“这完全是索尼人工智能方面的一次探索,”他说。

“我们有一个研究问题想要回答,关于 GT Sophy 学习策略方面的知识,当然,Polyphony Digital 在赛车策略方面拥有丰富的经验,因此他们在这个过程中为我们提供了指导。

“值得注意的一点是,我们希望人工智能的反应符合玩家的直觉和期望。这些玩家经常参加比赛,他们非常非常了解这项技术。对于其中一个按钮,这是一种激进的超车模式,我们认为它直观上是有意义的。但问题是,它是否符合每个玩家的期望?

“对于某些人来说是的,对于另一些人来说,也许不那么如此,所以我们接下来希望弥合这一差距,确保当玩家选择该选项时,他们知道会发生什么。”

“对我来说,看到展览上发生的事情,看到我们可以通过其他方式让 GT Sophy 与玩家互动和参与,真的很令人兴奋,”MacAlpine 总结道。

“这是我们正在通过这项工作探索的一个新的、令人兴奋的研究领域和前沿。”