不久之后重新推出,包含超过 55,000 个屏幕截图和一系列新功能,游戏 UI 数据库遇到了重大障碍。
免费存储库的创建者 Edd Coates 注意到该网站“非常缓慢”,并在服务器大师 Jay Peet 的帮助下开始进行调查。修复方法非常简单。封锁单个 IP 地址可以恢复正常服务,但该数字电话卡的所有者是谁?正是 OpenAI,ChatGPT 和 Dall-E 背后的生成人工智能公司。
阅读更多:Future Publishing 与 OpenAI 签署内容合作伙伴关系
科茨最初在 X 上分享了这一消息,并猛烈抨击了 OpenAI 从网站上抓取可用于训练其模型的信息的做法。该公司对此并不害羞。它是网站公开表示其大型语言模型根据三个来源进行训练,包括“互联网上公开提供的信息”。当然,无数的诉讼和潜在的法律挑战涉及各大报纸(包括《纽约时报》) 和甚至 YouTube 创作者会争辩说“公开可用”并不等于合法(感谢《卫报》和《The Verge》)。
对于科茨来说,这里的问题是双重的。首先,他不同意 OpenAI 的方法或商业模式,但成为该公司的目标也让他花了五年时间构建的免费资源遭到破坏。
“我第一次注意到数据库在几周前出现问题,当时页面加载时间要长得多。我知道这与网站本身无关,因为它一直运行顺利(即使有更活跃的在线用户),所以我怀疑有不法行为,但当时找不到任何证据,”科茨告诉游戏开发者。
“我无法向网站发布任何更新,因为延迟干扰了我的管理工具,我什至收到了来自依赖该网站作为其日常工作流程一部分的用户的愤怒电子邮件和消息。”
他解释说,这次中断最终导致网站完全停止工作,向用户发出“502 Bad Gateway”错误。在这个阶段,科茨寻求了杰伊·皮特 (Jay Peet) 的帮助,过去五年里,杰伊·皮特 (Jay Peet) 在他们的私人服务器上托管了数据库。 Peet 查看了网站日志,意识到该网站的资源正在被属于 OpenAI 的单个 IP 地址吞噬。
“主页每秒重新加载 200 次,因为 [OpenAI] 机器人显然正在努力在网站中寻找路径并陷入连续循环,”Coates 补充道。 “这本质上是一次为期两周的 DDoS 攻击,以数据窃取的形式进行。”
Coates 不从游戏 UI 数据库中赚钱。事实上,他们实际上是亏本运营该网站的。然而,如果他们试图通过该项目货币化或利用 Amazon Web Services 等外部工具,OpenAI 不受欢迎的兴趣可能会造成财务损失。
“如果我依靠 [游戏 UI 数据库] 获得广告收入或会员费,OpenAI 造成的停机绝对会对我的收入产生影响,”他说。 “他们每十分钟从服务器传输约 70GB 的数据。幸运的是,我没有带宽成本,服务器费用也很少,因此我能够免费向每个人提供此资源(所有教育资源都应该如此)。但是,例如,如果我向 AWS 支付存储费用,则此带宽每天将花费我大约 850 英镑。”
“OpenAI 甚至没有公开其数据的来源,所以我将独自承担这项法案的责任。这公平甚至合法吗?而且我当然不是唯一受此影响的人。”
不过,科茨表示,这个问题比潜在的收入损失更为严重。 “别让我开始了解他们正在用这些数据做什么,”他继续说道,并指出他花了数年时间精心收集和编目 UI 参考资料,以帮助游戏行业的其他创意人员,结果却让这项工作(其中包含了数千名开发人员的努力)“被一家价值数十亿美元的组织窃取”。
科茨表示,OpenAI 正在重新利用这项工作来“伤害和取代我试图帮助的人”,这种想法只会雪上加霜。 “这太恶心了。如果没有人类创造力的工作,生成式人工智能技术根本就不会存在,但我们却是在没有补偿或信用的情况下受到惩罚的人,”他们补充道。
至于 Game UI Database 如何成功拒绝 OpenAI 的进步,Coates 和 Peet 最终在 HTTP 服务器级别封锁了该公司的所有相关 IP,以阻止其部署解决方案。
“当我调查这个问题时,很明显我们正在被某些东西抓取或爬行。我们的使用情况分析显示有 10 个活跃用户,而实际服务器报告了 200 到 300 个活跃请求,”Peet 说。 “我怀疑有人试图对我们进行 DDoS,或者数据被自动抓取工具大量获取。
“阻止爬虫并不太复杂,尽管如果 OpenAI 添加或更改任何正在使用的 IP 地址,这样做的方法可能会很脆弱。修改 robots.txt(OpenAI 可以根据需要忽略它)后,我在 HTTP 服务器级别明确阻止了所有 OpenAI IP。切换到新配置后,网站立即恢复到正常响应时间。”
在撰写本文时,游戏用户界面数据库全力以赴,支持近 1,400 款游戏中的 UI 工作,其中包括命运多舛的项目,例如和睦。游戏开发商已联系 OpenAI 征求意见。
