29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》
作者:周末游戏网时间:2025-05-30 14:17:29
本站 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据本站了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
-
苹果时隔两年再度融资发债,价值 45 亿美元但吸引 100 亿美元认购感谢本站网友 往事2016 的线索投递! 本站 5 月 6 日消息,当地时间周一,苹果宣布发行价值 45 亿美元(现汇率约合 325 5 亿元人民币)的债
-
文远知行与 Uber 扩大战略合作,自动驾驶 Robotaxi 服务将覆盖全球 15 座新增城市本站 5 月 6 日消息,文远知行与移动出行及配送科技公司Uber 共同宣布扩大战略合作,计划未来五年将新增 15 座国际城市,部署自动驾驶 Robotaxi 服务,包含欧洲、中东等区域的国际市场。▲
-
飞腾首款笔记本 CPU 腾锐 D3000M 亮相:8 核心,典型办公续航长达 10 小时本站 5 月 6 日消息,本站从飞腾官方微信公众号 4 月 29 日文章获悉,该企业在 2025 数字中国建设峰会上展示了其首款笔记本处理器产品飞腾腾锐 D3000M。腾锐 D3000M 集成了 8
-
Beta 频道将完全跃迁 24H2:微软发布 Win11 26120.3950 预览版感谢本站网友 软媒新友2010825、EdgeOS 的线索投递! 本站 5 月 6 日消息,微软公司今天(5 月 6 日)发布博文,邀请 Beta 频道的
-
Anthropic 推出 AI for Science 计划:为生命科学等领域研究者提供免费 API 积分本站 5 月 6 日消息,AI 企业 Anthropic 当地时间今日宣布推出 AI for Science 科学支持计划。通过这一计划,被选中的研究人员将获得免费的大量 API 积分,用于加速科学研
-
安卓 16 全新电池状态图标曝光,预计 5 月 20 日谷歌 I/O 大会正式亮相本站 5 月 6 日消息,Mystic Leaks 解包发现,谷歌正为 Android 16 系统开发全新的电池状态指示图标。新版电池图标设计隶属于 Material 3 Expressive界面改版