IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
《歌手2025》第二期直播中,陈楚生演唱歌曲《我用什么把你留住》时,副歌高音部分出现短暂“无声”现象,引发网友对“设备故障”或“演唱失误”的争论。在歌手直播中的读热搜环节中,沈梦辰问陈楚生怎么回应热搜#陈楚生 高音没声#,陈楚生承认了这个失误,陈楚生说,这是一个直播,随时会有,我们可能不可预料,就连
2025-05-24 08:54:00从2020年下半年开始,一场持续约三年的汽车芯片荒席卷全球,一度导致整车厂减产、减配,中国新能源汽车更因车规级芯片的进口依赖度高而被波及。这一刻,刚刚实现中国第一款16纳米车规级芯片流片的仇雨菁看到了机会。她曾是全球最大汽车半导体供应商恩智浦的车规级芯片研发总负责人,带领团队推出了市场占有率最高的汽
2025-05-22 08:35:00本报讯 (记者 齐向真 通讯员 徐翠翠 文/摄)在车水马龙的城市道路上,斑马线是守护行人安全的重要防线。5月20日,太原公交一公司三车队推出斑马线“让、看、等”三字诀,并对全体驾驶员展开培训,将安全理念融入驾驶细节。“让”是指公交车距离斑马线约50米,驾驶员便会主动降低车速,缓缓靠近;“看”是指车辆
2025-05-20 19:47:00中新网山西新闻5月12日电 在山西运城的汽车运输公司家属院,“90后”网格经理王俊峰正挨家挨户检查新装的智能电表。这个有着30多年历史的老小区,在2024年6月完成电力改造后,575户居民的生活彻底告别了“用电焦虑”,而像王俊峰这样的“电管家”,正是这场蜕变的见证者和推动者。电压不稳的日子:老小区的
2025-05-12 18:31:00近日,工信部公开征集对《汽车车门把手安全技术要求》强制性国家标准制修订计划项目的意见,引发业界对隐形门把手这一设计的重新审视。作为新能源车的标志性设计之一,隐形门把手既代表了汽车工业对科技美学的追求,也因潜在的安全隐患而备受争议。这一技术标准的修订,不仅关乎行业设计风向的转变,更折射出汽车产业在创新
2025-05-12 10:15:00