IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
7 月 3 日深夜,罗马仕被曝出停工停产,工资只发到 6 月份。微博热搜上出现了 #罗马仕 倒闭# 的词条。图源:微博事情得从 6 月初说起,北京多所高校就下发“停用罗马仕充电宝”的通知,理由是 “充电时比其他品牌更容易爆炸”。北京联合大学甚至发生过充电宝自燃事件,消防部门都介入提醒风险了。6 月
2025-07-04 15:20:00每经记者:谢陶 每经编辑:唐元图片来源:受访者供图我们关注那些瞬息的变化、迎面而来的潮流,但我们更关注那些扎根社区、充满创造力的源泉。纵览成都乃至全国的文创园区版图,东郊记忆显然已进化成一个不可忽视的“新物种”。文创园区,作为重要的“关节”与“动脉”,关系到一座城市经济的活力与文化的创造力,亦与人们
2025-07-03 21:58:00长沙晚报掌上长沙7月2日讯(全媒体记者 岳霞 实习生 周雯)长沙市教育局今日发布长沙市城区2025年中考成绩总分2分段统计表,今年共有2883人考分在656分以上,不含预录指标生的656分以上的考生共1192人。长沙市教育局中招办根据“指标到校、择优录取”的原则,确定指标生录取最低控制分数线。分别划
2025-07-02 20:43:00IT之家 7 月 2 日消息,科技媒体 NeoWin 今天(7 月 2 日)发布博文,报道称微软宣布将于 7 月开始,陆续提高多款本地服务器产品和客户端访问许可(CAL)套装的价格,最高涨幅达 20%。微软已于 4 月通知企业客户,将于今年 7 月至 8 月期间,上调多款本地服务器产品部署价格,部分
2025-07-02 14:02:00中国日报网7月1日电 据美国《纽约时报》6月30日报道,在特朗普政府发起的全球贸易战中,美国通过对华加征关税,试图推动制造业回流。然而,美国关税政策的不确定性却让美企做出相反选择:将部分核心产品生产从美国迁往中国。文章说,特朗普政府发起的全球贸易战动摇了Cocona Labs公司的经济基础。受到美国
2025-07-01 18:19:00