IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
坊友们是否曾刷到过这样的直播间跳舞的既不是年轻女孩也不是帅哥哥帅弟弟而是孩子们的家长他们看起来不太会跳舞却又努力展示着自己有网友称这是——尬舞相信不少人都很疑惑这是在干嘛?是博眼球的新赛道?是减肥健身?还是卖惨?而她们背后的故事却让无数人泪目为了救娃妈妈们学跳舞、开直播在山东省济南市槐荫区的河头王庄
2025-09-06 09:36:00《科创板日报》8月21日讯(记者 黄心怡)在OpenAI发布GPT-5模型14天后,梁文锋终于出招了,新模型版本DeepSeek-V3.1正式发布。本次升级的核心亮点是采用了混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式,实现了DeepSeek-R1和DeepSeek-V3的
2025-08-21 21:56:00今年3月份,吴彦祖首度公开亲手设计的洛杉矶豪宅,因其讲究五行风水似北京四合院而火爆出圈。室外的院子融合了东方美学与现代设计,屋内则是现代简约风,陈列物品并非奢华昂贵的家具装饰,而是女儿9岁时的画作、被箭射中的旧手机等,无不体现吴彦祖的艺术品位与情感连接。时隔3个月后,吴彦祖在社交平台分享自己又一力作
2025-08-18 14:20:00IT之家 8 月 17 日消息,据中国航空工业集团消息,今日,AG600“鲲龙”批产第二架机(1102)在广东珠海成功完成生产试飞,即将交付客户进行运营。由机长陈明、副驾驶田亚飞、观察员周斌、空中机械师张朋飞组成的试飞机组驾驶着 AG600-1102 架机于珠海金湾机场顺利完成包括滑行、一般性检查、
2025-08-17 16:21:008月的浙江安吉余村层峦叠嶂、流水潺潺,游客纷至沓来,尽享生态之美。20年前,余村曾靠着开采山里优质石灰岩成为“富裕村”,但伴随而来的是溪流浑浊、烟尘弥漫的巨大环境代价。忍痛关掉矿山和水泥厂后,村集体经济和村民收入短时间内出现下滑。未来出路在哪里?2005年8月15日,时任浙江省委书记习近平同志来到这
2025-08-13 14:18:00