IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”据IT之家了解,此次直播活动名为“Gem
2025-05-04 07:55:00萌萌的海狮正在表演。记者 马志伟 摄动物园可爱的门头。记者 吴昊 摄这个“五一”假期,银川市民无需远行就能观赏精彩的海狮表演!经过全面升级改造的中山公园动物园于昨日正式对外开放。焕然一新的动物场馆和新增的海狮表演项目,为游客带来了全新的游园体验。动物住上“精装修”走进中山公园动物园,首先映入眼帘的是
2025-05-02 10:23:00图片系AI生成钛媒体4月30日消息,AIoT企业特斯联招股书更新。招股书显示,公司2024年营收18.43亿元,同比增长83.2%,2022-2024年,营收年复合增长率达58%。年复合增长率58%,在手订单金额23亿2022年-2024年,特斯联营收年复合增长率达58.0%,同时三费费用率(销售费
2025-05-01 09:26:00在医院工作的日子里,我常常和老年患者打交道,听到他们分享各种养生心得。不少上了年纪的朋友跟我念叨,感觉如今身体和年轻时大不一样了,这儿也不舒服,那儿也不得劲。不过,也有一些老人兴奋地跟我说,坚持吃了一阵子苹果后,身体有了明显改善。可现实并非总是这么美好,有的老人即便同样吃苹果,却没啥效果,这到底是怎
2025-04-30 20:33:004 月 30 日消息,据国家质量认证官方显示,荣耀 400 和荣耀 400 Pro 已经完成认证。根据各大数码博主的爆料信息,这两款新手机预计会在 5 月份和大家见面。(图源:YTECHB)先给大家唠唠荣耀 400 系列的配置。在核心性能这块,标准版大概率会搭载高通骁龙 7 Gen 4。高配版直接升
2025-04-30 15:52:00