IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
IT之家 7 月 26 日消息,鸿蒙智行昨日宣布,问界 M8 纯电版 SUV 8 小时小订破万。该车预售价 37.8 万元起,8 月上市,即刻下订享 5000 元抵 10000 元购车尾款及全新夜紫外饰 8000 元限时免费权益。IT之家注意到,问界 M8 纯电版尺寸为 5190×1999×1795
2025-07-26 07:56:00文|牛刀财经闲鱼变了。最初,闲鱼只是个单纯的闲置交易平台,如今却早已突破边界,成了各类“神奇事件”的策源地。有趣的是,此前知名导演于正跑到闲鱼招募演员,截止7月初已收到超4万份简历,这样的跨界联动在过去难以想象。(图片来源:微博)有人调侃“人类对闲鱼的开发还不到1%”,如今,闲鱼早已挣脱了单纯闲置交
2025-07-23 18:26:007月20日,“苏C”徐州和“苏D”常州迎来“CD之战”。开赛前三天,常州又一次火出了圈。有网友在“常州发布”留言,建议比赛当天临时开放单位停车场,得到迅速回应“已经在安排了”。出乎意料的是,这简短回应出自常州市市长本人。次日,“常州发布”公布“便民八条”,首条就是开放5000个机关事业单位停车位。网
2025-07-20 08:13:00近日,2025年山西省哲学社会科学普及周优秀活动评选结果揭晓。由黎城县图书馆精心策划并组织的“童心造物学科学 亲子相伴共成长”亲子军事科技与3D打印模型制作活动,凭借其创新形式和显著成效,获得“优秀活动”称号。 该活动作为黎城县2025年社科普及周的重点项目,旨在提升公众科学素养,巧妙融合科普教育
2025-07-14 11:04:00有市民爆料今年6月金山廊下镇中华村飞来了一只"野生"孔雀历经了一个多月的农家生活孔雀不仅飞上屋檐 "看风景"还大摇大摆走进农家接受村民"投喂"虽然已经和村民"打成"一片但毕竟大家还是想知道这只孔雀到底是哪儿来的带着疑问和求助村民们找到了记者昨天(7月12日)下午,记者来到中华村,看到这里的宅基前后大
2025-07-14 09:49:00