IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
45 岁的张女士对着体检报告愣住了:血脂、尿酸、胆固醇三项指标全线飘红。作为吃了 20 年牛肉的 “资深食客”,她一直坚信牛肉是 “滋补圣品”—— 脸色差了喝牛腩汤,精力不济来盘香煎牛排,甚至把牛肉当 “保健品” 天天吃。直到医生一句 “是不是经常吃牛肉”,才让她惊觉:这碗吃了二十年的 “补汤”,可
2025-06-13 10:08:00骆驼制片有限责任公司IT之家 6 月 12 日消息,美国演员工会 - 美国电视和广播艺术家联合工会(SAG-AFTRA)已暂停对十家游戏工作室的罢工行动。该组织的全国委员会将于明日召开会议,审议与这些游戏开发商达成的临时协议。如果委员会同意协议条款,更多细节将被披露。据 Variety 获得的一份来
2025-06-12 07:47:00端午节撞上儿童节,但院线市场并不景气。除了阿汤哥的《碟中谍8》还算有点小惊喜,其余作品均口碑、票房平平。面向儿童的《哆啦A梦:大雄的绘画奇遇记》《时间之子》《潜艇总动员》等影片也未有破圈之作。但剧集方面,临近暑期档,各平台都推出了热场子的选手。下面,我们来一一盘点。电影篇 与往常不同的是,本月的重头
2025-06-09 03:00:00蓝天白云,明月清风,大约是文学作品中出现最多的非常美好的景象或者说物像之一。这两种物像在人们的脑海里其实是呆板的,远远没有真实的物像那么变幻莫测,那么灵动丰富。要知道,永远没有两朵相似的云,更别说一样的云。天空那么大,云彩浮在上面,有大片的,有小朵的,有单独远离的,有紧挨着的。不仅如此,同样是大片或
2025-06-09 00:15:00深圳商报·读创客户端记者 胡星访6月6日,由深圳市妇联倾心打造的“万花筒大师课”上,大数据专家涂子沛以童趣的语言和引人入胜的实验,为百组亲子家庭开启了一场探索人工智能核心“大模型”启蒙之旅。培育未来建设者而非被动旁观者“大数据是土壤,人工智能是土壤上开出的花,而今这株智能之花,正舒展着‘大模型’这双
2025-06-08 16:43:00