《科创板日报》8月21日讯(记者 黄心怡)在OpenAI发布GPT-5模型14天后,梁文锋终于出招了,新模型版本DeepSeek-V3.1正式发布。
本次升级的核心亮点是采用了混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式,实现了DeepSeek-R1和DeepSeek-V3的合体。
此外,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,而UE8M0 FP8是针对即将发布的下一代国产芯片设计。
DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。
在技术与产品更新之外,DeepSeek的API接口调用价格有所上涨,并取消夜间优惠。从北京时间2025年9月6日凌晨起,自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。。
混合推理架构已成为大模型领域的一大趋势。除了DeepSeek外,此前发布的阿里通义千问Qwen3、GPT-5也都把推理模型与非推理模型进行融合。
不过,这类混合推理架构的实际效果仍有待观察。在GPT-5模型发布后,为了平息用户争议,OpenAI已将 GPT-4o 已重新上线。
而DeepSeek-V3.1发布后,《科创板日报》记者也看到不少用户反馈称,在体验了DeepSeek-V3.1的推理能力后,更习惯DeepSeek R1的回答。
IDC中国研究总监卢言霞对《科创板日报》表示,思考与非思考模式的融合可以说是必然的趋势,也是大模型发展史上的一个小迭代。“DeepSeek V3.1并非大版本,更值得期待的是大版本更新,但不知道何时。”
谈及基础模型的迭代速度,卢言霞表示,目前看确实有所放缓。“未来变革式的突破是不可预测的 就像创新不可被计划,这使得迭代放缓。但何时能大突破,也难以预测。”
开放传神(OpenCSG)联合创始人陈冉也认为,DeepSeek-V3.1综合看来在预期以下。“效率确实有提升,但突破较少。”
值得一提的是, 深度求索正式发布DeepSeek-V3.1后,称其为“迈向Agent(智能体)时代的第一步”。DeepSeek-V3.1具有更智能的工具调用能力,可以支持多种Code Agent框架,开发者可以自己搭建智能体。
“Agent方向支持,看来是DeepSeek重点方向。”陈冉分析。
目前,大模型厂商已经纷纷将重点放在了智能体的应用上,今年 7 月,月之暗面发布了拥有万亿参数规模的混合专家(MoE)模型。在其官方演示案例中, Kimi K2 迈出了智能体化的一步,可帮助用户直接制定旅行计划并预订机票和酒店。
而智谱 AI 在 7 月 28 日发布的 GLM-4.5 系列,也定位为 "Agent 原生基础模型 ",并在 8 月 20 日发布了全球首个手机 Agent(智能体)AutoGLM2.0,可以帮助用户 Agent 代理操作,具备推理、代码与多模态的全能能力,比如可以一键订票、订咖啡。
此次DeepSeek则称其在智能体能力方面实现了突破。编程智能体方面,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比前代模型有显著进步,所需轮数更少。
在搜索智能体测评方面,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。
有业内人士对《科创板日报》记者表示,今年属于智能体元年,在探索中发现很多挑战,也在逐步落地。“到明年的话或许会迎来真正的爆发年,随着标杆案例的成熟,预计将达到规模化发展。”
随着基础大模型迭代的放缓,未来国产大模型的竞争或也将围绕智能体等场景落地而展开。
(科创板日报记者 黄心怡)
相关文章
光明网讯在深入实施“人工智能+”行动的背景下,近日,中电信人工智能科技(北京)有限公司(以下简称“中电信人工智能公司”)宣布在天翼AI开放平台发布上线新一代企业级AI引擎——星辰超级智能体。该智能体依托中国电信全自研的“星辰大模型”技术底座,突破传统AI工具场景固化瓶颈,通过行业深度定制化架构、全链
2025-09-10 11:39:00文|融中财经港交所又来了个超级“消费股”。9月9日,来自深圳的“全球折叠自行车龙头品牌”大行科工(02543.HK) 在港交所挂牌上市,公司上市首日较发售价49.5港元高开36.36%报67.5港元/股,总市值约21亿港元。单从体量看,大行科工不算“大股”,但从市场表现来看却不容小觑。在此前打新环节
2025-09-09 17:27:00近年来一种号称“解压神器”的软泥类玩具风靡市场不仅受到孩子们的追捧不少打工人也喜欢“拿捏”一下然而有不少家长反映这类“解压”软泥类玩具经常散发出刺鼻的气味导致孩子出现皮肤过敏等症状有些软泥类玩具的包装中甚至没有厂名厂址信息和产品合格证是典型的“三无”产品解压软泥玩具有毒!成型水含硼砂其实这类软泥类玩
2025-09-09 00:05:00编者按:民声有呼,政必有应。红网邵阳站、时刻新闻邵阳频道全新推出“时刻追踪”专栏,这里,每一则“急难愁盼”都是政务服务的“行动清单”,《问政湖南》 以“政”为舵,将网友留言转化为部门整改的倒计时表;《百姓呼声》 以“民”为尺,让困扰您的事件件有回响;我们追踪的不仅是问题的解决进度,更是“为民初心”的
2025-09-08 09:48:00新一轮科技革命和产业变革加速发展,人工智能作为其中具有引领作用的颠覆性技术,正成为国际竞争的新焦点和经济发展的强大引擎。“人工智能+”行动迎来重要进展。国务院日前印发了《关于深入实施“人工智能+”行动的意见》,明确了实施“人工智能+”行动的总体要求、发展目标和重点方向。当前,新一轮科技革命和产业变革
2025-09-06 12:23:00