DeepSeek 今天憋了个大招——V3.2 正式版发布,而且一口气放出两个版本:标准版和 Speciale(特供版)。1)先来看标准版。定位很明确——适合日常使用、问答场景和通用 Agent 任务。核心卖点是「不水字数」:在推理类 Benchmark 上达到 GPT-5 水平 (仅略低于 Gemini-3.0-Pro),但相比 Kimi-K2-Thinking,输出长度大幅缩短。翻译一下就是:该说人话的时候不废话,计算开销和等待时间都大幅降低。然后就是 Agent 能力加持——这是 DeepSeek 首个将思考融入工具调用的模型。官方搞了个 1800+环境、85000+复杂指令的强化学习任务库 (解答、易验证类型),直接把模型泛化能力拉满。智能体评测成绩已经是开源天花板水平,跟闭源模型的差距在肉眼可见地缩小。2)Speciale 版:这版本更狠——长思考增强版+DeepSeek-Math-V2 定理证明能力加持。目标就一个:把开源推理能力推向极致、探索模型边界。来看看这个特供版的成绩:IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC 全球总决赛、IOI 2025 全部金牌。其中 ICPC 拿到人类选手第二名、IOI 第十名。这个版本的代价是——消耗 Token 显著更多、成本更高。不过官方也明确表示 Speciale 版本仅供研究使用,不支持工具调用,也没针对日常对话优化,相当于说这是「解题神器但不适合闲聊」。


