【国盛计算机】DeepSeek-V3.2发布,国产模型再度引领创新DeepSee

无事正经 2025-12-01 21:33:00

【国盛计算机】DeepSeek-V3.2发布,国产模型再度引领创新DeepSeek-V3.2(标准版)在公开推理 Benchmark 中达到 GPT-5 级别,仅略低于 Gemini-3.0-Pro。首次实现将思考融入工具调用,支持思考和非思考模式下的工具调用,Agent 评测性能达到开源模型最高水平。DeepSeek-V3.2-Speciale(特别版)性能媲美 Gemini-3.0-Pro,并在 IMO、CMO、ICPC、IOI 等顶级竞赛中取得金牌级别成绩。创新点1:DeepSeek 稀疏注意力机制,简称 DSA,当需要回忆某个信息时,模型通过索引选取TOP-K相关的部分进行矩阵处理,其余部分进行线性处理。降低单位Token计算量和KV占用,从而增长上下文长度创新点2:RL算力占比持续提升、成为Scaling law新驱动,后训练阶段花费了超过预训练计算10%的资源,让模型的逻辑推理能力大幅提升创新点3:采用大批量Agent合成数据,生成了超过1800个不同的环境和 85000个复杂提示驱动强化学习过程,让模型学会一边思考一边使用工具,显著提升了模型在Agent场景中的泛化能力和指令遵循能力。观点:1.后训练规模扩展以及大量应用合成数据表明靠Scaling law提升模型能力的路径依旧有效。2.DeepSeek近期连续发布DeepSeekMath-V2和DeepSeek-V3.2,展示出算法创新能力,不必担心大模型技术已到达瓶颈。投资建议: 1、后训练以及推理需求显著提升,寒武纪(曾伴随DS首发芯片匹配)等算力、存储;2、自定义Agent(阿里、腾讯)、国内应用;3、杭州概念股风险提示:AI进展不及预期;行业竞争加剧;宏观经济风险联系人:李可夫等国盛计算机成员

0 阅读:1
无事正经

无事正经

感谢大家的关注