【国盛计算机】DeepSeek-V3.2发布，国产模型再度引领创新DeepSee

无事正经 2025-12-01 21:33:00

【国盛计算机】DeepSeek-V3.2发布，国产模型再度引领创新DeepSeek-V3.2（标准版）在公开推理 Benchmark 中达到 GPT-5 级别，仅略低于 Gemini-3.0-Pro。首次实现将思考融入工具调用，支持思考和非思考模式下的工具调用，Agent 评测性能达到开源模型最高水平。DeepSeek-V3.2-Speciale（特别版）性能媲美 Gemini-3.0-Pro，并在 IMO、CMO、ICPC、IOI 等顶级竞赛中取得金牌级别成绩。创新点1：DeepSeek 稀疏注意力机制，简称 DSA，当需要回忆某个信息时，模型通过索引选取TOP-K相关的部分进行矩阵处理，其余部分进行线性处理。降低单位Token计算量和KV占用，从而增长上下文长度创新点2：RL算力占比持续提升、成为Scaling law新驱动，后训练阶段花费了超过预训练计算10%的资源，让模型的逻辑推理能力大幅提升创新点3：采用大批量Agent合成数据，生成了超过1800个不同的环境和 85000个复杂提示驱动强化学习过程，让模型学会一边思考一边使用工具，显著提升了模型在Agent场景中的泛化能力和指令遵循能力。观点：1.后训练规模扩展以及大量应用合成数据表明靠Scaling law提升模型能力的路径依旧有效。2.DeepSeek近期连续发布DeepSeekMath-V2和DeepSeek-V3.2,展示出算法创新能力，不必担心大模型技术已到达瓶颈。投资建议： 1、后训练以及推理需求显著提升，寒武纪（曾伴随DS首发芯片匹配）等算力、存储；2、自定义Agent（阿里、腾讯）、国内应用；3、杭州概念股风险提示：AI进展不及预期；行业竞争加剧；宏观经济风险联系人：李可夫等国盛计算机成员

0 阅读：1

【国盛计算机】DeepSeek-V3.2发布，国产模型再度引领创新DeepSee

DeepSeek在DeepSeek-V3.2的技术报告中说，与领先的闭源模

不知道大家发现了吗，最近一段时间，没人提Deepseek了，这就很奇怪，

DeepSeek新模型有多猛有点新感觉，也许不急于发布DeepseekR2有道

Deepseek又进步了，居然能拿2025IMO金牌了Deepseek去年做C

两周复刻DeepSeekOCR两人小团队还原DeepSeekOCR两人小团队，仅

DeepSeek预测中国未来可能成为世界顶级的10家企业:1.华为。2.字节跳

Deepseek被豆包反超了，是什么原因呢？👀看看网友和用户们是怎么