1/这篇报告释放了什么核心增量信息?。市场固有偏见=单看晶圆制程(比如中芯7nm对标台积电3nm),认为中国AI芯片技术落后,没法打。大摩的增量视角=评价AI芯片不能只看单卡峰值算力,要看"性能/功耗/成本(美元)"的综合账本。,核心结论=叠加中国更低的芯片定价+极其便宜的电费(尤其是西部数据中心),国产AI GPU在推理端已经具备极强的商业竞争力。这意味着国产替代不再仅仅是"政策硬推"的政治任务,而是大厂算过经济账后切实可行的商业选择。预计到2030年,中国AI芯片自给率将从2024年的33%飙升至76%.
2/买不到最先进的设备,国产硬件怎么破局?痛点=极紫外光刻机(EUV)等先进制造设备+高端EDA软件被限制导致单片算力(Die)结构性落后海外1.5到2代破局思路="单片不够,封装和集群来凑"具体动作=采用先进封装(把多个Die塞进一个芯片)+系统级暴力堆料(扩大机柜规模).。比如CloudMatrix384或字节的256卡集群用超强的高速光互联带宽,来弥补单卡算力的不足。用大白话总结就是:虽然单兵作战能力稍弱,但靠打群架+系统级网络优化,整体机柜的战斗力已经能和英伟达特供版(H20/A100)掰手腕。
3 为什么现阶段主战场在"推理"而不是"训练"?训练前沿大模型=需要万卡集群极高的互联稳定性。国产芯片在超大规模扩展时,容易出现通信故障,掉线或同步失败现阶段搞不定最前沿的超大模型预训练。推理端(Inference)=容错率高+极度看重性价比(Cost per token).商业优势=国产芯片采购价低+耗电成本极低导致国产AI数据中心的总拥有成本(TCO)比使用英伟达方案低30%-60%结果=在跑DeepSeekR1这类模型的推理测试中,华为950,寒武纪690的TPS(每秒生成 token数)甚至能超越英伟达H20.
4 除了硬件堆料,中国厂商还有什么杀手锏?护城河=英伟达的CUDA软件生态依然是难以逾越的壁垒,国产芯片的底层软件优化仍需大量人工介入。
杀手锏=中国大模型厂商(DeepSeek,阿里 Qwen)极其强悍的算法与软件优化能力案例=DeepSeek R1采用创新的强化学习架构+极致的MoE(混合专家模型)稀疏激活大幅降低了对底层极致算力的依赖。
基本上就代表:中国正在用世界级的算法创新给相对落后的国产硬件"打辅助",硬生生把整体系统的产出效率拉到了国际前沿水平。
5 对行业格局和投资估值意味着什么?现状=目前国产GPU赛道"十戏水"(玩家众多),估值(P/S市销率)动辄几十倍甚至上百倍,远高于英伟达/AMD。市场买的是"国产替代的期权",而不是当下的盈利能力。趋势=随着产能释放和技术同质化,未来2-3年必然走向价格战与行业大洗牌(Commoditization and Consolidation)赢家画像=活到最后的寡头必须同时具备:1/抢到头部晶圆厂(中芯)稀缺产能的能力+2/深度绑定大厂客户(CSP)的客情关系+3/极高的推理性价比。格局预测=华为(Ascend)将吃下超60%的市场份额成为绝对霸主+互联网大厂自研芯片(如百度昆仑芯,阿里平头哥)占据核心生态位缺乏背景的独立第三方芯片厂商,生存空间将被严重挤压。