pytorch官博：的Mooncake正式加入PyTorch生态系统py

蚁工厂 2026-02-13 10:32:00

pytorch官博：的 Mooncake 正式加入 PyTorch 生态系统pytorch.org/blog/mooncake-joins-pytorch-ecosystem/

"我们非常高兴地宣布，Mooncake 正式加入 PyTorch 生态系统！通过将 Mooncake 高性能的 KVCache 传输和存储能力与 SGLang、vLLM 和 TensorRT-LLM 等 PyTorch 原生推理引擎相结合，我们正在为大语言模型的部署解锁更高水平的吞吐量和可扩展性。

关于 MooncakeMooncake 旨在解决 LLM 服务中的“内存墙（memory wall）”问题。随着上下文长度的增加和模型规模的扩大，键值（KV）缓存与特定 GPU 工作节点（worker）的静态绑定已成为主要的瓶颈。

Mooncake 赋能推理引擎打破这种绑定，解锁了四项关键能力：

🌟(Encoder) 预填充-解码分离（Prefill-Decode Disaggregation）： Mooncake 高性能的传输引擎（Transfer Engine）将计算密集型的预填充（prefill/encoder）阶段与对延迟敏感的生成（decoding）阶段分离到不同的集群中。

🌟全局 KVCache 复用：通过充当 KV 块的分布式共享内存，Mooncake Store 使得有效的缓存在不同请求和引擎实例之间实现全局复用。

🌟弹性专家并行（Elastic Expert Parallelism）：通过将专家（experts）与特定工作节点解耦，Mooncake-EP 实现了弹性和高可用的服务。在混合专家（MoE）模型中，专家可以被动态路由或恢复，从而确保即使在部分节点故障期间也能保持高可用性。

🌟 PyTorch 分布式后端： Mooncake Backend 作为一个容错的 PyTorch 分布式后端运行。它提供了强大的集合通信原语，能够在出现 Rank 故障时无缝继续运行。

🌟权重更新： Mooncake Store 通过在内部存储权重，支持强化学习（RL）和检查点（checkpoint）场景下的快速权重更新。它提供了张量原生（tensor-native）和零拷贝 API。"

HOW I AI

0 阅读：0

感谢大家的关注

作者最新文章

1

好想知道huggingface随随便便就给普通用户这么大带宽，那得多大带宽费啊，

2

分享图片

3

Gemini 3 Deep Think 绘制的svg版骑自行车的鹈鹕。Simon

4

这个项目把大模型训练过程中的知识点都总结成了skillgithub.com/Or

5

OpenClaw 在 GitHub的 star 数现已超过 VSCode

6

转发抽奖转发抽三本的新书《复杂架构设计 : 从高并发到大模型架构实战》。年

7

OpenAI 给美国众议院中美战略竞争特别委员会打小报告了，说DeepSeek

8

pytorch官博：的 Mooncake 正式加入 PyTorch 生态系统py

9

Anthropic刚获得了300亿美元的投资，投后估值3800亿美元。以及马斯克

10

蚂蚁的大模型也更新了：Ring-2.5-1T，首个混合线性架构的 1T 级思维模

热门分类

科技TOP

1

雷军明天早上8:00又要做直播！就是刚才，雷军在社交网络上给大家拜早年了，这

2

宇树机器人三上春晚，宇树机器人今后就是春晚界的“赵本山”，今年宇树机器人又会带给

3

华为第二代阔折叠机型曝光华为PuraX2终于要来了，华为这个产品其实挺有意

4

影石年会直接送5套房打工人看完直接破防了！影石Insta360这波年会操

5

ProAir正式发布了：6.1mm厚，155g重，6.3寸屏幕小尺寸天

6

TikTok因应用程序的成瘾功能被指控违反欧盟规定TikTok、周五、被指控违反

7

鸿蒙微信消费者版本邀请内测8.0.15.161.设置-朋友权限新增“添加我的

8

宇树机器人的主要供应链曝光了，果然，制造业是一个大的生态，一荣俱荣。#宇树#

9

刚刚！400万粉丝大V曝光流量收益！流量原来真的可以变现，就在刚刚，拥有400

10

我去小米澎湃OS3深夜上热搜。

科技最新文章

1

直接杀疯了！雷总这步棋太狠小米把PC行业彻底掀翻！2月12日，小米正式发

2

真是猪队友荣耀X80还没发布，配置全给曝光了今晚谁也别想睡个好觉了，真要这

3

影石年会直接送5套房打工人看完直接破防了！影石Insta360这波年会操

4

去年是DeepSeek，今年是Seedance！去年deepseek让大模型的硬

5

LCD党终于等来了一款主流品牌新机，它就是iQOOZ11X，这款手机搭载了6.

6

全体起立！荣耀X80配置曝光，这次性能和续航将全面升级，再加上一如既往的出色外观

7

曝华为阔屏直板机立项确实听说了，而且好像不止华为哦，还有两家也在考虑阔直屏，这让

8

华为要出阔屏直板机？看到传了好久的阔屏直板机要来了，16：9的屏幕确实怀念，但

9

谁也没想到，三星S26标准版一曝光就扔出王炸！😯机身狂减重，相机彻底变

10

华为nova14Ultra512GB版发布仅半年，价格从首发4499元直降至