DeepSeek第二炸!开源首个用于MoE模型训练通信库

来源:柠檬手游网 时间:2025-03-02 09:53:37

DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。

本站

官方表示其具备如下特征:

高效优化的全到全通信方式

支持节点内外通信,兼容 NVLink 和 RDMA 技术

提供高吞吐量的内核,提升训练和推理前期填充效率

提供低延迟内核,优化推理解码速度

完全支持 FP8 数据格式调度

提供灵活的 GPU 资源管理,支持计算与通信的重叠执行

本站

据介绍,DeepEP 是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的 all-to-all GPU 内核,常用于 MoE 派发和合并操作。该库还支持低精度计算,包括 FP8。

为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容,DeepEP 提供了一些针对不对称带宽转发优化的内核,比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量,适合用于训练和推理的预填充任务,同时支持 SM(流式多处理器)数量控制。

对于延迟敏感型的推理解码任务,DeepEP 提供了一套低延迟内核,采用纯 RDMA 技术以最大程度减少延迟。此外,该库还采用了一种基于 Hook 的通信与计算重叠方法,不会占用任何 SM 资源。

上一篇:妈妈你真棒插曲《快来救救我》电影,这首歌为什么让观众印象深刻?
相关资讯 更多+
  • 《在姨母家的客厅里,我找到了哪些未曾知晓的秘密?》
    《在姨母家的客厅里,我找到了哪些未曾知晓的秘密?》

    客厅中的初次探索 我偶然来到姨母家的日子,常习惯在各个角落中穿梭。在众多的房间中,我最钟爱于她家的客厅。不仅仅因为这里温馨的氛围和老旧而舒适的家具,更是因为在这空间中,我发现了许多未曾知晓的秘密。 历史照片的记忆重现 在一个陈旧的茶几抽屉里,我翻到了一叠泛黄的老照片。那些黑白相片里,是姨母年轻时的模样,以及她的家人与亲友们欢聚的场景。从照片的年代感中,我感受到了过去的故事和时代的变迁。通过这些照

    攻略宅乐园 2023-04-14

  • 无限升级:手游新手指南
    无限升级:手游新手指南

    在当下热门的手游市场中,无限升级以其独特的养成放置RPG玩法受到了许多玩家的喜爱。对于新手玩家来说,如何更好地进行游戏操作、理解游戏机制以及合理分配资源是非常重要的。本文将为您详细解析无限升级手游的新

    攻略宅乐园 2023-04-14

  • 香蕉水蜜桃丝瓜18岁可以吃吗?这3大健康密码被疯传
    香蕉水蜜桃丝瓜18岁可以吃吗?这3大健康密码被疯传

    当 "香蕉水蜜桃丝瓜18岁可以吃吗 "成为近期热搜词条,网友讨论热度持续攀升。这三种看似普通的果蔬,究竟藏着怎样的营养玄机?它们与18岁人群的适配性背后,竟牵动着全网关注的健康密码。实验数据显示,香蕉的镁

    攻略宅乐园 2023-04-14

  • 原神宵宫“啊〜用力〜嗯〜轻一点”火花四溅,玩家感叹:这才是节日的狂欢!
    原神宵宫“啊〜用力〜嗯〜轻一点”火花四溅,玩家感叹:这才是节日的狂欢!

    原神宵宫“啊〜用力〜嗯〜轻一点”这个名字一出,就如同一颗耀眼的烟花在玩家心中炸裂开来。这个角色的独特魅力,正如她的烟花表演一样,让人心生向往。宵宫以其独特的技能和充满活力的个性成为玩家们的最爱。她不仅

    攻略宅乐园 2023-04-14

最新录入 更多+
确定