DeepSeek正式发布开源项目DeepGEMM
2月26日的报道显示,今天上午9点,DeepSeek如期履行了其“开源周”的承诺,正式发布了开源项目DeepGEMM。这一消息发布后迅速引起了广泛关注,累计阅读量达到2.1万次,充分体现了该项目在国内外技术领域的热度。
据介绍,DeepGEMM是一款专注于FP8高效通用矩阵乘法(GEMM)的库,主要满足普通矩阵计算以及混合专家(MoE)分组场景下的计算需求。该库能够动态优化资源分配,从而显著提升算力效率。DeepGEMM基于CUDA开发,采用了轻量级即时编译(JIT)模块,支持运行时动态编译内核,无需提前完成编译和安装。
值得注意的是,DeepGEMM的设计初衷是为DeepSeek-V3/R1模型的训练与推理提供简洁高效的底层支持。特别是针对Hopper架构GPU(例如H800)进行了深度优化,既保证了高性能,又兼顾了成本控制。
作为“开源周”活动中的第三项成果,DeepGEMM的推出延续了DeepSeek一贯的开源策略,进一步降低了高性能计算技术的应用门槛。此前,DeepSeek已相继发布了FlashMLA(高效解码内核)和DeepEP(专家并行通信库),这些项目共同构成了其推动技术开放与合作的重要举措。
此次“开源周”活动定于2月24日至28日举行,期间DeepSeek计划陆续发布多项开源项目,旨在通过共享技术成果促进行业创新与发展。