英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

人阅读 2025-02-01 11:46:38英特尔

近日，DeepSeek发布Janus Pro模型，其超强性能和高精度引起业界关注。英特尔? Gaudi 2D AI加速器现已针对该模型进行优化，这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化，有效满足行业应用对于推理算力的需求，为AI应用的落地和规模化发展提供强有力的支持。

作为一款创新性的 AIGC模型，DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构，突破了传统AIGC模型依赖多路径视觉编码的限制，实现了理解与生成任务的一体化支持。在此基础上，Janus Pro通过优化训练策略和扩展模型规模，显著提升了文生图等功能的性能与稳定性，并提供了10亿参数和70亿参数两个版本，在性能与精度上展现了较强的竞争力。

图片来源：https://github.com/deepseek-ai/Janus/blob/main/images/teaser_januspro.png

在Janus Pro统一的Transformer架构下，文生图模型的吞吐量高低已经从依赖加速器的高算力向充分利用HBM内存高带宽和大容量转换。英特尔? Gaudi 2D凭借 2.45TB/秒的高带宽和 96GB HBM 大容量内存，为 Janus Pro 模型提供了强大的计算支持，使其在生图批处理任务中，随着批量大小（Batch Size）的增加，吞吐性能得到显著提升，大幅缩短任务处理时间。

与此同时，结合英特尔Optimum-Habana 框架的优化，英特尔? Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率，仅需约 10 秒即可生成16张高质量的图片，性能表现卓越。而且，开发者仅需调整数行代码，即可实现这一结果，极大降低了开发门槛和迁移成本，为 AI 应用的高效部署提供便利。

图片来源：利用英特尔Gaudi 2D AI加速器运行DeepSeek Janus-Pro-7B模型生成

此外，DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持，能够为客户创造更好的总体拥有成本（TCO），推动AI的普惠。

一直以来，英特尔始终秉承开放的态度，并通过软硬件相结合的方式推动AI应用落地。目前，英特尔丰富的AI产品组合，包括英特尔?至强?处理器、英特尔?酷睿? Ultra处理器和英特尔锐炫?显卡等，已经针对业界超过500个开源AI模型提供支持，广泛涵盖DeepSeek、Llama 3.1和通义千问等。同时，英特尔深耕开放生态，不仅以开放生态系统软件实现针对性优化，也通过打造企业AI开放平台（OPEA）为这些模型提供支持。

【本文结束】如需转载请务必注明出处：

大数据

5G

LoRa

NB-IoT

ML/机器学习

区块链

云计算

雾计算

机器人

边缘计算

智能家居

智能安防

智能工业

智能医疗

智能农业

智慧城市

智能交通

智能环保

车联网

移动互联

业界新闻

企业要闻

产业政策

AI智能

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

栏目文章

最近发表

标签列表

Powered By LOT物联网 闽ICP备2024036174号-1

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

热门推荐

栏目文章

最近发表

标签列表

Powered By LOT物联网 闽ICP备2024036174号-1

Powered By LOT物联网闽ICP备2024036174号-1