> 资讯 > 业界新闻

AMD顶级APU展现实力!锐龙AI Max 395跑DeepSeek R1:比RTX 5080快3倍以上

人阅读 2025-03-18 11:47:52AMD

3月18日消息,AMD展示了其最新的锐龙AI MAX 395 “Strix Halo” APU在DeepSeek R1 AI基准测试中的表现,比NVIDIA RTX 5080桌面版显卡高出3倍以上。

锐龙AI MAX 395 “Strix Halo” APU集成了16核、32线程的Zen 5架构处理器、50 TOPS的XDNA 2神经处理单元(NPU)和集成显卡。

RTX 5080显卡仅配备16GB的VRAM,这在处理大型语言模型时成为明显的瓶颈,而Strix Halo APU的128GB统一内存可以灵活分配,最多可将96GB内存转换为显存,使其在处理大型AI模型时具备显著优势。

在实际测试中,AMD使用了包括llama.cpp驱动的应用程序LM Studio在内的多种消费者AI工作负载进行基准测试。

结果显示,当LLM模型大小超过16GB VRAM时,Ryzen AI MAX 395的性能优势尤为明显,其性能比RTX 5080高出3.05倍。

即使与更高端的RTX 5090(32GB显存)相比,Strix Halo APU的128GB统一内存依然使其在处理大型模型时占据绝对优势。

AMD表示,锐龙AI MAX 395相较于Copilot 竞品的优势主要如下:

性能:

与英特尔Arc 140V相比,最高提升2.2倍的token吞吐量

最高可达4倍于Llama 3.2 3b Instruct等小型模型的首个token生成时间

最高可达9.1倍于7-8B参数模型的速度

14B参数模型最高比英特尔酷睿Ultra 258V快12.2倍

内存:

提供高达128GB的统一内存,而竞争对手的最大仅为32GB

可将高达96GB转换为显存

可运行其他APU无法处理的更大模型,如谷歌Gemma 3 27B Vision

【本文结束】如需转载请务必注明出处:

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com