英特尔公布数据中心路线图推进情况助力生成式AI发展

人阅读 2023-04-17 10:16:04

随着数字经济的发展，算力需求也在不断增加。数字经济中，数据的收集、存储、处理和分析需要大量的计算能力，这些都推动了数据中心行业和服务器行业的深刻变革和快速发展，近日在英特尔举办的数据中心进展网络研讨会上，就详细介绍了英特尔最新的市场预测、硬件计划以及如何通过软件赋能开发者，并展示了英特尔数据中心业务的最新情况。其中包括有关未来几代英特尔至强产品的路线图。

1 英特尔至强产品路线图“走上正轨”

熟悉英特尔的朋友想必都知道，第四代至强处理器Sapphire Rapids的发布遭遇了一些波折，这也与整个半导体产业遭受的变故有关，不过在数据中心进展网络研讨会上，英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示英特尔至强产品路线图正在走向正轨。

Sapphire Rapids正在快速出货

具体来说，今年年初发布的第四代英特尔至强可扩展处理器Sapphire Rapids凭借业界领先的加速器、更多核心数量及更高的每瓦性能，这款全新的领先产品大幅提升了性能。随着这款性能卓越的新品面世，客户迅速采用这些新技术。在产品发布后仅八周时间，采用该款产品的处理器设计数量创造了英特尔至强系列的历史纪录，其可用平台及出货平台数量也创下新高。

迄今为止，已经有50+主流OEM和ODM厂商均在出货基于第四代英特尔至强可扩展处理器的系统，而前十大云服务提供商也在部署基于第四代至强的服务。作为英特尔迄今为止质量最高的数据中心CPU，SapphireRapids正在快速出货，目前，已获得450+处理器产品设计，创造了英特尔至强系列的新纪录，同时已有200+设计出货。

2023年Q4：第五代英特尔至强可扩展处理器Emerald Rapids

与消费级CPU类似，今年的Sapphire Rapids也由P-Core性能核和E-Core能效核组成，前者专为实现最高的每核性能和AI工作负载性能而设计，后者则为高能效、高核心密度和高吞吐量而设计。作为英特尔的下一款性能核（P-core）产品，第五代英特尔至强可扩展处理器Emerald Rapids已经从代号切换到正式的品牌名称，目前正在向客户提供样品，并计划于2023年第四季度进行交付，量产验证正在进行中。根据Sandra Rivera的说法，该产品的芯片质量非常高，并针对性能进行了优化。其将拥有极高的处理器内核性能，在相同功率范围内实现更高的每瓦性能，同时通过内置加速器为具体的工作负载进行优化。

具体来说，工艺方面，Emerald Rapids将仍然使用Intel 7制程，采用Raptor Cove核心架构，也就是Golden Cove核心的改进版本，将比Golden Cove核心提供5-10%的IPC提升。它还将包含多达64个内核和128个线程，与上一代Sapphire Rapids芯片的56个内核和112个线程相比有小幅提升。

2024年上半年E-Core产品：英特尔至强处理器（代号Sierra Forest）

与Emerald Rapids不同的是，Sierra Forest将会是英特尔在未来发布的第一款能效核（E-core）处理器，计划在2024年上半年上市。拥有每插槽144个内核。此外也是第一款采用即将推出的Intel 3制程工艺的CPU，在本季度早些时候上电后，多个操作系统在创纪录的时间内（不到一天）得以启动。目前正在按计划推进，第一批样品已经交付。在Sierra Forest演示中，通过任务管理器展现了144个内核忙碌地处理演示工作负载的场景，其专为云优化的工作负载而设计，将通过优化的每瓦性能、高内核密度，以及高吞吐量性能针对能效进行优化，专为满足英特尔超大规模客户的需求而设计。

2024年P-Core产品：英特尔至强处理器（代号Granite Rapids）

紧随Sierra Forest之后发布的是英特尔下一代P-Core产品Granite Rapids，尽管具体发布日期尚未披露，但与Sierra Forest共享一个平台将有利于其快速上市。共享的IP和技术最大限度地缩短了开发和设计时间。英特尔表示，Granite Rapids正在实现所有重大里程碑进展，并取得了顺利的工厂生产进程。它的样品也正在向客户提供，反馈良好，其具备更高的内核密度、内存和I/O创新。

英特尔方面称，其正在为Granite Rapids构建世界上最快的内存接口。英特尔发明并引领整个生态系统开发了一种名为多路合并阵列（MCR）的新型DIMM，可以实现在DDR5的基础上实现每秒8800兆次的传输速度。与当前一代服务器内存技术相比，MCR DIMM创新把峰值带宽增加了80%。并在健康的内存子系统满载读/写操作时非常稳定。

2025年E-Core产品：英特尔至强处理器（代号Clearwater Forest）

在本次数据中心进展网络研讨会上，英特尔首次公开表示，将在Sierra Forest之后开发后续产品Clearwater Forest，继续实施其能效核路线图。Clearwater Forest采用Intel 18A制程工艺制造。英特尔计划在该节点实现制程工艺领先——这也将是公司四年内推进五个制程节点战略的高潮。

除了至强产品之外，英特尔也表示在今年计划有15款新的FPGA产品通过生产放行资格（PRQ）程序，这是英特尔迄今为止最庞大的FPGA新品发布。

在公布至强产品路线图的同时，英特尔也顺势展望了CPU未来的市场规模，英特尔表示，五年后，数据中心芯片市场的规模将达到1100亿美元，是去年英特尔投资者大会上所预期市场规模的两倍左右。究其原因，是不断变化的数据中心市场格局扩大了目前仅仅针对CPU的需求。

在以往，业界通常通过CPU的出货量来衡量市场规模。然而，插槽数量并不能完全反映芯片创新为市场带来的价值。如今，创新已经涉及多个维度，包括提高CPU内核的密度、使用芯片中的内置加速器，以及使用独立加速器等，这也是市场规模扩大的重要原因。随着数据中心业务整合加速器计算和领先的GPU产品，英特尔能够更好地服务更为广泛的客户群体。此外，至强可扩展处理器在运行大型工作负载（如AI、数据分析、安全、网络和HPC）方面的出色性能，推动了对主流计算以及为工作负载“量身定制”的独立加速器的需求。

2 为人工智能做好准备，英特尔助力生成式AI

近几个月以来，chatGPT的出现再一次引领了AI热潮，然而，这种快速演进的技术也揭示出，在数据中心成功利用AI需要极其复杂的计算。因此除了有关芯片的最新情况以外，AI也是本次网络研讨会的一大主题。

英特尔技术是AI硬件的基石，从至强处理器上的数据准备及管理，到中、小型训练与推理，同时，越来越多的大模型训练和推理正在使用英特尔GPU和加速器。

而随着通用计算（主流为CPU）和加速计算（目前主流为GPU和专用加速器）的市场需求不断增长，到2027年，逻辑芯片的市场规模将超过400亿美元，AI芯片/加速器领域将大有可为。

多年以来，英特尔都在致力于推动真正的AI普及，从云到网络到边缘。通过开放的生态系统，英特尔让更多人能够获得解决方案并进行更为经济的AI部署。网络研讨会当天，英特尔首席技术官兼软件与技术集团负责人Greg Lavender谈到了英特尔的先进软件，以及其对于整体的端到端系统级AI软件开发方法的投资，包括为“可移植性”而推动编程语言的标准化。

Lavender表示：“我们认为，行业将受益于标准化的编程语言，让每个人都可以为其做出贡献，并展开广泛的合作，而不是受限于某个特定的供应商，与此同时，亦可以根据成员的以及一些共性需求寻求有机的发展。”

英特尔为SYCL（一种基于C++的开放编程模型）做出了很多贡献，并收购了CodeplaySoftware（SYCL语言和社区的领导者）。SYCL包含于oneAPI中，因此客户可以跨多个供应商的CPU、GPU和加速器进行编程和编译。上游软件优化方面的其他工作包括针对PyTorch2.0和TensorFlow 2.9的优化，以及与Hugging Face的合作，均可在英特尔至强处理器和Gaudi2的帮助下进行训练、调优和预测。

研讨会当天，英特尔确认Habana Gaudi 3人工智能加速器已完成设计认证（tape in）。虽然性能细节尚未公布，但Habana Gaudi 2已投入使用，并在运行主流的计算机视觉工作负载时拥有出色的每瓦吞吐量。

同时针对生成式AI领域，英特尔正在积极采取措施，并通过优化主流的开源框架、库和工具来实现出色的硬件性能，同时消除复杂性，来确保自身是实现生成式AI的明智选择。

近日，机器学习应用开发领域的重要厂商Hugging Face宣布在 Habana Gaudi 2上启用包含1760亿个参数的BLOOMZ模型。BLOOM模型是一个开源的大型语言AI模型，类似于ChatGPT所采用的包含1750亿个参数的GPT-3模型。该公司还证实，它在内置英特尔AMX加速器的第四代英特尔至强处理器上运行从文本到图像的深度学习模型StableDiffusion，并利于其为AI工作负载加速。Stable Diffusion是DALL·E的开放访问替代方案。

OpenVINO则进一步加速了Stable Diffusion推理。结合使用第四代至强CPU，它的速度几乎比第三代英特尔至强可扩展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一个工具，用于加速英特尔架构上的端到端管道，它将平均延迟再降低3.5倍，总共降低近10倍。

除了为构建开放生态系统所做的贡献之外，至强处理器在生成式AI领域同样发挥了重大作用。Rivera指出，英伟达正在使用第四代至强作为主节点，与其H100GPU一起运行，为在微软Azure中加速包括ChatGPT在内的生成式AI模型的虚拟机提供动力。

人工智能作为未来二三十年的科技发展趋势，全球各地的企业都在积极发展人工智能技术，为产业智能注入创新活力。在生产模式、运营模式、产品服务等诸多方面利用新技术实现创新，以此实现降本增效，激发企业活力。从英特尔的布局不难看出，英特尔正与产业伙伴接洽，以支持一个基于信任、透明和多种选择的开放式AI生态系统。

(8151043)