南大钱超 AI 团队攻克百亿晶体管难题,斩获 EDA 顶会 2025 最佳论文
据南京大学人工智能学院网站报道,南大 LAMDA 组钱超教授团队在 DATE 2025 发表的芯片设计优化论文「Timing-Driven Global Placement by Efficient Critical Path Extraction」获会议最佳论文奖。
电子设计自动化(Electronic Design Automation,EDA)是芯片设计的基石产业,被誉为「芯片之母」。
欧洲设计自动化与测试会议(Design, Automation and Test in Europe Conference,DATE)是 EDA 领域的顶级国际学术会议。
本次 DATE 2025 最佳论文第一作者侍昀琦、第四作者林熙、第五作者薛轲分别是南京大学人工智能学院的硕士生、本科生和博士生,钱超教授为通讯作者,论文与华为诺亚方舟实验室合作完成。
论文:https://www.lamda.nju.edu.cn/qianc/DATE_25_TDP_final.pdf
开源:https://github.com/lamda-bbo/Efficient-TDP
在芯片设计领域,为多达百亿量级晶体管设计最优布局,一直是一个难解的技术难题。传统的布局方法要么选择快速但不够精准的网线加权方案,要么采用精确但运算量巨大的路径优化方法。
就像在一个拥挤的城市规划新的交通路线, 既要考虑道路长度,又要确保交通畅通,面临精度与效率、局部与整体的冲突。这个两难困境一直困扰着芯片设计行业。
该论文提出了一种全新的时序驱动布局方法,巧妙地将效率和精度统一起来:
经典开源时序分析工具 OpenTimer 使用 O (n^2) 复杂度的算法提取 top-n 条时序违例路径,且不支持基于违例端点的路径分析。该论文针对每个违例端点提取其 top-n 条违例路径,不仅能覆盖所有时序违例端点,还将提取 n 条违例路径的复杂度降至 O (n),在时序分析中能够实现 6 倍加速。这个创新方法的核心在于「智能关键路径提取」技术,它能够快速定位需要优化的关键路径,将分析速度提升了 6 倍。
传统的基于线网的加权方案对于高扇出线网经常带来不必要的权重,从而过度优化许多不涉及时序违例的路径。论文提出了基于引脚间吸引力的精确指标,通过精确捕捉时序违例路径上的引脚对来建模时序信息,在显著提升时序指标的同时,几乎不造成整体线长的损失。
常用的时序模型 RC Delay Model 中,线网延时与其长度的平方成正比。论文首次提出将引脚间欧式距离的平方作为损失函数,并在 GPU 上实现了前向、反向传播的加速。较以往常用损失函数,在关键时序指标 TNS 和 WNS 上分别提升 50% 和 30%。
针对芯片宏元件布局问题,该团队在 NeurIPS’23 发表的工作「Macro Placement by Wire-Mask-Guided Black-Box Optimization」较 Google 在 Nature’21 提出方法的布线长度缩短 80% 以上,并获得 ACM SIGEVO Human-Competitive Results 奖;
针对芯片全局布局问题,该团队在 DAC’24 发表的 Poster 工作「Escaping Local Optima in Global Placement」通过变异算子缓解了当前解析式布局器易于陷入局部最优的问题,进一步提升芯片布线长度指标 15%;
针对芯片宏元件布局问题,该团队在 NeurIPS’24 发表的工作「Reinforcement Learning Policy as Macro Regulator Rather than Macro Placer」提出了新的基于强化学习的问题建模,通过训练策略对已有布局进行高效微调而不是从头摆放,保证了宏元件布局的贴边和规整,在时序和拥塞等指标上均取得了一致的显著提升;
针对芯片宏元件布局问题,该团队在 DAC’25 发表的工作「ReMaP: Macro Placement by Recursively Prototyping and Periphery-Guided Relocating」将大量专家知识引入算法,优化了宏元件和标准元件的数据流,更加符合工业界的实际需求,较当前最先进的开源 EDA 工具 OpenROAD 的方法,提升芯片最终时序指标超 65%;
若干技术在华为海思落地验证,包括攻克华为「揭榜挂帅」难题「EDA 专题难题:超高维空间多目标黑盒优化技术」,将芯片寄存器寻优效率平均提升 22.14 倍等。
https://ai.nju.edu.cn/5d/02/c17806a744706/page.htm
论文在 ICCAD-2015 竞赛数据集上进行了广泛的对比,相较于最先进的开源布局算法 DREAMPlace 4.0 做到了全部 8 个芯片的显著领先,特别是在 TNS 指标上达到 60% 的平均提升。
相较于 SOTA 方法 Differentiable-TDP 和 Distribution-TDP 算法分别达到 50% 和 40.5% 的 TNS 平均提升。
审稿人高度评价该工作,称「结果令人印象非常深刻,超过了所有先进工作」(「The results are very impressive, outperforming all state-of-the-art works」),取得显著提升(「significant improvements」)。
DATE 自 1994 年创办以来已举办 31 届,今年将于 3 月 31 日至 4 月 2 日在法国里昂召开。DATE 今年收到逾 1200 篇投稿,录用率约 25%,共评选出 4 篇最佳论文奖(获奖率仅 0.3%)。
近期,AI 技术在芯片设计中的应用受到了国际上高度关注。Google 在 Nature 提出 AlphaChip,应用于 TPU 设计,而多家 EDA 头部厂商也推出了 AI 赋能的 EDA 产品。芯片设计流程冗长复杂,存在大量复杂优化问题。
作为人工智能的重要研究分支,演化算法受达尔文进化论启发,通过模拟「交叉变异」和「自然选择」行为,可用于求解机器学习中复杂优化问题,但这类算法几乎纯粹是「启发式」:在不少情况下有效, 但为何奏效、在何种条件下奏效却并不清楚。
LAMDA 组周志华教授带领俞扬教授和钱超教授长期努力,希望能够建立起相应理论基础,并对算法设计给出指导;2019 年他们在 Springer 出版专著《Evolutionary Learning: Advances in Theories and Algorithms》,总结了他们在该方向上过去二十年的主要工作,并于 2021 年出版中文版《演化学习:理论与算法进展》。
基于这些长期理论研究,LAMDA 组近期针对芯片设计中的复杂优化问题设计出了多个原创领先算法,如:
LAMDA 组目前与华为正在进一步合作攻关,希望通过先进芯片设计缓解当前先进制造工艺局限。
参考资料:
本文来自微信公众号:新智元(ID:AI_era),原标题《南大钱超团队攻克百亿晶体管难题,斩获 EDA 顶会 2025 最佳论文!AI 学院本硕博生联手》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。