全球首个:中国电信完成千卡、千亿参数模型 500 公里联合训练试商用
1 月 23 日消息,中国电信官方今日宣布,中国电信研究院、天翼云、北京电信成功完成业内首个 1024 卡千亿参数商用大模型分布式联合训练真实用户试商用。
中国电信通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了 500 公里长距互联分布式训练,而且训练性能达到单数据中心的 97% 以上。
从官方获悉,本次试商用基于北京现网 800G 广域智联无损网络以及息壤一站式智算服务平台开展,在互联距离、带宽收敛比以及模型参数方面均产生突破,实现了多数据中心互联及资源整合支持商用模型分布式联合训练。