中國聯通實現全球最長距離大模型異構混訓突破

2025-07-21 來源：愛集微原創文章

138

在2025年中國聯通合作伙伴大會期間，中國聯通研究院聯合上海人工智能實驗室等合作伙伴，于7月19日正式發布了全球最長距離大模型異構混訓試驗成果。

隨著人工智能技術的迅猛發展和大模型時代的到來，模型訓練對算力基礎設施的高吞吐、低時延、高性能提出了更高要求。然而，當前算力資源呈現出異構化和多中心化的格局，面臨著跨域資源互聯互通機制不健全、長距離傳輸存在帶寬與時延瓶頸、異構資源統一調度與高效融合能力有限等挑戰。

中國聯通攜手上海人工智能實驗室、阿里云、浪潮、基流科技、加佳科技等行業合作伙伴，針對超大模型跨域訓練和碎片化算力整合需求，依托“算力智聯網 AINet”長距無損傳輸技術優勢，結合上海人工智能實驗室“DeepLink”超大規模跨域混訓技術方案，在上海臨港和山東濟南鮑山數據中心間構建了長度超1500公里的跨域異構混訓系統。

通過自動調整多種并行策略和跨域收斂比下MoE模型和Dense模型的參數配置，聯合團隊成功完成了超1500公里跨域的千億參數AI大模型異構混訓試驗。經驗證，等效算力可達單芯片單集群等效算力的95%以上。

在算力互聯層面，項目采用了聯通自研內置長距RDMA協議棧的RoCE交換機，兼顧數據中心內和數據中心間高性能網絡需求；在算力調度與資源管理層面，通過聯通“智馭”平臺實現對跨域網絡和集群的統一管控及任務調度；在算力協同層面，基于DeepLink在訓練加速、異構通信、并行策略等核心技術，實現了千億參數大模型在超長距離異構GPU環境下的高效訓練。

此次試驗的成功，不僅驗證了中國聯通在長距離算力協同方面的技術實力，也為未來大規模AI模型的跨域訓練提供了有力支撐。隨著這一技術的進一步應用和推廣，有望推動人工智能領域的快速發展，助力各行各業實現智能化轉型。

行業動態

2025年全球及中國儲能電池出貨量預測分析（圖）

首款“印度制造”芯片將于2025年底實現量產

7月前20天韓國半導體出口額同比增長16.5%

熱讀文章

苗圩出席統籌推進疫情防控和產業轉型升級促進制造業通信業穩定發展發布會

一圖讀懂2020年《政府工作報告》

工業富聯：擬7763萬美元收購鴻海精密美國子公司相關資產