
DeepSeek致謝騰訊技術團隊:這是一次“巨大的加速”代碼貢獻!
聲明:該文章來自(快科技)版權由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務。
DeepSeek致謝騰訊技術團隊,這是一次“巨大的加速”代碼貢獻。
據(jù)新浪報道,騰訊技術團隊針對DeepSeek開源的DeepEP通信框架進行深度優(yōu)化,使其在多種網(wǎng)絡環(huán)境下均實現(xiàn)顯著性能提升。
經(jīng)測試,優(yōu)化后的通信框架性能在RoCE網(wǎng)絡環(huán)境提升100%,IB網(wǎng)絡環(huán)境提升30%,為企業(yè)開展AI大模型訓練提供更高效的解決方案。
該技術方案獲得了DeepSeek公開致謝,稱這是一次“huge speedup(巨大的加速)”代碼貢獻。
據(jù)了解,自今年2月DeepSeek開源包括DeepEP在內(nèi)的五大代碼庫以來,該團隊便向業(yè)界展示了如何利用有限的硬件資源實現(xiàn)接近萬卡集群的性能。
在這些技術中,DeepEP憑借突破性的方法提升了300%的通信效率,成功解決了MoE架構大模型對英偉達NCCL的依賴問題。但該技術在成本較低、適用面更廣的RoCE網(wǎng)絡環(huán)境中表現(xiàn)不佳,限制了其在更廣泛場景的應用。這一痛點引發(fā)了開源社區(qū)的持續(xù)討論。
據(jù)悉,騰訊星脈網(wǎng)絡團隊在DeepEP開源后便展開技術攻關,發(fā)現(xiàn)兩大關鍵瓶頸:一是對于雙端口網(wǎng)卡帶寬利用率不足,二是CPU控制面交互存在時延。
在騰訊的技術優(yōu)化下,DeepEP不僅在RoCE網(wǎng)絡實現(xiàn)性能翻倍,反哺到IB(InfiniBand)網(wǎng)絡時更使原有通信效率再提升30%。
目前,該技術已全面開源,并成功應用于騰訊混元大模型等項目的訓練推理,在騰訊星脈與H20服務器構建的高性能環(huán)境中,這套方案展現(xiàn)出出色的通用性。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關注數(shù)據(jù)與安全,洞悉企業(yè)級服務市場:https://www.ijiandao.com/
- 1 中美完全可以相互成就、共同繁榮 7904070
- 2 加沙已變“死城” 7808224
- 3 菲將舉行大規(guī)模游行 中使館發(fā)提醒 7714640
- 4 近距離感受“大國重器” 7619309
- 5 委內(nèi)瑞拉:美國“不宣而戰(zhàn)” 7521007
- 6 中小學春秋假還沒推廣 難在哪 7425128
- 7 暴雨中臺下只剩1名觀眾 演員仍開演 7328186
- 8 始祖鳥煙花秀引爭議 日喀則通報 7235793
- 9 特朗普:我們在烏克蘭戰(zhàn)爭中賺錢了 7140748
- 10 女子婚后起訴父母返還18萬彩禮 7044899