
消息稱DeepSeek R2下月發(fā):成本較GPT降97%、華為芯片性能不輸英偉達(dá)
據(jù)國內(nèi)媒體報(bào)道稱,深度求索可能會(huì)在下個(gè)月有所行動(dòng),推出下一代AI大模型DeepSeek-R2。
報(bào)道稱,DeepSeek-R2大模型將會(huì)采用一種更先進(jìn)的混合專家模型(MoE),其結(jié)合了更加智能的門控網(wǎng)絡(luò)層(Gating Network)以優(yōu)化高負(fù)載推理任務(wù)的性能。
有分析師預(yù)計(jì),DeepSeek-R2的定價(jià)可能顯著低于OpenAI同類產(chǎn)品,預(yù)示著其可能顛覆現(xiàn)有AI服務(wù)的定價(jià)模式。
此外,還有相關(guān)消息顯示,DeepSeek-R2預(yù)計(jì)比GPT-4成本下降97%;并且是在昇騰卡上做的訓(xùn)練,主打一個(gè)全方位全產(chǎn)業(yè)鏈的自主可控。
據(jù)相關(guān)人士透露的情況,DeepSeek-R2的總參數(shù)量可能會(huì)達(dá)到1.2萬億,比DeepSeek-R1的6710億參數(shù)增加大約一倍。
DeepSeek-R2是一款基于華為昇騰910B(Ascend 910B)芯片集群訓(xùn)練的模型,在FP16精度下達(dá)到512PetaFLOPS的計(jì)算能力,芯片使用效率為82%。
據(jù)華為實(shí)驗(yàn)室統(tǒng)計(jì),這個(gè)性能相當(dāng)于英偉達(dá)上一代A100訓(xùn)練集群的91%左右。至于這些是不是真實(shí)的,還有待觀察,但看起來確實(shí)更強(qiáng)大、更自主了。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場:https://www.ijiandao.com/

隨時(shí)掌握互聯(lián)網(wǎng)精彩
- 1 習(xí)近平接見新疆各族各界代表 7904825
- 2 樺加沙風(fēng)眼內(nèi)部曝光 拍攝部門:震撼 7808382
- 3 飛機(jī)狂風(fēng)中降落 機(jī)翼險(xiǎn)些砸地 7711810
- 4 援疆的山海深情 跨越千里萬里 7615978
- 5 馬克龍被美警察攔下 當(dāng)場打給特朗普 7521902
- 6 臺(tái)風(fēng)“樺加沙”影響有多大?解讀來了 7426244
- 7 深圳機(jī)場飛機(jī)被“五花大綁”防臺(tái)風(fēng) 7334113
- 8 盒馬最難吃甜品被臺(tái)風(fēng)選出來了 7236187
- 9 為避臺(tái)風(fēng) 小區(qū)近百輛車停上大橋 7143890
- 10 特朗普警告孕婦別吃“泰諾” 7041282