
新聞分類
DeepSeek研究員在線爆料:過年都沒歇 還有大招!
大年初四Daya Guo發(fā)了一條推文,透露了春節(jié)期間讓他最興奮的事情,親眼見證了R1-Zero模型性能曲線的 “持續(xù)增長”,并且直言感受到了 強化學(xué)習(xí)(RL)的強大力量。
Daya Guo回復(fù)了網(wǎng)友有關(guān)DeepSeek R1的一些問題,以及接下來的公司的計劃,只能說DeepSeek的R1僅僅只是開始,內(nèi)部研究還在快速推進(jìn),DeepSeek的研究員過年都沒歇,一直在爆肝推進(jìn)研究,接下來DeepSeek還有大招。
網(wǎng)友提問:“如果不是秘密的話:這次RL訓(xùn)練跑了多久?”對此,Daya Guo表示,660B參數(shù)的R1-Zero和R1是在V3發(fā)布之后才開始跑的,訓(xùn)練大約花了2-3周。
此外,他還表示在嘗試將R1應(yīng)用于形式化證明環(huán)境,希望盡快向社區(qū)發(fā)布更好的模型。聽Daya Guo的意思,他們在這方面已經(jīng)有進(jìn)展,未來可能會有更重磅的模型發(fā)布!期待值拉滿!
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/

隨時掌握互聯(lián)網(wǎng)精彩
排名
熱點
搜索指數(shù)
- 1 豐收時節(jié)感悟總書記的“三農(nóng)”情懷 7904877
- 2 深圳機場飛機被“五花大綁”防臺風(fēng) 7808715
- 3 疑追風(fēng)觀浪 香港一對母子被卷入海 7712930
- 4 盤點新疆的全國之“最” 7618548
- 5 驢肉價格上漲 中國正面臨缺驢問題 7523915
- 6 用一條毛巾避免大窗玻璃離家出走 7425859
- 7 護(hù)網(wǎng):社交賬號不受控制?木馬在作祟 7332880
- 8 鴻蒙智行秋季新品發(fā)布會 7237061
- 9 “晚1秒就撞 我肯定不慣著他” 7142530
- 10 中國每年吃掉約70億只白羽肉雞 7047108