
百川智能王小川:美國OpenAI要把1000萬個GPU連接起來做大模型 這種想法像登月一樣
在今天上午舉辦的2023云棲大會上,百川智能創(chuàng)始人兼CEO王小川發(fā)表演講稱,今年年底之前,國內(nèi)會有幾家公司能夠做到GPT3.5的水平,明年國內(nèi)會有若干款超級應用。
王小川表示,百川智能做大模型的理念是“理想上慢一步,落地上快三步”。4月下場之后,百川在兩個月時間就完成了第一個70億參數(shù)的模型的發(fā)布,行業(yè)一般需要半年,比預期時間節(jié)省了三倍。
他直言,在大模型領域,確實得承認跟美國存在差距。他預計今年年底之前國內(nèi)會有幾家公司能達到GPT 3.5的水平,到明年也有信心能夠達到GPT4.0的水平,但是達到之后,可能很難去超越他們。
他在發(fā)言中還談到在美國與OpenAI交流時了解到的情況。
“他們在正在設計一個把1000萬顆GPU連在一起做模型的技術。咱們做GPT3.5的時候用了4000顆GPU,做GPT4的時候是25000顆,英偉達一年生產(chǎn)能力才100萬顆,而OpenAI在設計把1000萬個GPU連接起來,這樣一種想法像登月一樣。“
“我對他們充滿了敬畏。我更自豪的地方是,我們在做應用方面可能比美國走得更快。”王小川表示。
王小川認為,在做應用方面,中國企業(yè)會走得很快?;诂F(xiàn)在已有的技術,相信中國明年有若干款超級應用。
公開資料顯示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川創(chuàng)立。其核心團隊來自搜狗、Google、騰訊、百度、華為、微軟、字節(jié)等知名科技公司,目前團隊規(guī)模170余人,研發(fā)人員占比超80%。
成立半年,百川智能便接連發(fā)布baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B兩款閉源大模型,平均每28天就會發(fā)布一款新的大模型。
10月30日,百川智能發(fā)布Baichuan2-192K大模型,其上下文窗口長度達192K,是目前全球最長的上下文窗口,能夠處理約35萬個漢字,是目前支持長上下文窗口最優(yōu)秀大模型Claude2(支持100K上下文窗口,實測約8萬字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,實測約 2.5萬字)的14倍。
據(jù)悉,Baichuan2-192K現(xiàn)已正式開啟內(nèi)測,以API(應用程序接口)調(diào)用的方式開放給核心合作方,目前已經(jīng)與財經(jīng)類媒體及律師事務所等機構達成了合作,將全球領先的長上下文能力應用到了傳媒、金融、法律等具體場景當中,不久后將全面開放。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關注數(shù)據(jù)與安全,洞悉企業(yè)級服務市場:https://www.ijiandao.com/

隨時掌握互聯(lián)網(wǎng)精彩
- 1 傳統(tǒng)產(chǎn)業(yè)“綠”動“智”變 7904880
- 2 廣東氣象罕見提醒:做好巨災防御準備 7809254
- 3 “南天門計劃”有50萬字了 7713075
- 4 殲-20的首次靜態(tài)展示有何重要意義 7619530
- 5 女兒發(fā)現(xiàn)父親500多萬遺產(chǎn)用于保健 7522309
- 6 始祖鳥事件后 多戶外品牌集體表態(tài) 7425036
- 7 菲軍方宣布“紅色警戒”狀態(tài) 7329032
- 8 大爺蹲點進周杰倫演唱會賣水:5元1瓶 7233455
- 9 為阻止印籍員工返美 美國人組團搶票 7142115
- 10 多部門推進預制菜國家標準制定 7045524