
國產(chǎn)中文大語言模型“天河天元”發(fā)布:由天河超算訓(xùn)練
聲明:該文章來自(快科技)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
5月21日消息,5月18日,2023第七屆世界智能大會(huì)于國家會(huì)展中心(天津)正式開始。而天河新一代超級計(jì)算機(jī)是中國新一代百億億次超級計(jì)算機(jī),也在此次展會(huì)迎來首次亮相。
同時(shí),為充分發(fā)揮超算在算力方面的優(yōu)勢,推動(dòng)國產(chǎn)異構(gòu)超級計(jì)算機(jī)平臺在AI應(yīng)用開發(fā)和服務(wù)領(lǐng)域中的應(yīng)用。
國家超算天津中心在大會(huì)上發(fā)布了“天河E級智能計(jì)算開放創(chuàng)新平臺”和“天河天元大模型”。
據(jù)介紹,中文大語言模型的數(shù)據(jù)集非常稀缺。國家超算天津中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓(xùn)練數(shù)據(jù)、中文小說數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù),以及專業(yè)領(lǐng)域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集。
訓(xùn)練數(shù)據(jù)集總token數(shù)達(dá)到350B,最終訓(xùn)練打造出了自己的中文語言大模型——天河天元大模型。
據(jù)悉,“天河E級智能計(jì)算開放創(chuàng)新平臺”將帶來突破百億億次的跨模態(tài)的超級計(jì)算算力,支撐傳統(tǒng)的科學(xué)工程計(jì)算,并服務(wù)智能混合計(jì)算,打造全方位的算力賦能創(chuàng)新和數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展載體。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/
- 1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904577
- 2 央視曝光直播間“高端四件套”貓膩 7808727
- 3 以總理:絕不會(huì)有巴勒斯坦國 等著瞧 7714402
- 4 長春航空展這些“首次”不要錯(cuò)過 7616292
- 5 始祖鳥“惹火” 安踏“惹禍” 7520223
- 6 浙江大學(xué)教授被留置 持股市值31億 7426648
- 7 租客長租15年不到1年就被勸退 7334229
- 8 9月23日晚8點(diǎn)將上演“龍收尾”天象 7238228
- 9 內(nèi)蒙古一地集中采集男性居民血樣 7142595
- 10 風(fēng)王“樺加沙”體型超整個(gè)廣東省 7045495