
華為官宣!DeepSeek系列模型正式上線昇騰社區(qū)
聲明:該文章來自(快科技)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
今日,華為宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開箱即用。
據(jù)了解,DeepSeek-V3首個(gè)版本于2024年上線并同步開源,為自研MoE模型,671B 參數(shù),激活37B,在14.8T token上進(jìn)行了預(yù)訓(xùn)練。
據(jù)DeepSeek介紹,DeepSeek-V3多項(xiàng)評(píng)測(cè)成績超越了Qwen2.5-72B和Llama-3.1-405B 等其他開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
以下以Deepseek-V3為例,演示在昇騰社區(qū)如何高效獲取模型及使用
一、硬件要求
部署DeepSeek-V3模型需配置4臺(tái)Atlas 800I A2(8*64G)服務(wù)器資源
二、模型調(diào)用實(shí)踐
1、權(quán)重轉(zhuǎn)換
GPU:
NPU:
2、加載鏡像
在昇騰社區(qū)/開發(fā)資源下載適配DeepSeek-V3的鏡像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,請(qǐng)使用docker images命令確認(rèn)查找具體鏡像名稱與標(biāo)簽。
3、容器啟動(dòng)
提供的MindIE鏡像預(yù)置了DeepSeek-V3模型推理腳本,從您信任的來源自行獲取權(quán)重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執(zhí)行權(quán)限為750,啟動(dòng)容器。
4、服務(wù)化測(cè)試
配置服務(wù)化環(huán)境變量,expandable_segments-使能內(nèi)存池?cái)U(kuò)展段功能,即虛擬內(nèi)存特性。
修改服務(wù)化參數(shù)
拉起服務(wù)化
出現(xiàn)“Daemon start success!”,則認(rèn)為服務(wù)成功啟動(dòng)。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/
- 1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904577
- 2 央視曝光直播間“高端四件套”貓膩 7808727
- 3 以總理:絕不會(huì)有巴勒斯坦國 等著瞧 7714402
- 4 長春航空展這些“首次”不要錯(cuò)過 7616292
- 5 始祖鳥“惹火” 安踏“惹禍” 7520223
- 6 浙江大學(xué)教授被留置 持股市值31億 7426648
- 7 租客長租15年不到1年就被勸退 7334229
- 8 9月23日晚8點(diǎn)將上演“龍收尾”天象 7238228
- 9 內(nèi)蒙古一地集中采集男性居民血樣 7142595
- 10 風(fēng)王“樺加沙”體型超整個(gè)廣東省 7045495