黄色网站入口国产美女,精品国产欧美另类一区,国产一区二区美女自慰,日日摸夜夜添无码国产

<span id="seybm"><form id="seybm"></form></span>

選擇你喜歡的標(biāo)簽
我們會(huì)為你匹配適合你的網(wǎng)址導(dǎo)航

確認(rèn) 跳過

跳過將刪除所有初始化信息

您的位置：0XUCN > 資訊 > 智能

新聞分類

科技
互聯(lián)網(wǎng)
- 融資
- 新零售
- 企服
- 共享
- 教育
- 醫(yī)療
- 物聯(lián)網(wǎng)
- 安全
- 智能
- 政策
- 動(dòng)態(tài)
- 技術(shù)
- 軟件
娛樂
- 電影
- 電視劇
- 綜藝
- 動(dòng)漫
- 音樂
- 明星
- 網(wǎng)娛
- 韓娛
- 熱點(diǎn)
- 值得買
游戲
- 手游
- 端游
- 頁游
- 主機(jī)
- 公告
- 攻略
體育
- 業(yè)界
- 足球
- 籃球
- 彩票
汽車
時(shí)尚
- 奢侈品
- 時(shí)裝
- 美妝
- 美體
健康
- 疾病
- 兩性
- 健美
- 醫(yī)美
- 養(yǎng)生
- 新冠
旅游
母嬰
- 孕產(chǎn)
- 哺育
- 早教
- 親子
- 萌娃
房產(chǎn)
- 資訊
- 家居
- 家電
教育
- 高考
- 考研
- 公考
- 留學(xué)
- 高校
- 小初高
寵物
其它
造數(shù)

美團(tuán)發(fā)布并開源混合專家模型：5600億參數(shù) 只激活5％就有奇效

智能 PRO 稿源：快科技 2025-09-01 14:22

美團(tuán)宣布正式發(fā)布LongCat-Flash-Chat AI模型，并同步開源，采用創(chuàng)新性混合專家(MoE)，總參數(shù)量達(dá)560B(5600億)，實(shí)際激活參數(shù)18.6-31.3B，平均僅27B，從而實(shí)現(xiàn)計(jì)算效率與性能的雙重優(yōu)化。

美團(tuán)聲稱，根據(jù)多項(xiàng)基準(zhǔn)測試綜合評(píng)估，作為一款非思考型基礎(chǔ)模型，LongCat-Flash-Chat在僅激活少量參數(shù)的前提下，性能就可以比肩當(dāng)下領(lǐng)先的主流模型，尤其在智能體任務(wù)中具備突出優(yōu)勢。

同時(shí)，因?yàn)槊嫦蛲评硇实脑O(shè)計(jì)和創(chuàng)新，LongCat-Flash-Chat具有明顯更快的推理速度，更適合于耗時(shí)較長的復(fù)雜智能體應(yīng)用。

美團(tuán)LongCat-Flash在架構(gòu)層面引入“零計(jì)算專家（Zero-Computation Experts）”機(jī)制，總參數(shù)量560B，每token依據(jù)上下文需求僅激活18.6-31.3B參數(shù)，實(shí)現(xiàn)算力按需分配和高效利用。

為控制總算力消耗，訓(xùn)練過程采用PID控制器實(shí)時(shí)微調(diào)專家偏置，將單個(gè)token的平均激活量穩(wěn)定在約27B。

此外，LongCat-Flash在層間鋪設(shè)跨層通道，使MoE的通信和計(jì)算能很大程度上并行，極大提高了訓(xùn)練和推理效率。

配合定制化的底層優(yōu)化，LongCat-Flash在30天內(nèi)完成了高效訓(xùn)練，并在H800 GPU上實(shí)現(xiàn)單用戶100+ tokens/s的推理速度。

LongCat-Flash還對(duì)常用大模型組件和訓(xùn)練方式進(jìn)行了改進(jìn)，使用了超參遷移和模型層疊加的方式進(jìn)行訓(xùn)練，并結(jié)合了多項(xiàng)策略保證訓(xùn)練穩(wěn)定性，使得訓(xùn)練全程高效且順利。

針對(duì)智能體（Agentic）能力，LongCat-Flash自建了Agentic評(píng)測集指導(dǎo)數(shù)據(jù)策略，并在訓(xùn)練全流程進(jìn)行了全面的優(yōu)化，包括使用多智能體方法生成多樣化高質(zhì)量的軌跡數(shù)據(jù)等，實(shí)現(xiàn)了優(yōu)異的智能體能力。

通過算法和工程層面的聯(lián)合設(shè)計(jì)，LongCat-Flash在理論上的成本和速度都大幅領(lǐng)先行業(yè)同等規(guī)模、甚至規(guī)模更小的模型。

通過系統(tǒng)優(yōu)化，LongCat-Flash在H800上達(dá)成了100 tokens/s的生成速度，同時(shí)輸出成本低至5元/百萬token。

LongCat-Flash架構(gòu)圖

通用領(lǐng)域知識(shí)方面，LongCat-Flash在ArenaHard-V2基準(zhǔn)測試中取得86.50的優(yōu)異成績，位列所有評(píng)估模型中的第二名。

在基礎(chǔ)基準(zhǔn)測試中，MMLU（多任務(wù)語言理解基準(zhǔn)）得分為89.71，CEval（中文通用能力評(píng)估基準(zhǔn)）得分為 90.44。

這些成績可與目前國內(nèi)領(lǐng)先的模型比肩，且其參數(shù)規(guī)模少于DeepSeek-V3.1、Kimi-K2等產(chǎn)品。

智能體工具使用方面，LongCat-Flash即便與參數(shù)規(guī)模更大的模型相比，在τ2-Bench（智能體工具使用基準(zhǔn)）中的表現(xiàn)仍超越其他模型；高復(fù)雜度場景下，在VitaBench（復(fù)雜場景智能體基準(zhǔn)）中以24.30分位列第一。

編程方面，LongCat-Flash在TerminalBench（終端命令行任務(wù)基準(zhǔn)）中，以39.51的得分位列第二，在SWE-Bench-Verified（軟件工程師能力驗(yàn)證基準(zhǔn)）中得分為 60.4。

指令遵循方面，LongCat-Flash在IFEval（指令遵循評(píng)估基準(zhǔn)）中以89.65的得分位列第一，在COLLIE（中文指令遵循基準(zhǔn)）和 Meeseeks-zh（中文多場景指令基準(zhǔn)）中成績分別為 57.10 和 43.03。

LongCat-Flash基準(zhǔn)測試性能

美團(tuán)同步提供了分別基于SGLang和vLLM的兩種高效部署方案。

以下為使用SGLang進(jìn)行單機(jī)部署的示例：

python3 -m sglang.launch_server \

? ? --model meituan-longcat/LongCat-Flash-Chat-FP8 \

? ? --trust-remote-code \

? ? --attention-backend flashinfer \

? ? --enable-ep-moe \

? ? --tp 8

現(xiàn)在前往https://longcat.ai/ ，就能立即與LongCat-Flash-Chat開啟對(duì)話。?

開源平臺(tái)地址：

Hugging Face：

https://huggingface.co/meituan-longcat/LongCat-Flash-Chat

Github：

https://github.com/meituan-longcat/LongCat-Flash-Chat

開源倉庫統(tǒng)一采用MIT License，并允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。

0XU.CN

[超站]友情鏈接：

四季很好，只要有你，文娛排行榜：https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全，洞悉企業(yè)級(jí)服務(wù)市場：https://www.ijiandao.com/

*文章為作者獨(dú)立觀點(diǎn)，不代表 0XUCN 立場

本文由一路順風(fēng)半路栽坑。發(fā)表，轉(zhuǎn)載此文章須經(jīng)作者同意，并請(qǐng)附上出處(0XUCN)及本頁鏈接。

原文鏈接 http://jjbxz.cn/article/intelnet/intelligent/63069.html

快科技美團(tuán) 混合專家模型 LongCat-Flash-Chat

圖庫

一路順風(fēng)半路栽坑。

公眾號(hào)

關(guān)注網(wǎng)絡(luò)尖刀微信公眾號(hào)
隨時(shí)掌握互聯(lián)網(wǎng)精彩

贊助鏈接

fastposter

processon

itrust

SSL

K2CMS

百度熱搜榜

排名熱點(diǎn) 搜索指數(shù)

1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904633
2 今年最強(qiáng)臺(tái)風(fēng)來襲 7808843
3 澳加英宣布承認(rèn)巴勒斯坦國 7713285
4 長春航空展這些“首次”不要錯(cuò)過 7616028
5 43歲二胎媽媽患阿爾茨海默病 7521510
6 iPhone 17橙色斜挎掛繩賣斷貨 7428535
7 老奶奶去世3年鄰居幫打掃門前落葉 7329280
8 三所“零近視”小學(xué)帶來的啟示 7239197
9 女兒發(fā)現(xiàn)父親500多萬遺產(chǎn)用于保健 7143995
10 英國航母從南海“溜了” 7047149

分享文章

微信
微信掃碼分享

新浪微博
離開
復(fù)制鏈接
返回頂部