黄色网站入口国产美女,精品国产欧美另类一区,国产一区二区美女自慰,日日摸夜夜添无码国产

<rp id="re5b5"><optgroup id="re5b5"></optgroup></rp>

<span id="re5b5"><meter id="re5b5"></meter></span>

選擇你喜歡的標(biāo)簽
我們會為你匹配適合你的網(wǎng)址導(dǎo)航

跳過將刪除所有初始化信息

DeepSeek開源周才第二天有些公司就已經(jīng)坐不住了

智能 2025-02-26 08:15

聲明：該文章來自（差評）版權(quán)由原作者所有，K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。

哥幾個，走過路過別錯過，今天的 AI 圈可以說是格外熱鬧了。

真正?“Open”?的 DeepSeek ，打出開源周的第二發(fā)炮彈，短短幾個小時就已經(jīng)在 GitHub 上，收獲了 3k 多星。

?“?開源老兵?”?阿里通義千問也沒閑著，推出了 QwQ-Max-Preview 深度思考模型，展示思維鏈，還支持聯(lián)網(wǎng)搜索。

還有凌晨兩點多，大伙兒可能還在做夢的時候，大洋彼岸的 Anthropic 也給模型升級換代了。號稱他們迄今為止最聰明的 Claude 3.7 Sonnet ，還是個推理模型和傳統(tǒng)模型的?“?混血?”?。

我估計今天那些專門做模型測評的博主，都快要忙不過來了吧。。。

再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有一戰(zhàn)，但沒想到，來得這么快。

光這么說大伙兒估計也沒感受，今天咱們就挨個來看看， AI 圈子到底是怎么個熱鬧法。

先把視線，放在新一代?“?開源戰(zhàn)神?” DeepSeek 身上。

用 R1 教育了一遍市場之后， DeepSeek 這兩天，干脆開源了個徹底， 5 天時間，每天發(fā)一個代碼庫。

第一天，整了個?FlashMLA?，這玩意兒專門針對英偉達的?Hoppers GPU?（?比如?H100?、?H800?），進行了效率優(yōu)化，通俗點說就是榨干?GPU?的最后一滴性能。

今天開源的，則是 DeepEP 通信庫。

根據(jù)官方的介紹，這是一個專門為專家混合（ MoE ）和專家并行（ EP ）設(shè)計的通信庫。太復(fù)雜的咱也不去深究，大白話就是通信庫可以讓?“?專家們?”?的交流更快速、高效。

盲猜一波，國內(nèi)那些個手里有 Hoppers GPU ，還是研究 MOE 模型的 AI 公司，可能已經(jīng)沖了。

不知道明天 DeepSeek 又會開源哪個代碼庫，但光憑他們這敞亮、真誠的態(tài)度，圈粉就是分分鐘的事兒，在 DeepSeek 的評論區(qū)底下，世超已經(jīng)看到不只一位老哥，對著 OpenAI 貼臉開大了。

不過說到這，可能會有差友疑惑，網(wǎng)上整天嚷嚷著開源，這跟咱到底有啥關(guān)系？

這么說吧， DeepSeek R1 開源以后，大大小小的私企、國企都吻了上來，還有高校甚至政府機關(guān)，不是已經(jīng)接入 DeepSeek ，就是在接入的路上。

經(jīng)過大規(guī)模的模型部署后，下一步就是生態(tài)的構(gòu)建、產(chǎn)業(yè)的融合，就像當(dāng)年的?“?互聯(lián)網(wǎng)?+”?， AI 同樣也可以成為基礎(chǔ)設(shè)施，融入到咱們生活的方方面面。

很難說，閉源模型在構(gòu)建生態(tài)這一步，能不能在短時間內(nèi)達到像 DeepSeek 這樣的效果。

所以這一切，我們可能都得感謝開源。

再來看阿里通義千問的 QwQ-Max-Preview ，是個推理模型。阿里也算是國內(nèi)第一個，推出推理模型的頭部大廠。

根據(jù)官方的說法，這是一個基于 Qwen2.5-Max 的推理模型，有很強的數(shù)學(xué)理解、編碼能力，但目前還只是預(yù)覽版。

世超在第一時間簡單試了試， QwQ 也有思維鏈的展示。（不得不說，QwQ這名字有點可愛。。）

問它一道數(shù)學(xué)競賽真題，最后的答案倒是對了，就是思考時間稍微久了些，我粗略估計思考了得有兩分鐘出頭。

這道題問 DeepSeek R1 ，它的思考過程跟 QwQ 很相似，也是分析了多種可能性，但 R1 勝在推理的速度稍微快一些（ 112 秒?）。

而同樣的題目，我又問了今天的另外一位主角 Claude 3.7 Sonnet 。

只能說，又快又準(zhǔn)。

但值得注意的是， Claude 3.7 Sonnet 是個混合模型，一個模型有標(biāo)準(zhǔn)和擴展兩種模式。

如果你想看到大模型的推理步驟、思考過程，那就得選擴展模式。

如大伙兒所見，體驗 Claude 3.7 Sonnet 的推理能力，是另外的價格。

世超還找了幾個外網(wǎng)的實測案例，發(fā)現(xiàn) Claude 的代碼能力依然強得可怕。

同一組提示詞喂給 Claude 3.7 Sonnet 和 Grok 3 ，這是 Claude 3.7 Sonnet 的結(jié)果。

再來看 Grok 3 的，直接被碾壓。

即使 DeepSeek 加入戰(zhàn)斗，也被秒了。。。

反正看下來， AI 發(fā)展到今天，已經(jīng)有點超乎世超的想象了。

雖說今天這三則新聞放一起，打眼一看，好像沒啥特別大的關(guān)聯(lián)。

但稍微一提煉你就會發(fā)現(xiàn)，它們恰好體現(xiàn)了當(dāng)前人工智能發(fā)展的趨勢：開源陣營不斷壯大，推理模型成為主流。

模型的開源和閉源之爭， DeepSeek 一出手，即便是奧特曼，也不得不親口承認， OpenAI 的閉源策略?“?站在了歷史錯誤的一邊?”?。

像 Llama 家族這種具有里程碑意義的模型，對于開源社區(qū)的重要性無需多言。

而除了 DeepSeek 和 Meta ，阿里通義千問、 xAI ，還有陸續(xù)擁抱開源的百度、 Minimax 和階躍星辰，開源陣營肉眼可見在壯大。

另外一邊，前兩年大模型是不是老強調(diào)自己的長文本能力，慢慢的開始卷文生圖、文生視頻還有語音交互這些多模態(tài)，再到最近，模型跑分全是數(shù)學(xué)、代碼。

真就應(yīng)了那句話， AI 一天，人間一年。

照這么下去，可能哪天 OpenAI 宣布開源，又或者誰家突然宣布把 AGI 整出來了，我都不會覺得驚訝了。

責(zé)任編輯：隨心

文章內(nèi)容舉報

關(guān)注我們

[超站]友情鏈接：

四季很好，只要有你，文娛排行榜：https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全，洞悉企業(yè)級服務(wù)市場：https://www.ijiandao.com/

*文章為作者獨立觀點，不代表 0XUCN 立場

本文由愛跳舞的小羊發(fā)表，轉(zhuǎn)載此文章須經(jīng)作者同意，并請附上出處(0XUCN)及本頁鏈接。

原文鏈接 http://jjbxz.cn/article/intelnet/intelligent/56727.html

差評 DeepEP Grok 3 DeepSeek R1 o3 mini DeepSeek FlashMLA Hoppers GPU Anthropic OpenAI QwQ-Max-Preview

圖庫

百度熱搜榜

排名熱點搜索指數(shù)

1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904541
2 今年最強臺風(fēng)來襲 7808563
3 澳加英宣布承認巴勒斯坦國 7714289
4 長春航空展這些“首次”不要錯過 7617856
5 43歲二胎媽媽患阿爾茨海默病 7520539
6 iPhone 17橙色斜挎掛繩賣斷貨 7428353
7 老奶奶去世3年鄰居幫打掃門前落葉 7330865
8 三所“零近視”小學(xué)帶來的啟示 7236064
9 “樺加沙”致災(zāi)程度堪比“山竹” 7139942
10 女兒發(fā)現(xiàn)父親500多萬遺產(chǎn)用于保健 7048211

bgame.cn

分享文章

微信
微信掃碼分享

新浪微博
離開
復(fù)制鏈接
返回頂部