
阿里通義新一代語音模型Fun-ASR再進(jìn)化 垂直領(lǐng)域識(shí)別準(zhǔn)確率提升超15%
今日,阿里通義發(fā)布新一代端到端的語音識(shí)別大模型Fun-ASR,該模型增強(qiáng)了上下文感知和高精度語音轉(zhuǎn)寫能力,在家裝、保險(xiǎn)等多個(gè)行業(yè)場(chǎng)景的語音識(shí)別準(zhǔn)確率均提升了15%以上。
據(jù)了解,F(xiàn)un-ASR是大語言模型驅(qū)動(dòng)的語音識(shí)別算法,其基于自研語音算法和監(jiān)督微調(diào)的Qwen3訓(xùn)練,并采用前沿的模型架構(gòu)以及先進(jìn)的文本模態(tài)對(duì)齊技術(shù),可有效保護(hù)和增強(qiáng)大模型的語言處理能力;
此外,F(xiàn)un-ASR集成了RAG方案,可提供自動(dòng)化音頻信息檢索功能,最高可導(dǎo)入1000多個(gè)自定義熱詞。
基于該功能,系統(tǒng)能夠根據(jù)輸入音頻精確獲取相關(guān)領(lǐng)域熱詞、文檔及前文記錄,大幅提升特定領(lǐng)域內(nèi)的關(guān)鍵詞識(shí)別效果。
為解決語音識(shí)別不準(zhǔn)確、噪聲干擾、語種混淆以及生成幻覺等問題,通義團(tuán)隊(duì)還在ASR模型訓(xùn)練中引入了RL(強(qiáng)化學(xué)習(xí))技術(shù),此策略有效減少識(shí)別過程中的幻覺,提高整體系統(tǒng)的準(zhǔn)確性與可靠性。
值得一提的是,在四川話、粵語、閩南語等多地方言上,F(xiàn)un-ASR取得了領(lǐng)先同類產(chǎn)品的表現(xiàn)。
此外,F(xiàn)un-ASR對(duì)遠(yuǎn)場(chǎng)拾音和近場(chǎng)降噪的等多樣環(huán)境也表現(xiàn)出了良好的適應(yīng)性,無論是會(huì)議室、工位,還是超市、戶外,均可有效保證識(shí)別準(zhǔn)確率。
在訓(xùn)練數(shù)據(jù)上,F(xiàn)un-ASR基于上億小時(shí)音頻數(shù)據(jù)的訓(xùn)練,全面涵蓋了互聯(lián)網(wǎng)、科技、家裝、畜牧、汽車等十多個(gè)領(lǐng)域的專業(yè)術(shù)語,在多個(gè)垂直領(lǐng)域的識(shí)別準(zhǔn)確率顯著提升。
實(shí)測(cè)數(shù)據(jù)顯示,F(xiàn)un-ASR在保險(xiǎn)行業(yè)的準(zhǔn)確率較以往提升18%,在家裝、畜牧等行業(yè)也實(shí)現(xiàn)了15%-20%的提升。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/

隨時(shí)掌握互聯(lián)網(wǎng)精彩
- 1 中美完全可以相互成就、共同繁榮 7904577
- 2 加沙已變“死城” 7809655
- 3 暴雨中臺(tái)下只剩1名觀眾 演員仍開演 7713882
- 4 近距離感受“大國重器” 7616066
- 5 美國大豆中國訂單量仍為零 7522179
- 6 試管嬰兒患腎病 父母要求醫(yī)院擔(dān)全責(zé) 7429028
- 7 女子婚后起訴父母返還18萬彩禮 7328951
- 8 委內(nèi)瑞拉:美國“不宣而戰(zhàn)” 7237434
- 9 金價(jià)飆升 有非法淘金人井下生活兩年 7135812
- 10 穿始祖鳥是為親近自然而非看它炸山 7043525