
新聞分類
Logics-Parsing – 阿里開源的端到端文檔解析模型
Logics-Parsing是什么
Logics-Parsing 是阿里巴巴開源的端到端文檔解析模型,基于 Qwen2.5-VL-7B。通過強化學習優(yōu)化文檔布局分析和閱讀順序推斷,能將 PDF 圖像轉換為結構化 HTML 輸出,支持多種內容類型,包括普通文本、數(shù)學公式、表格、化學公式和手寫中文字符。采用兩階段訓練:第一階段是監(jiān)督微調,學習生成結構化輸出;第二階段是布局為中心的強化學習,優(yōu)化文本準確性、布局定位和閱讀順序。在 LogicsParsingBench 基準測試中表現(xiàn)出色,尤其在純文本、化學結構和手寫內容解析方面優(yōu)于其他方法。
Logics-Parsing的主要功能
- 端到端文檔解析:Logics-Parsing 能將 PDF 圖像直接轉換為結構化的 HTML 輸出,支持多種內容類型,包括普通文本、數(shù)學公式、表格、化學公式和手寫中文字符。
- 強化學習優(yōu)化:采用兩階段訓練方法,第一階段通過監(jiān)督微調學習生成結構化輸出,第二階段以布局為中心的強化學習優(yōu)化文本準確性、布局定位和閱讀順序。
- 高性能表現(xiàn):在 LogicsParsingBench 基準測試中,Logics-Parsing 在多個文檔類型上表現(xiàn)出色,尤其在純文本、化學結構和手寫內容解析方面優(yōu)于其他方法。
- 應用場景廣泛:適用于學術論文、復雜多欄文檔、報紙、海報等多種復雜文檔類型,能處理多欄排版、數(shù)學公式和化學結構。
Logics-Parsing的技術原理
- 基于 Qwen2.5-VL-7B:Logics-Parsing 以強大的 Qwen2.5-VL-7B 模型為基礎,繼承了其在視覺和語言處理方面的優(yōu)勢。
- 兩階段訓練:第一階段是監(jiān)督微調,模型學習生成結構化的 HTML 輸出;第二階段是布局為中心的強化學習,通過文本準確性、布局定位和閱讀順序三個獎勵組件優(yōu)化模型。
- 強化學習優(yōu)化:通過強化學習,模型能更好地理解文檔的布局和內容的邏輯順序,生成更準確的結構化輸出。
- 結構化 HTML 輸出:模型能將文檔圖像轉換為結構化的 HTML 格式,保留文檔的邏輯結構,每個內容塊都有類別、邊界框坐標和 OCR 文本標簽。
- 高級內容識別:模型能準確識別復雜科學公式、化學結構和手寫中文字符,將化學結構轉換為標準的 SMILES 格式。
- 自動去除無關元素:模型能自動識別并過濾掉頁眉、頁腳等無關元素,專注于文檔的核心內容。
Logics-Parsing的項目地址
Github倉庫:https://github.com/alibaba/Logics-Parsing
HuggingFace模型庫:https://huggingface.co/Logics-MLLM/Logics-Parsing
arXiv技術論文:https://arxiv.org/pdf/2509.19760
Logics-Parsing的應用場景
- 學術論文解析:能處理包含多欄排版、數(shù)學公式和化學結構的學術論文,準確提取關鍵信息并生成結構化輸出。
- 復雜多欄文檔:適用于報紙、海報等復雜多欄文檔,有效解析布局并提取內容。
- 手寫文檔識別:支持手寫中文字符的識別和解析,可應用于手寫筆記、試卷等場景。
- 化學文檔處理:準確識別化學公式并轉換為標準 SMILES 格式,適用于化學領域的文檔解析。
- 數(shù)學文檔解析:能處理包含復雜數(shù)學公式的文檔,如數(shù)學教材、科研論文等,提供準確的公式解析。
- 多語言文檔支持:支持多種語言的文檔解析,適用于國際化文檔處理場景。
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關注數(shù)據(jù)與安全,洞悉企業(yè)級服務市場:https://www.ijiandao.com/

隨時掌握互聯(lián)網(wǎng)精彩
排名
熱點
搜索指數(shù)
- 1 家和萬事興 7904209
- 2 收花生找到姥姥丟了12年的金鐲子 7808467
- 3 賣不完的月餅都去哪兒了 7714222
- 4 中秋遇國慶 祝愿家國共團圓 7617659
- 5 妻子抄起油桶砸丈夫 網(wǎng)友卻一致好評 7524188
- 6 波蘭女子只吃水果 去世前體重僅44斤 7426581
- 7 網(wǎng)警提醒:假期過半安全不松懈 7329802
- 8 航天員的中秋大餐吃啥?菜品曝光 7238319
- 9 核電站竟然還有產(chǎn)珍珠的副業(yè) 7144073
- 10 牛彈琴:這場血腥戰(zhàn)爭終于打不下去了 7039816