
RAGFlow:基于OCR和文檔解析的下一代 RAG 引擎
聲明:該文章由作者(望彩云)發(fā)表,轉(zhuǎn)載此文章須經(jīng)作者同意并請(qǐng)附上出處(0XUCN)及本頁(yè)鏈接。。
在人工智能的浪潮中,檢索增強(qiáng)生成(Retrieval-Augmented Generation,簡(jiǎn)稱(chēng)RAG)技術(shù)以其獨(dú)特的優(yōu)勢(shì)成為了研究和應(yīng)用的熱點(diǎn)。RAG技術(shù)通過(guò)結(jié)合大型語(yǔ)言模型(LLMs)的強(qiáng)大生成能力和高效的信息檢索系統(tǒng),為用戶(hù)提供了一種全新的交互體驗(yàn)。然而,隨著技術(shù)的深入應(yīng)用,一系列挑戰(zhàn)也逐漸浮現(xiàn)。
首先,現(xiàn)有的RAG系統(tǒng)在處理海量數(shù)據(jù)時(shí)面臨著效率和準(zhǔn)確性的雙重壓力。盡管LLMs能夠生成流暢的文本,但在面對(duì)復(fù)雜、非結(jié)構(gòu)化的數(shù)據(jù)時(shí),它們往往難以準(zhǔn)確把握和召回關(guān)鍵信息。此外,RAG系統(tǒng)在數(shù)據(jù)管理和理解方面也存在局限,這導(dǎo)致了所謂的“垃圾輸入,垃圾輸出”(GIGOut)問(wèn)題,即如果輸入數(shù)據(jù)質(zhì)量不高,那么生成的答案也很難達(dá)到預(yù)期的準(zhǔn)確性。
正是在這種背景下,RAGFlow 應(yīng)運(yùn)而生。作為一款端到端的RAG解決方案,RAGFlow 旨在通過(guò)深度文檔理解技術(shù),解決現(xiàn)有RAG技術(shù)在數(shù)據(jù)處理和生成答案方面的挑戰(zhàn)。它不僅能夠處理多種格式的文檔,還能夠智能地識(shí)別文檔中的結(jié)構(gòu)和內(nèi)容,從而確保數(shù)據(jù)的高質(zhì)量輸入。RAGFlow 的設(shè)計(jì)哲學(xué)是“高質(zhì)量輸入,高質(zhì)量輸出”,它通過(guò)提供可解釋性和可控性的生成結(jié)果,讓用戶(hù)能夠信任并依賴(lài)于系統(tǒng)提供的答案。
2024年4月1日,RAGFlow宣布正式開(kāi)源,這一消息在技術(shù)界引起了轟動(dòng)。開(kāi)源當(dāng)天,RAGFlow 在 GitHub 上迅速獲得了數(shù)千的關(guān)注,不到一周時(shí)間,已吸收2900顆星,這不僅體現(xiàn)了社區(qū)對(duì) RAGFlow 的高度認(rèn)可,也顯示出大家對(duì)這一新技術(shù)的熱情。
隨著 RAGFlow 的開(kāi)源,它不僅為技術(shù)社區(qū)帶來(lái)了新的活力,也為解決RAG技術(shù)面臨的困難提供了新的思路和工具。RAGFlow的出現(xiàn),標(biāo)志著我們?cè)跇?gòu)建更加智能、高效和可靠的RAG系統(tǒng)的道路上邁出了堅(jiān)實(shí)的一步。
二、RAGFlow 的核心功能
二、RAGFlow 的核心功能
深度文檔理解:"Quality in, quality out",RAGFlow 基于深度文檔理解,能夠從各類(lèi)復(fù)雜格式的非結(jié)構(gòu)化數(shù)據(jù)中提取真知灼見(jiàn)。真正在無(wú)限上下文(token)的場(chǎng)景下快速完成大海撈針測(cè)試。對(duì)于用戶(hù)上傳的文檔,它需要自動(dòng)識(shí)別文檔的布局,包括標(biāo)題、段落、換行等,還包含難度很大的圖片和表格。對(duì)于表格來(lái)說(shuō),不僅僅要識(shí)別出文檔中存在表格,還會(huì)針對(duì)表格的布局做進(jìn)一步識(shí)別,包括內(nèi)部每一個(gè)單元格,多行文字是否需要合并成一個(gè)單元格等。并且表格的內(nèi)容還會(huì)結(jié)合表頭信息處理,確保以合適的形式送到數(shù)據(jù)庫(kù),從而完成 RAG 針對(duì)這些細(xì)節(jié)數(shù)字的“大海撈針”。
可控可解釋的文本切片:RAGFlow 提供多種文本模板,用戶(hù)可以根據(jù)需求選擇合適的模板,確保結(jié)果的可控性和可解釋性。因此 RAGFlow 在處理文檔時(shí),給了不少的選擇:Q&A,Resume,Paper,Manual,Table,Book,Law,通用...?。當(dāng)然,這些分類(lèi)還在不斷繼續(xù)擴(kuò)展中,處理過(guò)程還有待完善。后續(xù)還會(huì)抽象出更多共通的東西,使各種定制化的處理更加容易。
降低幻覺(jué):RAGFlow 是一個(gè)完整的 RAG 系統(tǒng),而目前開(kāi)源的 RAG,大都忽視了 RAG 本身的最大優(yōu)勢(shì)之一:可以讓 LLM 以可控的方式回答問(wèn)題,或者換種說(shuō)法:有理有據(jù)、消除幻覺(jué)。我們都知道,隨著模型能力的不同,LLM 多少都會(huì)有概率會(huì)出現(xiàn)幻覺(jué),在這種情況下, 一款 RAG 產(chǎn)品應(yīng)該隨時(shí)隨地給用戶(hù)以參考,讓用戶(hù)隨時(shí)查看 LLM 是基于哪些原文來(lái)生成答案的,這需要同時(shí)生成原文的引用鏈接,并允許用戶(hù)的鼠標(biāo) hover 上去即可調(diào)出原文的內(nèi)容,甚至包含圖表。如果還不能確定,再點(diǎn)一下便能定位到原文。RAGFlow 的文本切片過(guò)程可視化,支持手動(dòng)調(diào)整,答案提供關(guān)鍵引用的快照并支持追根溯源,從而降低幻覺(jué)的風(fēng)險(xiǎn)。
兼容各類(lèi)異構(gòu)數(shù)據(jù)源:RAGFlow 支持 支持豐富的文件類(lèi)型,包括 Word 文檔、PPT、excel 表格、txt 文件、圖片、PDF、影印件、復(fù)印件、結(jié)構(gòu)化數(shù)據(jù), 網(wǎng)頁(yè)等。對(duì)于無(wú)序文本數(shù)據(jù),RAGFlow 可以自動(dòng)提取其中的關(guān)鍵信息并轉(zhuǎn)化為結(jié)構(gòu)化表示;而對(duì)于結(jié)構(gòu)化數(shù)據(jù),它則能靈活切入,挖掘內(nèi)在的語(yǔ)義聯(lián)系。最終將這兩種不同來(lái)源的數(shù)據(jù)統(tǒng)一進(jìn)行索引和檢索,為用戶(hù)提供一站式的數(shù)據(jù)處理和問(wèn)答體驗(yàn)。
自動(dòng)化 RAG 工作流:RAGFlow 支持全面優(yōu)化的 RAG 工作流可以支持從個(gè)人應(yīng)用乃至超大型企業(yè)的各類(lèi)生態(tài)系統(tǒng);大語(yǔ)言模型 LLM 以及向量模型均支持配置,用戶(hù)可以根據(jù)實(shí)際需求自主選擇。;基于多路召回、融合重排序,能夠權(quán)衡上下文語(yǔ)義和關(guān)鍵詞匹配兩個(gè)維度,實(shí)現(xiàn)高效的相關(guān)性計(jì)算;提供易用的 API,可以輕松集成到各類(lèi)企業(yè)系統(tǒng),無(wú)論是對(duì)個(gè)人用戶(hù)還是企業(yè)開(kāi)發(fā)者,都極大方便了二次開(kāi)發(fā)和系統(tǒng)集成工作。
?
三、技術(shù)架構(gòu)
3.1、RAGFlow 系統(tǒng)架構(gòu)
3.1、RAGFlow 系統(tǒng)架構(gòu)
RAGFlow 系統(tǒng)是一個(gè)高效、智能的信息處理平臺(tái),它通過(guò)一系列精心設(shè)計(jì)的組件,實(shí)現(xiàn)了對(duì)復(fù)雜查詢(xún)的快速響應(yīng)和精準(zhǔn)處理。這個(gè)系統(tǒng)的核心組件包括:
文檔解析器:這是 RAGFlow 系統(tǒng)的“大腦”,負(fù)責(zé)將各種格式的文檔進(jìn)行解析,從中提取出文本、圖像和表格等關(guān)鍵內(nèi)容。無(wú)論是PDF、Word文檔還是Excel表格,文檔解析器都能夠準(zhǔn)確捕捉信息,為后續(xù)的處理打下基礎(chǔ)。
查詢(xún)分析器:這個(gè)組件是 RAGFlow 系統(tǒng)的“神經(jīng)系統(tǒng)”,它對(duì)用戶(hù)的查詢(xún)進(jìn)行深入分析,識(shí)別并提取出查詢(xún)中的關(guān)鍵信息。通過(guò)這種分析,系統(tǒng)能夠更準(zhǔn)確地理解用戶(hù)的需求,為檢索工作提供精確的指導(dǎo)。
檢索:這是 RAGFlow 系統(tǒng)的“搜索引擎”,它使用查詢(xún)分析器提供的關(guān)鍵信息,從海量文檔中快速檢索出與之相關(guān)的信息。檢索組件的強(qiáng)大能力保證了用戶(hù)能夠及時(shí)獲得所需的數(shù)據(jù)。
重排:這個(gè)組件是 RAGFlow 系統(tǒng)的“過(guò)濾器”,它對(duì)檢索到的信息進(jìn)行排序和過(guò)濾,確保最終呈現(xiàn)給用戶(hù)的信息是最相關(guān)、最有價(jià)值的。通過(guò)這種方式,系統(tǒng)能夠去除冗余和不相關(guān)的數(shù)據(jù),提高信息的準(zhǔn)確性和可用性。
LLM:作為 RAGFlow 系統(tǒng)的“語(yǔ)言生成器”,LLM(大型語(yǔ)言模型)負(fù)責(zé)將排序后的信息整合并生成最終的答案或輸出。LLM的強(qiáng)大生成能力不僅能夠確保答案的準(zhǔn)確性,還能夠使答案表達(dá)得更加自然和流暢。
這些組件共同構(gòu)成了RAGFlow系統(tǒng)的強(qiáng)大架構(gòu),使得它能夠高效地處理用戶(hù)的查詢(xún),快速地從文檔中檢索信息,并生成準(zhǔn)確、有用的答案。這個(gè)系統(tǒng)不僅提高了信息處理的效率,也極大地提升了用戶(hù)的使用體驗(yàn)。
RAG 系統(tǒng)的架構(gòu)是一個(gè)精密而高效的工作流程,它通過(guò)一系列精心設(shè)計(jì)的組件,確保了用戶(hù)查詢(xún)的準(zhǔn)確處理和高質(zhì)量答案的生成。這個(gè)系統(tǒng)的工作流程可以概括為以下幾個(gè)步驟:
首先,當(dāng)用戶(hù)輸入一個(gè)查詢(xún)時(shí),查詢(xún)分析器便開(kāi)始工作。它對(duì)用戶(hù)的查詢(xún)進(jìn)行深入分析,從中提取出關(guān)鍵信息,這些信息是后續(xù)檢索工作的基礎(chǔ)。
接下來(lái),檢索模塊根據(jù)查詢(xún)分析器提供的關(guān)鍵信息,在大量的文檔資源中尋找與之相關(guān)的數(shù)據(jù)。這一步驟是在整個(gè)系統(tǒng)中非常關(guān)鍵的一環(huán),因?yàn)樗苯記Q定了后續(xù)答案的相關(guān)性和準(zhǔn)確性。
然后,重排模塊對(duì)檢索到的信息進(jìn)行進(jìn)一步的排序和過(guò)濾。這一步驟確保了最終呈現(xiàn)給用戶(hù)的信息是經(jīng)過(guò)優(yōu)化的,去除了不相關(guān)或冗余的內(nèi)容,使得答案更加精確和有價(jià)值。
最后,LLM(大型語(yǔ)言模型)根據(jù)重排模塊提供的信息,生成最終的答案或輸出。LLM的強(qiáng)大生成能力使得答案不僅準(zhǔn)確,而且表達(dá)流暢自然,就像一個(gè)知識(shí)豐富的助手在回答用戶(hù)的問(wèn)題一樣。
通過(guò)這樣的工作流程,RAG系統(tǒng)架構(gòu)能夠高效地處理用戶(hù)的查詢(xún),從文檔中提取有價(jià)值的信息,并生成準(zhǔn)確、有用的答案。這種系統(tǒng)不僅提高了信息檢索的效率,也極大地提升了用戶(hù)體驗(yàn)。
3.2、DeepDoc:深度文檔理解的基石
DeepDoc?是 RAGFlow 的核心組件,它利用視覺(jué)信息和解析技術(shù),對(duì)文檔進(jìn)行深度理解,提取文本、表格和圖像等信息。DeepDoc 的功能模塊包括:
OCR 技術(shù):支持多種語(yǔ)言和字體,并能夠處理復(fù)雜的文檔布局和圖像質(zhì)量。
布局識(shí)別(布局分析識(shí)別)技術(shù):RAGFlow 使用 Yolov8 進(jìn)行 OCR/布局識(shí)別/TSR(表格結(jié)構(gòu)識(shí)別),識(shí)別文檔的布局結(jié)構(gòu),例如標(biāo)題、段落、表格、圖像等。
表格結(jié)構(gòu)識(shí)別 (TSR):識(shí)別表格的結(jié)構(gòu),例如行列、表頭、單元格合并等,并將其轉(zhuǎn)換為自然語(yǔ)言句子。
文檔解析:支持解析 PDF、DOCX、EXCEL 和 PPT 等多種文檔格式,并提取文本塊、表格和圖像等信息。
簡(jiǎn)歷解析:將簡(jiǎn)歷中的非結(jié)構(gòu)化文本解析為結(jié)構(gòu)化數(shù)據(jù),例如姓名、聯(lián)系方式、工作經(jīng)歷、教育背景等。
?
3.3、LLM 和嵌入模型在 RAGFlow 中的作用
在 RAGFlow 中,LLM(Large Language Models,大型語(yǔ)言模型)和嵌入模型(Embedding Models)扮演著至關(guān)重要的角色,它們共同協(xié)作以實(shí)現(xiàn)高效的信息檢索和生成任務(wù)。
LLM是RAGFlow中的核心組件之一,負(fù)責(zé)理解和生成自然語(yǔ)言。在RAGFlow中,LLM的主要作用包括:
理解用戶(hù)查詢(xún):?LLM能夠理解用戶(hù)的自然語(yǔ)言查詢(xún),并將其轉(zhuǎn)化為可執(zhí)行的指令或問(wèn)題。
生成回答:?基于用戶(hù)查詢(xún)和檢索到的信息,LLM能夠生成流暢、連貫且相關(guān)性強(qiáng)的回答。
提供可控性:?LLM可以根據(jù)用戶(hù)的指示生成特定風(fēng)格或格式的回答,確保生成內(nèi)容的可控性和準(zhǔn)確性。
跨語(yǔ)言能力:?對(duì)于多語(yǔ)言環(huán)境下的RAG任務(wù),LLM需要具備跨語(yǔ)言理解和生成的能力,以便在不同語(yǔ)言之間進(jìn)行有效的信息檢索和轉(zhuǎn)換。
嵌入模型在RAGFlow中主要用于將文本數(shù)據(jù)轉(zhuǎn)換為向量表示,這對(duì)于信息檢索和相似性比較至關(guān)重要。嵌入模型的主要作用包括:
文本向量化:?嵌入模型將文本(如文檔、段落、句子等)轉(zhuǎn)換為數(shù)值向量,這些向量能夠表示文本的語(yǔ)義信息。
相似性比較:?通過(guò)計(jì)算向量之間的相似度,嵌入模型可以幫助 RAGFlow 快速找到與用戶(hù)查詢(xún)最相關(guān)的信息。
數(shù)據(jù)檢索:?嵌入模型使得RAGFlow能夠在大規(guī)模數(shù)據(jù)集中高效地執(zhí)行檢索任務(wù),尤其是在處理非結(jié)構(gòu)化數(shù)據(jù)時(shí),如文檔和圖片。
多模態(tài)能力:?對(duì)于包含圖表、圖片等非文本元素的文檔,嵌入模型可以輔助提取和理解這些元素的語(yǔ)義信息,增強(qiáng)RAGFlow的多模態(tài)處理能力。
在 RAGFlow 中,LLM 和嵌入模型的結(jié)合使用,使得系統(tǒng)不僅能夠理解復(fù)雜的自然語(yǔ)言查詢(xún),還能夠在海量數(shù)據(jù)中快速準(zhǔn)確地檢索到相關(guān)信息,并生成高質(zhì)量的回答。這種協(xié)同工作機(jī)制大大提高了RAGFlow在知識(shí)庫(kù)問(wèn)答、企業(yè)數(shù)據(jù)集成和多模態(tài)信息處理等場(chǎng)景下的應(yīng)用潛力和效率。
3.4、文本分塊過(guò)程中的可視化和人工干預(yù)
RAGFlow在處理文檔時(shí),特別強(qiáng)調(diào)了智能文檔處理的可視化和可解釋性。這意味著用戶(hù)不僅可以獲得由系統(tǒng)處理后的結(jié)果,還能夠清晰地看到文檔是如何被分塊和解析的。這樣的設(shè)計(jì)使得用戶(hù)可以對(duì)AI的處理結(jié)果進(jìn)行核查和必要的干預(yù),確保最終輸出的準(zhǔn)確性和可靠性。
在文本分塊過(guò)程中,RAGFlow首先會(huì)對(duì)用戶(hù)上傳的文檔進(jìn)行結(jié)構(gòu)識(shí)別,這包括但不限于標(biāo)題、段落、換行等。對(duì)于更為復(fù)雜的元素,如圖片和表格,RAGFlow也會(huì)進(jìn)行詳細(xì)的布局識(shí)別和結(jié)構(gòu)分析。例如,在處理表格時(shí),系統(tǒng)不僅會(huì)識(shí)別出表格的存在,還會(huì)進(jìn)一步識(shí)別表格內(nèi)部的每一個(gè)單元格,以及多行文字是否需要合并成一個(gè)單元格等。這些信息都會(huì)被合理地處理并結(jié)合表頭信息,以確保數(shù)據(jù)的正確性和完整性。
RAGFlow的可視化功能允許用戶(hù)查看文檔解析的具體結(jié)果。用戶(hù)可以看到文檔被分割成了多少塊,各種圖表是如何處理的。如果系統(tǒng)識(shí)別的結(jié)果與用戶(hù)的預(yù)期有所出入,用戶(hù)可以進(jìn)行適當(dāng)?shù)母深A(yù)。這種干預(yù)可能包括調(diào)整分塊的方式、合并或分割某些部分,以及修改表格的識(shí)別結(jié)果等。RAGFlow提供了直觀的用戶(hù)界面,使得用戶(hù)可以輕松地進(jìn)行這些操作。
此外,RAGFlow還提供了一種機(jī)制,允許用戶(hù)通過(guò)點(diǎn)擊來(lái)定位到原文,對(duì)比處理結(jié)果和原文的差異。這種對(duì)比功能不僅可以幫助用戶(hù)確認(rèn)AI的處理是否準(zhǔn)確,還可以讓用戶(hù)對(duì)處理過(guò)程有更多的了解和控制。這種可視化和可解釋性的設(shè)計(jì),大大提高了用戶(hù)對(duì)AI處理結(jié)果的信任度,同時(shí)也使得RAGFlow成為一個(gè)更加強(qiáng)大和靈活的工具。
?
四、設(shè)置和運(yùn)行 RAGFlow
RAGFlow 是一個(gè)基于深度文檔理解的開(kāi)源 RAG(檢索增強(qiáng)生成)引擎,旨在為企業(yè)提供一個(gè)簡(jiǎn)化的 RAG 工作流程。以下是設(shè)置和運(yùn)行 RAGFlow 的詳細(xì)指南:
4.1、系統(tǒng)要求
在開(kāi)始安裝 RAGFlow 之前,請(qǐng)確保您的系統(tǒng)滿(mǎn)足以下基本要求:
CPU 核心數(shù):至少 2 核
內(nèi)存大?。褐辽?8 GB
?
4.2、安裝 Docker
RAGFlow 需要 Docker 來(lái)運(yùn)行。如果您的本地計(jì)算機(jī)(Windows、Mac 或 Linux)尚未安裝 Docker,請(qǐng)?jiān)L問(wèn) Docker 官網(wǎng)進(jìn)行安裝。
?
4.3、啟動(dòng) RAGFlow 服務(wù)器
調(diào)整系統(tǒng)設(shè)置:確保?vm.max_map_count?的值大于或等于 262144。您可以通過(guò)運(yùn)行以下命令來(lái)檢查和設(shè)置該值:#?要檢查 vm.max_map_count 的值:sysctl?vm.max_map_count#?如果不是,請(qǐng)將 vm.max_map_count 重置為至少 262144 的值。sudo?sysctl?-w?vm.max_map_count=262144為了使更改永久生效,請(qǐng)?jiān)?/etc/sysctl.conf 文件中添加或更新 vm.max_map_count=262144。克隆 RAGFlow 存儲(chǔ)庫(kù):git?clone?https://github.com/infiniflow/ragflow.git構(gòu)建 Docker 鏡像并啟動(dòng)服務(wù)器:cd?ragflow/dockerdocker?compose?up?-d核心映像大小約為 9 GB,加載可能需要一些時(shí)間。檢查服務(wù)器狀態(tài):docker?logs?-f?ragflow-server如果系統(tǒng)成功啟動(dòng),您將看到確認(rèn)消息。? ? ____?????????????????______?__???/?__?\?____?_?____?_?/?____//?/____??_??????__??/?/_/?//?__?`//?__?`//?/_???/?//?__?\|?|?/|?/?/?/?_,?_//?/_/?//?/_/?//?__/??/?//?/_/?/|?|/?|/?//_/?|_|?\__,_/?\__,?//_/????/_/?\____/?|__/|__/??????????????/____/?*?Running?on?all?addresses?(0.0.0.0)?*?Running?on?http://127.0.0.1:9380?*?Running?on?http://172.22.0.5:9380?INFO:werkzeug:Press?CTRL+C?to?quit
4.4、配置選項(xiàng)
選擇 LLM 工廠(chǎng):在?service_conf.yaml?文件中的?user_default_llm?部分選擇所需的 LLM 工廠(chǎng)。
API 密鑰設(shè)置:使用相應(yīng)的 API 密鑰更新?service_conf.yaml?文件中的?API_KEY?字段。更多信息請(qǐng)參閱?/docs/llm_api_key_setup.md。
要更新默認(rèn) HTTP 服務(wù)端口 (80),請(qǐng)轉(zhuǎn)到?docker-compose.yml?并將?80:80?更改為?<YOUR_SERVING_PORT>:80?。
所有系統(tǒng)配置的更新需要重新啟動(dòng)系統(tǒng)才能生效:docker-compose up -d
?
4.5、訪(fǎng)問(wèn) RAGFlow 界面
一旦服務(wù)器啟動(dòng)并運(yùn)行,您可以通過(guò)瀏覽器訪(fǎng)問(wèn) RAGFlow 界面。在默認(rèn)配置下,您可以省略默認(rèn) HTTP 服務(wù)端口 80。只需在瀏覽器中輸入 RAGFlow 服務(wù)器的 IP 地址即可。
通過(guò)上述步驟,您可以成功設(shè)置和運(yùn)行 RAGFlow。確保遵循所有配置指南,并在啟動(dòng)服務(wù)器后檢查其狀態(tài)以確認(rèn)一切正常。通過(guò)選擇適當(dāng)?shù)?LLM 工廠(chǎng)和設(shè)置 API 密鑰,您可以確保 RAGFlow 與您的業(yè)務(wù)需求無(wú)縫集成。最后,通過(guò)簡(jiǎn)單的瀏覽器操作,您就可以開(kāi)始使用 RAGFlow 強(qiáng)大的文檔理解和問(wèn)答功能了。
?
五、RAGFlow 未來(lái)規(guī)劃
RAGFlow 作為一款先進(jìn)的檢索增強(qiáng)生成引擎,其未來(lái)發(fā)展規(guī)劃主要圍繞以下幾個(gè)核心方向:
增強(qiáng)多語(yǔ)言支持能力:
RAGFlow 將致力于提升其對(duì)不同語(yǔ)言的支持能力,使其能夠更好地服務(wù)于全球化的市場(chǎng)。這意味著 RAGFlow 將開(kāi)發(fā)和集成更多語(yǔ)言的文檔結(jié)構(gòu)識(shí)別模型,從而能夠準(zhǔn)確理解和處理各種語(yǔ)言的非結(jié)構(gòu)化數(shù)據(jù)。這不僅包括常見(jiàn)的英語(yǔ)、中文等,還將擴(kuò)展到其他語(yǔ)種,以滿(mǎn)足不同地區(qū)用戶(hù)的需求。
提升本地大型語(yǔ)言模型(LLM)的性能:
為了提高 RAGFlow 在處理非結(jié)構(gòu)化數(shù)據(jù)時(shí)的準(zhǔn)確性和效率,未來(lái)將對(duì)本地的大型語(yǔ)言模型進(jìn)行優(yōu)化和升級(jí)。這可能包括改進(jìn)模型的訓(xùn)練數(shù)據(jù)、調(diào)整模型結(jié)構(gòu)以及采用新的算法和技術(shù),以提高模型的理解和生成能力。通過(guò)這些改進(jìn),RAGFlow 將能夠更準(zhǔn)確地理解和生成復(fù)雜的語(yǔ)言?xún)?nèi)容,為用戶(hù)提供更加豐富和精準(zhǔn)的信息。
擴(kuò)展網(wǎng)絡(luò)爬蟲(chóng)功能:
RAGFlow 計(jì)劃擴(kuò)展其網(wǎng)絡(luò)爬蟲(chóng)的功能,以便能夠從更廣泛的來(lái)源獲取數(shù)據(jù)。這包括接入企業(yè)的各類(lèi)數(shù)據(jù)源,如 MySQL 的 binlog、數(shù)據(jù)湖的 ETL 以及外部的爬蟲(chóng)等。通過(guò)這些數(shù)據(jù)源的集成,RAGFlow 將能夠更全面地收集和分析信息,為用戶(hù)提供更全面的知識(shí)庫(kù)和更準(zhǔn)確的檢索結(jié)果。
適應(yīng)更多復(fù)雜場(chǎng)景:
RAGFlow 的設(shè)計(jì)目標(biāo)之一是讓其能夠適應(yīng)更多的復(fù)雜場(chǎng)景,尤其是企業(yè)級(jí)(B 端)的應(yīng)用場(chǎng)景。為此,RAGFlow 將開(kāi)發(fā)更多的定制化模板和處理流程,以滿(mǎn)足不同行業(yè)和崗位對(duì)文檔處理和信息檢索的特殊需求。這可能涉及到對(duì)特定行業(yè)術(shù)語(yǔ)的理解、對(duì)復(fù)雜文檔結(jié)構(gòu)的處理等。
提供更靈活的企業(yè)級(jí)數(shù)據(jù)接入:
RAGFlow 將推出面向企業(yè)級(jí)數(shù)據(jù)接入的低代碼平臺(tái),使得企業(yè)能夠更容易地將內(nèi)部數(shù)據(jù)和文檔整合到 RAGFlow 系統(tǒng)中。這將極大地提高企業(yè)使用 RAGFlow 的便利性和效率,同時(shí)也為企業(yè)提供了更多的靈活性和自主性。
高級(jí)內(nèi)容生成:
除了問(wèn)答對(duì)話(huà)之外,RAGFlow 還將提供高級(jí)內(nèi)容生成的功能,如長(zhǎng)文生成等。這將使得 RAGFlow 不僅能夠回答用戶(hù)的問(wèn)題,還能夠創(chuàng)作文章、報(bào)告等內(nèi)容,為用戶(hù)提供更加全面的服務(wù)。
通過(guò)這些未來(lái)規(guī)劃,RAGFlow 旨在成為一個(gè)更加強(qiáng)大、靈活且易于使用的系統(tǒng),能夠滿(mǎn)足不同用戶(hù)在各種場(chǎng)景下的需求,特別是在企業(yè)級(jí)應(yīng)用中發(fā)揮重要作用,可以期待一下。
?
六、總結(jié)
在對(duì) RAGFlow 的探索中,我們可以清晰地看到其在RAG(Retrieval-Augmented Generation)領(lǐng)域中的重要地位和顯著優(yōu)勢(shì)。RAGFlow作為一款下一代開(kāi)源RAG引擎,不僅在問(wèn)答對(duì)話(huà)方面表現(xiàn)出色,還具備高級(jí)內(nèi)容生成的能力,例如長(zhǎng)文生成等。這使得RAGFlow能夠?yàn)橛脩?hù)提供更為全面和深入的服務(wù),滿(mǎn)足不同場(chǎng)景下的需求,尤其在企業(yè)級(jí)應(yīng)用中發(fā)揮著重要作用。
RAGFlow 的核心功能和技術(shù)架構(gòu),包括其系統(tǒng)架構(gòu)、DeepDoc深度文檔理解模塊、LLM和嵌入模型的應(yīng)用,以及文本分塊過(guò)程中的可視化和人工干預(yù)等,共同構(gòu)成了一個(gè)強(qiáng)大、靈活且易于使用的系統(tǒng)。這些特點(diǎn)不僅提升了用戶(hù)體驗(yàn),也為開(kāi)發(fā)者提供了更多的創(chuàng)新空間。
開(kāi)源項(xiàng)目如 RAGFlow 在推動(dòng)技術(shù)創(chuàng)新方面扮演著至關(guān)重要的角色。它們促進(jìn)了知識(shí)的共享和技術(shù)的民主化,為全球開(kāi)發(fā)者社區(qū)提供了一個(gè)共同成長(zhǎng)和協(xié)作的平臺(tái)。通過(guò)開(kāi)源,RAGFlow鼓勵(lì)更多的開(kāi)發(fā)者參與到項(xiàng)目中來(lái),共同解決問(wèn)題,分享最佳實(shí)踐,從而加速了創(chuàng)新的步伐。
最終,RAGFlow 的成功不僅體現(xiàn)在其技術(shù)成就上,更在于其對(duì)整個(gè)RAG領(lǐng)域乃至人工智能技術(shù)發(fā)展的貢獻(xiàn)。它不僅推動(dòng)了相關(guān)技術(shù)的創(chuàng)新和應(yīng)用,也為未來(lái)的技術(shù)進(jìn)步和產(chǎn)業(yè)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著RAGFlow的不斷發(fā)展和完善,我們有理由相信,它將繼續(xù)在推動(dòng)人工智能技術(shù)進(jìn)步和促進(jìn)社會(huì)數(shù)字化轉(zhuǎn)型方面發(fā)揮重要作用。
?
七、參考文獻(xiàn)
[1]. DeepDoc: https://huggingface.co/InfiniFlow/deepdoc[2]. RAGFlow GitHub:?https://github.com/infiniflow/ragflow[3]. RAGFlow Demo:?https://demo.ragflow.io/[4]. Infinity?:?https://github.com/infiniflow/infinity[5]. RAGFlow YC News: https://news.ycombinator.com/item?id=39896923[6]. DTrOCR: Decoder-only Transformer for Optical Character Recognition: https://arxiv.org/pdf/2308.15996v1.pdf
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/
- 1 “花兒為什么這樣紅” 7904673
- 2 70萬(wàn)一針救命藥進(jìn)醫(yī)保 7808044
- 3 用1分錢(qián)做“暗號(hào)”的食堂阿姨火了 7713486
- 4 去新疆的100個(gè)理由 7615786
- 5 霸總要沒(méi)了?廣電出手規(guī)范管理短劇 7522222
- 6 老人用手機(jī)哄5歲孫子 致1000度近視 7428699
- 7 全球首例!中國(guó)航母福建艦創(chuàng)紀(jì)錄 7333788
- 8 日本網(wǎng)友贊嘆福建艦:真的太帥了 7232397
- 9 中國(guó)今年出了三位A類(lèi)影后 7138398
- 10 國(guó)慶中秋假期何時(shí)出門(mén)不堵?官方預(yù)測(cè) 7042902