
Mad-Professor 開源的 AI 驅(qū)動(dòng)學(xué)術(shù)論文閱讀工具
聲明:該文章來自(開源星探)版權(quán)由原作者所有,K2OS渲染引擎提供網(wǎng)頁加速服務(wù)。
?Mad-Professor?是一款開源的 AI 驅(qū)動(dòng)學(xué)術(shù)論文閱讀工具,集成 PDF 處理、AI 翻譯、RAG 檢索、AI 問答和語音交互功能。
還通過 AI 問答和語音交互解答疑惑,賦予“暴躁教授”等個(gè)性化角色,讓交互更具趣味。
Mad Professor 自動(dòng)提取、翻譯和結(jié)構(gòu)化論文內(nèi)容,支持中英文對(duì)照,并以分屏界面結(jié)合語音問答,讓閱讀體驗(yàn)高效且生動(dòng)。
它就像一個(gè)“真人教授”坐在你身邊,幫你一邊讀論文,一邊用 AI 和你互動(dòng)講解!
核心功能
??PDF導(dǎo)入:支持上傳任意學(xué)術(shù) PDF 論文 ??自動(dòng)結(jié)構(gòu)化:AI 自動(dòng)解析章節(jié)、摘要、引言、方法等結(jié)構(gòu) ??中英對(duì)照翻譯:提供精確中英雙語翻譯,支持句段級(jí)對(duì)照 ??AI智能問答:可基于上下文提問論文細(xì)節(jié)、術(shù)語解釋、研究貢獻(xiàn)等 ??教授人設(shè):AI 回答帶有擬人化風(fēng)格,可選擇不同性格/語音風(fēng)格的角色 ??RAG 檢索增強(qiáng):利用檢索增強(qiáng)生成(RAG)模型提升問答準(zhǔn)確性 ??語音交互:支持語音提問 + TTS 回答,真正實(shí)現(xiàn)“邊聽邊學(xué)” ??分屏界面:左側(cè)論文閱讀,右側(cè) AI 助教問答,互不打擾高效學(xué)習(xí)
技術(shù)架構(gòu)
??前端界面:PyQt6構(gòu)建的現(xiàn)代化桌面應(yīng)用 ??核心引擎: ? AI問答模塊:基于LLM的學(xué)術(shù)問答系統(tǒng) ? RAG檢索系統(tǒng):向量檢索增強(qiáng)的問答精準(zhǔn)度 ? 論文處理管線:PDF轉(zhuǎn)MD、自動(dòng)翻譯、結(jié)構(gòu)化解析 ??交互系統(tǒng): ? 語音識(shí)別:實(shí)時(shí)語音輸入識(shí)別 ? TTS語音合成:AI回答實(shí)時(shí)播報(bào) ? 情感識(shí)別:根據(jù)問題內(nèi)容調(diào)整回答情緒
快速入門
Mad Professor 支持手動(dòng)部署,推薦 GPU 環(huán)境(NVIDIA 6GB顯存以上)。
安裝步驟
① 使用conda創(chuàng)建環(huán)境
conda?create?-n?mad-professor?python=3.10.16 conda?activate?mad-professor
② 安裝MinerU依賴及其他依賴
pip?install?-U?magic-pdf[full]==1.3.3?-i?https://mirrors.aliyun.com/pypi/simple pip?install?-r?requirements.txt
③ 安裝電腦顯卡版本匹配的CUDA和torch
pip?install?--force-reinstall?torch?torchvision?torchaudio?"numpy<=2.1.1"?--index-url?https://download.pytorch.org/whl/cu124
④ 安裝FAISS的gpu版本
conda?install?-c?conda-forge?faiss-gpu
⑤ 模型下載
python?download_models.py
python腳本會(huì)自動(dòng)下載模型文件并配置好配置文件中的模型目錄,配置文件可以在用戶目錄中找到,文件名為magic-pdf.json
修改【用戶目錄】配置文件magic-pdf.json中"device-mode"的值來啟用CUDA
{ ????"device-mode":"cuda" }
語音輸入的Whisper模型會(huì)在運(yùn)行時(shí)自動(dòng)下載
⑥ API密鑰配置
項(xiàng)目依賴LLM和TTS在線API服務(wù),通過修改config.py中的對(duì)應(yīng)字段配置請(qǐng)求路徑和密鑰
API_BASE_URL?=?"YOUR_API_URL" API_KEY?=?"YOUR_API_KEY"??? TTS_GROUP_ID?=?"YOUR_MINIMAX_GROUP_ID" TTS_API_KEY?=?"YOUR_MINIMAX_API_KEY"
⑦ 啟動(dòng)應(yīng)用
python?main.py
使用方法
① 導(dǎo)入論文
點(diǎn)擊側(cè)邊欄的"導(dǎo)入論文"按鈕,然后選擇PDF文件導(dǎo)入,點(diǎn)擊“繼續(xù)”,等待處理完成(包括翻譯和索引構(gòu)建)
② 論文閱讀
在側(cè)邊欄選擇已經(jīng)處理好的論文
在主窗口查看論文內(nèi)容,右上角可切換中英文
左右側(cè)可折疊隱藏,提供沉浸式閱讀體驗(yàn)
③ AI問答與語音對(duì)話
在對(duì)話窗口下方選擇語音輸入設(shè)備
點(diǎn)擊麥克風(fēng)按鈕,等指示燈變綠時(shí)開始對(duì)話
PS:如果說話時(shí)指示燈沒有變黃,可能說明輸入設(shè)備無法檢測(cè)到人聲,建議切換其他輸入設(shè)備進(jìn)行嘗試
寫在最后
mad-professor?是一款集 PDF 處理、AI 翻譯、智能問答、語音交互于一體的學(xué)術(shù)工具。
通過它,你不再孤軍奮戰(zhàn)看論文,而是有一個(gè)理解你語言、語境、提問邏輯的智能教授,幫你總結(jié)重點(diǎn)、解析難點(diǎn)、啟發(fā)思考。
還提供有暴躁個(gè)性的AI教授角色,讓學(xué)術(shù)論文閱讀更加高效有趣。
mad-professor 或許更適合追求本地化和趣味性的小伙伴們!
GitHub 項(xiàng)目地址:https://github.com/LYiHub/mad-professor-public
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場(chǎng):https://www.ijiandao.com/
- 1 情暖天山氣象新 7904053
- 2 廣東或大范圍停工 7808667
- 3 央視起底柯克之死 7714281
- 4 國慶中秋臨近 文旅部發(fā)出游提示 7617967
- 5 臺(tái)風(fēng)“樺加沙”強(qiáng)度已達(dá)17級(jí)以上 7523460
- 6 3×8還是8×3?80后90后家長(zhǎng)吵翻了 7427038
- 7 央行證監(jiān)會(huì)等負(fù)責(zé)人出席發(fā)布會(huì) 7328426
- 8 中產(chǎn)運(yùn)動(dòng)三件套又換了 7231389
- 9 內(nèi)蒙古一地集中采集男性居民血樣 7139278
- 10 特朗普兒子模仿爸爸引哄堂大笑 7042614