
DroidRun 開源的Android自動化框架
聲明:該文章由作者(0310blue)發(fā)表,轉(zhuǎn)載此文章須經(jīng)作者同意并請附上出處(0XUCN)及本頁鏈接。。
這款由 DroidRun 團隊開發(fā)的框架允許通過自然語言命令控制 Android 手機,讓大型語言模型(LLM)化身智能助手,輕松實現(xiàn)社交媒體自動化、消息發(fā)送或測試任務。
隨著 LLM 的理解和推理能力飛速提升,手機任務自動化成為 AI 應用的新熱點。DroidRun 通過結合視覺解析、UI 提取和 LLM 推理,讓 Android 手機像人類一樣被操控。
剛剛在 GitHub 上開源就已經(jīng)攬獲了 1.2k 標星!
無論是測試工程師用于自動化測試,還是普通用戶簡化日常操作,DroidRun 都展現(xiàn)了無限可能。
項目介紹
DroidRun?是一個開源的 Android 自動化框架,通過自然語言指令驅(qū)動 LLM 智能體控制手機。
它由兩部分組成:
??LLM 智能體:運行在電腦或云端,負責解析自然語言指令,生成操作序列,支持 OpenAI、Anthropic、Gemini 等多種 LLM 提供商。 ??DroidRun Portal App:安裝在 Android 手機上,通過 ADB 或 Wi-Fi 接收指令,執(zhí)行屏幕點擊、輸入等操作。
它利用視覺模型(解析屏幕截圖)和 UI 結構提?。ɑ?Accessibility Service API),結合 LLM 的推理能力,實現(xiàn)復雜任務自動化。
主要功能
??自然語言控制:使用自然語言命令控制 Android 設備 ??多 LLM 支持:支持多個 LLM 提供商(OpenAI、Anthropic、Gemini) ??極簡命令行操作:易于使用的命令行界面 ??豐富的擴展能力:可擴展的Python API用于自定義自動化 ??視覺UI解析:直接通過截圖理解手機控件元素
快速使用
DroidRun 的部署過程簡單,以下是詳細步驟,助你快速實現(xiàn)手機自動化:
方式一:從PyPI安裝(推薦)
pip?install?droidrun
方式二:從源代碼安裝
git?clone?https://github.com/droidrun/droidrun.git cd?droidrun pip?install?-e?.
先決條件:
1、通過USB或ADB連接到TCP/IP的Android設備
2、ADB(Android 調(diào)試橋)已安裝并配置
adb 安裝非常簡單,可直接搜索教程安裝到本地電腦即可。安裝完成后,別忘了設置下環(huán)境變量就可以隨時在命令行全局使用了。
能執(zhí)行以下命令,說明安裝成功:
adb?version
與此同時,對于要操作的Android手機需要打開開發(fā)者模式,啟用USB調(diào)試。
3、DroidRun Portal 應用程序已安裝在您的 Android 設備上
DroidRun 需要在你的 Android 設備上安裝 DroidRun 門戶應用程序。
下載地址:https://github.com/droidrun/droidrun-portal
兩種命令安裝方式:
droidrun?setup?--path=/path/to/droidrun-portal.apk #?or adb?install?-r?/path/to/droidrun-portal.apk
4. OpenAI等LLM大模型配置
#?Choose?at?least?one?of?these?based?on?your?preferred?provider export?OPENAI_API_KEY="your_openai_api_key_here" export?ANTHROPIC_API_KEY="your_anthropic_api_key_here" export?GEMINI_API_KEY="your_gemini_api_key_here"
最后就可以通過USB連接您的設備或設置無線ADB:
#?List?connected?devices droidrun?devices #?Connect?to?a?device?over?Wi-Fi droidrun?connect?192.168.1.100
驗證設置是否正確:
#?Should?list?your?connected?device?and?show?portal?status droidrun?status
基本用法:
#?打開設置APP droidrun?"Open?the?settings?app" #?指定模型 droidrun?"Open?the?calculator?app"?--provider?openai?--model?gpt-4o-mini #?指定設備 droidrun?"Open?Chrome?and?search?for?weather"?--device?abc123
還可以創(chuàng)建Python測試代碼:
#!/usr/bin/env?python3 import?asyncio import?os from?droidrun.agent.react_agent?import?ReActAgent from?droidrun.agent.llm_reasoning?import?LLMReasoner from?dotenv?import?load_dotenv #?Load?environment?variables?from?.env?file load_dotenv() async?def?main(): ????#?Create?an?LLM?instance?(choose?your?preferred?provider) ????llm?=?LLMReasoner( ????????llm_provider="gemini",??#?Can?be?"openai",?"anthropic",?or?"gemini" ????????model_name="gemini-2.0-flash",??#?Choose?appropriate?model?for?your?provider ????????api_key=os.environ.get("GEMINI_API_KEY"),??#?Get?API?key?from?environment ????????temperature=0.2 ????) ???? ????#?Create?and?run?the?agent ????agent?=?ReActAgent( ????????task="Open?the?Settings?app?and?check?the?Android?version", ????????llm=llm ????) ???? ????steps?=?await?agent.run() ????print(f"Execution?completed?with?{len(steps)}?steps") if?__name__?==?"__main__": ????asyncio.run(main())
支持的操作類型
? App 啟動與關閉:啟動應用、回到主界面、切換任務等 ? UI 操作:點擊、長按、滑動、輸入文字 ? 控件識別:可基于 AccessibilityNode 信息判斷是否找到按鈕 ? 工具調(diào)用:截圖、OCR、圖像問答輔助定位控件 ? 反饋能力:可截圖/日志記錄執(zhí)行過程 ? 自動化測試:執(zhí)行固定 UI 流程并驗證是否成功
寫在最后
DroidRun 是 AI 手機自動化領域的開源先鋒,其自然語言驅(qū)動和強大功能讓人眼前一亮。
DroidRun = 讓 LLM 真的“動起手機”,實現(xiàn)從語言到操作的閉環(huán)!
它不僅是 AI+移動自動化的新起點,更可能開啟LLM 控制世界的觸手端口。
如果想讓 AI 幫你發(fā)消息、發(fā)帖或測試 App?那它就可以。
GitHub 項目地址:https://github.com/droidrun/droidrun
文檔入口:https://docs.droidrun.ai/introduction
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關注數(shù)據(jù)與安全,洞悉企業(yè)級服務市場:https://www.ijiandao.com/
- 1 習近平接見新疆各族各界代表 7904662
- 2 樺加沙風眼內(nèi)部曝光 拍攝部門:震撼 7809642
- 3 飛機狂風中降落 機翼險些砸地 7712513
- 4 援疆的山海深情 跨越千里萬里 7618284
- 5 馬克龍被美警察攔下 當場打給特朗普 7520190
- 6 臺風“樺加沙”影響有多大?解讀來了 7423795
- 7 珠海多區(qū)倡議沿海高層住宅居民撤離 7332982
- 8 廣東一地安排農(nóng)民工住進學校避臺風 7231988
- 9 上海再通報多校午餐發(fā)臭:涉嫌瞞報 7138276
- 10 深圳機場飛機被“五花大綁”防臺風 7045301