Droidrun
WebsiteFree Trial
Droidrun은 AI 에이전트가 자연어 명령을 통해 Android 및 iOS 장치를 제어하여 모바일 앱 및 워크플로우의 원활한 자동화를 가능하게 하는 오픈 소스 프레임워크입니다.
https://www.droidrun.ai/?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:Jul 31, 2025
Droidrun이란?
Droidrun은 AI 시스템과 모바일 플랫폼 간의 격차를 해소하기 위해 개발된 강력한 모바일 에이전트 인프라입니다. 2023년에 출시되어 210만 유로의 프리 시드 자금을 지원받았으며, 개발자와 기업이 자연어 명령을 사용하여 모바일 상호 작용을 자동화할 수 있도록 지원합니다. 이 프레임워크는 출시 후 24시간 이내에 900명 이상의 개발자가 가입하고 3,300개 이상의 GitHub 스타를 축적하여 빠르게 인기를 얻었으며, 이는 동종 업계에서 가장 빠르게 성장하는 모바일 에이전트 프로젝트입니다.
Droidrun의 주요 기능
Droidrun은 자연어 명령을 통해 AI 에이전트가 Android 및 iOS 장치를 제어할 수 있도록 하는 혁신적인 오픈 소스 프레임워크입니다. Android의 접근성 서비스를 활용하여 구조화된 UI 계층 구조에 액세스함으로써 AI가 모바일 앱과 직접 상호 작용하고, 워크플로를 자동화하고, 데이터를 추출할 수 있습니다. 이 플랫폼은 여러 LLM 제공업체(OpenAI, Anthropic, Gemini, Ollama, DeepSeek 포함)를 지원하며 개발자 및 기업을 위한 로컬 및 클라우드 기반 솔루션을 모두 제공합니다.
자연어 제어: 자연어 명령을 통해 모바일 장치를 제어할 수 있도록 하여 AI 에이전트가 서로 다른 앱에서 복잡한 작업을 실행할 수 있도록 함
다중 LLM 제공업체 지원: OpenAI, Anthropic, Gemini, Ollama 및 DeepSeek를 포함한 다양한 언어 모델과 호환되어 AI 구현에 유연성을 제공함
구조화된 UI 액세스: Android의 접근성 서비스를 사용하여 구조화된 UI 계층 구조에 직접 액세스하므로 기존의 화면 스크래핑 방법보다 자동화가 더 안정적임
클라우드 인프라: 사전 설치된 앱, 병렬 작업 실행 및 안전한 자격 증명 관리를 통해 호스팅된 솔루션 제공
Droidrun의 사용 사례
모바일 데이터 추출: 외부 API를 제공하지 않는 모바일 전용 플랫폼 및 앱에서 데이터 추출
자동화된 테스트: 여러 앱 및 장치에서 테스트 시나리오를 자동화하여 QA 프로세스 지원
워크플로 자동화: 여행 예약 또는 소셜 미디어 계정 관리와 같이 서로 다른 앱에서 복잡한 다단계 프로세스 자동화
접근성 지원: 모바일 장치의 음성 제어 작동을 활성화하여 이동이 불편한 사용자를 지원
장점
AndroidWorld 벤치마크 테스트에서 높은 성공률(63.0%)
광범위한 설명서가 포함된 오픈 소스 프레임워크
물리적 장치와 가상 장치 모두 지원
기존의 화면 스크래핑 방법보다 더 안정적임
단점
현재 클라우드 기능에 대한 대기자 명단 단계에 있음
일부 기능은 Android 10 이상이 필요함
장시간 실행 작업의 경우 전력 소비가 높을 수 있음
Droidrun 사용 방법
필수 구성 요소 설치: 컴퓨터에 ADB(Android Debug Bridge)를 설치하고 Python이 설치되어 있는지 확인합니다.
DroidRun Portal 앱 설치: UI 제어 및 피드백을 활성화하려면 Android 기기에 DroidRun Portal 접근성 서비스 앱을 설치합니다.
환경 구성: 선택한 LLM API 키(OpenAI, Anthropic, Gemini 등)를 사용하여 .env 파일에 환경 변수를 설정합니다.
장치 연결: 'adb connect <device-ip>:5555' 명령을 사용하여 USB 또는 TCP/IP를 통해 Android 장치를 연결하거나 'droidrun connect <device-ip>'를 사용합니다.
Python 패키지 설치: pip를 사용하여 DroidRun Python 패키지를 설치하여 프레임워크의 기능에 액세스합니다.
에이전트 스크립트 만들기: DroidAgent 클래스를 사용하여 Python 스크립트를 작성하고 목표, 선택한 LLM을 지정하고 비전 및 추론과 같은 필요한 기능을 활성화합니다.
LLM 구성: 에이전트 초기화에서 선호하는 LLM 공급자(OpenAI, Gemini, Anthropic 등)를 선택하고 구성합니다.
에이전트 실행: 스크립트를 실행하여 에이전트가 자연어 명령을 사용하여 Android 장치에서 지정된 작업을 수행하도록 합니다.
실행 모니터링: 활성화된 추적 및 디버깅 기능을 사용하여 작업 실행을 모니터링하고 필요한 경우 문제를 해결합니다.
템플릿 저장: 자주 사용하는 작업의 경우 명령을 다시 입력하지 않고도 재사용할 수 있도록 템플릿으로 저장합니다.
Droidrun 자주 묻는 질문
Droidrun은 AI 에이전트에게 휴대폰(Android 및 iOS)을 기본적으로 제어할 수 있도록 지원하는 프레임워크로, 자연어 명령을 사용하여 모바일 워크플로우 및 장치 상호 작용을 자동화할 수 있습니다.