Droidrun

Droidrun

WebsiteFree Trial
Droidrun ist ein Open-Source-Framework, das es KI-Agenten ermöglicht, Android- und iOS-Geräte über Befehle in natürlicher Sprache zu steuern und so die nahtlose Automatisierung von mobilen Apps und Arbeitsabläufen zu ermöglichen.
https://www.droidrun.ai/?ref=producthunt&utm_source=aipure
Droidrun

Produktinformationen

Aktualisiert:Jul 31, 2025

Was ist Droidrun

Droidrun ist eine leistungsstarke mobile Agenten-Infrastruktur, die entwickelt wurde, um die Lücke zwischen KI-Systemen und mobilen Plattformen zu schließen. Es wurde 2023 eingeführt und mit 2,1 Millionen Euro an Pre-Seed-Finanzierung unterstützt. Es bietet Entwicklern und Unternehmen die Möglichkeit, mobile Interaktionen mithilfe von Befehlen in natürlicher Sprache zu automatisieren. Das Framework gewann schnell an Zugkraft, da sich innerhalb von 24 Stunden nach dem Start über 900 Entwickler anmeldeten und über 3.300 GitHub-Sterne sammelten, was es zum am schnellsten wachsenden mobilen Agentenprojekt in seiner Kategorie macht.

Hauptfunktionen von Droidrun

Droidrun ist ein innovatives Open-Source-Framework, das es KI-Agenten ermöglicht, Android- und iOS-Geräte über natürliche Sprachbefehle zu steuern. Es nutzt die Barrierefreiheitsdienste von Android, um auf strukturierte UI-Hierarchien zuzugreifen, wodurch KI direkt mit mobilen Apps interagieren, Arbeitsabläufe automatisieren und Daten extrahieren kann. Die Plattform unterstützt mehrere LLM-Anbieter (einschließlich OpenAI, Anthropic, Gemini, Ollama, DeepSeek) und bietet sowohl lokale als auch Cloud-basierte Lösungen für Entwickler und Unternehmen.
Natürliche Sprachsteuerung: Ermöglicht die Steuerung mobiler Geräte über natürliche Sprachbefehle, wodurch KI-Agenten komplexe Aufgaben über verschiedene Apps hinweg ausführen können
Multi-LLM-Anbieterunterstützung: Kompatibel mit verschiedenen Sprachmodellen, darunter OpenAI, Anthropic, Gemini, Ollama und DeepSeek, und bietet Flexibilität bei der KI-Implementierung
Strukturierter UI-Zugriff: Verwendet die Barrierefreiheitsdienste von Android, um direkt auf die strukturierte UI-Hierarchie zuzugreifen, wodurch die Automatisierung zuverlässiger wird als herkömmliche Screen-Scraping-Methoden
Cloud-Infrastruktur: Bietet eine gehostete Lösung mit vorinstallierten Apps, paralleler Aufgabenbearbeitung und sicherer Anmeldeinformationsverwaltung

Anwendungsfälle von Droidrun

Mobile Datenextraktion: Extrahieren Sie Daten von rein mobilen Plattformen und Apps, die keine externen APIs bereitstellen
Automatisierte Tests: Unterstützen Sie QA-Prozesse durch die Automatisierung von Testszenarien über mehrere Apps und Geräte hinweg
Workflow-Automatisierung: Automatisieren Sie komplexe, mehrstufige Prozesse über verschiedene Apps hinweg, wie z. B. das Buchen von Reisearrangements oder das Verwalten von Social-Media-Konten
Barrierefreiheitsunterstützung: Unterstützen Sie Benutzer mit eingeschränkter Mobilität, indem Sie die sprachgesteuerte Bedienung mobiler Geräte ermöglichen

Vorteile

Hohe Erfolgsquote (63,0 %) bei AndroidWorld-Benchmark-Tests
Open-Source-Framework mit umfangreicher Dokumentation
Unterstützt sowohl physische als auch virtuelle Geräte
Zuverlässiger als herkömmliche Screen-Scraping-Methoden

Nachteile

Derzeit in der Wartelistenphase für Cloud-Funktionen
Einige Funktionen erfordern Android 10 oder höher
Kann bei lang andauernden Aufgaben einen hohen Stromverbrauch haben

Wie verwendet man Droidrun

Voraussetzungen installieren: Installieren Sie ADB (Android Debug Bridge) auf Ihrem Computer und stellen Sie sicher, dass Python installiert ist
DroidRun Portal App installieren: Installieren Sie die DroidRun Portal Accessibility Service App auf Ihrem Android-Gerät, um die UI-Steuerung und das Feedback zu aktivieren
Umgebung konfigurieren: Richten Sie Umgebungsvariablen in der .env-Datei mit Ihren gewählten LLM-API-Schlüsseln ein (OpenAI, Anthropic, Gemini usw.)
Gerät verbinden: Verbinden Sie Ihr Android-Gerät über USB oder TCP/IP mit dem Befehl 'adb connect <device-ip>:5555' oder verwenden Sie 'droidrun connect <device-ip>'
Python-Paket installieren: Installieren Sie das DroidRun Python-Paket mit pip, um auf die Funktionen des Frameworks zuzugreifen
Agent-Skript erstellen: Schreiben Sie ein Python-Skript mit der DroidAgent-Klasse, geben Sie Ihr Ziel und das gewählte LLM an und aktivieren Sie die erforderlichen Funktionen wie Vision und Reasoning
LLM konfigurieren: Wählen und konfigurieren Sie Ihren bevorzugten LLM-Anbieter (OpenAI, Gemini, Anthropic usw.) bei der Agenteninitialisierung
Agent ausführen: Führen Sie Ihr Skript aus, damit der Agent die angegebene Aufgabe auf Ihrem Android-Gerät mithilfe von Befehlen in natürlicher Sprache ausführt
Ausführung überwachen: Verwenden Sie die aktivierten Tracing- und Debugging-Funktionen, um die Aufgabenausführung zu überwachen und Fehler zu beheben, falls erforderlich
Vorlagen speichern: Speichern Sie häufig verwendete Aufgaben als Vorlagen, um sie wiederzuverwenden, ohne Befehle erneut eingeben zu müssen

Droidrun FAQs

Droidrun ist ein Framework, das KI-Agenten die native Steuerung von Mobiltelefonen (sowohl Android als auch iOS) ermöglicht und die Automatisierung von mobilen Workflows und Geräteinteraktionen mithilfe von Befehlen in natürlicher Sprache ermöglicht.