Arch
Arch ist ein intelligentes Layer-7-Gateway, das auf Envoy Proxy basiert und eine sichere Handhabung, robuste Beobachtbarkeit und nahtlose Integration von Eingabeaufforderungen mit APIs für den Aufbau schneller, robuster und personalisierter KI-Agenten bietet.
https://github.com/katanemo/arch?ref=aipure&utm_source=aipure
Produktinformationen
Aktualisiert:Dec 16, 2024
Was ist Arch
Arch ist ein Open-Source-intelligentes Eingabeaufforderungsgateway, das mit speziell entwickelten LLMs ausgestattet ist, um kritische Aufgaben im Zusammenhang mit der Verarbeitung von Eingabeaufforderungen und der API-Integration zu bewältigen. Es wurde von den Hauptbeitragsleistenden des Envoy-Proxys entwickelt und behandelt Eingabeaufforderungen als nuancierte Benutzeranfragen, die dieselben Fähigkeiten wie traditionelle HTTP-Anfragen erfordern. Die Plattform ist darauf ausgelegt, LLM-Anwendungen wie Agenten, Assistenten und Co-Piloten zu schützen, zu beobachten und zu personalisieren, während sie mit Backend-APIs integriert werden.
Hauptfunktionen von Arch
Arch ist ein intelligentes Layer-7-Gateway, das für die Verarbeitung von KI/LLM-Anwendungen entwickelt wurde und auf Envoy Proxy basiert. Es bietet umfassende Funktionen zur Verwaltung von Eingabeaufforderungen, einschließlich Jailbreak-Erkennung, API-Integration, LLM-Routing und Observabilitätsfunktionen. Die Plattform verwendet speziell entwickelte LLMs, um kritische Aufgaben wie Funktionsaufrufe, Parameterextraktion und sichere Verarbeitung von Eingabeaufforderungen zu bewältigen, während sie standardbasierte Überwachungs- und Verkehrsmanagementfunktionen bietet.
Integrierte Funktionsaufrufe: Entwickelt mit speziell entwickelten LLMs, um schnelle, kosteneffektive API-Aufrufe und Parameterextraktion aus Eingabeaufforderungen für den Aufbau agentischer und RAG-Anwendungen zu ermöglichen
Eingabeaufforderungssicherheit: Zentralisiert Eingabeaufforderungsrichtlinien und bietet automatische Erkennung von Jailbreak-Versuchen, ohne dass eine benutzerdefinierte Codeimplementierung erforderlich ist
Erweitertes Verkehrsmanagement: Verwaltet LLM-Aufrufe mit intelligenten Wiederholungen, automatischem Failover und resilienten Upstream-Verbindungen, um eine kontinuierliche Verfügbarkeit sicherzustellen
Unternehmensgerechte Observabilität: Implementiert den W3C Trace Context-Standard für vollständiges Anforderungs-Tracking und bietet umfassende Metriken zur Überwachung von Latenz, Token-Nutzung und Fehlerquoten
Anwendungsfälle von Arch
KI-gestützte Wettervorhersage: Integration mit Wetterdiensten zur Bereitstellung intelligenter Wettervorhersagen durch natürliche Sprachverarbeitung
Automatisierung von Versicherungsagenten: Erstellung automatisierter Versicherungsagenten, die Kundenanfragen bearbeiten und versicherungsbezogene Aufgaben verarbeiten können
Netzwerkmanagement-Assistent: Erstellung von Netzwerk-Co-Piloten, die Betreibern helfen, den Datenverkehr zu verstehen und Netzwerkoperationen durch natürliche Sprachinteraktionen zu verwalten
Integration von Unternehmens-APIs: Nahtlose Verbindung von KI-Funktionen mit bestehenden Unternehmens-APIs unter Wahrung von Sicherheit und Observabilität
Vorteile
Basierend auf bewährter Envoy Proxy-Technologie für zuverlässige Leistung
Umfassende Sicherheitsfunktionen mit integrierter Jailbreak-Erkennung
Standardsbasierte Observabilität, die es unternehmensbereit macht
Nachteile
Potenzielle Sichtbarkeitsprobleme in Suchmaschinen aufgrund von Namensverwirrung mit Arch Linux
Benötigt Docker und spezifische technische Voraussetzungen für die Einrichtung
Eingeschränkte Dokumentation und Community-Ressourcen als neuere Projekt
Wie verwendet man Arch
Installiere Voraussetzungen: Stelle sicher, dass Docker (v24), Docker Compose (v2.29), Python (v3.10) und Poetry (v1.8.3) auf deinem System installiert sind. Poetry wird für die lokale Entwicklung benötigt.
Erstelle virtuelle Python-Umgebung: Erstelle und aktiviere eine neue Python-virtuelle Umgebung mit: python -m venv venv && source venv/bin/activate (oder venv\Scripts\activate unter Windows)
Installiere Arch CLI: Installiere das Arch-Gateway-CLI-Tool mit pip: pip install archgw
Erstelle Konfigurationsdatei: Erstelle eine Konfigurationsdatei (z.B. arch_config.yaml), die deine LLM-Anbieter, Eingabeaufforderungsziele, Endpunkte und andere Einstellungen wie Systemaufforderungen und Parameter definiert.
Konfiguriere LLM-Anbieter: Richte in der Konfigurationsdatei deine LLM-Anbieter (z.B. OpenAI) mit den entsprechenden Zugriffsschlüsseln und Modelleinstellungen ein.
Definiere Eingabeaufforderungsziele: Konfiguriere Eingabeaufforderungsziele in der Konfigurationsdatei, indem du Endpunkte, Parameter und Beschreibungen für jede Ziel-Funktion angibst.
Richte Endpunkte ein: Definiere deine Anwendungsendpunkte in der Konfigurationsdatei, einschließlich Verbindungseinstellungen und Zeitüberschreitungen.
Initialisiere Client: Erstelle eine OpenAI-Clientinstanz, die auf das Arch-Gateway zeigt (z.B. base_url='http://127.0.0.1:12000/v1') in deinem Anwendungscode.
Führe API-Aufrufe durch: Verwende den konfigurierten Client, um API-Aufrufe über Arch durchzuführen, das Routing, Sicherheit und Beobachtbarkeit übernimmt.
Überwache die Leistung: Nutze die integrierten Beobachtungsfunktionen von Arch, um Metriken, Traces und Protokolle für deine LLM-Interaktionen zu überwachen.
Arch FAQs
Arch ist ein intelligentes Layer-7-Gateway, das entwickelt wurde, um LLM-Anwendungen mit APIs zu schützen, zu beobachten und zu personalisieren. Es basiert auf Envoy Proxy und ist mit speziell entwickelten LLMs für eine sichere Handhabung, robuste Beobachtbarkeit und nahtlose Integration von Eingabeaufforderungen mit APIs konzipiert.
Offizielle Beiträge
Wird geladen...Arch Video
Beliebte Artikel
Midjourney führt Pinterest-ähnliche Moodboards nach Patchwork-Veröffentlichung ein
Dec 17, 2024
Google startet Whisk: Revolutionärer KI-Bildgenerator kombiniert drei Bilder zu einem
Dec 17, 2024
Google enthüllt KI-Bildgenerator der nächsten Generation Imagen 3
Dec 17, 2024
Google stellt Gemini Gems und Imagen 3 für verbesserte Kreativität vor
Dec 17, 2024