Arch Introduction
Arch est une passerelle intelligente de couche 7 construite sur Envoy Proxy qui fournit un traitement sécurisé, une observabilité robuste et une intégration transparente des invites avec des API pour construire des agents d'IA rapides, robustes et personnalisés.
Voir plusQu'est-ce que Arch
Arch est une passerelle d'invite intelligente open-source conçue avec des LLM construits sur mesure pour gérer des tâches critiques liées au traitement des invites et à l'intégration des API. Construite par les contributeurs principaux du proxy Envoy, elle traite les invites comme des demandes utilisateur nuancées qui nécessitent les mêmes capacités que les demandes HTTP traditionnelles. La plateforme est conçue pour protéger, observer et personnaliser les applications LLM telles que les agents, les assistants et les copilotes tout en les intégrant avec des API backend.
Comment fonctionne Arch ?
Arch fonctionne en gérant des tâches indifférenciées dans le traitement des invites grâce à plusieurs mécanismes clés. Il utilise des LLM spécialisés pour détecter et rejeter les tentatives de jailbreak, appelant intelligemment les API backend pour satisfaire les demandes des utilisateurs et gérant le routage des invites entre les LLM en amont. Le système fonctionne aux côtés des serveurs d'application et tire parti des capacités de gestion HTTP d'Envoy pour gérer le trafic entrant et sortant. Il comprend des LLM construits sur mesure pour l'appel de fonction/API et l'extraction de paramètres, tout en centralisant les garde-fous des invites grâce à sa fonctionnalité Prompt Guard. La plateforme met en œuvre la norme W3C Trace Context pour un traçage complet des demandes et fournit une gestion robuste du trafic avec des fonctionnalités telles que des nouvelles tentatives intelligentes et un basculement automatique.
Avantages de Arch
L'utilisation d'Arch apporte de multiples avantages au développement d'applications d'IA. Elle élimine le besoin d'écrire du code personnalisé pour la sécurité des invites en fournissant des garde-fous centralisés pour les invites. La plateforme offre des performances améliorées grâce à des tâches basées sur des invites rapides, rentables et précises, tout en garantissant une disponibilité continue grâce à des connexions en amont résilientes et une gestion intelligente du trafic. Les organisations bénéficient d'une observabilité complète avec des métriques standardisées pour surveiller la latence, l'utilisation des jetons et les taux d'erreur. De plus, son intégration avec Envoy Proxy offre une évolutivité et une fiabilité éprouvées, facilitant ainsi la tâche des développeurs pour construire et maintenir des applications d'IA sécurisées et performantes.
Articles populaires
Apple Lance Final Cut Pro 11 : Montage Vidéo IA pour Mac, iPad et iPhone
Nov 14, 2024
AI Perplexity introduit la publicité pour révolutionner sa plateforme
Nov 13, 2024
X prévoit de lancer une version gratuite du chatbot IA Grok pour concurrencer les géants de l'industrie
Nov 12, 2024
Meilleurs Générateurs d'Images IA : Flux 1.1 Pro Ultra est-il le Meilleur Comparé à Midjourney, Recraft V3 et Ideogram
Nov 12, 2024
Voir plus