Arch Introduction
Arch est une passerelle intelligente de couche 7 construite sur Envoy Proxy qui fournit un traitement sécurisé, une observabilité robuste et une intégration transparente des invites avec des API pour construire des agents d'IA rapides, robustes et personnalisés.
Voir plusQu'est-ce que Arch
Arch est une passerelle d'invite intelligente open-source conçue avec des LLM construits sur mesure pour gérer des tâches critiques liées au traitement des invites et à l'intégration des API. Construite par les contributeurs principaux du proxy Envoy, elle traite les invites comme des demandes utilisateur nuancées qui nécessitent les mêmes capacités que les demandes HTTP traditionnelles. La plateforme est conçue pour protéger, observer et personnaliser les applications LLM telles que les agents, les assistants et les copilotes tout en les intégrant avec des API backend.
Comment fonctionne Arch ?
Arch fonctionne en gérant des tâches indifférenciées dans le traitement des invites grâce à plusieurs mécanismes clés. Il utilise des LLM spécialisés pour détecter et rejeter les tentatives de jailbreak, appelant intelligemment les API backend pour satisfaire les demandes des utilisateurs et gérant le routage des invites entre les LLM en amont. Le système fonctionne aux côtés des serveurs d'application et tire parti des capacités de gestion HTTP d'Envoy pour gérer le trafic entrant et sortant. Il comprend des LLM construits sur mesure pour l'appel de fonction/API et l'extraction de paramètres, tout en centralisant les garde-fous des invites grâce à sa fonctionnalité Prompt Guard. La plateforme met en œuvre la norme W3C Trace Context pour un traçage complet des demandes et fournit une gestion robuste du trafic avec des fonctionnalités telles que des nouvelles tentatives intelligentes et un basculement automatique.
Avantages de Arch
L'utilisation d'Arch apporte de multiples avantages au développement d'applications d'IA. Elle élimine le besoin d'écrire du code personnalisé pour la sécurité des invites en fournissant des garde-fous centralisés pour les invites. La plateforme offre des performances améliorées grâce à des tâches basées sur des invites rapides, rentables et précises, tout en garantissant une disponibilité continue grâce à des connexions en amont résilientes et une gestion intelligente du trafic. Les organisations bénéficient d'une observabilité complète avec des métriques standardisées pour surveiller la latence, l'utilisation des jetons et les taux d'erreur. De plus, son intégration avec Envoy Proxy offre une évolutivité et une fiabilité éprouvées, facilitant ainsi la tâche des développeurs pour construire et maintenir des applications d'IA sécurisées et performantes.
Articles populaires
Midjourney lance des tableaux d'ambiance de type Pinterest après la sortie de Patchwork
Dec 17, 2024
Google lance Whisk : Un générateur d'images IA révolutionnaire qui fusionne trois images en une
Dec 17, 2024
Google dévoile Imagen 3, son générateur d'images IA de nouvelle génération
Dec 17, 2024
Google dévoile Gemini Gems et Imagen 3 pour une créativité améliorée
Dec 17, 2024
Voir plus