Arch Introduzione
Arch è un gateway intelligente Layer 7 costruito su Envoy Proxy che fornisce una gestione sicura, un'osservabilità robusta e un'integrazione senza soluzione di continuità dei prompt con le API per costruire agenti AI veloci, robusti e personalizzati.
Visualizza AltroCos'è Arch
Arch è un gateway di prompt intelligente open-source progettato con LLM appositamente costruiti per gestire compiti critici relativi all'elaborazione dei prompt e all'integrazione delle API. Costruito dai contributori principali di Envoy proxy, tratta i prompt come richieste utente sfumate che richiedono le stesse capacità delle richieste HTTP tradizionali. La piattaforma è progettata per proteggere, osservare e personalizzare le applicazioni LLM come agenti, assistenti e co-piloti, integrandole con le API backend.
Come funziona Arch?
Arch opera gestendo compiti non differenziati nell'elaborazione dei prompt attraverso diversi meccanismi chiave. Utilizza LLM specializzati per rilevare e rifiutare tentativi di jailbreak, chiamando intelligentemente le API backend per soddisfare le richieste degli utenti e gestendo il routing dei prompt tra gli LLM upstream. Il sistema funziona insieme ai server applicativi e sfrutta le capacità di gestione HTTP di Envoy per gestire il traffico in ingresso e in uscita. Include LLM appositamente costruiti per la chiamata di funzioni/API e l'estrazione di parametri, centralizzando i guardrail dei prompt attraverso la sua funzione Prompt Guard. La piattaforma implementa lo standard W3C Trace Context per una tracciabilità completa delle richieste e fornisce una gestione robusta del traffico con funzionalità come tentativi intelligenti e passaggi automatici.
Benefici di Arch
Utilizzare Arch porta numerosi vantaggi nello sviluppo di applicazioni AI. Elimina la necessità di scrivere codice personalizzato per la sicurezza dei prompt fornendo guardrail centralizzati per i prompt. La piattaforma offre prestazioni migliorate attraverso compiti basati su prompt rapidi, economici e accurati, garantendo al contempo disponibilità continua attraverso connessioni upstream resilienti e gestione intelligente del traffico. Le organizzazioni beneficiano di un'osservabilità completa con metriche standardizzate per monitorare la latenza, l'uso dei token e i tassi di errore. Inoltre, la sua integrazione con Envoy Proxy offre scalabilità e affidabilità comprovate, rendendo più facile per gli sviluppatori costruire e mantenere applicazioni AI sicure e ad alte prestazioni.
Articoli Popolari
12 Giorni di Aggiornamenti OpenAI 2024
Dec 18, 2024
Google presenta il generatore di immagini AI di nuova generazione Imagen 3
Dec 17, 2024
Google presenta Gemini Gems e Imagen 3 per una creatività potenziata
Dec 17, 2024
Veo 2: Il Nuovo Modello di Generazione Video all'Avanguardia di Google Entra in Scena
Dec 17, 2024
Visualizza altro