Arch 紹介
Archは、Envoy Proxy上に構築されたインテリジェントなレイヤー7ゲートウェイであり、安全な処理、堅牢な可視性、およびAPIとのプロンプトのシームレスな統合を提供し、高速で堅牢かつパーソナライズされたAIエージェントの構築を可能にします。
もっと見るArchとは
Archは、プロンプト処理およびAPI統合に関連する重要なタスクを処理するために目的に特化したLLMを用いて設計されたオープンソースのインテリジェントプロンプトゲートウェイです。Envoyプロキシのコア貢献者によって構築され、プロンプトを従来のHTTPリクエストと同じ機能を必要とする微妙なユーザーリクエストとして扱います。このプラットフォームは、エージェント、アシスタント、コーパイロットなどのLLMアプリケーションを保護、観察、パーソナライズし、バックエンドAPIと統合するように設計されています。
Archはどのように機能しますか?
Archは、プロンプト処理における差別化されていないタスクをいくつかの主要なメカニズムを通じて処理することで機能します。脱獄試行を検出および拒否するための専門的なLLMを使用し、ユーザーリクエストを満たすためにバックエンドAPIをインテリジェントに呼び出し、アップストリームLLM間のプロンプトルーティングを管理します。このシステムはアプリケーションサーバーと並行して実行され、IngressおよびEgressトラフィックを処理するためにEnvoyのHTTP管理機能を活用します。関数/API呼び出しおよびパラメータ抽出のための目的に特化したLLMを含み、Prompt Guard機能を通じてプロンプトガードレールを中央集権化します。このプラットフォームは、包括的なリクエストトレーシングのためにW3C Trace Context標準を実装し、スマートリトライや自動切り替えなどの機能を備えた堅牢なトラフィック管理を提供します。
Archのメリット
Archを使用することで、AIアプリケーション開発に複数の利点があります。中央集権的なプロンプトガードレールを提供することで、プロンプトのセキュリティのためにカスタムコードを書く必要がなくなります。このプラットフォームは、高速でコスト効率が良く、正確なプロンプトベースのタスクを通じてパフォーマンスの向上を提供し、レジリエントなアップストリーム接続とスマートトラフィック管理を通じて継続的な可用性を確保します。組織は、レイテンシ、トークン使用量、エラーレートを監視するための標準化されたメトリクスを使用して、包括的な可視性を享受します。さらに、Envoy Proxyとの統合により、実績のあるスケーラビリティと信頼性を提供し、開発者が安全で高性能なAIアプリケーションを構築および維持しやすくします。
もっと見る