Arch
Arch 是一个基于 Envoy Proxy 构建的智能第 7 层网关,提供安全处理、强大的可观察性和无缝的提示与 API 集成,用于构建快速、强大和个性化的 AI 代理。
https://github.com/katanemo/arch?ref=aipure&utm_source=aipure
产品信息
更新于:2024年12月16日
什么是 Arch
Arch 是一个开源的智能提示网关,专为处理与提示处理和 API 集成相关的关键任务而设计。由 Envoy 代理的核心贡献者构建,它将提示视为需要与传统 HTTP 请求相同功能的复杂用户请求。该平台旨在保护、观察和个性化像代理、助手和副驾这样的 LLM 应用,同时将它们与后端 API 集成。
Arch 的主要功能
Arch 是一个为处理 AI/LLM 应用程序而设计的智能第 7 层网关,基于 Envoy Proxy 构建。它提供了全面的提示管理功能,包括越狱检测、API 集成、LLM 路由和可观测性功能。该平台使用专门构建的 LLM 来处理关键任务,如函数调用、参数提取和安全提示处理,同时提供基于标准的监控和流量管理功能。
内置函数调用: 使用专门构建的 LLM 设计,用于处理快速、成本效益的 API 调用和从提示中提取参数,以构建代理和 RAG 应用程序
提示安全: 集中管理提示防护栏,并提供自动越狱尝试检测,无需自定义代码实现
高级流量管理: 通过智能重试、自动故障转移和弹性上游连接管理 LLM 调用,确保持续可用性
企业级可观测性: 实施 W3C Trace Context 标准,实现完整的请求跟踪,并提供全面的指标以监控延迟、令牌使用率和错误率
Arch 的使用场景
AI 驱动的天气预报: 与天气服务集成,通过自然语言处理提供智能天气预报
保险代理自动化: 构建自动化的保险代理,能够处理客户查询和处理保险相关任务
网络管理助手: 创建网络副驾,帮助操作员通过自然语言交互理解流量流向和管理网络操作
企业 API 集成: 无缝连接 AI 能力与现有企业 API,同时保持安全性和可观测性
优点
基于经过验证的 Envoy Proxy 技术,性能可靠
内置越狱检测,提供全面的安全功能
基于标准的可观测性,使其企业级就绪
缺点
由于名称与 Arch Linux 混淆,可能导致搜索可见性问题
需要 Docker 和特定的技术前提条件进行设置
作为较新的项目,文档和社区资源有限
如何使用 Arch
安装先决条件: 确保您的系统已安装 Docker (v24)、Docker compose (v2.29)、Python (v3.10) 和 Poetry (v1.8.3)。Poetry 用于本地开发。
创建 Python 虚拟环境: 创建并激活一个新的 Python 虚拟环境:python -m venv venv && source venv/bin/activate (或 venv\Scripts\activate 在 Windows 上)
安装 Arch CLI: 使用 pip 安装 Arch 网关 CLI 工具:pip install archgw
创建配置文件: 创建一个配置文件(例如,arch_config.yaml),定义您的 LLM 提供商、提示目标、端点和其他设置,如系统提示和参数
配置 LLM 提供商: 在配置文件中设置您的 LLM 提供商(例如,OpenAI),并使用适当的访问密钥和模型设置
定义提示目标: 在配置文件中配置提示目标,指定每个目标函数的端点、参数和描述
设置端点: 在配置文件中定义您的应用程序端点,包括连接设置和超时
初始化客户端: 在您的应用程序代码中创建一个指向 Arch 网关的 OpenAI 客户端实例(例如,base_url='http://127.0.0.1:12000/v1')
调用 API: 使用配置的客户端通过 Arch 进行 API 调用,Arch 将处理路由、安全性和可观察性
监控性能: 使用 Arch 的内置可观察性功能监控您的 LLM 交互的指标、跟踪和日志
Arch 常见问题
Arch 是一个智能的第 7 层网关,旨在通过 API 保护、观察和个性化 LLM 应用程序。它基于 Envoy Proxy 构建,并使用专为安全处理、强大的可观测性和与 API 的无缝集成而设计的 LLM 进行工程设计。