
Well Extract
Well Extract 是一款轻量级的开源 CLI 工具,它使用 OpenAI、Anthropic、Gemini 或 Ollama 等各种 AI 模型从发票和收据中提取结构化数据。
https://extract.wellapp.ai/?ref=producthunt&utm_source=aipure

产品信息
更新于:2025年07月09日
什么是 Well Extract
Well Extract 是一款 AI 驱动的发票和收据数据提取工具,专为开发者设计。它提供了一个命令行界面 (CLI),允许用户将混乱的发票和收据转换为结构化、可用的数据。作为 Well 品牌开源工具套件的一部分,Well Extract 专注于轻量级、可定制以及无缝集成到现有开发者工作流程中,而不会将用户锁定到昂贵的 API 中。
Well Extract 的主要功能
Well Extract 是一款轻量级的开源工具,专为开发者设计,用于从发票和收据中提取结构化数据。它支持 PDF 和图像格式,允许用户通过 CLI 界面使用各种 AI 模型(OpenAI、Anthropic、Gemini 或 Ollama)处理文档。该工具支持可定制的 JSON 输出格式,并在本地运行,无需外部上传。
多种 AI 模型支持: 可灵活选择和切换不同的 AI 提供商,包括 OpenAI、Anthropic、Gemini 和 Ollama,使用您自己的 API 密钥
CLI 优先方法: 基于本地终端的操作,没有 UI 依赖,提供快速高效的文档处理
可定制的 JSON 输出: 能够通过自定义提示定义和接收您首选的 JSON 结构中的数据
本地处理: 在本地处理文档,无需将敏感的财务信息上传到外部服务器
Well Extract 的使用场景
财务数据处理: 自动从发票和收据中提取财务数据,用于会计和簿记目的
开发者集成: 通过整合自动文档数据提取功能,构建自定义应用程序和工作流程
费用管理: 通过自动从收据中提取相关信息,简化费用报告和跟踪
税务文档: 通过以结构化格式提取关键信息,高效地组织和处理税务相关文档
优点
开源且可定制
本地处理,安全性更高
灵活的 AI 模型选择
开发者友好的 CLI 界面
缺点
需要技术知识才能设置和使用
依赖于外部 AI API 密钥
仅限于 CLI 界面,没有 GUI
如何使用 Well Extract
克隆 GitHub 仓库: 使用以下命令从 GitHub 克隆 Well Extract 仓库:git clone https://github.com/WellApp-ai/Well.git
设置 Python 环境: 创建并激活 Python 虚拟环境(Python 3.10+):python -m venv venv && source venv/bin/activate (Linux/macOS) 或 venv\\Scripts\\activate (Windows)
安装依赖: 安装所需的包:pip install -e .[dev] (Windows) 或 pip install -e .\\[dev\\] (Linux/macOS)
配置 API 密钥: 创建一个 .env 文件并添加您选择的 AI 提供商 API 密钥(OPENAI_API_KEY、ANTHROPIC_API_KEY 等)
准备输入文件: 准备好 PDF 或图像格式的发票/收据文件
通过 CLI 运行提取: 使用 CLI 命令:ai-invoice-extractor [options] <file-path> 来处理您的文档
定义 JSON 结构: 通过提示指定您所需的输出 JSON 结构以获取格式化的数据
检索提取的数据: 获取包含以您指定的格式提取的发票/收据信息的结构化 JSON 输出
Well Extract 常见问题
Well Extract是一个AI驱动的工具,可以从发票和收据(PDF或图像格式)中提取结构化数据。它轻量级、可定制且开源,专为开发人员设计。