
noirdoc
WebsiteFree
noirdoc 是一个开源的、本地运行的 PII 保护工具,它在敏感数据到达 LLM 之前(例如,通过 Claude Code 插件)自动对其进行假名化,将可逆映射保留在您的机器上,并将模型输出恢复为原始值。
https://www.noirdoc.de/en/launch?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年05月18日
什么是 noirdoc
noirdoc 是一款隐私工具,旨在防止个人身份信息 (PII) 进入 LLM 的上下文。它提供了一个 Claude Code PreToolUse 钩子/插件,可在 Claude 读取文件之前在本地编辑文件,确保真实姓名和标识符不会出现在记录中。相同的编辑引擎也可用作更广泛 LLM 工作流的 CLI,以及用于使用 OpenAI、Anthropic 或 Azure 等提供商的团队的托管代理选项。它是开源的,采用 MIT 许可,检测和映射在本地处理。
noirdoc 的主要功能
Noirdoc 是一个开源的 PII 保护工具,它在敏感内容(例如姓名、日期、城市、ID、IBAN)到达大型语言模型 (LLM) 之前,在本地对其进行假名化处理,从而使真实值不进入模型的上下文。它提供了一个 Claude Code 插件,可以在读取时自动编辑受保护的文件并在之后恢复响应,此外还有一个相同的编辑引擎作为 CLI,用于更广泛的 LLM 工作流程,以及一个用于 OpenAI/Anthropic/Azure API 流量的托管代理选项。映射保留在用户机器上,原始数据只能在用户的终端中显示,从而保持转录和共享日志的清洁。
本地、可逆的假名化: 在设备上检测 PII 并将其替换为占位符,并在本地保留可逆映射,以便您可以在不将其暴露给 LLM 的情况下恢复原始数据。
带自动恢复功能的 Claude Code 插件: 作为 PreToolUse 钩子,在 Claude 读取受保护文件之前对其进行编辑,并在之后自动恢复模型的响应。
文件访问时免手动自动编辑: 一旦在 Claude Code 中打开/读取受保护文件,noirdoc 就会在任何数据离开您的机器之前在本地替换敏感值。
基于路径的保护规则(glob 模式): 允许您使用 glob 规则(例如,./incoming/**, *.contract.*)定义哪些文件/文件夹受到保护,而其他内容则保持不变。
本地缓存和映射存储: 将假名化副本存储在本地 .noirdoc/cache/ 目录中,并将映射保留在您的机器上;检测无需 API 调用。
多个入口点:插件、CLI、托管代理: 根据工作流程需求,使用 Claude Code 插件进行 IDE 工作流程,使用 CLI 处理本地文档和管道,或使用托管代理保护团队范围内的 LLM API 调用 (OpenAI/Anthropic/Azure)。
noirdoc 的使用场景
法律和合同审查: 在使用 LLM 总结协议、起草条款或提取义务之前,对客户姓名、地址和合同标识符进行假名化处理,而不会将 PII 泄露到聊天日志中。
医疗保健文档工作流程: 在生成就诊摘要、编码建议或内部笔记时,编辑患者标识符和日期,使敏感数据不进入模型上下文和转录中。
财务和会计协助: 在使用 LLM 进行对账、报告草稿或支持响应时,保护 IBAN、客户姓名和交易参考。
客户支持和 CRM 工单处理: 在要求 LLM 起草回复或分类问题之前,自动编辑入站工单或附件中的个人详细信息(例如 ID、姓名)。
拥有真实用户数据的工程团队: 当开发人员使用 Claude Code 检查日志、调试报告或用户提交的文件时,防止生产数据(用户名、标识符)意外暴露。
通过代理进行企业 LLM 治理: 通过托管代理路由组织范围内的 LLM API 调用,以便在使用 OpenAI/Anthropic/Azure 的工具和团队之间一致地对敏感字段进行假名化处理。
优点
通过在发送任何数据之前在本地编辑,使真实的 PII 不进入 LLM 上下文。
可逆工作流程:原始数据可以在您自己的终端中显示,而转录保持清洁。
根据工作流程需求,通过 Claude Code 插件、CLI 或托管代理灵活采用。
开源 (MIT 许可) 组件和仅限本地的映射存储提高了透明度和控制力。
缺点
有效性取决于检测覆盖范围;不常见的格式或边缘情况标识符可能需要调整或可能被遗漏。
本地存储的可逆映射可能成为安全责任(访问控制、备份、设备泄露)。
基于路径/glob 的保护需要正确的配置;配置错误的规则可能会导致敏感文件未被编辑。
如何使用 noirdoc
1) 安装 noirdoc (CLI 引擎): 通过 pip 在您的机器上安装 noirdoc(如官方网站所述)。安装后,您可以从 Python 或直接从 shell 运行它。
2) (可选) 安装 Claude Code 插件: 从 noirdoc 启动页面,使用“安装插件”链接安装开源 Claude Code 插件(MIT 许可)。这使得在 Claude 读取受保护文件之前自动进行本地假名化。
3) 选择要保护的文件(路径规则): 配置基于 glob 的路径规则,以决定哪些内容会自动进行假名化(示例:“./incoming/**”或“*.contract.*”)。匹配这些规则的文件在任何内容到达 Claude 之前都会在本地进行编辑。
4) 正常使用 Claude Code;noirdoc 自动编辑受保护文件: 当您在 Claude Code 中打开或读取受保护文件时,插件会在本地用占位符替换敏感数据(例如,姓名、IBAN、ID)——在 Claude 看到它之前。示例占位符包括“<<PERSON_1>>”、“<<DATE_1>>”、“<<CITY_1>>”等标记。
5) 了解数据在本地的存储位置: 假名化副本存储在“.noirdoc/cache/”中,可逆映射保留在您的机器上。检测在本地运行,不会发送任何 API 调用(包括发送给 noirdoc 团队)。
6) 仅在您自己的终端中显示原始数据(绝不在 Claude 记录中): 当您需要查看真实值时,在 shell 中运行“noirdoc reveal”。这会在 Claude 之外显示原始数据,使 Claude 对话中不包含真实的个人数据。
7) 在 Claude Code 之外使用 noirdoc (CLI 工作流): 使用 noirdoc CLI 为任何 LLM 工作流(不限于 Claude Code)假名化本地文档。同样适用于本地检测和可逆映射方法。
8) (团队选项) 使用托管代理进行 API 调用: 如果您的团队希望保护每个 API 调用(OpenAI / Anthropic / Azure),请使用网站上提到的托管代理服务,或联系供应商获取代理/自托管选项。
noirdoc 常见问题
Noirdoc 是一款 PII 保护工具,它可以在大型语言模型读取敏感数据(例如真实姓名、IBAN、ID)之前对其进行假名化/编辑,从而使真实值不会进入模型的上下文。



