noirdoc

noirdoc

WebsiteFree
noirdoc 是一個開源的、本地運行的 PII 保護工具,它會在敏感資料到達 LLM 之前自動進行假名化(例如,透過 Claude Code 插件),將可逆映射保留在您的機器上,並將模型輸出恢復為原始值。
https://www.noirdoc.de/en/launch?ref=producthunt&utm_source=aipure
noirdoc

產品資訊

更新時間:2026年05月18日

什麼是 noirdoc

noirdoc 是一個隱私工具,旨在防止個人身份資訊 (PII) 進入 LLM 的上下文。它提供了一個 Claude Code PreToolUse 鉤子/插件,可以在 Claude 讀取文件之前在本地對文件進行編輯,確保真實姓名和識別符不會出現在記錄中。相同的編輯引擎也可用作 CLI,用於更廣泛的 LLM 工作流程,並可作為託管代理選項,供使用 OpenAI、Anthropic 或 Azure 等提供商的團隊使用。它是開源的,採用 MIT 許可,檢測和映射在本地處理。

noirdoc 的主要功能

Noirdoc 是一個開源的 PII 防護工具,它在敏感內容(例如姓名、日期、城市、ID、IBAN)到達 LLM 之前,在本地將其假名化,從而使真實值不進入模型的上下文。它提供了一個 Claude Code 插件,可以在讀取時自動編輯受保護的文件,並在之後恢復響應;此外,它還提供相同的編輯引擎作為 CLI,用於更廣泛的 LLM 工作流程,以及一個用於 OpenAI/Anthropic/Azure API 流量的託管代理選項。映射保留在用戶的機器上,原始文件只能在用戶的終端中顯示,從而保持轉錄和共享日誌的整潔。
本地、可逆的假名化: 在設備上檢測 PII 並用佔位符替換,並在本地保留可逆映射,以便您可以在不將原始文件暴露給 LLM 的情況下恢復它們。
帶自動恢復功能的 Claude Code 插件: 作為一個 PreToolUse 鉤子,在 Claude 讀取受保護的文件之前對其進行編輯,並在之後自動恢復模型的響應。
文件訪問時的免手動自動編輯: 一旦在 Claude Code 中打開/讀取受保護的文件,noirdoc 會在任何內容離開您的機器之前在本地替換敏感值。
基於路徑的保護規則(glob 模式): 允許您使用 glob 規則(例如,./incoming/**, *.contract.*)定義哪些文件/文件夾受保護,而其他內容則保持不變。
本地緩存和映射存儲: 將假名化副本存儲在本地 .noirdoc/cache/ 目錄中,並將映射保留在您的機器上;檢測不需要 API 調用。
多個入口點:插件、CLI、託管代理: 根據工作流程需求,使用 Claude Code 插件進行 IDE 工作流程,使用 CLI 處理本地文檔和管道,或使用託管代理保護團隊範圍的 LLM API 調用 (OpenAI/Anthropic/Azure)。

noirdoc 的使用案例

法律和合同審查: 在使用 LLM 總結協議、起草條款或提取義務之前,將客戶姓名、地址和合同標識符假名化,而不會將 PII 洩露到聊天日誌中。
醫療保健文檔工作流程: 在生成就診摘要、編碼建議或內部筆記時,編輯患者標識符和日期,使敏感數據不進入模型上下文和轉錄。
金融和會計協助: 在使用 LLM 進行對賬、報告草稿或支持響應時,保護 IBAN、客戶姓名和交易參考。
客戶支持和 CRM 票務處理: 在要求 LLM 起草回复或分類問題之前,自動編輯入站票務或附件中的個人詳細信息(例如,ID、姓名)。
擁有真實用戶數據的工程團隊: 當開發人員使用 Claude Code 檢查日誌、調試報告或用戶提交的文件時,防止生產數據(用戶名、標識符)意外暴露。
通過代理進行企業 LLM 治理: 通過託管代理路由全組織的 LLM API 調用,以便在使用 OpenAI/Anthropic/Azure 的工具和團隊中一致地假名化敏感字段。

優點

在發送任何數據之前在本地編輯,使真實 PII 不進入 LLM 上下文。
可逆工作流程:原始文件可以在您自己的終端中顯示,而轉錄保持整潔。
根據工作流程需求,通過 Claude Code 插件、CLI 或託管代理靈活採用。
開源(MIT 許可)組件和本地映射存儲提高了透明度和控制力。

缺點

有效性取決於檢測覆蓋範圍;不常見的格式或邊緣案例標識符可能需要調整或可能被遺漏。
本地存儲的可逆映射可能成為安全責任(訪問控制、備份、設備洩露)。
基於路徑/glob 的保護需要正確配置;配置錯誤的規則可能會導致敏感文件未被編輯。

如何使用 noirdoc

1) 安裝 noirdoc (CLI 引擎): 在您的機器上透過 pip 安裝 noirdoc(如官方網站所述)。安裝後,您可以從 Python 或直接從 shell 運行它。
2) (可選) 安裝 Claude Code 插件: 從 noirdoc 啟動頁面,使用「安裝插件」連結安裝開源的 Claude Code 插件(MIT 許可)。這可以在 Claude 讀取受保護文件之前自動進行本地假名化。
3) 選擇應受保護的文件 (路徑規則): 配置基於 glob 的路徑規則,以決定哪些內容會自動假名化(給出的範例:「./incoming/**」或「*.contract.*」)。符合這些規則的文件會在任何內容到達 Claude 之前在本地進行編輯。
4) 正常使用 Claude Code;noirdoc 自動編輯受保護文件: 當您在 Claude Code 中打開或讀取受保護文件時,插件會在本地將敏感資料(例如姓名、IBAN、ID)替換為佔位符——在 Claude 看到它之前。範例佔位符包括「<<PERSON_1>>」、「<<DATE_1>>」、「<<CITY_1>>」等標記。
5) 了解資料在本地的儲存位置: 假名化副本儲存在「.noirdoc/cache/」中,可逆映射保留在您的機器上。檢測在本地運行,不會發送任何 API 調用(包括發送給 noirdoc 團隊)。
6) 僅在您自己的終端機中顯示原始資料(絕不在 Claude 記錄中): 當您需要查看真實值時,在您的 shell 中運行「noirdoc reveal」。這會在 Claude 之外顯示原始資料,使 Claude 對話不包含真實的個人資料。
7) 在 Claude Code 之外使用 noirdoc (CLI 工作流程): 使用 noirdoc CLI 對任何 LLM 工作流程(不僅僅是 Claude Code)的本地文件進行假名化。相同的本地檢測和可逆映射方法適用。
8) (團隊選項) 使用託管代理進行 API 調用: 如果您的團隊希望保護每個 API 調用 (OpenAI / Anthropic / Azure),請使用網站上提到的託管代理服務,或聯繫供應商以獲取代理/自託管選項。

noirdoc 常見問題

Noirdoc 是一個 PII 防護工具,它在 LLM 讀取敏感資料(例如真實姓名、IBAN、ID)之前對其進行假名化/編輯,這樣真實值就不會進入模型的上下文。