noirdoc

noirdoc

WebsiteFree
noirdoc là một công cụ bảo vệ PII mã nguồn mở, chạy cục bộ, tự động giả danh dữ liệu nhạy cảm trước khi nó đến LLM (ví dụ: thông qua plugin Claude Code), giữ các ánh xạ có thể đảo ngược trên máy của bạn và khôi phục đầu ra của mô hình về các giá trị gốc.
https://www.noirdoc.de/en/launch?ref=producthunt&utm_source=aipure
noirdoc

Thông tin Sản phẩm

Đã cập nhật:May 18, 2026

noirdoc là gì

noirdoc là một công cụ bảo mật được thiết kế để ngăn chặn thông tin nhận dạng cá nhân (PII) không bao giờ đi vào ngữ cảnh của LLM. Nó cung cấp một hook/plugin Claude Code PreToolUse giúp biên tập các tệp cục bộ trước khi Claude đọc chúng, đảm bảo tên thật và định danh không xuất hiện trong bản ghi. Công cụ biên tập tương tự cũng có sẵn dưới dạng CLI cho các quy trình làm việc LLM rộng hơn và dưới dạng tùy chọn proxy được lưu trữ cho các nhóm sử dụng các nhà cung cấp như OpenAI, Anthropic hoặc Azure. Nó là mã nguồn mở và được cấp phép MIT, với việc phát hiện và ánh xạ được xử lý cục bộ.

Các Tính năng Chính của noirdoc

Noirdoc là một "PII-guard" mã nguồn mở giúp ẩn danh cục bộ các nội dung nhạy cảm (ví dụ: tên, ngày tháng, thành phố, ID, IBAN) trước khi chúng đến LLM, giữ cho các giá trị thực không nằm trong ngữ cảnh của mô hình. Nó cung cấp một plugin Claude Code tự động biên tập các tệp được bảo vệ khi đọc và khôi phục phản hồi sau đó, cộng với cùng một công cụ biên tập dưới dạng CLI cho các quy trình làm việc LLM rộng hơn và một tùy chọn proxy được lưu trữ cho lưu lượng truy cập API OpenAI/Anthropic/Azure. Các ánh xạ vẫn nằm trên máy của người dùng và các bản gốc chỉ có thể được tiết lộ trong thiết bị đầu cuối của người dùng, giữ cho bản ghi và nhật ký được chia sẻ sạch sẽ.
Ẩn danh cục bộ, có thể đảo ngược: Phát hiện và thay thế PII bằng các phần giữ chỗ trên thiết bị và giữ một ánh xạ có thể đảo ngược cục bộ để bạn có thể khôi phục bản gốc mà không làm lộ chúng cho LLM.
Plugin Claude Code với tính năng khôi phục tự động: Hoạt động như một hook PreToolUse giúp biên tập các tệp được bảo vệ trước khi Claude đọc chúng và tự động khôi phục phản hồi của mô hình sau đó.
Tự động biên tập rảnh tay khi truy cập tệp: Ngay sau khi một tệp được bảo vệ được mở/đọc trong Claude Code, noirdoc sẽ thay thế các giá trị nhạy cảm cục bộ trước khi bất cứ thứ gì rời khỏi máy của bạn.
Quy tắc bảo vệ dựa trên đường dẫn (mẫu glob): Cho phép bạn xác định các tệp/thư mục nào được bảo vệ bằng các quy tắc glob (ví dụ: ./incoming/**, *.contract.*), để lại các nội dung khác không bị ảnh hưởng.
Bộ nhớ cache và ánh xạ cục bộ: Lưu trữ các bản sao được ẩn danh trong thư mục .noirdoc/cache/ cục bộ và giữ ánh xạ trên máy của bạn; không cần gọi API để phát hiện.
Nhiều điểm truy cập: plugin, CLI, proxy được lưu trữ: Sử dụng plugin Claude Code cho quy trình làm việc IDE, CLI cho tài liệu và đường ống cục bộ hoặc proxy được lưu trữ để bảo vệ các cuộc gọi API LLM toàn nhóm (OpenAI/Anthropic/Azure).

Các Trường hợp Sử dụng của noirdoc

Xem xét pháp lý và hợp đồng: Ẩn danh tên khách hàng, địa chỉ và mã định danh hợp đồng trước khi sử dụng LLM để tóm tắt thỏa thuận, soạn thảo điều khoản hoặc trích xuất nghĩa vụ—mà không làm rò rỉ PII vào nhật ký trò chuyện.
Quy trình làm việc tài liệu chăm sóc sức khỏe: Biên tập mã định danh bệnh nhân và ngày tháng trong khi tạo tóm tắt lượt khám, đề xuất mã hóa hoặc ghi chú nội bộ, giữ dữ liệu nhạy cảm không nằm trong ngữ cảnh và bản ghi của mô hình.
Hỗ trợ tài chính và kế toán: Bảo vệ IBAN, tên khách hàng và tham chiếu giao dịch trong khi sử dụng LLM để đối chiếu, soạn thảo báo cáo hoặc phản hồi hỗ trợ.
Hỗ trợ khách hàng và xử lý phiếu CRM: Tự động biên tập chi tiết cá nhân trong các phiếu đến hoặc tệp đính kèm (ví dụ: ID, tên) trước khi yêu cầu LLM soạn thảo trả lời hoặc phân loại vấn đề.
Các nhóm kỹ thuật với dữ liệu người dùng thực: Ngăn chặn việc vô tình tiết lộ dữ liệu sản xuất (tên người dùng, mã định danh) khi các nhà phát triển sử dụng Claude Code để kiểm tra nhật ký, báo cáo gỡ lỗi hoặc tệp do người dùng gửi.
Quản trị LLM doanh nghiệp thông qua proxy: Định tuyến các cuộc gọi API LLM toàn tổ chức thông qua một proxy được lưu trữ để ẩn danh nhất quán các trường nhạy cảm trên các công cụ và nhóm sử dụng OpenAI/Anthropic/Azure.

Ưu điểm

Giữ PII thực không nằm trong ngữ cảnh LLM bằng cách biên tập cục bộ trước khi bất kỳ dữ liệu nào được gửi đi.
Quy trình làm việc có thể đảo ngược: bản gốc có thể được tiết lộ trong thiết bị đầu cuối của riêng bạn trong khi bản ghi vẫn sạch sẽ.
Áp dụng linh hoạt thông qua plugin Claude Code, CLI hoặc proxy được lưu trữ tùy thuộc vào nhu cầu quy trình làm việc.
Các thành phần mã nguồn mở (được cấp phép MIT) và lưu trữ ánh xạ chỉ cục bộ cải thiện tính minh bạch và kiểm soát.

Nhược điểm

Hiệu quả phụ thuộc vào phạm vi phát hiện; các định dạng không phổ biến hoặc các mã định danh trường hợp đặc biệt có thể yêu cầu điều chỉnh hoặc có thể bị bỏ sót.
Các ánh xạ có thể đảo ngược được lưu trữ cục bộ có thể trở thành một trách nhiệm bảo mật (kiểm soát truy cập, sao lưu, xâm nhập thiết bị).
Bảo vệ dựa trên đường dẫn/glob yêu cầu cấu hình chính xác; các quy tắc được cấu hình sai có thể khiến các tệp nhạy cảm không được biên tập.

Cách Sử dụng noirdoc

1) Cài đặt noirdoc (công cụ CLI): Cài đặt noirdoc qua pip trên máy của bạn (như mô tả trên trang web chính thức). Sau khi cài đặt, bạn có thể chạy nó từ Python hoặc trực tiếp từ shell.
2) (Tùy chọn) Cài đặt plugin Claude Code: Từ trang khởi chạy noirdoc, sử dụng liên kết “Install the plugin” để cài đặt plugin Claude Code mã nguồn mở (được cấp phép MIT). Điều này cho phép tự động giả danh cục bộ trước khi Claude đọc các tệp được bảo vệ.
3) Chọn tệp nào nên được bảo vệ (quy tắc đường dẫn): Cấu hình các quy tắc đường dẫn dựa trên glob để quyết định những gì được giả danh tự động (ví dụ: "./incoming/**" hoặc "*.contract.*"). Các tệp khớp với các quy tắc này sẽ được biên tập cục bộ trước khi bất kỳ nội dung nào đến Claude.
4) Sử dụng Claude Code bình thường; noirdoc tự động biên tập các tệp được bảo vệ: Khi bạn mở hoặc đọc một tệp được bảo vệ trong Claude Code, plugin sẽ thay thế dữ liệu nhạy cảm (ví dụ: tên, IBAN, ID) bằng các trình giữ chỗ cục bộ—trước khi Claude nhìn thấy nó. Các trình giữ chỗ ví dụ bao gồm các mã thông báo như "<<PERSON_1>>", "<<DATE_1>>", "<<CITY_1>>".
5) Hiểu nơi dữ liệu được lưu trữ cục bộ: Các bản sao được giả danh được lưu trữ trong ".noirdoc/cache/" và ánh xạ có thể đảo ngược vẫn nằm trên máy của bạn. Việc phát hiện chạy cục bộ và không có cuộc gọi API nào được gửi đi (bao gồm cả đến nhóm noirdoc).
6) Chỉ tiết lộ bản gốc trong thiết bị đầu cuối của riêng bạn (không bao giờ trong bản ghi Claude): Khi bạn cần xem các giá trị thực, hãy chạy "noirdoc reveal" trong shell của bạn. Điều này tiết lộ bản gốc bên ngoài Claude, giữ cho cuộc trò chuyện của Claude không có dữ liệu cá nhân thực.
7) Sử dụng noirdoc bên ngoài Claude Code (quy trình làm việc CLI): Sử dụng CLI noirdoc để giả danh các tài liệu cục bộ cho bất kỳ quy trình làm việc LLM nào (không chỉ Claude Code). Phương pháp phát hiện cục bộ và ánh xạ có thể đảo ngược tương tự được áp dụng.
8) (Tùy chọn nhóm) Sử dụng proxy được lưu trữ cho các cuộc gọi API: Nếu nhóm của bạn muốn bảo vệ mọi cuộc gọi API (OpenAI / Anthropic / Azure), hãy sử dụng dịch vụ proxy được lưu trữ được đề cập trên trang web, hoặc liên hệ với nhà cung cấp để biết các tùy chọn proxy/tự lưu trữ.

Câu hỏi Thường gặp về noirdoc

Noirdoc là một công cụ bảo vệ PII giúp giả danh/chỉnh sửa dữ liệu nhạy cảm (ví dụ: tên thật, IBAN, ID) trước khi LLM có thể đọc nó, để các giá trị thực không đi vào ngữ cảnh của mô hình.