noirdoc

noirdoc

WebsiteFree
noirdoc es un protector de PII de código abierto que se ejecuta localmente y seudonimiza automáticamente los datos sensibles antes de que lleguen a un LLM (por ejemplo, a través de un plugin de Claude Code), mantiene mapeos reversibles en su máquina y restaura las salidas del modelo a los valores originales.
https://www.noirdoc.de/en/launch?ref=producthunt&utm_source=aipure
noirdoc

Información del Producto

Actualizado:18/05/2026

¿Qué es noirdoc?

noirdoc es una herramienta de privacidad diseñada para evitar que la información de identificación personal (PII) entre en el contexto de un LLM. Proporciona un hook/plugin PreToolUse de Claude Code que redacta archivos localmente antes de que Claude los lea, asegurando que los nombres e identificadores reales no aparezcan en la transcripción. El mismo motor de redacción también está disponible como CLI para flujos de trabajo LLM más amplios y como una opción de proxy alojado para equipos que utilizan proveedores como OpenAI, Anthropic o Azure. Es de código abierto y tiene licencia MIT, con detección y mapeo manejados localmente.

Características Principales de noirdoc

Noirdoc es un "PII-guard" de código abierto que pseudonimiza localmente contenido sensible (por ejemplo, nombres, fechas, ciudades, identificaciones, IBANs) antes de que llegue a un LLM, manteniendo los valores reales fuera del contexto del modelo. Proporciona un plugin de Claude Code que redacta automáticamente los archivos protegidos al leerlos y restaura las respuestas después, además del mismo motor de redacción como CLI para flujos de trabajo LLM más amplios y una opción de proxy alojado para el tráfico de la API de OpenAI/Anthropic/Azure. Los mapeos permanecen en la máquina del usuario, y los originales solo se pueden revelar en la terminal del usuario, manteniendo las transcripciones y los registros compartidos limpios.
Pseudonimización local y reversible: Detecta y reemplaza PII con marcadores de posición en el dispositivo y mantiene un mapeo reversible localmente para que puedas restaurar los originales sin exponerlos al LLM.
Plugin de Claude Code con restauración automática: Actúa como un "hook" de PreToolUse que redacta los archivos protegidos antes de que Claude los lea y restaura automáticamente las respuestas del modelo después.
Redacción automática sin intervención en el acceso a archivos: Tan pronto como se abre/lee un archivo protegido en Claude Code, noirdoc reemplaza los valores sensibles localmente antes de que algo salga de tu máquina.
Reglas de protección basadas en rutas (patrones glob): Te permite definir qué archivos/carpetas están protegidos usando reglas glob (por ejemplo, ./incoming/**, *.contract.*), dejando otro contenido intacto.
Caché local y almacenamiento de mapeos: Almacena copias pseudonimizadas en un directorio local .noirdoc/cache/ y mantiene el mapeo en tu máquina; no se requiere ninguna llamada a la API para la detección.
Múltiples puntos de entrada: plugin, CLI, proxy alojado: Usa el plugin de Claude Code para flujos de trabajo IDE, la CLI para documentos y pipelines locales, o un proxy alojado para proteger las llamadas a la API de LLM de todo el equipo (OpenAI/Anthropic/Azure).

Casos de Uso de noirdoc

Revisión legal y de contratos: Pseudonimiza nombres de clientes, direcciones e identificadores de contratos antes de usar LLMs para resumir acuerdos, redactar cláusulas o extraer obligaciones, sin filtrar PII en los registros de chat.
Flujos de trabajo de documentación sanitaria: Redacta identificadores de pacientes y fechas mientras generas resúmenes de visitas, sugerencias de codificación o notas internas, manteniendo los datos sensibles fuera del contexto y las transcripciones del modelo.
Asistencia financiera y contable: Protege IBANs, nombres de clientes y referencias de transacciones mientras usas LLMs para conciliaciones, borradores de informes o respuestas de soporte.
Atención al cliente y gestión de tickets de CRM: Redacta automáticamente los detalles personales en tickets o archivos adjuntos entrantes (por ejemplo, identificaciones, nombres) antes de pedir a un LLM que redacte respuestas o clasifique problemas.
Equipos de ingeniería con datos de usuarios reales: Evita la exposición accidental de datos de producción (nombres de usuario, identificadores) cuando los desarrolladores usan Claude Code para inspeccionar registros, informes de depuración o archivos enviados por el usuario.
Gobernanza de LLM empresarial a través de proxy: Dirige las llamadas a la API de LLM de toda la organización a través de un proxy alojado para pseudonimizar consistentemente los campos sensibles en todas las herramientas y equipos que usan OpenAI/Anthropic/Azure.

Ventajas

Mantiene la PII real fuera del contexto del LLM al redactar localmente antes de que se envíe cualquier dato.
Flujo de trabajo reversible: los originales se pueden revelar en tu propia terminal mientras las transcripciones permanecen limpias.
Adopción flexible a través del plugin de Claude Code, CLI o proxy alojado según las necesidades del flujo de trabajo.
Los componentes de código abierto (licencia MIT) y el almacenamiento de mapeos solo local mejoran la transparencia y el control.

Desventajas

La efectividad depende de la cobertura de detección; formatos poco comunes o identificadores de casos extremos pueden requerir ajustes o podrían pasarse por alto.
Los mapeos reversibles almacenados localmente pueden convertirse en una responsabilidad de seguridad (control de acceso, copias de seguridad, compromiso del dispositivo).
La protección basada en rutas/glob requiere una configuración correcta; reglas mal configuradas podrían dejar archivos sensibles sin redactar.

Cómo Usar noirdoc

1) Instalar noirdoc (motor CLI): Instale noirdoc a través de pip en su máquina (como se describe en el sitio oficial). Después de la instalación, puede ejecutarlo desde Python o directamente desde el shell.
2) (Opcional) Instalar el plugin de Claude Code: Desde la página de inicio de noirdoc, use el enlace "Instalar el plugin" para instalar el plugin de código abierto de Claude Code (con licencia MIT). Esto permite la seudonimización local automática antes de que Claude lea los archivos protegidos.
3) Elija qué archivos deben protegerse (reglas de ruta): Configure reglas de ruta basadas en glob para decidir qué se seudonimiza automáticamente (ejemplos dados: "./incoming/**" o "*.contract.*"). Los archivos que coinciden con estas reglas se redactan localmente antes de que cualquier contenido llegue a Claude.
4) Use Claude Code normalmente; noirdoc redacta automáticamente los archivos protegidos: Cuando abre o lee un archivo protegido en Claude Code, el plugin reemplaza los datos sensibles (por ejemplo, nombres, IBAN, identificaciones) con marcadores de posición localmente, antes de que Claude los vea. Los marcadores de posición de ejemplo incluyen tokens como "<<PERSON_1>>", "<<DATE_1>>", "<<CITY_1>>".
5) Comprender dónde se almacenan los datos localmente: Las copias seudonimizadas se almacenan en ".noirdoc/cache/" y el mapeo reversible permanece en su máquina. La detección se ejecuta localmente y no se envía ninguna llamada a la API (incluido al equipo de noirdoc).
6) Revelar originales solo en su propio terminal (nunca en la transcripción de Claude): Cuando necesite ver valores reales, ejecute "noirdoc reveal" en su shell. Esto revela los originales fuera de Claude, manteniendo la conversación de Claude libre de datos personales reales.
7) Usar noirdoc fuera de Claude Code (flujo de trabajo CLI): Use la CLI de noirdoc para seudonimizar documentos locales para cualquier flujo de trabajo de LLM (no solo Claude Code). Se aplica el mismo enfoque de detección local y mapeo reversible.
8) (Opción de equipo) Usar el proxy alojado para llamadas a la API: Si su equipo desea proteger cada llamada a la API (OpenAI / Anthropic / Azure), use la oferta de proxy alojado mencionada en el sitio, o comuníquese con el proveedor para opciones de proxy/autoalojamiento.

Preguntas Frecuentes de noirdoc

Noirdoc es una herramienta de protección de PII que "seudonimiza"/redacta datos sensibles (por ejemplo, nombres reales, IBAN, identificaciones) antes de que un LLM pueda leerlos, para que los valores reales no entren en el contexto del modelo.