CambioML Anleitung
CambioML ist ein Unternehmen für Open-Source-Maschinenlern-Infrastruktur, das Tools für die genaue, private und konfigurierbare Dokumentenabfrage und Datenextraktion mit LLMs bereitstellt.
Mehr anzeigenWie verwendet man CambioML
CambioML installieren: Installieren Sie die Open-Source-Python-Bibliothek von CambioML, wahrscheinlich mit pip: pip install cambioml
Importieren und initialisieren: Importieren Sie die Bibliothek und initialisieren Sie den AnyParser mit Ihrem API-Schlüssel: from any_parser import AnyParser; op = AnyParser(your_api_key)
Bereiten Sie Ihr Dokument vor: Halten Sie Ihre PDF-, HTML- oder andere Dokumentdatei bereit zur Extraktion
Inhalt extrahieren: Verwenden Sie die Extraktionsmethode, um Ihr Dokument zu verarbeiten: content_result = op.extract(your_file_path)
Ausgabe konfigurieren: Geben Sie Ihr gewünschtes Ausgabeformat (JSON, CSV oder Markdown) und das Schema-Mapping an
Überprüfen und verwenden Sie die extrahierten Daten: Untersuchen Sie den extrahierten Inhalt und verwenden Sie ihn für Ihren gewünschten Zweck (z. B. LLM-Training, Datenbankeingabe)
Schwärzen, falls nötig: Wenn Sie mit sensiblen Informationen arbeiten, verwenden Sie die Schwärzungsfunktionen von CambioML, um vertrauliche Daten während der Abfrage zu entfernen
Integrieren Sie mit anderen Tools: Verwenden Sie die extrahierten Daten mit anderen CambioML-Tools wie Pykoi für den Modellvergleich oder RLHF-Finetuning, falls erforderlich
CambioML FAQs
CambioML ist ein Unternehmen, das sich auf Open-Source-Maschinenlern-Infrastruktur spezialisiert hat und Werkzeuge zum Extrahieren und Rekonstruieren von Text und Daten aus PDFs, HTMLs und Formularen bereitstellt. Sie bieten Lösungen für die genaue Dokumentenretrieval und Datenextraktion unter Verwendung von LLMs (Large Language Models).
Mehr anzeigen