CambioML Howto
CambioML adalah perusahaan infrastruktur pembelajaran mesin open-source yang menyediakan alat untuk pengambilan dokumen dan ekstraksi data yang akurat, pribadi, dan dapat dikonfigurasi menggunakan LLMs.
Lihat Lebih BanyakCara Menggunakan CambioML
Instal CambioML: Instal pustaka Python open-source CambioML, kemungkinan menggunakan pip: pip install cambioml
Impor dan inisialisasi: Impor pustaka dan inisialisasi AnyParser dengan kunci API Anda: from any_parser import AnyParser; op = AnyParser(your_api_key)
Siapkan dokumen Anda: Siapkan file dokumen PDF, HTML, atau lainnya untuk ekstraksi
Ekstrak konten: Gunakan metode ekstrak untuk memproses dokumen Anda: content_result = op.extract(your_file_path)
Konfigurasi output: Tentukan format output yang diinginkan (JSON, CSV, atau Markdown) dan pemetaan skema
Tinjau dan gunakan data yang diekstrak: Periksa konten yang diekstrak dan gunakan untuk tujuan yang diinginkan (misalnya pelatihan LLM, input database)
Redaksi jika diperlukan: Jika bekerja dengan informasi sensitif, gunakan fitur redaksi CambioML untuk menghapus data rahasia selama pengambilan
Integrasikan dengan alat lain: Gunakan data yang diekstrak dengan alat CambioML lainnya seperti pykoi untuk perbandingan model atau penyempurnaan RLHF jika diperlukan
FAQ CambioML
CambioML adalah perusahaan yang mengkhususkan diri dalam infrastruktur pembelajaran mesin sumber terbuka, menyediakan alat untuk mengekstrak dan merekonstruksi teks dan data dari PDF, HTML, dan formulir. Mereka menawarkan solusi untuk pengambilan dokumen yang akurat dan ekstraksi data menggunakan LLM (Model Bahasa Besar).
Lihat Selengkapnya