CambioML 使い方
CambioMLは、LLMを使用して正確でプライベート、かつ構成可能な文書取得とデータ抽出のためのツールを提供するオープンソースの機械学習インフラストラクチャ会社です
もっと見るCambioMLの使い方
CambioMLをインストール: CambioMLのオープンソースPythonライブラリをインストールします。おそらくpipを使用して: pip install cambioml
インポートと初期化: ライブラリをインポートし、APIキーを使用してAnyParserを初期化します: from any_parser import AnyParser; op = AnyParser(your_api_key)
ドキュメントを準備: 抽出のためにPDF、HTML、または他のドキュメントファイルを準備します
コンテンツを抽出: extractメソッドを使用してドキュメントを処理します: content_result = op.extract(your_file_path)
出力を構成: 希望する出力形式(JSON、CSV、またはMarkdown)とスキーママッピングを指定します
抽出したデータを確認し使用: 抽出したコンテンツを確認し、希望する目的(例: LLMトレーニング、データベース入力)に使用します
必要に応じて削除: 機密情報を扱う場合は、取得中に機密データを削除するためにCambioMLの削除機能を使用します
他のツールと統合: 必要に応じて、モデル比較やRLHF微調整のためにpykoiなどの他のCambioMLツールと抽出したデータを使用します
CambioMLのよくある質問
CambioMLは、PDF、HTML、およびフォームからテキストとデータを抽出および再構築するためのツールを提供するオープンソースの機械学習インフラストラクチャに特化した会社です。彼らは、LLM(大規模言語モデル)を使用して、正確な文書検索とデータ抽出のソリューションを提供しています。
もっと見る