CambioML 사용법
CambioML은 LLM을 사용하여 정확하고, 비공식적이며, 구성 가능한 문서 검색 및 데이터 추출 도구를 제공하는 오픈 소스 머신 러닝 인프라 회사입니다.
더 보기CambioML 사용 방법
CambioML 설치: CambioML 오픈 소스 Python 라이브러리를 설치합니다. 아마도 pip를 사용하여: pip install cambioml
가져오기 및 초기화: 라이브러리를 가져오고 API 키로 AnyParser를 초기화합니다: from any_parser import AnyParser; op = AnyParser(your_api_key)
문서 준비: PDF, HTML 또는 기타 문서 파일을 추출을 위해 준비합니다.
내용 추출: 추출 방법을 사용하여 문서를 처리합니다: content_result = op.extract(your_file_path)
출력 구성: 원하는 출력 형식(JSON, CSV 또는 Markdown) 및 스키마 매핑을 지정합니다.
추출된 데이터 검토 및 사용: 추출된 내용을 검토하고 원하는 목적(예: LLM 훈련, 데이터베이스 입력)에 사용합니다.
필요 시 삭제: 민감한 정보를 다루는 경우, 검색 중 기밀 데이터를 제거하기 위해 CambioML의 삭제 기능을 사용합니다.
다른 도구와 통합: 필요한 경우 모델 비교 또는 RLHF 미세 조정을 위해 pykoi와 같은 다른 CambioML 도구와 추출된 데이터를 사용합니다.
CambioML 자주 묻는 질문
CambioML은 PDF, HTML 및 양식에서 텍스트와 데이터를 추출하고 재구성하는 도구를 제공하는 오픈 소스 머신 러닝 인프라에 특화된 회사입니다. 그들은 LLM(대형 언어 모델)을 사용하여 정확한 문서 검색 및 데이터 추출 솔루션을 제공합니다.
더 보기