LiteLLM 사용법
LiteLLM은 OpenAI 형식을 사용하여 다양한 공급자의 100개 이상의 대규모 언어 모델과 상호작용하기 위한 통합 API를 제공하는 오픈 소스 라이브러리 및 프록시 서버입니다.
더 보기LiteLLM 사용 방법
LiteLLM 설치: pip를 사용하여 LiteLLM 라이브러리를 설치합니다: pip install litellm
환경 변수 가져오기 및 설정: litellm을 가져오고 API 키를 위한 환경 변수를 설정합니다: import litellm, os; os.environ['OPENAI_API_KEY'] = 'your-api-key'
API 호출하기: completion() 함수를 사용하여 API 호출을 합니다: response = litellm.completion(model='gpt-3.5-turbo', messages=[{'role': 'user', 'content': 'Hello'}])
스트리밍 응답 처리: 스트리밍 응답을 위해 stream=True로 설정합니다: response = litellm.completion(model='gpt-3.5-turbo', messages=[{'role': 'user', 'content': 'Hello'}], stream=True)
오류 처리 설정: OpenAIError와 함께 try-except 블록을 사용하여 예외를 처리합니다: try: litellm.completion(...) except OpenAIError as e: print(e)
콜백 구성: 로깅을 위한 콜백을 설정합니다: litellm.success_callback = ['helicone', 'langfuse']
LiteLLM 프록시 배포: LiteLLM 프록시 서버를 배포하려면 Docker를 사용합니다: docker run -e LITELLM_MASTER_KEY='sk-1234' ghcr.io/berriai/litellm:main
모델 라우팅 구성: config.yaml 파일을 생성하여 다양한 공급자를 위한 모델 라우팅 및 API 키를 설정합니다
프록시 서버 사용: OpenAI SDK 또는 curl 명령을 사용하여 배포된 LiteLLM 프록시로 API 호출을 합니다
LiteLLM 자주 묻는 질문
LiteLLM은 개발자가 표준화된 OpenAI 호환 형식을 사용하여 100개 이상의 다양한 LLM 공급자(OpenAI, Azure, Anthropic 등)와 상호 작용할 수 있도록 하는 통합 API 및 프록시 서버입니다. 로드 밸런싱, 지출 추적 및 공급자 간 일관된 오류 처리를 제공하여 LLM 통합을 간소화합니다.
LiteLLM 월간 트래픽 동향
LiteLLM은 11월에 172,140회 방문을 기록하며 4.8% 증가를 보였습니다. 2024년 11월의 특별한 업데이트나 시장 활동이 없었음에도 이러한 소폭 성장은 부하 분산, 장애 복구 메커니즘, 그리고 예산 관리와 같은 플랫폼의 지속적인 기능들 덕분인 것으로 보입니다.
과거 트래픽 보기
더 보기