Collaborative Language Model Runner 자주 묻는 질문

Question 1

Petals란 무엇인가요?

Accepted Answer

Petals는 사용자가 BitTorrent와 유사하게 분산 방식으로 대규모 언어 모델(100B+ 매개변수)을 공동으로 실행할 수 있도록 하는 오픈 소스 시스템입니다. 사용자가 모델의 작은 부분을 로드하고 다른 사용자와 팀을 이루어 BLOOM-176B와 같은 모델을 추론 및 미세 조정할 수 있게 합니다.

Question 2

Petals는 어떻게 작동하나요?

Accepted Answer

Petals는 여러 사용자 간에 대규모 언어 모델을 분할하여 작동합니다. 각 사용자는 모델의 작은 부분을 로드한 다음, 나머지 부분을 제공하는 다른 사용자와 협력하여 추론 또는 미세 조정을 실행합니다. 이 분산 접근 방식은 소비자 하드웨어에서 대규모 모델을 실행할 수 있게 합니다.

Question 3

Petals를 사용할 때의 장점은 무엇인가요?

Accepted Answer

Petals는 여러 가지 장점을 제공합니다: 1) 소비자 하드웨어에서 대규모 언어 모델을 실행할 수 있습니다. 2) 미세 조정 및 추론을 위해 오프로드하는 것보다 최대 10배 빠릅니다. 3) 일반 API보다 더 많은 유연성을 제공하여 사용자 정의 미세 조정, 샘플링 방법 및 숨겨진 상태에 대한 접근을 허용합니다. 4) 오픈 소스이며 커뮤니티 주도입니다.

Question 4

Petals는 무료로 사용할 수 있나요?

Accepted Answer

네, Petals는 무료이며 오픈 소스입니다. 그러나 사용자는 분산 모델을 실행하는 데 도움을 주기 위해 네트워크에 GPU 리소스를 기여하도록 권장됩니다.

Question 5

Petals에서 실행할 수 있는 모델은 무엇인가요?

Accepted Answer

Petals는 BLOOM-176B, Llama 3.1(최대 405B), Mixtral(8x22B), Falcon(40B+)와 같은 대규모 언어 모델을 실행하는 것을 지원합니다. 사용 가능한 모델은 Petals 건강 대시보드에서 확인할 수 있습니다.

Question 6

민감한 데이터에 대해 Petals를 사용하는 것이 안전한가요?

Accepted Answer

아니요, 민감한 데이터에 대해 공개 Petals 스웜을 사용하는 것은 권장되지 않습니다. 공개 스웜은 연구 및 학술 용도로만 설계되었습니다. 민감한 데이터의 경우, 사용자는 신뢰할 수 있는 당사자 간에 개인 스웜을 설정할 수 있습니다.

Collaborative Language Model Runner 사용법

추가 정보

Collaborative Language Model Runner 사용 방법