
Parallax by Gradient
Parallax는 구성 및 물리적 위치에 관계없이 여러 장치에서 대규모 언어 모델을 실행하기 위한 분산 AI 클러스터를 구축할 수 있도록 하는 완전한 분산 추론 엔진입니다.
https://github.com/GradientHQ/parallax?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:Oct 31, 2025
Parallax by Gradient이란?
Gradient에서 개발한 Parallax는 모델 추론을 글로벌 협업 프로세스로 재구상하는 혁신적인 오픈 소스 추론 엔진입니다. 대규모 언어 모델을 분해, 실행 및 검증할 수 있도록 하여 기존의 중앙 집중식 인프라에서 벗어나 분산된 머신 네트워크에서 실행됩니다. 이 시스템은 Blackwell, Ampere 및 Hopper 시리즈를 포함한 다양한 GPU 아키텍처와의 호환성을 통해 Windows, Linux 및 macOS에서 크로스 플랫폼 배포를 지원합니다.
Parallax by Gradient의 주요 기능
Parallax는 사용자가 구성이나 물리적 위치에 관계없이 여러 노드에 모델 추론을 분산하여 자체 AI 클러스터를 구축할 수 있도록 지원하는 완전한 탈중앙화 추론 엔진입니다. 크로스 플랫폼 지원, 파이프라인 병렬 처리를 통한 효율적인 모델 샤딩, 동적 리소스 관리 기능을 제공하여 개인 장치에서 대규모 언어 모델을 실행하면서도 높은 성능을 유지할 수 있습니다.
분산 모델 추론: 사용 가능한 컴퓨팅 리소스를 효율적으로 사용할 수 있도록 모델 추론을 분할하여 여러 분산 노드에서 실행할 수 있습니다.
크로스 플랫폼 호환성: 소스 코드, Docker 또는 네이티브 애플리케이션을 통해 유연한 설치 옵션으로 Windows, Linux 및 macOS를 포함한 여러 운영 체제를 지원합니다.
동적 리소스 관리: Mac용 동적 KV 캐시 관리 및 지속적인 일괄 처리, 최적의 성능을 위한 지능형 요청 스케줄링 및 라우팅 기능을 제공합니다.
파이프라인 병렬 아키텍처: 파이프라인 병렬 모델 샤딩을 구현하여 클러스터의 여러 노드에 모델 레이어를 효율적으로 분산합니다.
Parallax by Gradient의 사용 사례
개인 AI 인프라: 개인은 여러 컴퓨팅 리소스를 결합하여 개인 장치에서 대규모 언어 모델을 실행할 수 있습니다.
분산 연구 환경: 연구 기관은 여러 위치에 있는 여러 컴퓨터를 연결하여 협업 AI 환경을 만들 수 있습니다.
리소스 최적화 개발: 개발자는 사용 가능한 장치에 모델 워크로드를 분산하여 기존 하드웨어 인프라를 활용할 수 있습니다.
장점
개인 장치에서 대규모 언어 모델을 실행할 수 있습니다.
다양한 플랫폼에서 유연한 배포 옵션을 제공합니다.
분산 컴퓨팅을 통해 효율적인 리소스 활용이 가능합니다.
단점
설치 프로세스가 길어질 수 있습니다(약 30분 소요).
일부 기능은 플랫폼에 따라 다릅니다(예: 특정 Docker 기능은 Linux+GPU로 제한됨).
Parallax by Gradient 사용 방법
필수 조건 확인: Python 버전 3.11.0에서 3.14.0이 설치되어 있는지 확인하십시오. Blackwell GPU의 경우 Ubuntu 24.04가 필요합니다.
설치: OS에 따라 설치 방법을 선택하십시오. Windows 사용자는 설치 프로그램을 다운로드할 수 있고, Linux/macOS 사용자는 소스에서 설치하고, Linux GPU 사용자는 Docker를 사용할 수 있습니다. macOS의 경우 먼저 Python 가상 환경을 만드십시오.
스케줄러 시작: 'parallax run'을 실행하여 기본 노드에서 스케줄러를 시작하십시오. http://localhost:3001에서 설정 인터페이스에 액세스하십시오. 프런트엔드 이외의 용도로는 'parallax run -m {model-name} -n {number-of-worker-nodes}'를 사용하십시오.
클러스터 및 모델 구성: 웹 인터페이스를 통해 지원되는 목록(DeepSeek, MiniMax-M2, GLM-4.6, Kimi-K2, Qwen, gpt-oss, Meta Llama 3 포함)에서 원하는 노드 구성 및 모델을 선택하십시오.
노드 연결: 연결하려는 각 노드에서 'parallax join'(로컬 네트워크) 또는 'parallax join -s {scheduler-address}'(공용 네트워크) 명령을 실행하십시오.
사용 시작: 노드가 연결되면 http://localhost:3001에서 웹 채팅 인터페이스를 사용하거나 http://localhost:3001/v1/chat/completions에 API 호출을 하여 프로그래밍 방식으로 액세스할 수 있습니다.
선택적 원격 액세스: 스케줄러가 아닌 컴퓨터에서 채팅 인터페이스에 액세스하려면 'parallax chat'(로컬 네트워크) 또는 'parallax chat -s {scheduler-address}'(공용 네트워크)를 실행한 다음 http://localhost:3002를 방문하십시오.
제거 (필요한 경우): pip 설치의 경우 'pip uninstall parallax'를 사용하십시오. Docker의 경우 docker 명령을 사용하여 컨테이너 및 이미지를 제거하십시오. Windows의 경우 제어판을 통해 제거하십시오.
Parallax by Gradient 자주 묻는 질문
Parallax는 Gradient에서 개발한 완전 분산형 추론 엔진으로, 사용자가 구성 및 물리적 위치에 관계없이 분산 노드에서 모델 추론을 위해 자체 AI 클러스터를 구축할 수 있습니다.











