
MulmoChat
MulmoChat은 음성 채팅, 이미지 생성 및 웹 브라우징 기능을 원활하게 통합하는 오픈 소스 멀티모달 AI 채팅 인터페이스로, 사용자가 풍부한 시각적 및 상호 작용적 콘텐츠를 경험하면서 대화를 통해 자연스럽게 상호 작용할 수 있습니다.
https://github.com/receptron/MulmoChat?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:Mar 31, 2026
MulmoChat이란?
MulmoChat은 Microsoft 엔지니어였던 나카지마 사토시가 개발한 획기적인 연구 프로토타입으로, 기존 채팅 인터페이스를 재해석합니다. 기존의 텍스트 기반 채팅 애플리케이션과 달리 MulmoChat은 GUI(그래픽 사용자 인터페이스)와 NLUI(자연어 사용자 인터페이스)를 통합하여 멀티모달 AI 채팅 경험을 위한 새로운 패러다임을 제시합니다. 이 프로젝트는 오픈 소스이며 기능을 수행하려면 OpenAI 및 Google Gemini API 키가 필요하며 Windows, macOS 및 Linux 플랫폼을 지원합니다.
MulmoChat의 주요 기능
MulmoChat은 전통적인 텍스트 기반 커뮤니케이션과 풍부한 시각적 및 인터랙티브 콘텐츠를 결합하여 AI 채팅 상호 작용에 혁명을 일으키는 연구 프로토타입입니다. 음성 채팅 기능, 이미지 생성, 웹 브라우징 및 사용자가 캔버스에서 직접 동적인 시각적 콘텐츠를 경험하면서 자연스러운 대화에 참여할 수 있는 멀티모달 상호 작용을 제공하며, OpenAI, Anthropic, Google Gemini 및 Ollama를 포함한 여러 AI 제공업체에서 지원합니다.
멀티모달 상호 작용: 전통적인 텍스트 전용 채팅 경험을 넘어 텍스트, 음성, 이미지 및 인터랙티브 요소를 단일 대화형 인터페이스에 원활하게 통합합니다.
공급자에 구애받지 않는 텍스트 생성: 통합 API 인터페이스를 통해 여러 AI 제공업체(OpenAI, Anthropic, Google Gemini, Ollama)를 지원하여 유연한 모델 선택 및 통합을 허용합니다.
고급 이미지 생성: 로컬 이미지 생성을 위해 ComfyUI와 통합되어 사용자 정의 가능한 매개변수 및 워크플로를 통해 FLUX와 같은 고급 모델을 지원합니다.
확장 가능한 플러그인 아키텍처: 개발자가 TypeScript 계약에서 Vue 뷰 및 구성에 이르기까지 플러그인을 통해 기능을 확장할 수 있습니다.
MulmoChat의 사용 사례
인터랙티브 교육: 교사는 실시간 시각 자료 및 인터랙티브 요소와 함께 구두 설명을 결합하여 몰입형 학습 경험을 만들 수 있습니다.
디자인 협업: 디자이너는 실시간으로 이미지를 생성하고 조작하면서 개념을 논의하여 창의적인 프로세스를 간소화할 수 있습니다.
가상 관광: 여행사는 지도 기능, 이미지 생성 및 자연스러운 대화를 결합하여 인터랙티브 가상 투어를 제공할 수 있습니다.
장점
여러 AI 제공업체에 대한 지원으로 매우 유연합니다.
풍부한 멀티모달 상호 작용 기능
오픈 소스 및 확장 가능한 아키텍처
단점
전체 기능을 위해 여러 API 키가 필요합니다.
다양한 종속성이 있는 복잡한 설정
연구 프로토타입 상태는 제한된 생산 준비 상태를 나타낼 수 있습니다.
MulmoChat 사용 방법
종속성 설치: MulmoChat에 필요한 모든 종속성을 설치하려면 'yarn install'을 실행하세요.
환경 변수 구성: .env 파일을 만들고 필요한 API 키를 추가하세요. OPENAI_API_KEY 및 GEMINI_API_KEY는 필수입니다. 선택적 키에는 GOOGLE_MAP_API_KEY, EXA_API_KEY, ANTHROPIC_API_KEY, OLLAMA_BASE_URL, COMFYUI_BASE_URL, COMFYUI_DEFAULT_MODEL 및 COMFYUI_TIMEOUT_MS가 포함됩니다.
개발 서버 시작: 개발 서버를 시작하려면 'yarn dev'를 실행하세요.
마이크 접근 허용: 브라우저를 열 때 메시지가 표시되면 마이크에 접근할 수 있도록 허용하세요.
음성 채팅 시작: AI와 상호 작용을 시작하려면 인터페이스에서 '음성 채팅 시작' 버튼을 클릭하세요.
선택 사항: ComfyUI 통합 설정: 로컬 이미지 생성을 위해: 1) ComfyUI Desktop을 설치하고, 2) ComfyUI Desktop 서버를 실행하고, 3) flux1-schnell-fp8.safetensors와 같은 호환 모델을 다운로드하고, 4) 필요한 경우 ComfyUI 환경 변수를 구성하세요.
멀티모달 상호 작용 시작: 음성 또는 텍스트를 통해 AI와 대화를 시작하세요. 시스템은 대화를 기반으로 이미지를 생성하고, 지도를 표시하고, 상호 작용적인 시각적 콘텐츠를 제공할 수 있습니다.
MulmoChat 자주 묻는 질문
MulmoChat은 멀티모달 AI 채팅 경험을 위한 새로운 패러다임을 탐구하는 연구 프로토타입입니다. 기존의 텍스트 기반 채팅 인터페이스와 달리, 사용자는 캔버스에서 풍부한 시각적 및 인터랙티브 콘텐츠를 직접 경험하면서 자연스러운 대화에 참여할 수 있습니다.











