
MulmoChat
MulmoChat adalah antarmuka obrolan AI multimodal sumber terbuka yang secara mulus mengintegrasikan obrolan suara, pembuatan gambar, dan kemampuan penjelajahan web, memungkinkan pengguna untuk berinteraksi secara alami melalui percakapan sambil mengalami konten visual dan interaktif yang kaya.
https://github.com/receptron/MulmoChat?ref=producthunt&utm_source=aipure

Informasi Produk
Diperbarui:Mar 31, 2026
Apa itu MulmoChat
MulmoChat adalah prototipe penelitian inovatif yang dikembangkan oleh mantan insinyur Microsoft, Satoshi Nakajima, yang menata ulang antarmuka obrolan tradisional. Tidak seperti aplikasi obrolan berbasis teks konvensional, MulmoChat mewakili paradigma baru untuk pengalaman obrolan AI multimodal dengan menyatukan GUI (Antarmuka Pengguna Grafis) dan NLUI (Antarmuka Pengguna Bahasa Alami). Proyek ini bersifat sumber terbuka dan memerlukan kunci API OpenAI dan Google Gemini untuk berfungsi, mendukung platform Windows, macOS, dan Linux.
Fitur Utama MulmoChat
MulmoChat adalah prototipe penelitian yang merevolusi interaksi obrolan AI dengan menggabungkan komunikasi berbasis teks tradisional dengan konten visual dan interaktif yang kaya. Fitur-fiturnya mencakup kemampuan obrolan suara, pembuatan gambar, penjelajahan web, dan interaksi multimodal di mana pengguna dapat terlibat dalam percakapan alami sambil menikmati konten visual dinamis langsung di kanvas, didukung oleh beberapa penyedia AI termasuk OpenAI, Anthropic, Google Gemini, dan Ollama.
Interaksi Multimodal: Mengintegrasikan teks, suara, gambar, dan elemen interaktif secara mulus dalam satu antarmuka percakapan, melampaui pengalaman obrolan berbasis teks tradisional
Pembuatan Teks Agnostik Penyedia: Mendukung beberapa penyedia AI (OpenAI, Anthropic, Google Gemini, Ollama) melalui antarmuka API terpadu, memungkinkan pemilihan dan integrasi model yang fleksibel
Pembuatan Gambar Tingkat Lanjut: Terintegrasi dengan ComfyUI untuk pembuatan gambar lokal, mendukung model tingkat lanjut seperti FLUX dengan parameter dan alur kerja yang dapat disesuaikan
Arsitektur Plugin yang Dapat Diperluas: Memungkinkan pengembang untuk memperluas fungsionalitas melalui plugin, dari kontrak TypeScript hingga tampilan dan konfigurasi Vue
Kasus Penggunaan MulmoChat
Pendidikan Interaktif: Guru dapat menciptakan pengalaman belajar yang mendalam dengan menggabungkan penjelasan verbal dengan alat bantu visual waktu nyata dan elemen interaktif
Kolaborasi Desain: Desainer dapat mendiskusikan konsep sambil membuat dan memanipulasi gambar secara waktu nyata, merampingkan proses kreatif
Pariwisata Virtual: Agen perjalanan dapat menyediakan tur virtual interaktif yang menggabungkan fitur peta, pembuatan gambar, dan percakapan alami
Kelebihan
Sangat fleksibel dengan dukungan untuk beberapa penyedia AI
Kemampuan interaksi multimodal yang kaya
Arsitektur sumber terbuka dan dapat diperluas
Kekurangan
Memerlukan beberapa kunci API untuk fungsionalitas penuh
Pengaturan kompleks dengan berbagai dependensi
Status prototipe penelitian dapat mengindikasikan kesiapan produksi yang terbatas
Cara Menggunakan MulmoChat
Instal Dependensi: Jalankan 'yarn install' untuk menginstal semua dependensi yang diperlukan untuk MulmoChat
Konfigurasi Variabel Lingkungan: Buat file .env dan tambahkan kunci API yang diperlukan: OPENAI_API_KEY dan GEMINI_API_KEY wajib diisi. Kunci opsional termasuk GOOGLE_MAP_API_KEY, EXA_API_KEY, ANTHROPIC_API_KEY, OLLAMA_BASE_URL, COMFYUI_BASE_URL, COMFYUI_DEFAULT_MODEL, dan COMFYUI_TIMEOUT_MS
Mulai Server Pengembangan: Jalankan 'yarn dev' untuk memulai server pengembangan
Izinkan Akses Mikrofon: Saat membuka browser, izinkan untuk mengakses mikrofon Anda saat diminta
Mulai Obrolan Suara: Klik tombol 'Mulai Obrolan Suara' di antarmuka untuk mulai berinteraksi dengan AI
Opsional: Siapkan Integrasi ComfyUI: Untuk pembuatan gambar lokal: 1) Instal ComfyUI Desktop, 2) Luncurkan server ComfyUI Desktop, 3) Unduh model yang kompatibel seperti flux1-schnell-fp8.safetensors, 4) Konfigurasikan variabel lingkungan ComfyUI jika diperlukan
Mulai Interaksi Multimodal: Mulai berbicara dengan AI melalui suara atau teks. Sistem dapat menghasilkan gambar, menampilkan peta, dan menyediakan konten visual interaktif berdasarkan percakapan Anda
FAQ MulmoChat
MulmoChat adalah prototipe penelitian yang mengeksplorasi paradigma baru untuk pengalaman obrolan AI multimodal. Tidak seperti antarmuka obrolan berbasis teks tradisional, ini memungkinkan pengguna untuk terlibat dalam percakapan alami sambil mengalami konten visual dan interaktif yang kaya secara langsung di kanvas.
Artikel Populer

OpenAI Menutup Aplikasi Sora: Apa yang Akan Terjadi pada Generasi Video AI di Tahun 2026
Mar 25, 2026

5 Agen AI Terbaik di Tahun 2026: Cara Memilih yang Tepat
Mar 18, 2026

Panduan Penerapan OpenClaw: Cara Melakukan Self-Hosting Agen AI Nyata (Pembaruan 2026)
Mar 10, 2026

Tutorial Atoms 2026: Bangun Dasbor SaaS Lengkap dalam 20 Menit (Praktik Langsung AIPURE)
Mar 2, 2026







