Apa saja persyaratan API utama untuk menjalankan MulmoChat?

Kunci API penting adalah OPENAI_API_KEY. Kunci API opsional termasuk GEMINI_API_KEY, GOOGLE_MAP_API_KEY (untuk fitur peta), EXA_API_KEY (untuk pencarian bertenaga AI), ANTHROPIC_API_KEY (untuk pembuatan HTML), dan konfigurasi untuk OLLAMA_BASE_URL dan pengaturan COMFYUI.

Bagaimana cara memulai dengan MulmoChat?

Untuk memulai, Anda perlu: 1) Instal dependensi menggunakan 'yarn install', 2) Buat file .env dengan kunci API yang diperlukan, 3) Mulai server pengembangan menggunakan 'yarn dev', 4) Izinkan akses mikrofon browser, dan 5) Klik 'Mulai Obrolan Suara' untuk mulai berinteraksi dengan AI.

Apa itu integrasi ComfyUI di MulmoChat?

Integrasi ComfyUI menyediakan kemampuan pembuatan gambar lokal menggunakan model canggih seperti FLUX. Ini menawarkan alternatif untuk pembuatan gambar berbasis cloud dengan kontrol penuh atas model dan alur kerja. Pengguna perlu menginstal ComfyUI Desktop, meluncurkannya secara lokal, dan mengonfigurasi variabel lingkungan untuk menggunakan fitur ini.

Dokumentasi apa yang tersedia untuk MulmoChat?

MulmoChat menyediakan tiga file dokumentasi utama: LLM_OS.md untuk ahli strategi produk dan desainer, WHITEPAPER.md untuk insinyur dan peneliti yang menerapkan tumpukan orkestrasi, dan TOOLPLUGIN.md untuk pengembang yang memperluas MulmoChat dengan kemampuan baru.

MulmoChat

WebsiteFreeAI Chatbot Multi-purpose Tools

MulmoChat adalah antarmuka obrolan AI multimodal sumber terbuka yang secara mulus mengintegrasikan obrolan suara, pembuatan gambar, dan kemampuan penjelajahan web, memungkinkan pengguna untuk berinteraksi secara alami melalui percakapan sambil mengalami konten visual dan interaktif yang kaya.

Kunjungi Situs Web

Iklankan Alat Ini

https://github.com/receptron/MulmoChat?ref=producthunt&utm_source=aipure

Ikhtisar
Alternatif

Informasi Produk

Diperbarui:Apr 8, 2026

Apa itu MulmoChat

MulmoChat adalah prototipe penelitian inovatif yang dikembangkan oleh mantan insinyur Microsoft, Satoshi Nakajima, yang menata ulang antarmuka obrolan tradisional. Tidak seperti aplikasi obrolan berbasis teks konvensional, MulmoChat mewakili paradigma baru untuk pengalaman obrolan AI multimodal dengan menyatukan GUI (Antarmuka Pengguna Grafis) dan NLUI (Antarmuka Pengguna Bahasa Alami). Proyek ini bersifat sumber terbuka dan memerlukan kunci API OpenAI dan Google Gemini untuk berfungsi, mendukung platform Windows, macOS, dan Linux.

Fitur Utama MulmoChat

MulmoChat adalah prototipe penelitian yang merevolusi interaksi obrolan AI dengan menggabungkan komunikasi berbasis teks tradisional dengan konten visual dan interaktif yang kaya. Fitur-fiturnya mencakup kemampuan obrolan suara, pembuatan gambar, penjelajahan web, dan interaksi multimodal di mana pengguna dapat terlibat dalam percakapan alami sambil menikmati konten visual dinamis langsung di kanvas, didukung oleh beberapa penyedia AI termasuk OpenAI, Anthropic, Google Gemini, dan Ollama.

Interaksi Multimodal: Mengintegrasikan teks, suara, gambar, dan elemen interaktif secara mulus dalam satu antarmuka percakapan, melampaui pengalaman obrolan berbasis teks tradisional

Pembuatan Teks Agnostik Penyedia: Mendukung beberapa penyedia AI (OpenAI, Anthropic, Google Gemini, Ollama) melalui antarmuka API terpadu, memungkinkan pemilihan dan integrasi model yang fleksibel

Pembuatan Gambar Tingkat Lanjut: Terintegrasi dengan ComfyUI untuk pembuatan gambar lokal, mendukung model tingkat lanjut seperti FLUX dengan parameter dan alur kerja yang dapat disesuaikan

Arsitektur Plugin yang Dapat Diperluas: Memungkinkan pengembang untuk memperluas fungsionalitas melalui plugin, dari kontrak TypeScript hingga tampilan dan konfigurasi Vue

Kasus Penggunaan MulmoChat

Pendidikan Interaktif: Guru dapat menciptakan pengalaman belajar yang mendalam dengan menggabungkan penjelasan verbal dengan alat bantu visual waktu nyata dan elemen interaktif

Kolaborasi Desain: Desainer dapat mendiskusikan konsep sambil membuat dan memanipulasi gambar secara waktu nyata, merampingkan proses kreatif

Pariwisata Virtual: Agen perjalanan dapat menyediakan tur virtual interaktif yang menggabungkan fitur peta, pembuatan gambar, dan percakapan alami

Kelebihan

Sangat fleksibel dengan dukungan untuk beberapa penyedia AI

Kemampuan interaksi multimodal yang kaya

Arsitektur sumber terbuka dan dapat diperluas

Kekurangan

Memerlukan beberapa kunci API untuk fungsionalitas penuh

Pengaturan kompleks dengan berbagai dependensi

Status prototipe penelitian dapat mengindikasikan kesiapan produksi yang terbatas

Cara Menggunakan MulmoChat

Instal Dependensi: Jalankan 'yarn install' untuk menginstal semua dependensi yang diperlukan untuk MulmoChat

Konfigurasi Variabel Lingkungan: Buat file .env dan tambahkan kunci API yang diperlukan: OPENAI_API_KEY dan GEMINI_API_KEY wajib diisi. Kunci opsional termasuk GOOGLE_MAP_API_KEY, EXA_API_KEY, ANTHROPIC_API_KEY, OLLAMA_BASE_URL, COMFYUI_BASE_URL, COMFYUI_DEFAULT_MODEL, dan COMFYUI_TIMEOUT_MS

Mulai Server Pengembangan: Jalankan 'yarn dev' untuk memulai server pengembangan

Izinkan Akses Mikrofon: Saat membuka browser, izinkan untuk mengakses mikrofon Anda saat diminta

Mulai Obrolan Suara: Klik tombol 'Mulai Obrolan Suara' di antarmuka untuk mulai berinteraksi dengan AI

Opsional: Siapkan Integrasi ComfyUI: Untuk pembuatan gambar lokal: 1) Instal ComfyUI Desktop, 2) Luncurkan server ComfyUI Desktop, 3) Unduh model yang kompatibel seperti flux1-schnell-fp8.safetensors, 4) Konfigurasikan variabel lingkungan ComfyUI jika diperlukan

Mulai Interaksi Multimodal: Mulai berbicara dengan AI melalui suara atau teks. Sistem dapat menghasilkan gambar, menampilkan peta, dan menyediakan konten visual interaktif berdasarkan percakapan Anda

FAQ MulmoChat

MulmoChat adalah prototipe penelitian yang mengeksplorasi paradigma baru untuk pengalaman obrolan AI multimodal. Tidak seperti antarmuka obrolan berbasis teks tradisional, ini memungkinkan pengguna untuk terlibat dalam percakapan alami sambil mengalami konten visual dan interaktif yang kaya secara langsung di kanvas.

Artikel Populer

Atoms: Platform AI Multi-Agen yang Mengubah Ide menjadi Produk Siap Diluncurkan

May 22, 2026

Nano Banana SBTI: Apa Itu, Bagaimana Cara Kerjanya, dan Cara Menggunakannya di Tahun 2026

Apr 15, 2026

Ulasan Atoms — Pembuat Produk AI yang Mendefinisikan Ulang Kreasi Digital di Tahun 2026

Apr 10, 2026

Kilo Claw: Cara Menerapkan dan Menggunakan Agen AI "Lakukan-Untuk-Anda" Sejati (Pembaruan 2026)

Apr 3, 2026

Alat AI Terbaru Serupa dengan MulmoChat

Folderr

Free TrialAI Chatbot AI Documents Assistant

Folderr adalah platform AI komprehensif yang memungkinkan pengguna untuk membuat asisten AI kustom dengan mengunggah file tanpa batas, mengintegrasikan dengan berbagai model bahasa, dan mengotomatiskan alur kerja melalui antarmuka yang ramah pengguna.

Peache.ai

Free TrialAI Chatbot AI Character

Peache.ai adalah taman bermain obrolan karakter AI yang memungkinkan pengguna untuk terlibat dalam percakapan menggoda, cerdas, dan berani dengan berbagai kepribadian AI melalui interaksi waktu nyata.

TalkPersona

FreemiumAI Chatbot AI Lip Sync Generator

TalkPersona adalah chatbot video bertenaga AI yang menyediakan percakapan mirip manusia waktu nyata melalui wajah berbicara virtual dengan suara alami dan kemampuan sinkronisasi bibir.

Thaly AI

Free TrialSales Assistant AI Chatbot

Thaly AI adalah asisten penjualan bertenaga AI yang mengotomatiskan percakapan pelanggan dan kualifikasi prospek untuk membantu bisnis meningkatkan operasi penjualan mereka sambil menghemat waktu.

Alat AI Populer Seperti MulmoChat

GPT‑5.5 | ChatGPT Official

Large Language Models (LLMs)AI Chatbot

GPT-5.5 di ChatGPT adalah model terbaru yang berfokus pada pekerjaan dari OpenAI yang dirancang untuk memahami tujuan yang kompleks, menggunakan alat secara efektif, memeriksa pekerjaannya, dan melaksanakan tugas multi-langkah (pengkodean, penelitian, dokumen, spreadsheet) hingga selesai dengan perlindungan yang lebih kuat.

DuckDuckGo AI Chat

FreeAI Chatbot AI Search Engine

DuckDuckGo AI Chat adalah cara gratis dan anonim untuk mengakses chatbot AI populer seperti GPT-3.5, Claude, dan lainnya sambil menjaga privasi pengguna.

Arch

Contact for PricingAI Chatbot Prompts

Arch adalah gerbang Layer 7 cerdas yang dibangun di atas Envoy Proxy yang menyediakan penanganan yang aman, observabilitas yang kuat, dan integrasi yang mulus dari prompt dengan API untuk membangun agen AI yang cepat, kuat, dan dipersonalisasi.

Off-grid LLM over Radio

FreeAI Chatbot Multi-purpose Tools

Sebuah platform yang mengintegrasikan Model Bahasa Besar (LLM) dengan jaringan komunikasi mesh Meshtastic untuk memungkinkan interaksi AI off-grid dan eksekusi tugas otomatis melalui komunikasi radio.

Peringkat

Kirim & PromosikanNew