
Ollama v0.7
Ollama v0.7 memperkenalkan mesin baru untuk dukungan AI multimodal kelas satu, memungkinkan menjalankan model visi canggih secara lokal seperti Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1 dengan peningkatan keandalan dan manajemen memori.
https://ollama.com/blog/multimodal-models?ref=aipure&utm_source=aipure

Informasi Produk
Diperbarui:Jun 16, 2025
Tren Traffic Bulanan Ollama v0.7
Ollama v0.7 mengalami penurunan lalu lintas sebesar 5,5%, dengan 298.679 kunjungan lebih sedikit. Meskipun ada pengenalan Qwen 2.5 VL dan peningkatan kemampuan dukungan vision, penurunan ini mungkin disebabkan oleh kerentanan dan masalah keamanan yang dilaporkan sebelumnya, yang mempengaruhi kepercayaan pengguna.
Apa itu Ollama v0.7
Ollama v0.7 mewakili evolusi signifikan dalam penerapan model bahasa besar lokal, bergerak melampaui ketergantungan sebelumnya pada llama.cpp untuk memperkenalkan mesin khusus baru untuk kemampuan AI multimodal. Versi ini berfokus untuk menjadikan model multimodal sebagai warga kelas satu, memungkinkan pengguna untuk menjalankan model visi-bahasa yang canggih secara lokal tanpa memerlukan layanan cloud. Sistem ini mendukung berbagai ukuran model, dari parameter 7B yang cocok untuk mesin RAM 8GB hingga model 33B yang lebih besar yang membutuhkan RAM 32GB, membuat AI canggih dapat diakses untuk konfigurasi perangkat keras yang berbeda.
Fitur Utama Ollama v0.7
Ollama v0.7 memperkenalkan mesin baru yang inovatif yang menghadirkan dukungan kelas satu untuk model AI multimodal, memungkinkan eksekusi lokal model visi-bahasa canggih seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini menampilkan peningkatan manajemen memori, modularitas model, dan peningkatan akurasi untuk memproses gambar dan teks bersama-sama, sambil mempertahankan kemudahan penggunaan khas Ollama untuk menjalankan model bahasa besar secara lokal.
Mesin Multimodal Baru: Arsitektur model mandiri yang memungkinkan setiap model untuk mengimplementasikan lapisan proyeksinya sendiri dan menangani input multimodal secara independen, meningkatkan keandalan dan penyederhanaan integrasi model
Manajemen Memori Tingkat Lanjut: Sistem caching gambar cerdas dan cache KV yang dioptimalkan dengan konfigurasi khusus perangkat keras untuk memaksimalkan efisiensi memori dan kinerja
Peningkatan Akurasi Pemrosesan: Peningkatan penanganan gambar dan token besar dengan manajemen metadata yang tepat dan mekanisme perhatian yang spesifik untuk arsitektur pelatihan setiap model
Dukungan Beberapa Model: Integrasi berbagai model visi-bahasa termasuk Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1, masing-masing dengan kemampuan khusus mereka sendiri
Kasus Penggunaan Ollama v0.7
Analisis Dokumen: Memproses dan mengekstrak informasi dari dokumen, termasuk pengenalan karakter dan terjemahan teks multibahasa dalam gambar
Tanya Jawab Visual: Memungkinkan interaksi bahasa alami tentang gambar, termasuk deskripsi terperinci dan menjawab pertanyaan spesifik tentang konten visual
Analisis Berbasis Lokasi: Menganalisis dan memberikan informasi tentang lokasi, landmark, dan fitur geografis dalam gambar, termasuk perhitungan jarak dan rekomendasi perjalanan
Perbandingan Multi-Gambar: Menganalisis hubungan dan pola di beberapa gambar secara bersamaan, mengidentifikasi elemen dan perbedaan umum
Kelebihan
Eksekusi lokal model multimodal canggih tanpa ketergantungan cloud
Peningkatan keandalan dan akurasi dalam pemrosesan model
Dukungan fleksibel untuk beberapa arsitektur model
Manajemen memori yang efisien dan optimasi perangkat keras
Kekurangan
Membutuhkan sumber daya perangkat keras yang signifikan untuk model yang lebih besar
Dukungan Windows terbatas (membutuhkan WSL2)
Beberapa fitur masih dalam fase eksperimen
Cara Menggunakan Ollama v0.7
Instal Ollama: Instal Ollama pada sistem Anda (mendukung MacOS, Linux, dan Windows melalui WSL2). Pastikan Anda memiliki RAM yang cukup - setidaknya 8GB untuk model 7B, 16GB untuk model 13B, dan 32GB untuk model 33B.
Mulai Layanan Ollama: Jalankan perintah 'ollama serve' untuk memulai layanan Ollama. Untuk unduhan yang lebih cepat, Anda dapat secara opsional menggunakan: OLLAMA_EXPERIMENT=client2 ollama serve
Tarik Model: Unduh model multimodal yang Anda inginkan menggunakan 'ollama pull <model_name>'. Model yang tersedia termasuk llama4:scout, gemma3, qwen2.5vl, mistral-small3.1, llava, bakllava, dan lebih banyak model visi.
Jalankan Model: Mulai model menggunakan 'ollama run <model_name>'. Contohnya: 'ollama run llama4:scout' atau 'ollama run gemma3'
Input Gambar: Anda dapat memasukkan gambar dengan memberikan jalur file gambar setelah perintah teks Anda. Beberapa gambar dapat ditambahkan dalam satu perintah atau melalui pertanyaan lanjutan. Mendukung format gambar WebP.
Berinteraksi dengan Model: Ajukan pertanyaan tentang gambar, minta analisis, atau lakukan percakapan lanjutan. Model akan memproses teks dan gambar untuk memberikan respons yang relevan.
Opsional: Gunakan API/Pustaka: Anda juga dapat berinteraksi dengan Ollama melalui API atau pustaka Python/JavaScript resminya untuk akses terprogram. Kemampuan multimodal berfungsi di seluruh CLI dan pustaka.
Opsional: Gunakan Web UI: Untuk antarmuka yang lebih ramah pengguna, Anda dapat menggunakan berbagai UI Web dan klien yang dibangun oleh komunitas yang mendukung fitur multimodal Ollama.
FAQ Ollama v0.7
Ollama sekarang mendukung model multimodal dengan mesin baru yang dapat menangani kemampuan penglihatan. Ia mendukung model seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini mencakup fitur-fitur seperti analisis gambar, penanganan banyak gambar, pemindaian dokumen, dan pengenalan karakter.
Artikel Populer

Alternatif SweetAI Chat Terbaik di 2025: Perbandingan Platform Obrolan AI Girlfriend & NSFW Terbaik
Jun 30, 2025

Cara Membuat Video AI ASMR Viral dalam 5 Menit (Tanpa Mikrofon, Tanpa Kamera) | 2025
Jun 23, 2025

Cara Membuat Video Vlog Bigfoot Viral dengan AI: Panduan Langkah demi Langkah untuk Tahun 2025
Jun 23, 2025

SweetAI Chat VS JuicyChat AI: Mengapa SweetAI Chat Menang di Tahun 2025
Jun 18, 2025
Analitik Situs Web Ollama v0.7
Lalu Lintas & Peringkat Ollama v0.7
5.1M
Kunjungan Bulanan
#10016
Peringkat Global
#247
Peringkat Kategori
Tren Lalu Lintas: Mar 2025-May 2025
Wawasan Pengguna Ollama v0.7
00:04:16
Rata-rata Durasi Kunjungan
4.93
Halaman Per Kunjungan
33.47%
Tingkat Pentalan Pengguna
Wilayah Teratas Ollama v0.7
CN: 32.76%
US: 14.47%
IN: 5.4%
RU: 3.52%
DE: 3.3%
Others: 40.55%