
Ollama v0.7
Ollama v0.7 memperkenalkan mesin baru untuk dukungan AI multimodal kelas satu, memungkinkan menjalankan model visi canggih secara lokal seperti Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1 dengan peningkatan keandalan dan manajemen memori.
https://ollama.com/blog/multimodal-models?ref=aipure&utm_source=aipure

Informasi Produk
Diperbarui:Aug 1, 2025
Tren Traffic Bulanan Ollama v0.7
Ollama v0.7 mengalami penurunan lalu lintas sebesar 12,8%, dengan 4,43 juta kunjungan pada bulan ini. Pengungkapan kerentanan dan masalah keamanan mungkin telah menghalangi beberapa pengguna, sementara pembaruan produk yang terbatas dapat berkontribusi pada kurangnya keterlibatan pengguna.
Apa itu Ollama v0.7
Ollama v0.7 mewakili evolusi signifikan dalam penerapan model bahasa besar lokal, bergerak melampaui ketergantungan sebelumnya pada llama.cpp untuk memperkenalkan mesin khusus baru untuk kemampuan AI multimodal. Versi ini berfokus untuk menjadikan model multimodal sebagai warga kelas satu, memungkinkan pengguna untuk menjalankan model visi-bahasa yang canggih secara lokal tanpa memerlukan layanan cloud. Sistem ini mendukung berbagai ukuran model, dari parameter 7B yang cocok untuk mesin RAM 8GB hingga model 33B yang lebih besar yang membutuhkan RAM 32GB, membuat AI canggih dapat diakses untuk konfigurasi perangkat keras yang berbeda.
Fitur Utama Ollama v0.7
Ollama v0.7 memperkenalkan mesin baru yang inovatif yang menghadirkan dukungan kelas satu untuk model AI multimodal, memungkinkan eksekusi lokal model visi-bahasa canggih seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini menampilkan peningkatan manajemen memori, modularitas model, dan peningkatan akurasi untuk memproses gambar dan teks bersama-sama, sambil mempertahankan kemudahan penggunaan khas Ollama untuk menjalankan model bahasa besar secara lokal.
Mesin Multimodal Baru: Arsitektur model mandiri yang memungkinkan setiap model untuk mengimplementasikan lapisan proyeksinya sendiri dan menangani input multimodal secara independen, meningkatkan keandalan dan penyederhanaan integrasi model
Manajemen Memori Tingkat Lanjut: Sistem caching gambar cerdas dan cache KV yang dioptimalkan dengan konfigurasi khusus perangkat keras untuk memaksimalkan efisiensi memori dan kinerja
Peningkatan Akurasi Pemrosesan: Peningkatan penanganan gambar dan token besar dengan manajemen metadata yang tepat dan mekanisme perhatian yang spesifik untuk arsitektur pelatihan setiap model
Dukungan Beberapa Model: Integrasi berbagai model visi-bahasa termasuk Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1, masing-masing dengan kemampuan khusus mereka sendiri
Kasus Penggunaan Ollama v0.7
Analisis Dokumen: Memproses dan mengekstrak informasi dari dokumen, termasuk pengenalan karakter dan terjemahan teks multibahasa dalam gambar
Tanya Jawab Visual: Memungkinkan interaksi bahasa alami tentang gambar, termasuk deskripsi terperinci dan menjawab pertanyaan spesifik tentang konten visual
Analisis Berbasis Lokasi: Menganalisis dan memberikan informasi tentang lokasi, landmark, dan fitur geografis dalam gambar, termasuk perhitungan jarak dan rekomendasi perjalanan
Perbandingan Multi-Gambar: Menganalisis hubungan dan pola di beberapa gambar secara bersamaan, mengidentifikasi elemen dan perbedaan umum
Kelebihan
Eksekusi lokal model multimodal canggih tanpa ketergantungan cloud
Peningkatan keandalan dan akurasi dalam pemrosesan model
Dukungan fleksibel untuk beberapa arsitektur model
Manajemen memori yang efisien dan optimasi perangkat keras
Kekurangan
Membutuhkan sumber daya perangkat keras yang signifikan untuk model yang lebih besar
Dukungan Windows terbatas (membutuhkan WSL2)
Beberapa fitur masih dalam fase eksperimen
Cara Menggunakan Ollama v0.7
Instal Ollama: Instal Ollama pada sistem Anda (mendukung MacOS, Linux, dan Windows melalui WSL2). Pastikan Anda memiliki RAM yang cukup - setidaknya 8GB untuk model 7B, 16GB untuk model 13B, dan 32GB untuk model 33B.
Mulai Layanan Ollama: Jalankan perintah 'ollama serve' untuk memulai layanan Ollama. Untuk unduhan yang lebih cepat, Anda dapat secara opsional menggunakan: OLLAMA_EXPERIMENT=client2 ollama serve
Tarik Model: Unduh model multimodal yang Anda inginkan menggunakan 'ollama pull <model_name>'. Model yang tersedia termasuk llama4:scout, gemma3, qwen2.5vl, mistral-small3.1, llava, bakllava, dan lebih banyak model visi.
Jalankan Model: Mulai model menggunakan 'ollama run <model_name>'. Contohnya: 'ollama run llama4:scout' atau 'ollama run gemma3'
Input Gambar: Anda dapat memasukkan gambar dengan memberikan jalur file gambar setelah perintah teks Anda. Beberapa gambar dapat ditambahkan dalam satu perintah atau melalui pertanyaan lanjutan. Mendukung format gambar WebP.
Berinteraksi dengan Model: Ajukan pertanyaan tentang gambar, minta analisis, atau lakukan percakapan lanjutan. Model akan memproses teks dan gambar untuk memberikan respons yang relevan.
Opsional: Gunakan API/Pustaka: Anda juga dapat berinteraksi dengan Ollama melalui API atau pustaka Python/JavaScript resminya untuk akses terprogram. Kemampuan multimodal berfungsi di seluruh CLI dan pustaka.
Opsional: Gunakan Web UI: Untuk antarmuka yang lebih ramah pengguna, Anda dapat menggunakan berbagai UI Web dan klien yang dibangun oleh komunitas yang mendukung fitur multimodal Ollama.
FAQ Ollama v0.7
Ollama sekarang mendukung model multimodal dengan mesin baru yang dapat menangani kemampuan penglihatan. Ia mendukung model seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini mencakup fitur-fitur seperti analisis gambar, penanganan banyak gambar, pemindaian dokumen, dan pengenalan karakter.
Video Ollama v0.7
Artikel Populer

Cara Memasang dan Menjalankan Generator Video AI WAN2.2 di PC Anda pada Tahun 2025 (Panduan Ramah Pemula)
Aug 4, 2025

SweetAI Chat vs Secret Desires: Pembuat Partner AI Mana yang Tepat untuk Anda?
Jul 10, 2025

Cara Membuat Video Hewan AI Viral di Tahun 2025: Panduan Langkah demi Langkah
Jul 3, 2025

Alternatif SweetAI Chat Terbaik di 2025: Perbandingan Platform Obrolan AI Girlfriend & NSFW Terbaik
Jun 30, 2025
Analitik Situs Web Ollama v0.7
Lalu Lintas & Peringkat Ollama v0.7
4.4M
Kunjungan Bulanan
#11252
Peringkat Global
#283
Peringkat Kategori
Tren Lalu Lintas: Apr 2025-Jun 2025
Wawasan Pengguna Ollama v0.7
00:04:08
Rata-rata Durasi Kunjungan
4.61
Halaman Per Kunjungan
34.38%
Tingkat Pentalan Pengguna
Wilayah Teratas Ollama v0.7
CN: 28.01%
US: 15.41%
IN: 6.9%
RU: 4.04%
DE: 3.81%
Others: 41.82%