Ollama v0.7

Ollama v0.7

Ollama v0.7 memperkenalkan mesin baru untuk dukungan AI multimodal kelas satu, memungkinkan menjalankan model visi canggih secara lokal seperti Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1 dengan peningkatan keandalan dan manajemen memori.
https://ollama.com/blog/multimodal-models?ref=aipure&utm_source=aipure
Ollama v0.7

Informasi Produk

Diperbarui:Jun 16, 2025

Tren Traffic Bulanan Ollama v0.7

Ollama v0.7 mengalami penurunan lalu lintas sebesar 5,5%, dengan 298.679 kunjungan lebih sedikit. Meskipun ada pengenalan Qwen 2.5 VL dan peningkatan kemampuan dukungan vision, penurunan ini mungkin disebabkan oleh kerentanan dan masalah keamanan yang dilaporkan sebelumnya, yang mempengaruhi kepercayaan pengguna.

Lihat riwayat traffic

Apa itu Ollama v0.7

Ollama v0.7 mewakili evolusi signifikan dalam penerapan model bahasa besar lokal, bergerak melampaui ketergantungan sebelumnya pada llama.cpp untuk memperkenalkan mesin khusus baru untuk kemampuan AI multimodal. Versi ini berfokus untuk menjadikan model multimodal sebagai warga kelas satu, memungkinkan pengguna untuk menjalankan model visi-bahasa yang canggih secara lokal tanpa memerlukan layanan cloud. Sistem ini mendukung berbagai ukuran model, dari parameter 7B yang cocok untuk mesin RAM 8GB hingga model 33B yang lebih besar yang membutuhkan RAM 32GB, membuat AI canggih dapat diakses untuk konfigurasi perangkat keras yang berbeda.

Fitur Utama Ollama v0.7

Ollama v0.7 memperkenalkan mesin baru yang inovatif yang menghadirkan dukungan kelas satu untuk model AI multimodal, memungkinkan eksekusi lokal model visi-bahasa canggih seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini menampilkan peningkatan manajemen memori, modularitas model, dan peningkatan akurasi untuk memproses gambar dan teks bersama-sama, sambil mempertahankan kemudahan penggunaan khas Ollama untuk menjalankan model bahasa besar secara lokal.
Mesin Multimodal Baru: Arsitektur model mandiri yang memungkinkan setiap model untuk mengimplementasikan lapisan proyeksinya sendiri dan menangani input multimodal secara independen, meningkatkan keandalan dan penyederhanaan integrasi model
Manajemen Memori Tingkat Lanjut: Sistem caching gambar cerdas dan cache KV yang dioptimalkan dengan konfigurasi khusus perangkat keras untuk memaksimalkan efisiensi memori dan kinerja
Peningkatan Akurasi Pemrosesan: Peningkatan penanganan gambar dan token besar dengan manajemen metadata yang tepat dan mekanisme perhatian yang spesifik untuk arsitektur pelatihan setiap model
Dukungan Beberapa Model: Integrasi berbagai model visi-bahasa termasuk Llama 4, Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1, masing-masing dengan kemampuan khusus mereka sendiri

Kasus Penggunaan Ollama v0.7

Analisis Dokumen: Memproses dan mengekstrak informasi dari dokumen, termasuk pengenalan karakter dan terjemahan teks multibahasa dalam gambar
Tanya Jawab Visual: Memungkinkan interaksi bahasa alami tentang gambar, termasuk deskripsi terperinci dan menjawab pertanyaan spesifik tentang konten visual
Analisis Berbasis Lokasi: Menganalisis dan memberikan informasi tentang lokasi, landmark, dan fitur geografis dalam gambar, termasuk perhitungan jarak dan rekomendasi perjalanan
Perbandingan Multi-Gambar: Menganalisis hubungan dan pola di beberapa gambar secara bersamaan, mengidentifikasi elemen dan perbedaan umum

Kelebihan

Eksekusi lokal model multimodal canggih tanpa ketergantungan cloud
Peningkatan keandalan dan akurasi dalam pemrosesan model
Dukungan fleksibel untuk beberapa arsitektur model
Manajemen memori yang efisien dan optimasi perangkat keras

Kekurangan

Membutuhkan sumber daya perangkat keras yang signifikan untuk model yang lebih besar
Dukungan Windows terbatas (membutuhkan WSL2)
Beberapa fitur masih dalam fase eksperimen

Cara Menggunakan Ollama v0.7

Instal Ollama: Instal Ollama pada sistem Anda (mendukung MacOS, Linux, dan Windows melalui WSL2). Pastikan Anda memiliki RAM yang cukup - setidaknya 8GB untuk model 7B, 16GB untuk model 13B, dan 32GB untuk model 33B.
Mulai Layanan Ollama: Jalankan perintah 'ollama serve' untuk memulai layanan Ollama. Untuk unduhan yang lebih cepat, Anda dapat secara opsional menggunakan: OLLAMA_EXPERIMENT=client2 ollama serve
Tarik Model: Unduh model multimodal yang Anda inginkan menggunakan 'ollama pull <model_name>'. Model yang tersedia termasuk llama4:scout, gemma3, qwen2.5vl, mistral-small3.1, llava, bakllava, dan lebih banyak model visi.
Jalankan Model: Mulai model menggunakan 'ollama run <model_name>'. Contohnya: 'ollama run llama4:scout' atau 'ollama run gemma3'
Input Gambar: Anda dapat memasukkan gambar dengan memberikan jalur file gambar setelah perintah teks Anda. Beberapa gambar dapat ditambahkan dalam satu perintah atau melalui pertanyaan lanjutan. Mendukung format gambar WebP.
Berinteraksi dengan Model: Ajukan pertanyaan tentang gambar, minta analisis, atau lakukan percakapan lanjutan. Model akan memproses teks dan gambar untuk memberikan respons yang relevan.
Opsional: Gunakan API/Pustaka: Anda juga dapat berinteraksi dengan Ollama melalui API atau pustaka Python/JavaScript resminya untuk akses terprogram. Kemampuan multimodal berfungsi di seluruh CLI dan pustaka.
Opsional: Gunakan Web UI: Untuk antarmuka yang lebih ramah pengguna, Anda dapat menggunakan berbagai UI Web dan klien yang dibangun oleh komunitas yang mendukung fitur multimodal Ollama.

FAQ Ollama v0.7

Ollama sekarang mendukung model multimodal dengan mesin baru yang dapat menangani kemampuan penglihatan. Ia mendukung model seperti Meta Llama 4, Google Gemma 3, Qwen 2.5 VL, dan Mistral Small 3.1. Pembaruan ini mencakup fitur-fitur seperti analisis gambar, penanganan banyak gambar, pemindaian dokumen, dan pengenalan karakter.

Analitik Situs Web Ollama v0.7

Lalu Lintas & Peringkat Ollama v0.7
5.1M
Kunjungan Bulanan
#10016
Peringkat Global
#247
Peringkat Kategori
Tren Lalu Lintas: Mar 2025-May 2025
Wawasan Pengguna Ollama v0.7
00:04:16
Rata-rata Durasi Kunjungan
4.93
Halaman Per Kunjungan
33.47%
Tingkat Pentalan Pengguna
Wilayah Teratas Ollama v0.7
  1. CN: 32.76%

  2. US: 14.47%

  3. IN: 5.4%

  4. RU: 3.52%

  5. DE: 3.3%

  6. Others: 40.55%

Alat AI Terbaru Serupa dengan Ollama v0.7

Athena AI
Athena AI
Athena AI adalah platform bertenaga AI yang serbaguna yang menawarkan bantuan belajar yang dipersonalisasi, solusi bisnis, dan pelatihan hidup melalui fitur seperti analisis dokumen, pembuatan kuis, kartu flash, dan kemampuan obrolan interaktif.
Aguru AI
Aguru AI
Aguru AI adalah solusi perangkat lunak on-premises yang menyediakan pemantauan komprehensif, keamanan, dan alat optimisasi untuk aplikasi berbasis LLM dengan fitur seperti pelacakan perilaku, deteksi anomali, dan optimisasi kinerja.
GOAT AI
GOAT AI
GOAT AI adalah platform yang didukung AI yang menyediakan kemampuan ringkasan satu klik untuk berbagai jenis konten termasuk artikel berita, makalah penelitian, dan video, sambil juga menawarkan orkestrasi agen AI canggih untuk tugas spesifik domain.
GiGOS
GiGOS
GiGOS adalah platform AI yang menyediakan akses ke berbagai model bahasa canggih seperti Gemini, GPT-4, Claude, dan Grok dengan antarmuka intuitif bagi pengguna untuk berinteraksi dan membandingkan berbagai model AI.