
Ollama v0.7
Ollama v0.7 引入了一個新的引擎,用於一流的多模態人工智慧支援,能夠在本地執行先進的視覺模型,如 Llama 4、Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1,並具有更高的可靠性和記憶體管理能力。
https://ollama.com/blog/multimodal-models?ref=aipure&utm_source=aipure

產品資訊
更新時間:2025年06月16日
Ollama v0.7 每月流量趨勢
Ollama v0.7 的流量下降了 5.5%,減少了 298,679 次訪問。儘管引入了 Qwen 2.5 VL 並增強了視覺支援功能,但過去報告的漏洞和安全隱患可能影響了用戶信心,導致流量下降。
什麼是 Ollama v0.7
Ollama v0.7 代表了本地大型語言模型部署的重大演進,它超越了之前對 llama.cpp 的依賴,引入了一個新的專用引擎,用於多模態人工智慧功能。此版本著重於使多模態模型成為一等公民,讓使用者可以在本地執行複雜的視覺語言模型,而無需雲端服務。該系統支援各種模型大小,從適用於 8GB RAM 機器的 7B 參數到需要 32GB RAM 的較大 33B 模型,使先進的人工智慧可供不同的硬體配置使用。
Ollama v0.7 的主要功能
Ollama v0.7 推出了一款突破性的新引擎,為多模態 AI 模型帶來了一流的支援,能夠在本機執行先進的視覺語言模型,例如 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1。此次更新具有改進的記憶體管理、模型模組化以及增強的圖像和文字處理準確性,同時保持 Ollama 標誌性的易用性,以便在本機執行大型語言模型。
新型多模態引擎: 獨立的模型架構,允許每個模型實現自己的投影層並獨立處理多模態輸入,從而提高可靠性並簡化模型整合
進階記憶體管理: 智慧圖像快取系統和經過優化的 KV 快取,具有特定於硬體的配置,可最大限度地提高記憶體效率和效能
增強的準確性處理: 改進了大型圖像和令牌的處理,具有適當的元資料管理和特定於每個模型訓練架構的注意力機制
多模型支援: 整合了各種視覺語言模型,包括 Llama 4、Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1,每個模型都具有自己獨特的功能
Ollama v0.7 的使用案例
文件分析: 處理和提取文件中的資訊,包括字元識別和圖像中多語言文字的翻譯
視覺問答: 實現關於圖像的自然語言互動,包括詳細描述和回答關於視覺內容的具體問題
基於位置的分析: 分析和提供關於圖像中位置、地標和地理特徵的資訊,包括距離計算和旅行建議
多圖像比較: 同時分析多個圖像之間的關係和模式,識別共同元素和差異
優點
在本機執行先進的多模態模型,無需雲端依賴
提高了模型處理的可靠性和準確性
靈活支援多種模型架構
高效的記憶體管理和硬體最佳化
缺點
較大的模型需要大量的硬體資源
有限的 Windows 支援(需要 WSL2)
某些功能仍處於實驗階段
如何使用 Ollama v0.7
安裝 Ollama: 在您的系統上安裝 Ollama(支援 MacOS、Linux 和透過 WSL2 的 Windows)。請確保您有足夠的 RAM - 7B 模型至少需要 8GB,13B 模型需要 16GB,33B 模型需要 32GB。
啟動 Ollama 服務: 執行 'ollama serve' 命令以啟動 Ollama 服務。為了加快下載速度,您可以選擇使用:OLLAMA_EXPERIMENT=client2 ollama serve
拉取模型: 使用 'ollama pull <model_name>' 下載您想要的多模態模型。可用的模型包括 llama4:scout、gemma3、qwen2.5vl、mistral-small3.1、llava、bakllava 和更多視覺模型。
執行模型: 使用 'ollama run <model_name>' 啟動模型。例如:'ollama run llama4:scout' 或 'ollama run gemma3'
輸入圖像: 您可以透過在文字提示後提供圖像檔案路徑來輸入圖像。可以在單個提示中或透過後續問題添加多個圖像。支援 WebP 圖像格式。
與模型互動: 詢問有關圖像的問題、請求分析或進行後續對話。模型將處理文字和圖像以提供相關的回應。
可選:使用 API/函式庫: 您也可以透過其 API 或官方 Python/JavaScript 函式庫與 Ollama 互動,以進行程式化存取。多模態功能可在 CLI 和函式庫中使用。
可選:使用 Web UI: 為了獲得更友好的使用者介面,您可以使用各種社群建立的 Web UI 和客戶端,它們支援 Ollama 的多模態功能。
Ollama v0.7 常見問題
Ollama 現在支援具有新型引擎的多模態模型,該引擎可以處理視覺功能。它支援 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1 等模型。此更新包括影像分析、多重影像處理、文件掃描和字元辨識等功能。
Ollama v0.7 網站分析
Ollama v0.7 流量和排名
5.1M
每月訪問量
#10016
全球排名
#247
類別排名
流量趨勢:Mar 2025-May 2025
Ollama v0.7 用戶洞察
00:04:16
平均訪問時長
4.93
每次訪問的頁面數
33.47%
用戶跳出率
Ollama v0.7 的主要地區
CN: 32.76%
US: 14.47%
IN: 5.4%
RU: 3.52%
DE: 3.3%
Others: 40.55%