Ollama v0.7

Ollama v0.7

Ollama v0.7 引入了一個新的引擎,用於一流的多模態人工智慧支援,能夠在本地執行先進的視覺模型,如 Llama 4、Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1,並具有更高的可靠性和記憶體管理能力。
https://ollama.com/blog/multimodal-models?ref=aipure&utm_source=aipure
Ollama v0.7

產品資訊

更新時間:2025年06月16日

Ollama v0.7 每月流量趨勢

Ollama v0.7 的流量下降了 5.5%,減少了 298,679 次訪問。儘管引入了 Qwen 2.5 VL 並增強了視覺支援功能,但過去報告的漏洞和安全隱患可能影響了用戶信心,導致流量下降。

查看歷史流量

什麼是 Ollama v0.7

Ollama v0.7 代表了本地大型語言模型部署的重大演進,它超越了之前對 llama.cpp 的依賴,引入了一個新的專用引擎,用於多模態人工智慧功能。此版本著重於使多模態模型成為一等公民,讓使用者可以在本地執行複雜的視覺語言模型,而無需雲端服務。該系統支援各種模型大小,從適用於 8GB RAM 機器的 7B 參數到需要 32GB RAM 的較大 33B 模型,使先進的人工智慧可供不同的硬體配置使用。

Ollama v0.7 的主要功能

Ollama v0.7 推出了一款突破性的新引擎,為多模態 AI 模型帶來了一流的支援,能夠在本機執行先進的視覺語言模型,例如 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1。此次更新具有改進的記憶體管理、模型模組化以及增強的圖像和文字處理準確性,同時保持 Ollama 標誌性的易用性,以便在本機執行大型語言模型。
新型多模態引擎: 獨立的模型架構,允許每個模型實現自己的投影層並獨立處理多模態輸入,從而提高可靠性並簡化模型整合
進階記憶體管理: 智慧圖像快取系統和經過優化的 KV 快取,具有特定於硬體的配置,可最大限度地提高記憶體效率和效能
增強的準確性處理: 改進了大型圖像和令牌的處理,具有適當的元資料管理和特定於每個模型訓練架構的注意力機制
多模型支援: 整合了各種視覺語言模型,包括 Llama 4、Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1,每個模型都具有自己獨特的功能

Ollama v0.7 的使用案例

文件分析: 處理和提取文件中的資訊,包括字元識別和圖像中多語言文字的翻譯
視覺問答: 實現關於圖像的自然語言互動,包括詳細描述和回答關於視覺內容的具體問題
基於位置的分析: 分析和提供關於圖像中位置、地標和地理特徵的資訊,包括距離計算和旅行建議
多圖像比較: 同時分析多個圖像之間的關係和模式,識別共同元素和差異

優點

在本機執行先進的多模態模型,無需雲端依賴
提高了模型處理的可靠性和準確性
靈活支援多種模型架構
高效的記憶體管理和硬體最佳化

缺點

較大的模型需要大量的硬體資源
有限的 Windows 支援(需要 WSL2)
某些功能仍處於實驗階段

如何使用 Ollama v0.7

安裝 Ollama: 在您的系統上安裝 Ollama(支援 MacOS、Linux 和透過 WSL2 的 Windows)。請確保您有足夠的 RAM - 7B 模型至少需要 8GB,13B 模型需要 16GB,33B 模型需要 32GB。
啟動 Ollama 服務: 執行 'ollama serve' 命令以啟動 Ollama 服務。為了加快下載速度,您可以選擇使用:OLLAMA_EXPERIMENT=client2 ollama serve
拉取模型: 使用 'ollama pull <model_name>' 下載您想要的多模態模型。可用的模型包括 llama4:scout、gemma3、qwen2.5vl、mistral-small3.1、llava、bakllava 和更多視覺模型。
執行模型: 使用 'ollama run <model_name>' 啟動模型。例如:'ollama run llama4:scout' 或 'ollama run gemma3'
輸入圖像: 您可以透過在文字提示後提供圖像檔案路徑來輸入圖像。可以在單個提示中或透過後續問題添加多個圖像。支援 WebP 圖像格式。
與模型互動: 詢問有關圖像的問題、請求分析或進行後續對話。模型將處理文字和圖像以提供相關的回應。
可選:使用 API/函式庫: 您也可以透過其 API 或官方 Python/JavaScript 函式庫與 Ollama 互動,以進行程式化存取。多模態功能可在 CLI 和函式庫中使用。
可選:使用 Web UI: 為了獲得更友好的使用者介面,您可以使用各種社群建立的 Web UI 和客戶端,它們支援 Ollama 的多模態功能。

Ollama v0.7 常見問題

Ollama 現在支援具有新型引擎的多模態模型,該引擎可以處理視覺功能。它支援 Meta Llama 4、Google Gemma 3、Qwen 2.5 VL 和 Mistral Small 3.1 等模型。此更新包括影像分析、多重影像處理、文件掃描和字元辨識等功能。

Ollama v0.7 網站分析

Ollama v0.7 流量和排名
5.1M
每月訪問量
#10016
全球排名
#247
類別排名
流量趨勢:Mar 2025-May 2025
Ollama v0.7 用戶洞察
00:04:16
平均訪問時長
4.93
每次訪問的頁面數
33.47%
用戶跳出率
Ollama v0.7 的主要地區
  1. CN: 32.76%

  2. US: 14.47%

  3. IN: 5.4%

  4. RU: 3.52%

  5. DE: 3.3%

  6. Others: 40.55%

与 Ollama v0.7 类似的最新 AI 工具

Athena AI
Athena AI
Athena AI 是一個多功能的 AI 驅動平台,通過文檔分析、測驗生成、閃卡和互動聊天功能,提供個性化的學習協助、商業解決方案和生活輔導。
Aguru AI
Aguru AI
Aguru AI 是一個本地部署的軟件解決方案,為基於 LLM 的應用提供全面的監控、安全和優化工具,包括行為跟蹤、異常檢測和性能優化等功能。
GOAT AI
GOAT AI
GOAT AI 是一個 AI 驅動的平台,提供一鍵摘要功能,適用於新聞文章、研究論文和視頻等多種內容類型,同時還提供先進的 AI 代理編排,用於特定領域的任務。
GiGOS
GiGOS
GiGOS 是一個 AI 平台,提供多個先進的語言模型,如 Gemini、GPT-4、Claude 和 Grok,並通過直觀的界面讓用戶與不同的 AI 模型互動和比較。