
Phi-4-multimodal and Phi-4-mini
Microsoft'un Phi-4-multimodal (5,6B parametre) ve Phi-4-mini (3,8B parametre), minimum bilgi işlem kaynağı gerektirirken güçlü çok modlu işleme ve verimli metin tabanlı yetenekler sunan yeni küçük dil modelleridir.
https://azure.microsoft.com/en-us/blog/empowering-innovation-the-next-generation-of-the-phi-family?ref=aipure&utm_source=aipure

Ürün Bilgisi
Güncellendi:May 16, 2025
Phi-4-multimodal and Phi-4-mini Aylık Trafik Trendleri
Phi-4-multimodal ve Phi-4-mini trafikte %7,4'lük bir düşüş yaşadı ve ziyaret sayısı 563 bin azaldı. Bu durum, son zamanlarda ürün güncellemelerinin olmaması ve gelişmiş yapay zeka özellikleri sunan Azure'daki Microsoft Copilot'un piyasaya sürülmesi ile kullanıcıların bu platforma yönelmesinden kaynaklanmış olabilir.
Phi-4-multimodal and Phi-4-mini Nedir
Phi-4-multimodal ve Phi-4-mini, Microsoft'un küçük dil modelleri (SLM) Phi ailesinin en yeni üyeleridir ve geliştiricileri verimliliği korurken gelişmiş yapay zeka yetenekleriyle güçlendirmek için tasarlanmıştır. Phi-4-multimodal, konuşma, görme ve metin işlemeyi tek bir birleşik mimaride sorunsuz bir şekilde entegre eden Microsoft'un ilk çok modlu dil modelidir; Phi-4-mini ise akıl yürütme, matematik, kodlama ve talimat takibi gibi metin tabanlı görevlerde mükemmeldir. Her iki model de artık Azure AI Foundry, Hugging Face ve NVIDIA API Kataloğu aracılığıyla kullanılabilir ve bu da onları geliştiricilerin yenilikçi yapay zeka uygulamaları oluşturması için erişilebilir hale getirir.
Phi-4-multimodal and Phi-4-mini Temel Özellikleri
Phi-4-multimodal (5.6B parametre) ve Phi-4-mini (3.8B parametre), Microsoft'un verimli yapay zeka dağıtımı için tasarlanmış en son küçük dil modelleridir. Phi-4-multimodal, konuşma, görme ve metin işlemeyi tek bir mimaride benzersiz bir şekilde entegre ederken, Phi-4-mini, akıl yürütme, matematik ve kodlama gibi metin tabanlı görevlerde mükemmeldir. Her iki model de hesaplama açısından kısıtlı ortamlar için optimize edilmiştir ve bulut, uç ve mobil cihazlarda dağıtılarak daha düşük hesaplama gereksinimleriyle yüksek performans sunar.
Birleşik Çok Modlu İşleme: Phi-4-multimodal, konuşma, görme ve metin işlemeyi, çoklu giriş türlerinin performans düşüşü olmadan eş zamanlı olarak işlenmesini sağlayan karışım-LoRA teknolojisini kullanarak tek bir modelde entegre eder
Kompakt Ama Güçlü: Daha küçük boyutlarına rağmen, her iki model de yüksek performans seviyelerini korur; Phi-4-mini, metin tabanlı görevlerde daha büyük modellerden daha iyi performans gösterirken, Phi-4-multimodal, daha fazla kaynak yoğun rakiplerin yetenekleriyle eşleşir
Çapraz Platform Dağıtımı: Her iki model de ONNX Runtime kullanılarak çeşitli platformlar için optimize edilebilir ve uç cihazlarda, cep telefonlarında ve bulut ortamlarında verimli kaynak kullanımıyla dağıtım sağlar
Genişletilmiş Bağlam İşleme: Büyük belgelerin ve karmaşık bağlamların verimliliği koruyarak analiz edilmesini sağlayan 128.000'e kadar belirtecin işlenmesini destekler
Phi-4-multimodal and Phi-4-mini Kullanım Alanları
Otomotiv Zekası: Sesli komut işleme, sürücü izleme, jest tanıma ve gerçek zamanlı navigasyon yardımı için araç sistemlerine entegrasyon, hem çevrimiçi hem de çevrimdışı çalışma
Sağlık Hizmetleri Uygulamaları: Görsel analiz yoluyla tıbbi teşhisi, hasta geçmişi özetlemesini ve hızlı tanı desteğini desteklerken, hesaplama açısından kısıtlı ortamlarda veri gizliliğini koruma
Akıllı Cihaz Entegrasyonu: Düşük gecikmeyle gerçek zamanlı dil çevirisi, görüntü analizi ve akıllı kişisel yardım için akıllı telefonlara ve kişisel cihazlara yerleştirme
Finansal Hizmetler: Karmaşık finansal hesaplamaları otomatikleştirme, çok dilli raporlar oluşturma ve finansal belgeleri çevirme, aynı zamanda hesaplama görevlerinde yüksek doğruluğu koruma
Artıları
Yüksek performansı korurken küçük model boyutuyla verimli kaynak kullanımı
Farklı bilgi işlem ortamlarında çok yönlü dağıtım seçenekleri
Kompakt bir biçimde güçlü akıl yürütme ve çok modlu işleme yetenekleri
Eksileri
Gemini-2.0-Flash gibi daha büyük modellere kıyasla konuşma QA görevlerinde performans açığı
Daha küçük işletmelerin uygulaması ve entegre etmesi zor olabilir
Daha büyük dil modellerine kıyasla sınırlı bilgi tutma kapasitesi
Phi-4-multimodal and Phi-4-mini Nasıl Kullanılır
Gerekli Bağımlılıkları Yükleyin: Gerekli paketleri yükleyin: pip install transformers==4.48.2 flash_attn==2.7.4.post1 torch==2.6.0 accelerate==1.3.0 soundfile==0.13.1 pillow==11.1.0 scipy==1.15.2 torchvision==0.21.0 backoff==2.2.1 peft==0.13.2
Gerekli Kitaplıkları İçe Aktarın: Gerekli Python kitaplıklarını içe aktarın: import requests, torch, os, io, PIL, soundfile, transformers
Modeli Yükleyin: Şunu kullanarak modeli ve işlemciyi yükleyin: model_path = 'microsoft/Phi-4-multimodal-instruct'; processor = AutoProcessor.from_pretrained(model_path); model = AutoModelForCausalLM.from_pretrained(model_path)
Girdiyi Hazırlayın: Girdinizi türe göre biçimlendirin - metin, resim veya ses. Metin için, sistem ve kullanıcı mesajlarıyla sohbet biçimini kullanın. Resimler/ses için, desteklenen biçimlerde olduklarından emin olun
Çıktı Oluşturun: Çıktı oluşturmak için işlem hattını kullanın: pipeline = transformers.pipeline('text-generation', model=model_path); outputs = pipeline(messages, max_new_tokens=128)
Platformlar Aracılığıyla Erişin: Alternatif olarak, model etkileşimi için kullanıcı arayüzleri sağlayan Azure AI Foundry, Hugging Face veya NVIDIA API Kataloğu platformları aracılığıyla modellere erişin
İsteğe Bağlı: İnce Ayar: Özelleştirme için, modeli belirli kullanım durumlarına uyarlamak üzere Azure Machine Learning veya Azure AI Foundry'nin kodsuz ince ayar özelliklerini kullanın
Dağıt: Üretim kullanımı için modeli Azure AI hizmetlerini kullanarak dağıtın veya optimizasyon için Microsoft Olive ile uç/cihaz dağıtımı için ONNX Runtime'ı kullanın
Phi-4-multimodal and Phi-4-mini SSS
Bunlar, Microsoft'un küçük dil modelleri (SLM) Phi ailesindeki en yeni modellerdir. Phi-4-multimodal, konuşma, görme ve metni aynı anda işleyebilen 5,6B parametreli çok modlu bir modeldir; Phi-4-mini ise metin tabanlı görevlerde mükemmel olan 3,8B parametreli bir modeldir.
Popüler Makaleler

2025'teki En İyi 5 NSFW Karakter Oluşturucu
May 29, 2025

Google Veo 3: Ses Desteğini Yerel Olarak Destekleyen İlk Yapay Zeka Video Oluşturucu
May 28, 2025

Denemeniz Gereken En İyi 5 Ücretsiz AI NSFW Kız Arkadaş Sohbet Robotu—AIPURE'un Gerçek İncelemesi
May 27, 2025

SweetAI Chat ve CrushOn.AI Karşılaştırması: 2025'te Nihai NSFW AI Kız Arkadaşı Hesaplaşması
May 27, 2025
Phi-4-multimodal and Phi-4-mini Web Sitesi Analitiği
Phi-4-multimodal and Phi-4-mini Trafik ve Sıralamaları
7.1M
Aylık Ziyaretler
-
Küresel Sıralama
-
Kategori Sıralaması
Trafik Trendleri: Jun 2024-Apr 2025
Phi-4-multimodal and Phi-4-mini Kullanıcı İçgörüleri
00:01:53
Ort. Ziyaret Süresi
1.93
Ziyaret Başına Sayfa Sayısı
61.28%
Kullanıcı Hemen Çıkma Oranı
Phi-4-multimodal and Phi-4-mini'in En Çok Kullanıldığı Bölgeler
US: 20.81%
IN: 9.88%
JP: 5.66%
GB: 4.2%
BR: 4.2%
Others: 55.24%