Zyphra Zonos

Zyphra Zonos

Zonos, Apache 2.0 lisansı altında yayınlanan yüksek kaliteli ses klonlama, gerçek zamanlı üretim ve etkileyici konuşma yeteneklerine sahip iki adet 1,6 milyar parametreli model (transformer ve hibrit) içeren açık kaynaklı bir metinden konuşmaya (TTS) model paketidir.
https://www.zyphra.com/post/beta-release-of-zonos-v0-1?ref=aipure&utm_source=aipure
Zyphra Zonos

Ürün Bilgisi

Güncellendi:May 9, 2025

Zyphra Zonos Aylık Trafik Trendleri

Zyphra Zonos, 317.8K'dan 178.5K ziyarete düşerek trafikte %43.9'luk bir düşüş yaşadı. Karmaşık matematiksel akıl yürütme görevlerini ve ileri düzey yazılım kodlama zorluklarını çözmek için ZR1-1.5B yapay zeka sisteminin tanıtılmasına rağmen, bu önemli düşüş, bu güncellemelerin kullanıcı etkileşimini önemli ölçüde etkilemediğini göstermektedir.

Geçmiş trafiği görüntüle

Zyphra Zonos Nedir

Zonos-v0.1, Zyphra tarafından geliştirilen ve iki adet 1,6 milyar parametreli model (bir transformer modeli ve bir SSM hibrit modeli) içeren son teknoloji bir metinden konuşmaya model paketidir. Şubat 2025'te beta sürümünde yayınlanan bu model, öncelikle İngilizce olmak üzere birden fazla dili kapsayan yaklaşık 200.000 saatlik konuşma verisi üzerinde eğitilmiştir. Modeller, yalnızca 5-30 saniyelik referans sesten ses klonlama yetenekleriyle son derece doğal konuşma üretebilirken, konuşma hızı, perde, ses kalitesi ve duygular üzerinde de kontrol sunar. Her iki model de Apache 2.0 lisansı altında yayınlanmıştır ve bu da onları araştırma ve geliştirme için tamamen erişilebilir kılar.

Zyphra Zonos Temel Özellikleri

Zyphra Zonos, Apache 2.0 lisansı altında yayınlanan iki adet 1.6B parametreli modele (transformer ve SSM hibrit) sahip, son teknoloji ürünü bir metinden konuşmaya (TTS) sistemidir. Yüksek kaliteli ses klonlama yetenekleri, çoklu dil desteği ve duygular, konuşma hızı ve perde dahil olmak üzere çeşitli vokal özellikleri üzerinde etkileyici kontrol ile gerçek zamanlı konuşma üretimi sunar. Sistem, yüksek kaliteli 44KHz ses çıkışı sağlar ve hem açık kaynaklı model ağırlıklarını hem de ticari bir API hizmetini sunar.
Yüksek Kaliteli Ses Klonlama: Sadece 5-30 saniyelik konuşma örnekleri kullanarak sesleri yüksek doğrulukla klonlayabilir
Etkileyici Kontrol: Konuşma hızı, perde, ses kalitesi ve duygular (üzüntü, korku, öfke, mutluluk, şaşkınlık) üzerinde ince ayarlı kontrol sunar
Çoklu Dil Desteği: İngilizce, Çince, Japonca, Fransızca, İspanyolca ve Almanca dahil olmak üzere birden çok dili yüksek kaliteli konuşma senteziyle destekler
Çift Mimari: Farklı performans özellikleri ve kalite ödünleşimleri sunan hem transformer hem de SSM hibrit modellerine sahiptir

Zyphra Zonos Kullanım Alanları

İçerik Oluşturma: İçerik oluşturucuların videolar, podcast'ler ve sesli kitaplar için özelleştirilmiş seslerle seslendirme ve anlatım oluşturmasını sağlayın
Erişilebilirlik Çözümleri: Görme engelli kullanıcılar için doğal ve etkileyici ses çıkışıyla metinden konuşmaya hizmetleri sağlayın
Dil Öğrenimi: Birden çok dilde ana dili konuşan kalitesinde telaffuz sağlayarak dil eğitimini destekleyin
Sanal Asistanlar: Doğal sesli ve duygusal olarak uygun ses yanıtlarıyla konuşma yapay zeka sistemlerine güç verin

Artıları

Apache 2.0 lisansı altında açık kaynak kullanılabilirliği
Tescilli çözümlerle eşleşen veya aşan yüksek kaliteli çıktı
Rekabetçi fiyatlandırma ve ücretsiz katman ile esnek API

Eksileri

Üretim başlangıcında/bitişinde daha yüksek ses artefaktı konsantrasyonu
Yüksek bit hızı gereksinimleri nedeniyle daha yavaş çıkarım
Dağıtım dışı cümlelerde ara sıra metin hizalama sorunları

Zyphra Zonos Nasıl Kullanılır

Ön Koşulları Yükleyin: Ubuntu'da fonemleştirme için eSpeak kütüphanesini yükleyin ve pip aracılığıyla uv'yi yükleyin: 'pip install -U uv'
Depoyu Klonlayın: 'git clone https://github.com/Zyphra/Zonos.git' komutunu kullanarak Zonos deposunu klonlayın ve dizine gidin: 'cd Zonos'
Dağıtım Yöntemini Seçin: Gradio arayüzü için: 'docker compose up' VEYA geliştirme için: 'docker build -t Zonos .'
Gerekli Kütüphaneleri İçe Aktarın: torch, torchaudio ve gerekli Zonos modüllerini içe aktarın: 'import torch, torchaudio, from zonos.model import Zonos, from zonos.conditioning import make_cond_dict'
Modeli Yükleyin: Zonos.from_pretrained() kullanarak transformer modelini ('Zyphra/Zonos-v0.1-transformer') veya hibrit modeli ('Zyphra/Zonos-v0.1-hybrid') yükleyin ve cihazı belirtin (örneğin 'cuda')
Ses Girişini Hazırlayın: Ses klonlama için konuşmacı gömme oluşturmak üzere torchaudio.load() kullanarak referans ses dosyasını yükleyin
Konuşmacı Gömme Oluşturun: model.make_speaker_embedding() kullanarak giriş sesinden konuşmacı gömme oluşturun
Koşullandırmayı Ayarlayın: metin, konuşmacı gömme, dil ve duygular, konuşma hızı vb. gibi diğer isteğe bağlı parametrelerle koşullandırma sözlüğü oluşturun: make_cond_dict() kullanın
Ses Oluşturun: model.prepare_conditioning(), model.generate() ve model.autoencoder.decode() kullanarak koşullandırmayı hazırlayın, ses kodları oluşturun ve dalga biçimine çözün
Çıktıyı Kaydedin: torchaudio.save() kullanarak oluşturulan sesi uygun örnekleme hızıyla kaydedin

Zyphra Zonos SSS

Zonos-v0.1, Zyphra tarafından yayınlanan, yüksek kaliteli ses klonlama özelliklerine sahip 1.6B transformatör ve 1.6B hibrit model içeren etkileyici bir metinden konuşmaya (TTS) model çiftidir. Her iki model de Apache 2.0 lisansı altında yayınlanmıştır.

Zyphra Zonos Web Sitesi Analitiği

Zyphra Zonos Trafik ve Sıralamaları
178.5K
Aylık Ziyaretler
#173145
Küresel Sıralama
#391
Kategori Sıralaması
Trafik Trendleri: Jan 2025-Apr 2025
Zyphra Zonos Kullanıcı İçgörüleri
00:02:16
Ort. Ziyaret Süresi
5.22
Ziyaret Başına Sayfa Sayısı
38.63%
Kullanıcı Hemen Çıkma Oranı
Zyphra Zonos'in En Çok Kullanıldığı Bölgeler
  1. US: 39.01%

  2. KR: 10.04%

  3. IN: 9.79%

  4. NG: 5.5%

  5. DE: 4.53%

  6. Others: 31.13%

Zyphra Zonos Benzer En Yeni Yapay Zeka Araçları

MicVoice.Ai
MicVoice.Ai
MicVoice.Ai, yazılı metni 17'den fazla dili destekleyen 5000'den fazla gerçekçi AI sesi ile yüksek kaliteli, doğal sesli konuşmaya dönüştüren hepsi bir arada bir AI ses üretim platformudur.
Narrai
Narrai
Narrai, kısa videolar için anında seslendirme ve arka plan müziği oluşturan AI destekli bir mobil uygulamadır; ilgili senaryoları otomatik olarak oluşturarak ve birden fazla anlatıcı kişiliği sunarak.
Vagent
Vagent
Vagent, kullanıcıların sesli komutlar aracılığıyla özel AI ajanlarıyla etkileşimde bulunmalarını sağlayan hafif bir ses arayüzüdür ve 60'tan fazla dil desteği ile otomasyonları kontrol etmenin doğal ve sezgisel bir yolunu sunar.
F5 TTS
F5 TTS
F5-TTS, sıfırdan ses klonlama yetenekleri ile son derece doğal ve etkileyici konuşma üretmek için Flow Matching ve Diffusion Transformer tekniklerini kullanan en son teknoloji, otomatik olmayan bir metinden konuşmaya sistemidir.