
Hush
Hush, 10 ms'lik çerçeve başına ~1 ms'nin altında üretim Sesli Yapay Zeka çağrıları için arka plan gürültüsünü ve rekabet eden konuşmacıları bastıran 8 MB'lık açık kaynaklı, CPU gerçek zamanlı bir konuşma geliştirme modelidir.
https://www.weya.ai/hush?ref=producthunt&utm_source=aipure

Ürün Bilgisi
Güncellendi:Jun 24, 2026
Hush Nedir
Hush, telefon ajanları, çağrı merkezi botları, sesli asistanlar ve gerçek zamanlı transkripsiyon hatları gibi üretim Sesli Yapay Zeka sistemleri için özel olarak oluşturulmuş weya AI'ın şirket içi açık kaynak gürültü bastırma ve konuşma geliştirme modelidir. Çoğunlukla genel gürültü kıyaslamaları için optimize edilmiş birçok geliştirme modelinin aksine, Hush, çakışan insan konuşmasının ASR ve aşağı akış konuşma yapay zekası için sıkça bir hata noktası olduğu gerçek dünya çağrıları için tasarlanmıştır. Hafiftir (~1.8M parametre, ~8 MB), tamamen CPU üzerinde gerçek zamanlı çalışır ve Apache 2.0 lisansı altında pratik dağıtım yapıtlarıyla (PyTorch kontrol noktası ve bir ONNX üretim paketi) dağıtılır.
Hush Temel Özellikleri
Hush, weya AI tarafından özel olarak üretim Voice AI için geliştirilmiş açık kaynaklı, gerçek zamanlı bir konuşma geliştirme/gürültü bastırma modelidir. Tamamen CPU üzerinde çok düşük gecikmeyle (10 ms'lik ses çerçevesi başına yaklaşık 1 ms'den az işlem) çalışır, hafiftir (~8 MB, ~1.8M parametre) ve tipik ortam gürültüsüne ek olarak rakip arka plan konuşmacılarını (üst üste binen konuşma) bastırmaya güçlü bir vurgu yaparak 10.000+ saatten fazla karışık gürültülü ses üzerinde eğitilmiştir. Dilden bağımsızdır (akustik özellikler üzerinde çalışır), nedensel/akış dostudur ve bir ONNX üretim paketi veya yaygın işletim sistemleri için önceden oluşturulmuş bağımsız ikili dosyalar aracılığıyla dağıtılabilir, bu da ses hatlarına entegrasyonu kolaylaştırır.
Arka plan konuşmacı bastırma: Sadece sabit gürültüyü değil, birincil arayanı izole etmek ve rakip insan seslerini (sesli ajanlar ve ASR için yaygın bir hata modu) azaltmak için tasarlanmıştır.
Gerçek zamanlı CPU performansı: Bir GPU gerektirmeden canlı aramalar için yeterince hızlı ses çerçevelerini işler (10 ms'lik ses başına ~1 ms'nin altında rapor edilmiştir).
Hafif ayak izi: Küçük model boyutu (~8 MB; ~1.8M parametre) sınırlı kaynaklara sahip şirket içi ve uç dağıtımlar için pratik hale getirir.
Üretim odaklı dağıtım seçenekleri: Linux, macOS (Apple Silicon) ve Windows için önceden oluşturulmuş ikili dosyalarla C/C++/Python'da doğrudan entegrasyon için bir ONNX üretim paketi ve bağımsız bir kütüphane ile birlikte gelir.
Büyük ölçekli gerçek dünya gürültülü veriler üzerinde eğitildi: 10.000+ saatten fazla karışık ses üzerinde eğitildi; büyük bir kısmı orta SIR seviyelerinde üst üste binen konuşmacıları içerir, bu da gerçek aramalarda sağlamlığı artırır.
Dilden bağımsız geliştirme: Dilsel içeriğe dayanmak yerine akustik sinyal kalitesini artırdığı için diller arasında çalışır.
Hush Kullanım Alanları
Çağrı merkezi sesli ajanları ve IVR: Gürültülü telefon sesini temizler ve arka plan konuşmasını/TV'yi bastırarak ajan anlayışını iyileştirir, tekrar istemleri azaltır ve uçtan uca sesli bot performansını stabilize eder.
Gerçek zamanlı transkripsiyon hatları: Konuşma netliğini artırarak ve gürültü ile üst üste binen konuşmacılardan kaynaklanan paraziti azaltarak canlı veya kaydedilmiş konuşmalarda ASR doğruluğunu iyileştirir.
BFSI müşteri alımı, satış ve tahsilat aramaları: Gürültülü ortamların ve konuşmacı çakışmasının yaygın olduğu düzenlenmiş, yüksek riskli aramalarda (örn. KYC, kredi/tahsilat görüşmeleri) anlaşılırlığı artırır.
Gürültülü ortamlarda sesli asistanlar: Ortam gürültüsünü azaltarak ve ana konuşmacıya odaklanarak asistanların kafelerde, sokaklarda, ofislerde ve diğer gerçek dünya ortamlarında işlev görmesine yardımcı olur.
Uyum ve QA çağrı incelemesi: Kaynak sinyali iyileştirerek daha net denetimler, kalite izleme ve aşağı akış analizi (özetleme, niyet tespiti) için kaydedilmiş çağrı sesini geliştirir.
Artıları
Açık kaynak (Apache 2.0) ve kurumsal/şirket içi dağıtım için tasarlanmıştır.
Çok düşük gecikme ve küçük model boyutu ile gerçek zamanlı, yalnızca CPU çalışması.
Rakip arka plan konuşmacılarını bastırmaya açıkça odaklanma, yaygın bir üretim Voice AI sorun noktası.
Eksileri
16 kHz akış/çağrı sesi için optimize edilmiştir; diğer formatlar için yeniden örnekleme ve dikkatli boru hattı entegrasyonu gerektirebilir.
Bir konuşma geliştirme modeli olarak, giriş alanına bağlı olarak aşırı gürültü/çakışma koşullarında artefaktlar oluşturabilir veya aşırı bastırabilir.
En iyi sonuçlar, basit çevrimdışı toplu işleme yerine uygun çerçeve tabanlı akış entegrasyonuna (oturum durumu, çerçeve boyutlandırma) bağlı olabilir.
Hush Nasıl Kullanılır
1) Hush model sayfasını açın: Modelin resmi Hugging Face deposuna gidin: https://huggingface.co/weya-ai/hush
2) Entegrasyon yolunuzu seçin (hızlı demo veya üretim): Hush'ı hızlı bir test için barındırılan Hugging Face arayüzü aracılığıyla mı denemek istediğinize (a) veya gerçek zamanlı çağrı işleme için kendi Sesli Yapay Zeka yığınıza entegre etmek istediğinize (b) karar verin.
3) Tarayıcıda Hush'ı deneyin (hızlı test): Hugging Face model sayfasında, bir örnek çalıştırmak ve gürültülü giriş ile geliştirilmiş çıktıyı karşılaştırmak için mevcut demoyu/widget'ı (gösteriliyorsa) kullanın.
4) Yerel kullanım için model varlıklarını indirin: Hugging Face deposu dosyalarından, çalışma zamanı ihtiyaçlarınıza bağlı olarak kontrol noktasını ve/veya ONNX üretim paketini (onnx/ dizini altındaki ONNX tarball'ı) indirin.
5) CPU gerçek zamanlı dağıtım için ONNX kullanın: PyTorch olmadan üretim kullanımı için, önceden oluşturulmuş ONNX paketini kullanın, böylece Hush tamamen CPU üzerinde gerçek zamanlı çalışabilir (model, tipik CPU'larda milisaniyenin altında hesaplama ile ~10 ms'lik çerçeveleri işlemek üzere tasarlanmıştır).
6) Ses hattınıza 'ön' taraftan entegre edin: Hush'ı ASR/transkripsiyon veya sesli aracınızdan önce yerleştirin, böylece çağrı sesi önce geliştirilir; bu, anlaşılırlığı artırır ve arka plan gürültüsünü ve aşağı akış bileşenlerine ulaşan rekabetçi konuşmayı azaltır.
7) Sesi gerçek zamanlı akış olarak besleyin: Gecikmeyi düşük tutmak ve çağrılar ve konuşma sistemleri için gerçek zamanlı davranışı sürdürmek için Hush'ı canlı ses çerçevelerinde (örn. 10 ms'lik parçalar) sürekli olarak çalıştırın.
8) Hedef ortamlarınızda doğrulayın: Gerçek çağrı koşullarınızla (kafeler, sokaklar, ofis gürültüsü, çakışan konuşmacılar) test edin. Hush'ın orta SIR'de (yaklaşık 12–24 dB) arka plan konuşmacılarıyla eğitildiğini unutmayın, bu nedenle aşırı yüksek sesli rakip konuşmacılar tamamen bastırılamayabilir.
9) Çıktı olarak ne kullanılmayacağını anlayın: Bir 'ayırma başlığı' veya arka plan konuşmacı maskesine atıflar görürseniz, bunu bir eğitim zamanı yardımcı düzenleyici (ERB-alan yumuşak maske) olarak değerlendirin, üretim için bağımsız bir kaynak ayırma çıktısı olarak değil.
10) Hedef işletim sisteminize dağıtın: Ağır üretim bağımlılıklarından kaçınmak için ONNX yaklaşımını kullanarak CPU çalışma zamanını ihtiyacınız olan yere (Linux, Apple Silicon dahil macOS veya Windows) dağıtın.
Hush SSS
Hush, gerçek dünya çağrı seslerinden arka plan gürültüsünü gideren ve rakip arka plan konuşmacılarını bastıran, Sesli Yapay Zeka için oluşturulmuş açık kaynaklı bir konuşma geliştirme/gürültü bastırma modelidir.
Hush Videosu
Popüler Makaleler

Atoms: Fikirleri Lansmana Hazır Ürünlere Dönüştüren Çoklu Ajan Yapay Zeka Platformu
May 22, 2026

Nano Banana SBTI: Nedir, Nasıl Çalışır ve 2026'da Nasıl Kullanılır
Apr 15, 2026

Atoms İncelemesi — 2026'da Dijital Oluşumu Yeniden Tanımlayan Yapay Zeka Ürün Geliştiricisi
Apr 10, 2026

Kilo Claw: Gerçek Bir "Senin Yerine Yapan" Yapay Zeka Aracısı Nasıl Kurulur ve Kullanılır (2026 Güncellemesi)
Apr 3, 2026







