Pada 25 November 2024 (kemarin), akun Twitter resmi Nvidia mengumumkan peluncuran model audio generatif canggih bernama Fugatto. Model ini dapat menciptakan berbagai suara, musik, dan ucapan berdasarkan input pengguna. Yang membedakan alat inovatif ini adalah kemampuannya untuk menghasilkan suara yang sepenuhnya baru, memadukan berbagai efek audio dengan cara yang sebelumnya tidak terbayangkan.
Era Baru dalam Generasi Audio: Nvidia Fugatto
Fugatto (singkatan dari Foundational Generative Audio Transformer Opus 1) dirancang untuk memenuhi berbagai kebutuhan kreatif dalam film, game, dan produksi musik. Ini memungkinkan pengguna memasukkan prompt teks dan audio, menghasilkan segala hal mulai dari jingle hingga lanskap suara yang kompleks. Model ini memiliki 2,5 miliar parameter dan dilatih menggunakan jutaan sampel audio dari berbagai genre.
Nvidia Fugatto: Kemampuan Penciptaan Suara Unik
Salah satu fitur unggulan Nvidia Fugatto adalah kemampuannya untuk menciptakan suara yang "belum pernah terdengar sebelumnya". Misalnya, dapat menghasilkan saksofon yang melolong seperti anjing atau terompet yang mengeong. Kemampuan ini berasal dari teknik yang disebut ComposableART, yang memungkinkan model menggabungkan berbagai instruksi yang dipelajarinya selama pelatihan. Ini berarti pengguna dapat mendeskripsikan kombinasi suara yang rumit—seperti denyut bass dalam yang dipasangkan dengan kicauan bernada tinggi—dan Fugatto akan menghasilkannya dengan mulus.
Nvidia Fugatto: Meningkatkan Audio yang Ada
Selain menciptakan suara baru, Nvidia Fugatto unggul dalam memodifikasi trek yang ada. Pengguna dapat menambah atau menghapus instrumen dari lagu, mengisolasi vokal, atau bahkan mengubah nada emosional dan aksen suara. Fleksibilitas ini memungkinkan teknisi suara dan musisi bereksperimen dengan komposisi mereka tanpa memerlukan keterampilan atau sumber daya editing yang ekstensif.
Nvidia Fugatto: Aplikasi Praktis untuk Para Kreatif
Fugatto siap menjadi pembawa perubahan untuk berbagai industri:
- Produksi Musik: Musisi dapat dengan cepat membuat prototipe ide dalam berbagai gaya dan aransemen.
- Film dan Periklanan: Kemampuan alat ini untuk mengadaptasi musik secara dinamis membuatnya ideal untuk scoring film atau membuat soundtrack yang disesuaikan untuk iklan.
- Gaming: Pengembang game dapat menggunakan Nvidia Fugatto untuk menghasilkan lanskap suara imersif yang berkembang seiring gameplay.
Rafael Valle, seorang manajer penelitian audio terapan di Nvidia, menekankan tujuan model ini: "Kami ingin menciptakan model yang memahami dan menghasilkan suara seperti yang dilakukan manusia." Pemahaman seperti manusia ini memungkinkan interaksi yang lebih intuitif dengan perangkat lunak.
Tantangan dan Pertimbangan Generator Audio AI
Meskipun Nvidia Fugatto menyajikan peluang yang menarik, ini juga menimbulkan pertanyaan tentang masa depan pekerjaan desain suara. Seiring alat AI seperti ini menjadi lebih umum, peran tradisional seperti artis foley mungkin menghadapi tantangan. Namun, Nvidia menyarankan bahwa Fugatto bisa berfungsi sebagai asisten daripada pengganti, memungkinkan para profesional untuk meningkatkan kreativitas mereka daripada menguranginya.
Selain itu, kekhawatiran tentang masalah hak cipta terkait konten yang dihasilkan AI semakin meningkat. Dengan banyak perusahaan menghadapi tantangan hukum atas penggunaan materi berhak cipta dalam dataset pelatihan, industri harus menavigasi kompleksitas ini dengan hati-hati.
Nvidia Fugatto mewakili lompatan besar dalam teknologi generasi audio AI. Dengan memadukan kemungkinan kreatif dengan keahlian teknis, alat baru Nvidia ini mengundang seniman dan produser untuk mengeksplorasi wilayah pendengaran yang belum terjamah.
Untuk wawasan lebih lanjut tentang perkembangan AI terbaru dan alat seperti Fugatto, kunjungi AIPURE untuk informasi komprehensif tentang inovasi kecerdasan buatan.