Lanskap produksi audio sedang mengalami transformasi dengan diperkenalkannya Adobe's MultiFoley AI. Dikembangkan bekerja sama dengan peneliti dari University of Michigan, sistem terobosan ini memungkinkan pengguna menghasilkan suara Foley berkualitas tinggi—efek audio khusus yang ditambahkan selama pasca-produksi—menggunakan berbagai metode input, termasuk prompt teks, audio referensi, dan contoh video.
Kekuatan MultiFoley AI
MultiFoley menonjol karena kemampuannya menghasilkan efek suara yang tidak hanya kreatif tetapi juga tersinkronisasi dengan baik dengan konten visual. Selama demonstrasi, sistem ini menunjukkan keserbagunaan dengan mengubah suara kucing menjadi auman singa dan mengubah suara mesin ketik menjadi nada piano, semuanya sambil mempertahankan timing yang tepat dengan pemutaran video. Tingkat sinkronisasi ini dicapai melalui algoritma canggih yang menganalisis fitur visual pada 8 frame per detik dan menyesuaikannya dengan tingkat sampling audio 40 Hz.
Output Audio Berkualitas Tinggi
Kualitas output audio MultiFoley mencapai bandwidth mengesankan 48kHz. Pencapaian ini dikaitkan dengan pelatihan ekstensif yang diterima AI pada dataset beragam yang terdiri dari video internet dan pustaka efek suara profesional. Sistem ini telah menunjukkan akurasi sinkronisasi rata-rata hanya 0,8 detik, peningkatan signifikan dibandingkan sistem tradisional yang biasanya mengalami penundaan lebih dari satu detik.
Desain dan Pengujian Berfokus pada Pengguna
Dalam studi pengguna, MultiFoley menerima nilai tinggi untuk kinerjanya. Sekitar 85,8% peserta menilai konsistensi semantiknya lebih unggul dibandingkan sistem pesaing, sementara 94,5% lebih memilih kemampuan sinkronisasinya. Umpan balik ini menyoroti potensi sistem untuk memperlancar desain suara baik untuk kreator individu maupun perusahaan produksi yang lebih besar.
Keterbatasan Saat Ini dan Prospek Masa Depan
Meskipun memiliki fitur inovatif, MultiFoley menghadapi beberapa keterbatasan. Ukuran dataset pelatihannya membatasi variasi efek suara yang dapat dihasilkan, dan saat ini masih kesulitan menghasilkan beberapa suara secara bersamaan secara efektif. Namun, tim peneliti berencana untuk segera merilis kode sumber dan model, yang dapat memfasilitasi pengembangan lebih lanjut dan perluasan kemampuannya.
Meskipun Adobe belum mengintegrasikan MultiFoley ke dalam produk yang ada seperti Premiere Pro, teknologi ini selaras dengan rangkaian alat kreatif Adobe. Aplikasi potensialnya dapat meningkatkan alur kerja dalam pengeditan video dan desain suara secara signifikan.
Kesimpulan
Adobe's MultiFoley AI merepresentasikan kemajuan signifikan dalam bidang desain suara, menawarkan alat yang kuat bagi kreator untuk menghasilkan efek audio tersinkronisasi secara efisien. Seiring teknologi ini terus berkembang dan berpotensi terintegrasi ke dalam jajaran produk Adobe, ini menjanjikan untuk mendefinisikan ulang bagaimana suara dibuat dalam produksi film dan video. Untuk wawasan lebih lanjut tentang alat AI terbaru dan inovasi, kunjungi AIPURE(https://aipure.ai) untuk informasi komprehensif tentang kemajuan kecerdasan buatan.