Vào ngày 25 tháng 11 năm 2024 (hôm qua), tài khoản Twitter chính thức của Nvidia đã công bố ra mắt một mô hình âm thanh generative tiên tiến gọi là Fugatto. Mô hình này có thể tạo ra nhiều loại âm thanh, âm nhạc và lời nói dựa trên đầu vào của người dùng. Điều khiến công cụ sáng tạo này trở nên độc đáo là khả năng tạo ra những âm thanh hoàn toàn mới, kết hợp các hiệu ứng âm thanh một cách mượt mà theo những cách mà trước đây chưa từng nghĩ đến.
Một Kỷ Nguyên Mới trong Tạo Âm Thanh: Nvidia Fugatto
Fugatto (viết tắt của Foundational Generative Audio Transformer Opus 1) được thiết kế để đáp ứng các nhu cầu sáng tạo đa dạng trong phim, trò chơi và sản xuất âm nhạc. Nó cho phép người dùng nhập cả văn bản và đầu vào âm thanh, tạo ra mọi thứ từ những giai điệu ngắn đến những cảnh quan âm thanh phức tạp. Mô hình này có 2,5 tỷ tham số và đã được huấn luyện sử dụng hàng triệu mẫu âm thanh từ các thể loại đa dạng.
Nvidia Fugatto: Khả Năng Tạo Âm Thanh Độc Đáo
Một trong những tính năng nổi bật của Nvidia Fugatto là khả năng tạo ra những âm thanh "chưa từng nghe". Ví dụ, nó có thể tạo ra tiếng saxophone gầm như chó hoặc tiếng kèn trumpet kêu meo meo. Khả năng này xuất phát từ một kỹ thuật gọi là ComposableART, cho phép mô hình kết hợp các hướng dẫn mà nó đã học trong quá trình huấn luyện. Điều này có nghĩa là người dùng có thể mô tả các sự kết hợp âm thanh phức tạp—như những nhịp đập bass sâu kết hợp với những tiếng kêu cao—và Fugatto sẽ tạo ra chúng một cách mượt mà.
Nvidia Fugatto: Tăng Cường Âm Thanh Hiện Có
Bên cạnh việc tạo ra những âm thanh mới, Nvidia Fugatto còn xuất sắc trong việc sửa đổi các bản nhạc hiện có. Người dùng có thể thêm hoặc loại bỏ các nhạc cụ khỏi bài hát, tách riêng giọng hát, hoặc thậm chí thay đổi giọng điệu và cách phát âm của một giọng nói. Sự linh hoạt này cho phép các kỹ sư âm thanh và nhạc sĩ thử nghiệm với các bản phối của họ mà không cần kỹ năng chỉnh sửa chuyên sâu hoặc nguồn lực.
Nvidia Fugatto: Ứng Dụng Thực Tế cho Người Sáng Tạo
Fugatto hứa hẹn sẽ là một cuộc cách mạng trong nhiều ngành công nghiệp:
- Sản Xuất Nhạc: Nhạc sĩ có thể nhanh chóng tạo ra các ý tưởng trong nhiều phong cách và cách phối khác nhau.
- Phim và Quảng Cáo: Khả năng thích ứng âm nhạc một cách động của công cụ này khiến nó lý tưởng cho việc làm nhạc phim hoặc tạo ra các bản nhạc nền tùy chỉnh cho quảng cáo.
- Trò Chơi: Nhà phát triển trò chơi có thể sử dụng Nvidia Fugatto để tạo ra những cảnh quan âm thanh sống động thay đổi theo gameplay.
Rafael Valle, quản lý nghiên cứu âm thanh ứng dụng tại Nvidia, nhấn mạnh mục tiêu của mô hình: "Chúng tôi muốn tạo ra một mô hình hiểu và tạo ra âm thanh giống như con người." Sự hiểu biết giống con người này cho phép tương tác trực quan hơn với phần mềm.
Thách Thức và Xem Xét của Công Cụ Tạo Âm Thanh AI
Trong khi Nvidia Fugatto mang lại nhiều cơ hội thú vị, nó cũng đặt ra những câu hỏi về tương lai của công việc thiết kế âm thanh. Khi các công cụ AI như vậy trở nên phổ biến hơn, các vai trò truyền thống như nghệ sĩ Foley có thể đối mặt với những thách thức. Tuy nhiên, Nvidia cho rằng Fugatto có thể hoạt động như một trợ lý thay vì thay thế, giúp các chuyên gia nâng cao sự sáng tạo của họ thay vì giảm bớt.
Ngoài ra, những lo ngại về vấn đề bản quyền liên quan đến nội dung do AI tạo ra đang tăng lên. Với nhiều công ty đối mặt với các thách thức pháp lý về việc sử dụng nội dung có bản quyền trong các tập dữ liệu huấn luyện, ngành công nghiệp phải cẩn thận điều hướng những phức tạp này.
Nvidia Fugatto đại diện cho một bước tiến lớn trong công nghệ tạo âm thanh AI. Bằng cách kết hợp khả năng sáng tạo với sức mạnh kỹ thuật, công cụ mới của Nvidia mời gọi các nghệ sĩ và nhà sản xuất cùng khám phá những vùng đất âm thanh chưa từng được khám phá.
Để biết thêm thông tin về các phát triển AI mới nhất và các công cụ như Fugatto, hãy truy cập AIPURE để có thông tin toàn diện về các đổi mới trí tuệ nhân tạo.