Przełomowy model AI od Nvidii do generowania dźwięku
Fugatto: Rewolucja w generowaniu muzyki i dźwięków od Nvidii
27 listopada 2024
Technologia Fugatto (Foundational Generative Audio Transformer Opus 1), opracowana przez Nvidię, zmienia sposób, w jaki tworzymy i edytujemy dźwięk. Ten przełomowy model AI pozwala na generowanie muzyki, głosów i unikalnych dźwięków, opierając się na tekstowych i audio podpowiedziach. Dzięki swojej wszechstronności Fugatto otwiera nowe możliwości dla muzyków, producentów gier wideo i wielu innych branż.

Co potrafi Fugatto?
Fugatto potrafi generować muzykę na podstawie tekstowych podpowiedzi, zmieniać emocje lub akcent w głosie oraz dodawać lub usuwać instrumenty z istniejącego utworu. Jego zaawansowana technika ComposableART pozwala na łączenie instrukcji, które wcześniej były trenowane osobno. Przykładem może być stworzenie dźwięku śpiewanego ze smutkiem w określonym akcencie.
Gdzie można wykorzystać Fugatto?
Model Fugatto ma szerokie zastosowanie w różnych branżach:
- Produkcja muzyczna: Fugatto pozwala na szybkie prototypowanie utworów muzycznych, eksperymentowanie z różnymi stylami i poprawianie jakości dźwięku.
- Gry wideo: Twórcy gier mogą generować unikalne dźwięki, dopasowane do dynamicznej akcji w grach.
- Film i media: Model może służyć do tworzenia efektów dźwiękowych i ulepszania ścieżek audio.
Jak powstał Fugatto?
Fugatto opiera się na wcześniejszych osiągnięciach Nvidii w modelowaniu mowy i kodowaniu dźwięku. Pełna wersja modelu wykorzystuje 2,5 miliarda parametrów i była trenowana na superkomputerze NVIDIA DGX, wyposażonym w 32 procesory graficzne H100 Tensor Core. Model został stworzony przez międzynarodowy zespół, co pozwoliło na wsparcie wielu akcentów i języków.
Czy Fugatto trafi do publicznego użytku?
Pomimo ogromnego potencjału Fugatto, Nvidia wciąż zastanawia się nad jego publicznym udostępnieniem. Jak powiedział Bryan Catanzaro, wiceprezes ds. badań nad uczeniem głębokim w Nvidii, każda technologia generatywna niesie ryzyko niewłaściwego użycia. Dlatego firma podchodzi do tego z ostrożnością, badając możliwości odpowiedzialnego wdrożenia.