Przełomowy model AI od Nvidii do generowania dźwięku

Opublikowano10 Months temu przez SmartfonStudio 148

Fugatto: Rewolucja w generowaniu muzyki i dźwięków od Nvidii

27 listopada 2024

Technologia Fugatto (Foundational Generative Audio Transformer Opus 1), opracowana przez Nvidię, zmienia sposób, w jaki tworzymy i edytujemy dźwięk. Ten przełomowy model AI pozwala na generowanie muzyki, głosów i unikalnych dźwięków, opierając się na tekstowych i audio podpowiedziach. Dzięki swojej wszechstronności Fugatto otwiera nowe możliwości dla muzyków, producentów gier wideo i wielu innych branż.

Co potrafi Fugatto?

Fugatto potrafi generować muzykę na podstawie tekstowych podpowiedzi, zmieniać emocje lub akcent w głosie oraz dodawać lub usuwać instrumenty z istniejącego utworu. Jego zaawansowana technika ComposableART pozwala na łączenie instrukcji, które wcześniej były trenowane osobno. Przykładem może być stworzenie dźwięku śpiewanego ze smutkiem w określonym akcencie.

Gdzie można wykorzystać Fugatto?

Model Fugatto ma szerokie zastosowanie w różnych branżach:

Produkcja muzyczna: Fugatto pozwala na szybkie prototypowanie utworów muzycznych, eksperymentowanie z różnymi stylami i poprawianie jakości dźwięku.
Gry wideo: Twórcy gier mogą generować unikalne dźwięki, dopasowane do dynamicznej akcji w grach.
Film i media: Model może służyć do tworzenia efektów dźwiękowych i ulepszania ścieżek audio.

Jak powstał Fugatto?

Fugatto opiera się na wcześniejszych osiągnięciach Nvidii w modelowaniu mowy i kodowaniu dźwięku. Pełna wersja modelu wykorzystuje 2,5 miliarda parametrów i była trenowana na superkomputerze NVIDIA DGX, wyposażonym w 32 procesory graficzne H100 Tensor Core. Model został stworzony przez międzynarodowy zespół, co pozwoliło na wsparcie wielu akcentów i języków.

Czy Fugatto trafi do publicznego użytku?

Pomimo ogromnego potencjału Fugatto, Nvidia wciąż zastanawia się nad jego publicznym udostępnieniem. Jak powiedział Bryan Catanzaro, wiceprezes ds. badań nad uczeniem głębokim w Nvidii, każda technologia generatywna niesie ryzyko niewłaściwego użycia. Dlatego firma podchodzi do tego z ostrożnością, badając możliwości odpowiedzialnego wdrożenia.

Śledź nas na:

Tag: generatywna AI, Fugatto, Nvidia, muzyka AI, transformacja dźwięku, technologie audio, model AI Fugatto, ComposableART, AI w grach, produkcja muzyki

Poprzedni blog Następny blog

Artykuły powiązane