Nvidia ile çalışan dünyanın dört bir yanından bir araştırmacı ekibi, ses için adeta bir İsviçre çakısı olarak tanımlanan bir şey geliştirdiler. Bu yapay zeka modeli, herhangi bir ses dosyası veya metin istemi kombinasyonunu kullanarak hemen hemen her türlü müzik karışımını üretebiliyor veya dönüştürebiliyor.
Yeni model, Foundational Generative Audio Transformer Opus 1'in kısaltması olan Fugatto olarak biliniyor . Nvidia'ya göre, yetenekleri benzersiz. Örneğin, Fugatto yalnızca metne dayalı bir melodi yaratabilir, bir şarkıcının sesindeki duyguyu değiştirebilir veya aksanını düzenleyebilir ve hatta mevcut bir şarkıya enstrüman ekleyebilir veya çıkarabilir.
Fugatto, müzik yaratma sürecinde devrim yaratabilir. Bununla birlikte, bir yapımcı, özel ses stilleri ve enstrümanlarla tamamlanmış yeni bir şarkı için bir fikri hızla prototipleyebilir veya mevcut bir parçadaki efektleri ayarlayabilir.
Çok platinli yapımcı ve söz yazarı Ido Zmishlany, yapay zekanın ve Fugatto gibi araçların müziğin bir sonraki bölümünü yazmaya yardımcı olacağına inanıyor. Bununla birlikte, model müzik prodüksiyonuyla sınırlı değil.
Nvidia, bir reklam ajansının farklı bölgelere, durumlara veya dillere uyum sağlamak için bir kampanyadaki seslendirmeleri değiştirmek için kullanması gibi birkaç alternatif kullanım örneğini vurguladı. Model ayrıca bir kullanıcının konuşmacının sesini, bir arkadaş veya aile üyesi gibi duyurmak gibi özelleştirmesine izin vererek dil öğrenme araçlarını geliştirmeye yardımcı olabilir.
Video oyunu geliştiricileri, bu aracı kullanarak oyuncu girdilerine göre anında yeni varlıklar yaratabilir veya önceden kaydedilmiş varlıkları, belirli bir zamanda ekrandaki eylem düzeyine en iyi şekilde uyacak şekilde değiştirebilirler.
Projede görev alan araştırmacılardan Rafael Valle, insanların seslerini anlayıp üretebilen bir model oluşturmak istediklerini söyledi.
Fugatto'nun 2,5 milyar parametre kullanan tam sürümünün oluşturulması için bir yıldan fazla çalışma yapıldı. Nvidia, modun 32 Nvidia H100 Tensor Core GPU'su tarafından desteklenen bir grup DGX sisteminde eğitildiğini söyledi. Ne yazık ki, Fugatto'nun halka ne zaman sunulabileceğine dair bir zaman çizelgesi paylaşılmadı.
Kaynak :
https://www.techspot.com/news/105727-nv ... audio.html