Stability AI lansează un generator open source de text-în-audio antrenat pe biblioteci de muzică gratuită pentru a “respecta drepturile creatorilor”

Autorul articolului: Mihai Preda |

Data actualizării: 10.06.2024 16:32 | Data publicării: 10.06.2024 20:31

| Categorie: Homepage

Foto: Pexels

Stability AI, compania din spatele generatorului de imagini AI, Stable Diffusion, a lansat Stable Audio Open, un model open source pentru generarea de mostre audio scurte, efecte sonore și elemente de producție utilizând comenzi text.

Noul model a fost antrenat folosind date audio din biblioteci de muzică gratuită precum Freesound și Free Music Archive. „Acest lucru ne-a permis să creăm un model audio deschis respectând în același timp drepturile creatorilor”, a declarat Stability AI. Compania adaugă că pregătirea specializată a modelului Stable Audio Open îl face ideal pentru crearea de ritmuri de tobe, riff-uri de instrumente, sunete ambientale, înregistrări foley și alte mostre audio pentru producția muzicală și designul sonor, scrie Music Tech.

Utilizatorii pot genera până la 47 de secunde de date audio introducând descrieri text precum „arpegii calde pe un sintetizator analogic cu un filtru în creștere graduală și o coadă de reverb” și „beat rock jucat într-un studio tratat, tobe de sesiune pe un kit acustic”.

Un avantaj cheie al lansării open source este că utilizatorii pot ajusta fin modelul pe date audio personalizate. De exemplu, un baterist ar putea să își ajusteze modelul pe mostre din propriile înregistrări de tobe pentru a genera noi ritmuri.

Cu toate acestea, deși Stable Audio Open poate genera clipuri muzicale scurte, nu este optimizat pentru piese complete, melodii sau voci, spre deosebire de serviciul principal al companiei, Stable Audio. Acesta din urmă poate produce piese cu structură muzicală coerentă de până la trei minute și oferă capacități avansate precum generarea audio-în-audio și compoziții muzicale multi-parte coerente.

Potrivit Stability AI, modelul open source „oferă o privire asupra AI generativă pentru designul sonor, prioritizând în același timp dezvoltarea responsabilă alături de comunitățile creative.”

Noua direcție a companiei privind „generarea responsabilă de audio” urmează plecarea de profil înalt a vicepreședintelui său pentru audio generativ, Ed Newton-Rex, în noiembrie anul trecut, care a demisionat din cauza dezacordurilor cu firma în ceea ce privește ce constituie „utilizarea echitabilă” a lucrărilor protejate de drepturi de autor.

Fostul executiv a declarat că nu este de acord „cu opinia companiei că antrenarea modelelor AI generative pe lucrări protejate de drepturi de autor este corectă.” Newton-Rex a spus, de asemenea, pentru BBC că a considerat „exploatativ” ca dezvoltatorii să folosească lucrări creative fără consimțământ – o poziție pe care a susținut că multe firme AI, inclusiv Stability AI, ar fi în dezacord.

Articole similare

Săptămâna Modei masculine de la Paris va fi deschisă de casa Louis Vuitton cu o defilare la Muzeul Luvru / Photo by Red-heart Li

Știri

Social

Lifestyle

Politică

Economie

Sport

Stability AI lansează un generator open source de text-în-audio antrenat pe biblioteci de muzică gratuită pentru a “respecta drepturile creatorilor”

Săptămâna Modei masculine de la Paris va fi deschisă de casa Louis Vuitton cu o de...

Un nou proces în lupta prinţului Harry împotriva tabloidelor britanice

Secretele copilăriei Melaniei Trump. Orașul care a transformat-o în Prima Doamnă a...

„Cine e tipul ăsta?” – Robbie Williams, despre momentul când Taylor Swift nu știa ...

Bruce Dickinson, solistul trupei Iron Maiden, şi-a arătat talentul de scrimer la u...

Nicki Minaj, acuzată de agresiune de fostul manager: Detalii șocante din proces