Stability AI lansează un generator open source de text-în-audio antrenat pe biblioteci de muzică gratuită pentru a “respecta drepturile creatorilor”

Autorul articolului: Mihai Preda |
Data actualizării: | Data publicării:
| Categorie: Homepage
Foto: Pexels
Foto: Pexels

Stability AI, compania din spatele generatorului de imagini AI, Stable Diffusion, a lansat Stable Audio Open, un model open source pentru generarea de mostre audio scurte, efecte sonore și elemente de producție utilizând comenzi text.

Noul model a fost antrenat folosind date audio din biblioteci de muzică gratuită precum Freesound și Free Music Archive. „Acest lucru ne-a permis să creăm un model audio deschis respectând în același timp drepturile creatorilor”, a declarat Stability AI. Compania adaugă că pregătirea specializată a modelului Stable Audio Open îl face ideal pentru crearea de ritmuri de tobe, riff-uri de instrumente, sunete ambientale, înregistrări foley și alte mostre audio pentru producția muzicală și designul sonor, scrie Music Tech.

Utilizatorii pot genera până la 47 de secunde de date audio introducând descrieri text precum „arpegii calde pe un sintetizator analogic cu un filtru în creștere graduală și o coadă de reverb” și „beat rock jucat într-un studio tratat, tobe de sesiune pe un kit acustic”.

Un avantaj cheie al lansării open source este că utilizatorii pot ajusta fin modelul pe date audio personalizate. De exemplu, un baterist ar putea să își ajusteze modelul pe mostre din propriile înregistrări de tobe pentru a genera noi ritmuri.

Cu toate acestea, deși Stable Audio Open poate genera clipuri muzicale scurte, nu este optimizat pentru piese complete, melodii sau voci, spre deosebire de serviciul principal al companiei, Stable Audio. Acesta din urmă poate produce piese cu structură muzicală coerentă de până la trei minute și oferă capacități avansate precum generarea audio-în-audio și compoziții muzicale multi-parte coerente.

Potrivit Stability AI, modelul open source „oferă o privire asupra AI generativă pentru designul sonor, prioritizând în același timp dezvoltarea responsabilă alături de comunitățile creative.”

Noua direcție a companiei privind „generarea responsabilă de audio” urmează plecarea de profil înalt a vicepreședintelui său pentru audio generativ, Ed Newton-Rex, în noiembrie anul trecut, care a demisionat din cauza dezacordurilor cu firma în ceea ce privește ce constituie „utilizarea echitabilă” a lucrărilor protejate de drepturi de autor.

Fostul executiv a declarat că nu este de acord „cu opinia companiei că antrenarea modelelor AI generative pe lucrări protejate de drepturi de autor este corectă.” Newton-Rex a spus, de asemenea, pentru BBC că a considerat „exploatativ” ca dezvoltatorii să folosească lucrări creative fără consimțământ – o poziție pe care a susținut că multe firme AI, inclusiv Stability AI, ar fi în dezacord.

Articole similare



Cele mai noi articole



Trend - Top citite


DC Media Group Audience


pixel