Musiikkiteollisuus on viime aikoina kokenut merkittävän murroksen tekoälyllä luodun musiikin myötä. Vuonna 2023 koettu ”Heart on My Sleeve” -niminen kappale, joka oli vakuuttava väärennös Draken ja The Weekndin duetosta, keräsi miljoonia striimejä ennen kuin kukaan ehti selvittää sen alkuperää. Tämä tapaus ei ainoastaan levinnyt viraaliksi, vaan se myös rikkoi illuusion siitä, että musiikkimaailmassa olisi joku täydellisesti ohjaksissa. Teollisuus on nyt siinä tilanteessa, ettei tekoälymusiikin vyöryä voida enää täysin pysäyttää, ja siksi sen onkin löydettävä uusia tapoja hyödyntää tilannetta ja tehdä siitä rahaa. Tämä lähestymistapa on johtanut siihen, että alalle on kehittymässä uudenlaista infrastruktuuria, jonka tarkoituksena ei ole estää generatiivista musiikkia kokonaan, vaan tehdä siitä jäljitettävää ja hallittavaa.
Tekoälymusiikin leviämisen myötä havaitsemisjärjestelmiä on alettu upottaa koko musiikkialan toimitusketjuun. Näitä järjestelmiä integroidaan malleja kouluttaviin työkaluihin, alustoille, joille kappaleita ladataan, oikeuksia lisensoiviin tietokantoihin ja löytämistä ohjaaviin algoritmeihin. Tavoitteena ei ole ainoastaan tunnistaa synteettistä sisältöä jälkikäteen, vaan tunnistaa se jo varhaisessa vaiheessa, merkitä se metatiedoilla ja hallita sen liikkumista järjestelmän läpi. Matt Adell, Musical AI:n toinen perustaja, korostaa, että ilman tällaista infrastruktuuria alan toimijat ajavat vain takaa omaa häntäänsä. Hän toteaa, että ei voida jatkuvasti reagoida jokaiseen uuteen kappaleeseen tai malliin, sillä se ei ole skaalautuvaa. Tarvitaan infrastruktuuria, joka toimii koulutuksesta jakeluun asti. Tämä uusi lähestymistapa pyrkii siis ennakoimaan ja hallitsemaan tekoälymusiikin virtaa sen sijaan, että se yrittäisi pysäyttää sitä kokonaan, mikä on osoittautunut mahdottomaksi tehtäväksi.
Tavoitteena lisensointi ja hallinta, ei poistaminen
Startup-yritykset ovat alkaneet kehittää havaitsemistyökaluja lisensointiprosesseihin integroitavaksi. Esimerkiksi YouTube ja Deezer ovat jo kehittäneet sisäisiä järjestelmiä, jotka merkitsevät synteettisen äänen latauksen yhteydessä ja vaikuttavat siihen, miten se näkyy hauissa ja suosituksissa. Myös muut musiikkiyhtiöt, kuten Audible Magic, Pex, Rightsify ja SoundCloud, laajentavat havaitsemis-, moderointi- ja attribuutio-ominaisuuksiaan aina koulutusaineistoista jakeluun asti. Tämä kehitys osoittaa, että tekoälyllä luodun sisällön havaitsemista ei enää nähdä pelkkänä valvontavälineenä, vaan välttämättömänä infrastruktuurina synteettisen median jäljittämiseen ja hallintaan. Tavoitteena on siirtyä reaktiivisesta toiminnasta proaktiiviseen, jotta tekoälymusiikki saadaan osaksi laillista ja hallittua ekosysteemiä.
Sen sijaan, että tekoälymusiikkia havaittaisiin vasta sen levittyä, jotkin yritykset rakentavat työkaluja sen merkitsemiseksi heti sen syntyhetkellä. Esimerkiksi Vermillio ja Musical AI kehittävät järjestelmiä, jotka skannaavat valmiita kappaleita synteettisten elementtien varalta ja merkitsevät ne automaattisesti metatietoihin. Vermillion TraceID-järjestelmä menee vielä syvemmälle jakamalla kappaleet osiin, kuten lauluääneen, melodisiin fraaseihin ja sanoitusten kuvioihin, ja merkitsemällä tietyt tekoälyllä luodut segmentit. Tämä mahdollistaa oikeuksien haltijoille jäljittelyn havaitsemisen jopa stem-tasolla, vaikka uusi kappale lainaisi vain osia alkuperäisestä. Yhtiön mukaan sen painopiste ei ole poistoissa, vaan ennakoivassa lisensoinnissa ja autentikoidussa julkaisussa.
TraceID:n kaltaisten työkalujen ennustetaan kasvattavan autentikoidun lisensoinnin arvon 75 miljoonasta dollarista vuonna 2023 jopa 10 miljardiin dollariin vuoteen 2025 mennessä. Tämä tarkoittaa, että oikeuksien haltija tai alusta voi ajaa valmiin kappaleen TraceID:n läpi nähdäkseen, sisältääkö se suojattuja elementtejä, ja jos sisältää, järjestelmä voi merkitä sen lisensoitavaksi ennen julkaisua. Tämänkaltaiset innovaatiot muuttavat perusteellisesti tapaa, jolla musiikkia hallinnoidaan ja hyödynnetään digitaalisessa ympäristössä.
Yhä varhaisempi tunnistus ja Eeettiset kysymykset
Jotkin yritykset menevät vieläkin pidemmälle, puuttuen asiaan jo koulutusaineiston tasolla. Analysoimalla, mitä malliin syötetään, niiden tavoitteena on arvioida, kuinka paljon generoitu kappale lainaa tietyiltä artisteiltä tai kappaleista. Tällainen attribuutio voisi mahdollistaa tarkemman lisensoinnin, jossa rojaltit perustuisivat luovaan vaikutukseen sen sijaan, että ne ratkaistaan julkaisun jälkeisillä kiistoilla. Tämä ajatus heijastaa vanhoja keskusteluja musiikillisesta vaikutuksesta, kuten ”Blurred Lines” -oikeusjuttu, mutta soveltaa niitä algoritmisesti luotuun musiikkiin. Ero on siinä, että nyt lisensointi voi tapahtua ennen julkaisua, ei vasta jälkikäteen oikeudenkäyntien kautta. Musical AI kehittää myös omaa havaitsemisjärjestelmäänsä, joka on kerrostettu vastaanottoon, generointiin ja jakeluun. Sen sijaan, että se suodattaisi tuotoksia, se jäljittää alkuperän päästä päähän. Musical AI:n toinen perustaja Sean Power toteaa, että attribuution ei pitäisi alkaa vasta, kun kappale on valmis, vaan sen pitäisi alkaa, kun malli alkaa oppia. Tavoitteena on siis kvantifioida luovaa vaikutusta, ei vain havaita kopioita.
Deezer on kehittänyt sisäisiä työkaluja, jotka merkitsevät täysin tekoälyllä luodut kappaleet latauksen yhteydessä ja vähentävät niiden näkyvyyttä sekä algoritmisissa että toimituksellisissa suosituksissa, erityisesti jos sisältö vaikuttaa roskapostilta. Deezerin innovaatiojohtaja Aurélien Hérault kertoo, että huhtikuussa nämä työkalut havaitsivat noin 20 prosenttia uusista päivittäisistä latauksista täysin tekoälyllä luoduiksi – mikä on yli kaksinkertainen määrä tammikuuhun verrattuna. Järjestelmän tunnistamat kappaleet pysyvät saatavilla alustalla, mutta niitä ei mainosteta. Héraultin mukaan Deezer aikoo alkaa merkitä nämä kappaleet käyttäjille suoraan ”muutaman viikon tai kuukauden kuluessa”. Hérault painottaa, etteivät he ole lainkaan tekoälyä vastaan, mutta suuri osa tästä sisällöstä käytetään vilpillisesti, ei luomiseen, vaan alustan hyväksikäyttöön. Siksi asiaan kiinnitetään niin paljon huomiota.
Spawning AI:n DNTP (Do Not Train Protocol) työntää havaitsemista vieläkin aikaisemmaksi – data-aineiston tasolle. Opt-out-protokolla antaa artisteille ja oikeuksien haltijoille mahdollisuuden merkitä työnsä harjoitusmallien ulkopuolelle. Vaikka kuvataiteilijoilla on jo käytössään vastaavia työkaluja, äänimaailma on edelleen jäljessä. Toistaiseksi ei ole saavutettu yksimielisyyttä siitä, miten suostumus, avoimuus tai lisensointi voitaisiin standardoida laajamittaisesti. Sääntely saattaa lopulta pakottaa asian, mutta toistaiseksi lähestymistapa on hajanainen. Tuen saaminen suurilta tekoälykoulutusyrityksiltä on myös ollut epäjohdonmukaista, ja kriitikot sanovat, että protokolla ei saa vetoa, ellei sitä hallinnoida itsenäisesti ja oteta laajalti käyttöön. Dryhurst toteaa, että opt-out-protokollan on oltava voittoa tavoittelematon, ja useiden eri toimijoiden valvoma, jotta siihen voidaan luottaa. Kukaan ei saisi luottaa suostumuksen tulevaisuutta epäselvään keskitettyyn yritykseen, joka voisi mennä konkurssiin – tai mikä pahempaa.
Musiikin tulevaisuus tekoälyn aikakaudella
Musiikkiteollisuus seisoo nyt merkittävän murroksen edessä, jossa tekoäly haastaa perinteisiä toimintamalleja ja luo samalla uusia mahdollisuuksia. Tunnistusteknologioiden kehitys ja lisensointikäytäntöjen uudelleenmäärittely ovat avainasemassa, kun pyritään luomaan kestävämpiä ja oikeudenmukaisempia toimintaympäristöjä. Vaikka haasteita riittää, kuten standardointi ja eettiset kysymykset, alan toimijoiden yhteistyö ja avoimuus voivat johtaa ratkaisuihin, jotka hyödyttävät sekä luojia että kuluttajia.
