Luovuuden ylistys ja muutama tekijänoikeusknoppi tekoälyhuumaan
Olin menossa asiakasyritykseen pitämään tekijänoikeuskoulutusta ja laadin esitysmateriaalia. Mitään IPR-juridiikkaa ei näinä päivinä voi käsitellä sanomatta jotakin tekoälystä, joten sisällytin koulutukseen myös perustietoutta tekijänoikeuden ja tekoälyn suhteesta. Tässä tekoälyn huumassa, jossa jokaista ammattikuntaa kannustetaan käyttämään tekoälysovelluksia, yritin puhua tekoälystä positiivisin sanakääntein. Pohdiskelin käyttäväni mantroja siitä, että ”tekoäly on välttämätön osa nykyaikaista liiketoimintaa. Tekoäly ei korvaa kaikkia työntekijöitä, mutta se korvaa ne, jotka eivät tekoälyä käytä”, sillä oletin, että niitä haluttiin kuulla, enkä halunnut vaikuttaa kaavoihini kangistuneelta – ehkä jopa riskejä huonosti sietävältä pessimistiltä – juristilta.
En kuitenkaan voinut estää itseäni eksymästä tekoälyn haasteisiin koulutusta valmistellessani; kysymykseen siitä, voiko tekoälyä kouluttaa materiaalilla, johon tekijällä on tekijänoikeuden suojaama yksinoikeus. Kysymykseen siitä, voiko tekoälyä käyttämällä luoda tekijänoikeudella suojattua materiaalia, jos ihan tosissaan ja luovuutta käyttäen kirjoittaa tekstikomentoja (prompteja). Kysymykseen siitä, mitä sijaa ihmisen luovuudelle on tekoälyn aikakautena. Päätin pureutua niihin tässä blogissa.
Tekoälyn kouluttaminen tekijänoikeudella suojatulla materiaalilla
Tekijänoikeudessa keskeistä on se, milloin tapahtuu tekijän yksinoikeuteen kuuluvaa kappaleen valmistamista tai yleisön saataville saattamista. Vaikuttaisi siltä, että tekoälyn kouluttamisessa tapahtuu kappaleen valmistamista useampaan kertaan: ensin aineiston keräämisessä ja järjestelyssä prosessia varten ja sitten itse koulutusprosessissa useampaan kertaan (niin pretraining kuin fine tuning -vaiheissa). Lähtökohtaisesti tämä kappaleen valmistaminen edellyttää tekijänoikeuden haltijan (siis alkuperäisen tekijän tai sen, jolle tekijä on oikeutensa luovuttanut) lupaa.
Tällaisia lupia ei ole GenAI-kehityksen tuoksinassa juuri kyselty, vaan esimerkiksi ChatGPT:lle on annettu alun perin aineistoksi käytännössä kaikki internetissä oleva tieto. Kansainvälisesti tekoäly-yrityksiä vastaan on nostettu jo lukuisia kanteita: esimerkiksi yhdysvaltalaislehti The New York Times haastoi OpenAI:n ja Microsoftin oikeuteen tekijänoikeusrikkomuksista, sillä ne olivat kanteen mukaan käyttäneet miljoonia sanomalehden julkaisuja kouluttaakseen tekoälyjärjestelmiään. Puolustuksenaan tekoälytoimijat kertoivat käyttäneensä tekijänoikeudella suojattua materiaalia kohtuullisen käytön periaatteen (fair use) nojalla.
Tekstin- ja tiedonlouhinta tekijänoikeussääntelyssä
Yhdysvaltalaisesta fair use -doktriinista ei ole Euroopassa suurta hyötyä, joten on syytä tarkastella, miten tekijänoikeuden ja tekoälyn suhdetta on käsitelty EU-lainsäädännössä. Tekijänoikeusdirektiiviin (DSM-direktiiviin) perustuvat, viime vuonna voimaantulleet tekijänoikeuslain muutokset mahdollistavat teoksen käyttämisen tekstin- ja tiedonlouhintaa varten, jollei tekijä ole nimenomaisesti ja asianmukaisella tavalla pidättänyt tätä oikeutta. Kyse on tekijänoikeuden lakisääteisestä rajoituksesta: sen sijaan, että pitäisi kysyä ennakollinen lupa tekijänoikeuden haltijalta teoksen käyttöön, tulee tarkistaa, onko tekijä ”nimenomaisesti ja asianmukaisella tavalla pidättänyt oikeuden.” Jos on, niin tällöin teosta ei saa käyttää tekstin- tai tiedonlouhintaan.
Ensimmäiseksi on pohdittava sitä, mitä ylipäänsä on ”tekstin- ja tiedonlouhinta”. DSM-direktiivin mukaan tekstin- ja tiedonlouhinnalla tarkoitetaan ”automaattista analyysitekniikkaa, jonka tarkoituksena on analysoida digitaalisessa muodossa olevaa tekstiä ja dataa tietojen tuottamiseksi. Tiedot voivat olla esimerkiksi malleja, suuntauksia tai korrelaatioita.” Kaikessa tekstin- ja tiedonlouhinnassa edellytyksenä on, että teokseen on laillinen pääsy. Laillisella pääsyllä tarkoitetaan sitä, että teos tai muu suojattu aineisto on saatavilla oikeudenhaltijan luvalla tai vapaasti internetissä ilman, että pääsyä siihen on rajoitettu.
Se, soveltuvatko tekstin- ja tiedonlouhintaa koskevat säännökset koneoppimiseen tai tekoälyyn, on oikeudellisesti epäselvää. DSM-direktiivissä tai tekijänoikeuslaissa ei oteta tähän kantaa, sillä GenAI:n todellinen läpimurto tapahtui vasta niiden säätämisen jälkeen. Jos painotetaan edellä todetun määritelmän termiä ”analyysitekniikka”, ei tekoäly näyttäisi mahtuvan tekstin- ja tiedonlouhinnan määritelmän piiriin, sillä analyysin lisäksi tekoäly usein myös tuottaa sisältöä. Tekijänoikeuden rajoituksia on perinteisesti tulkittu suppeasti.
Eräässä artikkelissa pureuduttiin tähän hieman pintaa syvemmin. Artikkelin ydinajatus on, että tekstin- ja tiedonlouhinta koskee vain teosten semanttisen informaation hyödyntämistä, kun taas tekoälyn kouluttamisessa hyödynnetään myös teosten syntaktista informaatiota. Tekstin- ja tiedonlouhinnassakin toki valmistetaan teoskappaleita, mutta sen lopputuotteessa on vain teoksista saatua tietoa, eikä tekijänoikeuden suojaama teoksen muoto välity siihen asti. Tekoälyn kouluttamisessa sen sijaan lopputuotteita varten tallentuu muistiin myös syntaktista informaatiota eli tekijänoikeuden suojaamaa teoksen muotoa. Sanojen yhteydet toisiinsa siis eivät kirjoittajien mukaan ole vain kielen ominaisuus, vaan myös tekijöiden luovuuden tuote. Niin sanottu vektorimuoto ei tallenna vain tietoa, vaan nimenomaan teosta. Tästä kirjoittajat päättelevät, että tekstin- ja tiedonlouhintaa koskeva poikkeus (tekijänoikeuden rajoitus) ei sovellu lainkaan tekoälyyn, vaan tulee soveltaa kappaleen valmistamista koskevaa pääsääntöä. Näin ollen tekijänoikeudella suojatun materiaalin käyttö tekoälyn kouluttamiseksi edellyttäisi tekijänoikeuden haltijan lupaa.
Oikeuden pidättäminen
Erikseen on pohdittava sitä, millä tavalla oikeus tekstin- ja tiedonlouhintaan voidaan pidättää. Monet sisältöyhtiöt ovat katsoneet, että ”oikeuden pidättämiseksi” riittää maininta sivuston käyttöehdoissa. Saksalaisessa oikeustapauksessa käsitellään teemaa parhaillaan, ja vaikuttaa siltä, että pelkkä yleinen ”kaikki oikeudet pidätetty” maininta ei ole riittävä, vaan ehdoilta edellytettäisiin erityistä viittausta tekstin- ja tiedonlouhinnassa käytettyihin mekanismeihin.
Tekoälysäädös
Kesällä 2024 voimaantullut ja pääosin 2026 sovellettavaksi tuleva EU:n tekoälysäädös sisältää viittauksen DSM-direktiivin tekstin- ja tiedonlouhintaa koskeviin säännöksiin sekä edellyttää yleiskäyttöisten tekoälymallien tarjoajilta vahvempaa toimintapolitiikkaa oikeuksien pidättämisen tunnistamiseksi ja noudattamiseksi. Tekoälysäädös tekee selväksi sen, että tekijänoikeuksia tulee kunnioittaa, mutta se ei varsinaisesti selvennä sitä, soveltuvatko DSM-direktiivin tekstin- ja tiedonlouhintaa koskevat säännökset tekoälyyn. Koska aihe on tärkeä, mutta toistaiseksi epäselvä, siihen liittyvälle selkeyttävälle ohjeistukselle olisi tarvetta.
Tekijänoikeus tekoälyllä tuotettuun materiaaliin
Mitä taas tulee siihen, voidaanko tekoälyn avulla luoda tekijänoikeudella suojattua materiaalia, niin lähtökohtaisesti tekijänoikeussuojan saaminen edellyttää teoskynnyksen ylittymistä eli sitä, että teosta pidetään riittävän itsenäisenä ja omaperäisenä.
Meille ihmisille luovuus on itsearvo ja sen ajurina toimii usein jokin sisäisen motivaation lähde, kuten uteliaisuus. Tekoälyjärjestelmät ovat sen sijaan rakennettu optimoimaan jokin erityinen tehtävä, kuten tuottamaan ihmistä miellyttäviä kuvia sille syötetystä datasta. Tekoäly siis prosessoi jotakin, jota sille on syötetty, sen sijaan, että se loisi jotakin täysin uutta. Voi perustellusti väittää, että koneelta puuttuu luovuus. Tätä olennaisempaa on kuitenkin se, että voimassaolevan lainsäädännön mukaan tekijänoikeus voi syntyä vain luonnolliselle henkilölle – siis ihmiselle, ei koneelle.
On myös kyseenalaista, voiko tekoälysovelluksen käyttäjänä toimiva luonnollinen henkilö saada tekoälysovelluksen avulla luomaansa tuotokseen tekijänoikeussuojaa. Esimerkiksi Yhdysvaltain tekijänoikeustoimisto hylkäsi tekijänoikeusrekisteröinnin Jason M. Allenin Midjourney-tekoälypalvelun avulla luomaan teokseen ”Théâtre D’opéra Spatial”. Allen oli käyttänyt teoksen luomisessa 624 kehotetta, mutta nämä eivät tekijänoikeustoimiston näkemyksen mukaan riittäneet teossuojan syntymiseen koska kehotteiden tulkinnasta ja varsinaisesta toteutuksesta vastasi tekoälyohjelmisto – ei käyttäjä.
Luovuuden tulevaisuus
Vaikka tekoälyyn liittyy paljon juridista knoppologiaa, lopulta keskeisemmäksi kysymykseksi minulle jäi se, mitä me saamme (tai mitä jää jäljelle), jos ihmisen – kirjoittajan, valokuvaajan, taiteilijan, muusikon – työ korvautuu koneella tai ihmisellä, joka ohjaa konetta käskyttämällä.
Mitä enemmän selaan Instagramin kuvavirrassa AI-kuvia, sitä vakuuttuneemmaksi tulen, että tämä ei ole sisältöä, jota haluan kuluttaa. Mitä enemmän minulle tarjotaan palveluita, jotka lupaavat, että tekoäly voi kirjoittaa blogini ja tehdä juridiset analyysini, sitä enemmän haluan kirkastaa sitä, missä olen hyvä.
Minä haluan oppia uusia näkökulmia tarjoavista artikkeleista, inspiroitua kuvista, jotka ovat todellisesta matkakohteesta otettuja, kuunnella musiikkia, joka ei ole teknisesti täydellistä, tehdä muistiinpanoja paperikirjaan, herkistyä tunteita repivän leffakohtauksen parissa. Minä haluan tarjota asiakkailleni henkilökohtaisia kohtaamisia, näkökulmia, ajoittain jopa juridisesti luovaa tulkintaa.
Tekoäly voi kirittää, ehkä jopa herätellä, mutta se ei voi korvata sitä, mikä lopulta tekee sisällöstä tai elämästä ylipäänsä mielenkiintoisen. Kun puhutaan sisällöstä, niin sillä on luovuuden itseisarvon lisäksi myös kaupallinen arvo. Sen tietävät tekijänoikeuden haltijat, mutta tulevaisuuden kannalta on kriittistä, että myös me luovasta työstä nauttivat kuluttajat muistamme sen tehdessämme valintoja niin mediasivustojen maksumuureilla kuin yleisemmin ajankäyttömme suhteen.
Anna Paimela
Valtioneuvosto on nimittänyt Annan tekijänoikeusasioiden neuvottelukunnan jäseneksi kaudelle 2023-2027 ja tekijänoikeuden yhteishallinnoinnin kehittämisen neuvottelukunnan jäseneksi kaudelle 2024-2027. Neuvottelukunnat mm. seuraavat ja arvioivat tekijänoikeusalan toimintaympäristön kehitystä.
Comments