Tekijänoikeuksista tekoälyn aikakaudella

Vastuullinen tekoäly ry järjestää keskustelutilaisuuksia yhdistyksen säännöissä mainituista teemoista. Keskustelutilaisuuksien tavoitteena on jakaa tietoa, oppia ja saada uusia näkökulmia sekä verkostoitua. Kuten perustuslain perusoikeuksilla, ei teemoillakaan ole keskinäistä hierarkiaa, vaan kaikki ovat omalla tavallaan tärkeitä.

Maanantaina 3.11. keskustelunaiheena olivat tekijänoikeudet. Tilaisuuden alusti tekijänoikeusjuristi Tuomas Mattila (OTT, VTM, FM), jonka nykyinen tutkimustyö käsittelee suojattujen aineistojen käytön lisensiointia tekoälyn kouluttamiseksi. Pyysin Tuomaksen alustajaksi, kun olin kuunnellut hänen luentonsa HY+:n järjestämällä AI-sääntelyä kontekstissa -kurssilla.

Alustuksessaan Tuomas Mattila kävi ensin läpi mitä tekijänoikeuksilla tavoitellaan. Tekijänoikeudet edistävät luovaa työtä, tuovat teoksia ihmisten saataville ja suojaavat tekijän persoonaa. Käytännössä ne myöntävät ajallisesti rajattuja yksinoikeuksia luovan työn tuloksiin ja tällä perusteella tekijä voi hyötyä teoksestaan, jos sillä on kysyntää.

Generatiivinen tekoäly muuttaa asetelmaa monella tavalla, koska luovan työn tuloksia voidaan käyttää – ja on käytetty – tekoälyn kouluttamiseen. Voiko alkuperäinen tekijä suojautua tai jos ei, voiko hän saada teoksen koulutuskäytöstä hyötyä? Toisaalta tekoälysovelluksilla voidaan tuottaa teoksia, jotka muistuttavat ulkomuodoltaan luovan työn tuloksia. Saako tällainen teos tekijänoikeussuojaa? Kuka vastaa, jos se loukkaa muiden tekijän- tai muita oikeuksia? Kyseessä on monitahoinen intressiristiriita, jossa ovat osapuolina teoksen tekijä, tekoälyn tarjoaja ja käyttäjä sekä julkinen intressi.

Itselleni tärkeä huomio alustuksessa oli, että tekijänoikeudet ovat olemassa tekoälysääntelystä riippumatta, ja vielä niin, että tekoälysääntely ottaa toistaiseksi vain vähän kantaa tekijänoikeuksiin. 

Toinen huomio oli, että tekoälyn koulutukseen liittyy suuri joukko teknisiä tekijänoikeuskysymyksiä, joita maallikko ei tule ajatelleeksi. Esimerkiksi: käytetäänkö teoksen kappaletta silloin, kun sillä koulutettua tekoälyä käytetään? Tai saatetaanko teos yleisön saataville silloin, kun sillä koulutettu tekoäly annetaan yleisön käyttöön? Näihin, ja moniin muihin alustuksessa esiteltyihin kysymyksiin ei ole vielä yksityiskohtaisia vastauksia, sillä oikeuskäytäntö on maailmalla vasta muodostumassa.

Alustuksesta kävi ilmi, että tekoälyllä tehty luomus ei pääasiassa saa tekijänoikeussuojaa. Poikkeuksiakin on maailmalla ollut. Oikeustapauksissa arvioidaan ihmistyön määrää (mikä on promptien ja iteraatioiden laajuus). Aihetta liipaten, vuoden 2026 elokuussa generatiivisten tekoälymallien täytyy alkaa merkitä tekoälyllä tehty sisältö koneluettavassa muodossa. Käyttäjän ei itse tarvitse asiasta huolehtia kuin muutamissa erikoistapauksissa, kuten syväväärennöksiä eli deepfakeja tekoälyllä tehtäessä (ks. AI-asetuksen Artikla 50). Tilaisuuden osallistujat pohtivat, eikö tekoälymerkintää voisi epäeettisesti kiertää sillä, että jatkojalostaa työn itse eri alustalla ja merkitsee sen ihmisen tekemäksi. Tekoälyasetus ei ota tähän kantaa, mutta jokin muu sääntely voisi tulla kyseeseen.

Yksi yleisöstä nousseista ajatuksista koski kustannusten nousun vaikutusta tekoälyllä tuotettujen töiden markkinaan. Tällä hetkellä teknojätit tarjoavat mallejaan käyttöön tappiolla (ks. esim. OpenAI), koska ajattelevat suosion myöhemmin muuntuvan voitolliseksi myynniksi. On mahdollista, että datakeskusten energiankulutus alkaa nostaa sähkön hintaa  ja samalla datakeskusten kustannuksia. Tekoälyllä tehdyistä töistä voi tulla niin kalliita, että se vaikuttaa kiinnostukseen hankkia niitä, ja tätä kautta tekijänoikeudet voisivat saada arvostustaan takaisin. Skenaarioon on kuitenkin vaikeaa ottaa kantaa vielä, kun ei tiedetä, mikä tulee olemaan voittava toimintamalli AI-markkinoilla.

Joka tapauksessa jotain työtä suojaamalla menetetään toisenlaista työtä AI:n aikakaudella. Itse olen ehdoitta ihmisperustaisen luovan työn kannattaja, mutta tekijänoikeuslainsäädännöstä on mahdollista löytää sopivia argumentteja myös koulutusaineistoja imuroiville teknologiajäteille tai tekoälyn tuomista uusista mahdollisuuksista kiinnostuneille luovan työn tekijöille.

Moniin kysymyksiin vastauksen ensimmäinen lähtökohta oli mitä tekijänoikeus suojaa? Se suojaa muotoa, ei tyyliä. Muistan omista kaukaisista luovan kirjoittamisen opinnoistani, että on aivan hyväksyttävää koettaa (ensin) kirjoittaa kuin ihailemansa kirjailija. Samalla oppii näkemään, mikä tekstistä tekee hyvän, jos siis pääsee lähellekään tavoitettaan. Tarkoituksena on löytää lopulta oma ääni. Ongelmallista on, että generatiivinen tekoäly matkii tyyliä vaivatta, ilman vuosikausien harjoittelua, eikä prosessissa ole mitään inhimillistä kehityskulmaa mukana, ainoastaan sille syötetyt tekstit ja niitä käyttävä ennustinmalli. Attribuutio alkuperäiselle tekijälle jää pois.

(Joku osallistujista muisteli, että ChatGPT:tä ei tällä hetkellä saisi enää kirjoittamaan tietyn kirjailijan tyylillä. En löytänyt vahvistusta enkä käytä tekoälyjä, mutta jos näin on, mahtaisivatko asiaan vaikuttaa monet meneillään olevat tekijänoikeusoikeudenkäynnit?)

Osallistujat miettivät myös ohjelmakoodin ja tekijänoikeuksien suhdetta uudessa tilanteessa. Vielä parikymmentä vuotta sitten isoissa ohjelmataloissa oli ehdoton kielto, että koodia ei saanut tuottaa kopioimalla. Tällä varmistettiin, että koodipohjaan ei joutunut rajoittavan avoimen lähdekoodin lisenssin (esim. GNU:n GPL) alaisia palasia, koska sillä olisi voinut olla omien ohjelmistojen levittämiseen liittyviä seurauksia. Nyt tämä tuntuu unohtuneen, vaikka on selvää, että tekoälyn avulla ohjelmoitaessa mukaan tulee em. koodia ’mustaan laatikkoon’ sisältyvän koulutusaineiston mukana. Ja lisenssistä riippumatta tekijänoikeuskysymys pysyy: koodista ei tule itse tehtyä esimerkiksi vain muuttujia muuttamalla.

Tekijänoikeusloukkausten huomaamiseksi valmistetun ohjelmiston lähdekoodin pitäisi kuitenkin olla avoin. Kysymys on kiinnostava, mutta keskustelijoiden tiedossa ei vielä ollut oikeustapausta ohjelmointiin, tekijänoikeuksiin ja tekoälyyn liittyen. Keskustelutilaisuuden jälkeen löytyi GitHubia, Microsoftia ja OpenAI:ta vastaan nostettu ryhmäkanne aiheena Codexin ja Copilotin kouluttamiseen liittyvät tekijänoikeusrikkeet.  

Blogikirjoitus perustuu muistiinpanoihini keskustelun kulusta ja mahdolliset virheet niin alustuksen kuin osallistujien ajatusten tulkinnassa ovat siis omalla vastuullani.

Isojoella 26.11.2025

Reija Haapanen
Yhdistyksen puheenjohtaja vuonna 2025