Advokatfullmektig Tove Øymo, paralegal Ekin Ince Ersvaer og advokatfullmektig Oda Grøner.Foto: Wikborg Rein
KUNSTIG INTELLIGENS
Kampen om opphavsrett i AI-æraen
Kan materiale som er beskyttet av opphavsrett, som fotografier og kunstverk, brukes til såkalt «trening» av kunstig intelligens, som ChatGPT og GPT-4? Spørsmålet er nå kommet opp for amerikanske domstoler, skriver Tove Øymo, Ekin Ince Ersvaer og Oda Grøner i Wikborg Rein i dette innlegget.
Husker du The Next Rembrandt fra 2016? Prosjektet
der en algoritme, gjennom maskinlæring, analyserte alle verkene til den
nederlandske maleren Rembrandt, og deretter produserte sin egen tolkning, et
nytt «Rembrandt»-verk.
Ettersom Rembrandt døde i 1669, er opphavsretten
til kunstverkene for lengst utløpt. Dette innebærer at verkene kan benyttes av
andre uten samtykke eller kompensasjon.
Annonse
Det aktuelle rettslige spørsmålet
Rembrandt-prosjektet utløste, knyttet seg derfor til om det frembrakte
resultatet overhodet er beskyttet av opphavsrett og hvem som i så fall skal ha
opphavsrett til verk skapt av kunstig intelligens (AI). Men kunne algoritmen lovlig
ha brukt Rembrandts bilder hvis verkene var beskyttet av opphavsrett?
Siden 2016 har Rembrandt-prosjektet
blitt etterfulgt av flere og mer komplekse kreative, generative AI-er. DALL-E 2, Stable Diffusion, Midjourney og Imagen er alle eksempler på AI som kan generere
bilder på bakgrunn av tekstbeskrivelser. I denne artikkelen vil vi se nærmere
på om materiale beskyttet av opphavsrett lovlig kan brukes til trening av slik
AI.
Avgjørende AI-trening
En AI-løsnings suksess avhenger i stor
grad av treningsprosessen. AI må trenes før den er i stand til å utføre gitte
oppgaver på en korrekt måte. Ved treningen av AI, brukes gjerne organiserte
samlinger av data kalt for datasett. Størrelsen på datasettet avhenger av om AI'en
er forhåndstrent, eller om den trenes fra bunnen.
Datasettet vil typisk bestå av
et treningssett som brukes til trening av AI-løsningen, og et testsett,
bestående av data som AI'en ikke har sett før, for å teste om AI-løsningen faktisk
har lært noe, eller om den kun har memorert dataene i treningssettet.
Det finnes en rekke tilgjengelige
datasett på internett. Stable Diffusion er for eksempel trent opp på datasettene
til organisasjonen LAION, som består av opp til 5,85 milliarder
tekst-bilde-par.
Enkelt forklart tilbyr LAION lister av URLs til originale
bilder på internett. Datasettene inneholder altså ikke selv bilder – bildene
lastes ned fra internett av de som bruker datasettene. LAION har i sin tur
skaffet innhold til sine datasett gjennom «skraping» av hundrevis av
domener på internett.
Inngrep i eneretten
Den som har opphavsrett til et
beskyttet åndsverk, for eksempel et bilde, har i utgangspunktet enerett til å
gjøre bildet tilgjengelig for allmennheten, og til å fremstille eksemplarer av bildet,
uavhengig av på hvilken måte og i hvilken form, og uavhengig av om fremstillingen
er varig eller midlertidig.
Når AI-løsninger opplæres ved å
analysere store mengder data i datasett, vil det typisk lagres midlertidige kopier
av innhold, for eksempel bilder, i maskinens hukommelse. I den forbindelse kan
man hevde at trening av AI gjør inngrep i eneretten til å fremstille eksemplarer
av verk.
Ettersom analyse og bruk av store
datamengder, inkludert beskyttede åndsverk, også er nødvendig innenfor en rekke
viktige samfunnsområder, vedtok lovgiverne i EU eksplisitte unntak for såkalt
tekst- og datautvinning i direktiv 2019/790 (DSM-direktivet) for å sikre
at slik aktivitet ikke begrenses av opphavsrett.
Omdiskutert artikkel i direktivet
Tekst- og datautvinning er
kort forklart maskinbasert analyse av store mengder data for å oppnå kunnskap. Det
er antatt at trening av AI i de fleste tilfeller vil falle innunder
definisjonen av tekst- og datautvinning i DSM-direktivet.
Tekst- og datautvinning -unntakene i DSM-direktivet finnes
i både artikkel 3 og 4. Mens artikkel 3 tillater tekst- og datautvinning for blant annet
forskningsorganisasjoner med henblikk på vitenskapelig forskning, åpner artikkel
4 for tekst- og datautvinning for alle aktører og for alle typer formål - uavhengig av om motivet
er kommersielt.
Av den grunn har artikkel 4 vært omdiskutert. For selv om tekst- og datautvinning kan
ses som en forutsetning for utvikling av AI som DALL-E 2, Stable Diffusion og
ChatGPT, er det omstridt om tekst- og datautvinning for kommersielle formål bør være unntatt fra opphavsretten.
Forventer gjennomføring i norsk rett
En nærmere undersøkelse av artikkel 4
viser at unntaket gir vesentlig mindre rom for tekst- og datautvinning enn man først får
inntrykk av.
Artikkelen åpner for kopiering og uttrekk av åndsverk til tekst- og datautvinning, forutsatt
at innholdet er lovlig tilgjengelig, at det ikke oppbevares lengre enn
nødvendig og at rettighetshavere ikke har tatt uttrykkelig forbehold om at
verket brukes til tekst- og datautvinning («opt-out»).
Slike forbehold må tas på passende
vis. For innhold som er tilgjengeliggjort online, vil det kun anses
passende å ta forbehold på en maskinlesbar måte.
Opt-out-mekanismen gjør det mulig for
rettighetshavere å reservere seg mot tekst- og datautvinning . I realiteten blir det dermed opp til rettighetshaverne
om profittbasert tekst- og datautvinning skal være lov i EU.
Dette står i kontrast til USA, hvor «fair
use»-doktrinen trolig åpner for tekst- og datautvinning for kommersielle formål uten
tillatelse fra rettighetshaveren.
Denne ulikheten kan medføre at AI-utviklere i
EU settes i en atskillig dårligere posisjon enn i USA. Hvis EU faktisk har
tenkt å gjøre alvor av å bli et knutepunkt for utvikling og bruk av
AI-teknologier, slik Europakommisjonen har uttalt,
er det viktig at rammeverket for innovasjon i EU ses i sammenheng med
regelverket i USA.
DSM-direktivet er ennå ikke
gjennomført i Norge, men det er forventet at det skjer i nær fremtid.
Flere interessante rettssaker
Med den massive økningen i bruk av AI,
ser vi nå en økning i relaterte søksmål. Spørsmålet om materiale beskyttet av
opphavsrett kan brukes til trening av AI er kommet opp for amerikanske
domstoler.
Selv om det er antatt at «fair use» i den amerikanske
opphavsrettsloven omfatter visse former for ulisensierte tekst- og datautvinning-aktiviteter,
krever disse rettssakene en mer reell vurdering av om dette faktisk er tilfelle,
og i så fall i hvilken grad.
Stability AI, som står bak Stable Diffusion, er
gjenstand for flere søksmål. I et gruppesøksmål anlagt av kunstnere i USA er Stability AI
saksøkt sammen med DeviantArt og Midjourney.
Bakgrunnen for gruppesøkmålet er
AI-løsningen Stable Diffusion, som angivelig inneholder kopier av millioner av
bilder som er beskyttet av opphavsrett. Spørsmålet i saken er om denne storskalabruken
av bilder er lovlig uten å innhente tillatelse fra rettighetshaverne.
Stability AI er også saksøkt av Getty Images
i både London og Delaware for å ha kopiert og brukt millioner av beskyttede
bilder fra Gettys database til å trene Stable Diffusion uten samtykke.
Selv om sakene gjelder jus utenfor
Norge og EU, og utfallet derfor har begrenset overføringsverdi, er det interessant
å følge med på disse første rettssakene knyttet til opphavsrett og trening av
AI.
Utviklingen løper løpsk?
Det er ingen tvil om at kunstig intelligens
representerer en ny teknologi som utfordrer den etablerte rettstilstanden. Spørsmålet
om materiale beskyttet av opphavsrett kan brukes til trening ev AI har ikke et entydig
svar og kan dessuten variere i ulike jurisdiksjoner.
I tillegg til at det vil komme
avgjørelser i flere rettssaker, har lovgivere og andre aktører i ulike deler av
verden kommet med forslag og initiativer som skal legge til rett for gode
regelverk rundt AI.
En utfordring for lovgiver er å hensynta den raske
teknologiutviklingen. Det er også verdt å merke seg at flere teknologiledere,
blant annet Elon Musk, har signert et åpent brev der de ber om en pause i den
videre utviklingen av AI-modeller. At også aktører som selv er eller har vært
involvert i AI nå uttrykker bekymring over at utviklingen går for raskt, er
interessant.
Helt til slutt, reagerte du på
tittelen til denne artikkelen?
Den er skapt av ChatGPT. Og hvis
du lurer på hvordan det kan se ut når kunstig intelligens trenes ifølge DALL-E
2, så ta en titt på bildet under.