Advokatfullmektig Tove Øymo, paralegal Ekin Ince Ersvaer og advokatfullmektig Oda Grøner.

KUNSTIG INTELLIGENS

Kampen om opphavsrett i AI-æraen

Kan materiale som er beskyttet av opphavsrett, som fotografier og kunstverk, brukes til såkalt «trening» av kunstig intelligens, som ChatGPT og GPT-4? Spørsmålet er nå kommet opp for amerikanske domstoler, skriver Tove Øymo, Ekin Ince Ersvaer og Oda Grøner i Wikborg Rein i dette innlegget.

Publisert Sist oppdatert

Husker du The Next Rembrandt fra 2016? Prosjektet der en algoritme, gjennom maskinlæring, analyserte alle verkene til den nederlandske maleren Rembrandt, og deretter produserte sin egen tolkning, et nytt «Rembrandt»-verk.

Ettersom Rembrandt døde i 1669, er opphavsretten til kunstverkene for lengst utløpt. Dette innebærer at verkene kan benyttes av andre uten samtykke eller kompensasjon.

Det aktuelle rettslige spørsmålet Rembrandt-prosjektet utløste, knyttet seg derfor til om det frembrakte resultatet overhodet er beskyttet av opphavsrett og hvem som i så fall skal ha opphavsrett til verk skapt av kunstig intelligens (AI). Men kunne algoritmen lovlig ha brukt Rembrandts bilder hvis verkene var beskyttet av opphavsrett?

Siden 2016 har Rembrandt-prosjektet blitt etterfulgt av flere og mer komplekse kreative, generative AI-er. DALL-E 2, Stable Diffusion, Midjourney og Imagen er alle eksempler på AI som kan generere bilder på bakgrunn av tekstbeskrivelser. I denne artikkelen vil vi se nærmere på om materiale beskyttet av opphavsrett lovlig kan brukes til trening av slik AI.

Avgjørende AI-trening

En AI-løsnings suksess avhenger i stor grad av treningsprosessen. AI må trenes før den er i stand til å utføre gitte oppgaver på en korrekt måte. Ved treningen av AI, brukes gjerne organiserte samlinger av data kalt for datasett. Størrelsen på datasettet avhenger av om AI'en er forhåndstrent, eller om den trenes fra bunnen.

Datasettet vil typisk bestå av et treningssett som brukes til trening av AI-løsningen, og et testsett, bestående av data som AI'en ikke har sett før, for å teste om AI-løsningen faktisk har lært noe, eller om den kun har memorert dataene i treningssettet.

Det finnes en rekke tilgjengelige datasett på internett. Stable Diffusion er for eksempel trent opp på datasettene til organisasjonen LAION, som består av opp til 5,85 milliarder tekst-bilde-par.

Enkelt forklart tilbyr LAION lister av URLs til originale bilder på internett. Datasettene inneholder altså ikke selv bilder – bildene lastes ned fra internett av de som bruker datasettene. LAION har i sin tur skaffet innhold til sine datasett gjennom «skraping» av hundrevis av domener på internett.

Inngrep i eneretten

Den som har opphavsrett til et beskyttet åndsverk, for eksempel et bilde, har i utgangspunktet enerett til å gjøre bildet tilgjengelig for allmennheten, og til å fremstille eksemplarer av bildet, uavhengig av på hvilken måte og i hvilken form, og uavhengig av om fremstillingen er varig eller midlertidig.

Når AI-løsninger opplæres ved å analysere store mengder data i datasett, vil det typisk lagres midlertidige kopier av innhold, for eksempel bilder, i maskinens hukommelse. I den forbindelse kan man hevde at trening av AI gjør inngrep i eneretten til å fremstille eksemplarer av verk.

Ettersom analyse og bruk av store datamengder, inkludert beskyttede åndsverk, også er nødvendig innenfor en rekke viktige samfunnsområder, vedtok lovgiverne i EU eksplisitte unntak for såkalt tekst- og datautvinning i direktiv 2019/790 (DSM-direktivet) for å sikre at slik aktivitet ikke begrenses av opphavsrett.

Omdiskutert artikkel i direktivet

Tekst- og datautvinning er kort forklart maskinbasert analyse av store mengder data for å oppnå kunnskap. Det er antatt at trening av AI i de fleste tilfeller vil falle innunder definisjonen av tekst- og datautvinning i DSM-direktivet.

Tekst- og datautvinning -unntakene i DSM-direktivet finnes i både artikkel 3 og 4. Mens artikkel 3 tillater tekst- og datautvinning for blant annet forskningsorganisasjoner med henblikk på vitenskapelig forskning, åpner artikkel 4 for tekst- og datautvinning for alle aktører og for alle typer formål - uavhengig av om motivet er kommersielt.

Av den grunn har artikkel 4 vært omdiskutert. For selv om tekst- og datautvinning kan ses som en forutsetning for utvikling av AI som DALL-E 2, Stable Diffusion og ChatGPT, er det omstridt om tekst- og datautvinning for kommersielle formål bør være unntatt fra opphavsretten.

Forventer gjennomføring i norsk rett

En nærmere undersøkelse av artikkel 4 viser at unntaket gir vesentlig mindre rom for tekst- og datautvinning enn man først får inntrykk av.

Artikkelen åpner for kopiering og uttrekk av åndsverk til tekst- og datautvinning, forutsatt at innholdet er lovlig tilgjengelig, at det ikke oppbevares lengre enn nødvendig og at rettighetshavere ikke har tatt uttrykkelig forbehold om at verket brukes til tekst- og datautvinning («opt-out»).

Slike forbehold må tas på passende vis. For innhold som er tilgjengeliggjort online, vil det kun anses passende å ta forbehold på en maskinlesbar måte.

Opt-out-mekanismen gjør det mulig for rettighetshavere å reservere seg mot tekst- og datautvinning . I realiteten blir det dermed opp til rettighetshaverne om profittbasert tekst- og datautvinning skal være lov i EU.

Dette står i kontrast til USA, hvor «fair use»-doktrinen trolig åpner for tekst- og datautvinning for kommersielle formål uten tillatelse fra rettighetshaveren.

Denne ulikheten kan medføre at AI-utviklere i EU settes i en atskillig dårligere posisjon enn i USA. Hvis EU faktisk har tenkt å gjøre alvor av å bli et knutepunkt for utvikling og bruk av AI-teknologier, slik Europakommisjonen har uttalt, er det viktig at rammeverket for innovasjon i EU ses i sammenheng med regelverket i USA.

DSM-direktivet er ennå ikke gjennomført i Norge, men det er forventet at det skjer i nær fremtid.

Flere interessante rettssaker

Med den massive økningen i bruk av AI, ser vi nå en økning i relaterte søksmål. Spørsmålet om materiale beskyttet av opphavsrett kan brukes til trening av AI er kommet opp for amerikanske domstoler.

Selv om det er antatt at «fair use» i den amerikanske opphavsrettsloven omfatter visse former for ulisensierte tekst- og datautvinning-aktiviteter, krever disse rettssakene en mer reell vurdering av om dette faktisk er tilfelle, og i så fall i hvilken grad.

Stability AI, som står bak Stable Diffusion, er gjenstand for flere søksmål. I et gruppesøksmål anlagt av kunstnere i USA er Stability AI saksøkt sammen med DeviantArt og Midjourney.

Bakgrunnen for gruppesøkmålet er AI-løsningen Stable Diffusion, som angivelig inneholder kopier av millioner av bilder som er beskyttet av opphavsrett. Spørsmålet i saken er om denne storskalabruken av bilder er lovlig uten å innhente tillatelse fra rettighetshaverne.

Stability AI er også saksøkt av Getty Images i både London og Delaware for å ha kopiert og brukt millioner av beskyttede bilder fra Gettys database til å trene Stable Diffusion uten samtykke.

Selv om sakene gjelder jus utenfor Norge og EU, og utfallet derfor har begrenset overføringsverdi, er det interessant å følge med på disse første rettssakene knyttet til opphavsrett og trening av AI.

Utviklingen løper løpsk?

Det er ingen tvil om at kunstig intelligens representerer en ny teknologi som utfordrer den etablerte rettstilstanden. Spørsmålet om materiale beskyttet av opphavsrett kan brukes til trening ev AI har ikke et entydig svar og kan dessuten variere i ulike jurisdiksjoner.

I tillegg til at det vil komme avgjørelser i flere rettssaker, har lovgivere og andre aktører i ulike deler av verden kommet med forslag og initiativer som skal legge til rett for gode regelverk rundt AI.

En utfordring for lovgiver er å hensynta den raske teknologiutviklingen. Det er også verdt å merke seg at flere teknologiledere, blant annet Elon Musk, har signert et åpent brev der de ber om en pause i den videre utviklingen av AI-modeller. At også aktører som selv er eller har vært involvert i AI nå uttrykker bekymring over at utviklingen går for raskt, er interessant.

Helt til slutt, reagerte du på tittelen til denne artikkelen?

Den er skapt av ChatGPT. Og hvis du lurer på hvordan det kan se ut når kunstig intelligens trenes ifølge DALL-E 2, så ta en titt på bildet under.

Hvordan DALL-E 2s illustrasjon kan se ut når kunstig intelligens trenes.
Powered by Labrador CMS