Tutorial: Wat je moet weten over AI en auteursrecht

Jurist van de Auteursbond Marloes van Rossum vertelt je in drie korte video’s alles wat je moet weten over AI en auteursrecht voor teksten.

Overzicht:

  • Video 1 – De input van AI: Hoe wordt AI getraind? Is jouw werk gebruikt om AI te trainen? Wat kun je doen om dit te achterhalen?
  • Video 2 – De output van AI: Rust er auteursrecht op werken zoals verhalen die door, of met AI zijn gemaakt?
  • Video 3: Transparantieplicht: Het is niet altijd duidelijk óf iets met AI is gemaakt. Hoe zit het met de melding- of transparantieplicht?

De video’s werden gemaakt in opdracht van de Creatieve Coalitie, de koepelvereniging voor professionals die werkzaam zijn in de culturele en creatieve sector, waar ook de Auteursbond bij is aangesloten.

De volledige tutorial vind je op de site van de Creatieve Coalitie: Tekstschrijvers: wat ik moet weten over auteursrecht en AI | De Creatieve Community

AI-systemen als ChatGPT zijn getraind met teksten waarop auteursrechten rusten. Ook de teksten van Nederlandse auteurs zijn zonder toestemming en zonder betaling van een eerlijke vergoeding gebruikt. De Auteursbond wil graag meer inzicht in welke werken hiervoor zijn gebruikt. Check of AI jouw werk kent en laat ons weten wat je hebt gevonden!

Zo controleer je of jouw werk is gebruikt:

Om erachter te komen of jouw werk is gebruikt bij de ontwikkeling van ChatGPT, Google Bard of een ander systeem, kun je de schrijfbot ondervragen. Het is belangrijk dat je vraagt naar informatie die niet op Wikipedia staat of ergens anders op het web.

Vraag de schrijfbot bijvoorbeeld om:
  • Een samenvatting van het hele boek
  • De samenvatting van een specifiek hoofdstuk
  • De outline voor een volgend deel (m.n. te gebruiken wanneer het gaat om series/trilogieën/etc)
  • Onbelangrijke details of onbelangrijke karakters te noemen of te omschrijven
  • Vervolgzinnen te schrijven op een gegeven zin

Pas op met wat je in de schrijfbot gooit, want het kan gebruikt worden als trainingsmateriaal (persoonsgegevens, gevoelige informatie, ongepubliceerde teksten).

Bewaar de antwoorden van de schrijfbot zodat je die als voorbeelden kunt uploaden!

Schrijfbots zoals ChatGPT zijn getraind met behulp van teksten waarop auteursrecht rust. Hebben schrijvers recht op een vergoeding? En hoe zit het met de teksten die met behulp van AI zijn geschreven? Bij wie ligt dan het auteursrecht? Over AI en auteursrecht is nog veel onduidelijk. Marloes van Rossum, jurist bij de Auteursbond, brengt de auteursrechtelijke aspecten rond gebruik van AI in kaart.

1. Output: Auteursrecht als je AI gebruikt

Wanneer krijg je auteursrecht?

Auteursrecht ontstaat in Nederland vanzelf. Er ligt auteursrecht op een werk wanneer er sprake is van een zekere mate van creativiteit en er een maker is. Van creativiteit is sprake als het werk  een eigen oorspronkelijk karakter heeft en  een persoonlijke stempel. Dit behelst een zogenaamde intellectuele schepping, waarbij de maker zich uit door het maken van vrije en creatieve keuzes. Alhoewel het niet letterlijk in de wettekst staat, gaat de Hoge Raad ervanuit dat de het werk een voortbrengsel is van de menselijke geest. Ook in de Europese Unie en de Verenigde Staten is dit het geval. Zonder mens dus geen maker, is de consensus. En zonder maker: geen auteursrecht.

Op een werk gemaakt door AI lijkt dus vooralsnog geen auteursrecht te liggen. Dit wordt (in het buitenland) bevestigd door het Amerikaanse Copyright Office en in de eerst bekende rechtszaak ter wereld die hierover heeft gediend. In augustus 2023 oordeelde de rechtbank van Columbia dat de Copyright Office terecht geen auteursrecht heeft toegekend aan een kunstwerk dat zonder menselijke inbreng tot stand is gebracht. 

AI als gereedschap

Je kunt  je afvragen of het nog verschil maakt of het betrokken werk volledig door AI is gegenereerd, of slechts met  behulp van AI is gemaakt. Over het algemeen krijgt de AI prompts (‘opdrachten’)  van een mens, en vaak vindt er ook nabewerking plaats. Voor het Amerikaanse Copyright Office maakt dit tot nog toe geen verschil. Ook op AI-gegenereerd werk, waar uren menselijk voor- en nawerk in zit (denk aan prompts schrijven en de output bewerken), kan wat hen betreft geen auteursrecht liggen. Enerzijds is het de vraag of dat terecht is. Anderzijds is het bovendien lang niet altijd duidelijk of een werk überhaupt door of met AI is gemaakt. Sommige teksten of ‘foto’s’ zijn al niet meer van echt te onderscheiden. En bronvermelding is niet verplicht, want het betreft geen auteursrechtelijk beschermd werk. Waar het Copyright Office in februari 2023 definitief oordeelde dat er geen auteursrecht kon liggen op de AI-afbeeldingen in het werk Zarya of the Dawn, kende het aan diezelfde afbeeldingen in september 2022 nog auteursrecht toe. Op dat moment had de maker namelijk nog niet bekend gemaakt dat het werk met behulp van AI was gecreëerd.

Op dit moment is de Europese Unie bezig om tot regelgeving ter regulering van AI te komen. Daartoe bestaat nu de AI-Verordening in concept, waarin onder andere een transparantiebepaling is opgenomen. Die bepaling houdt in dat de gebruiker het moet vermelden wanneer een werk met AI is gemaakt. Echter, in het huidige voorstel geldt op die bepaling een uitzondering wanneer het (onder andere) het recht op vrijheid van kunst en wetenschap betreft. De AI-Verordening in huidige vorm zou dus geen verschil teweeg brengen in het voorbeeld van Zarya of the Dawn

Plagiaat

Ook zonder wettelijke transparantieplicht dient de gebruiker van AI op te passen met het openbaar maken van werk dat door of met AI gegenereerd is . Er is namelijk geen garantie dat met de output geen auteursrechtinbreuk wordt gemaakt. Sommige schrijfbots waarschuwen daar inmiddels ook al voor. Komt de output woord voor woord overeen met een reeds bestaand werk waar auteursrecht op rust, dan is openbaarmaking daarvan mogelijk plagiaat.  

2. Input: Auteursrecht als AI jouw werk gebruikt

Het is inmiddels algemeen bekend dat AI getraind wordt met informatie die van alle uithoeken van het internet ‘geschraapt’ wordt, dus ook bestaande werken van makers. Hierbij wordt lang niet altijd gecontroleerd of werken misschien   onrechtmatig gepubliceerd (denk aan illegale downloads voor e- en audioboeken en films) zijn. En ook niet of de rechthebbende  mogelijk bezwaar heeft gemaakt tegen het gebruik van zijn werk voor het trainen van AI. Steeds meer makers klagen dan ook de bedrijven achter AI aan wegens auteursrechtinbreuk en/of diefstal. En in reactie daarop tonen de AI-bedrijven steeds minder openheid ten aanzien van de vraag naar het gebruikte trainingsmateriaal.

Auteursrecht geeft de maker de mogelijkheid om te bepalen wat er wel of niet met zijn werk gebeurt, en onder welke voorwaarden. Om een werk waar auteursrecht op ligt te kunnen gebruiken is dan ook toestemming, meestal in de vorm van een licentieverlening, nodig. Schrapen voor en trainen van AI vindt echter plaats zonder dat de maker het weet, laat staan dat deze hier toestemming voor heeft kunnen geven of er een vergoeding voor ontvangt.

Opt-out

Overigens kent de Auteurswet wel een tweetal bepalingen rondom tekst- en datamijnen (tdm), dus schrapen voor AI-training. Op grond van die bepalingen is dit geoorloofd voor wetenschappelijk onderzoek of wanneer de maker geen gebruikt maakt van een zogenaamde opt-out. Daarmee kan een maker aangeven dat zijn werk niet gebruikt mag worden voor het trainen van AI. Deze tdm-bepalingen zijn echter niet van toepassing wanneer het gaat om schrijfbots. Reproductie in het kader van tdm mag: alleen in speciale gevallen, zonder dat dit de normale exploitatie van het bestaande werk in de weg staat, én de legitieme belangen van de maker niet worden geschaad. Bij schrijfbots is daar geen sprake van.

In de praktijk kent de opt-out bovendien ook zijn beperkingen. Opt-outs worden dan ook nauwelijks gebruikt. Enerzijds omdat AI zo plots in de versnelling is geraakt en de opt-out bepaling voor veel mensen nog onbekend was. Anderzijds omdat er veel onduidelijkheid bestaat over hoe de opt-out precies werkt. De maker moet zijn bezwaren ‘op passende wijze’ kenbaar maken. Volgens de wet is daar in ieder geval sprake van bij ‘machinaal leesbare middelen’. Daarmee wordt gedoeld op een code in de opbouw van bijvoorbeeld een website. In de praktijk honoreert de schrijfbot die code echter vaak niet bij het schrapen van de website. Desalniettemin is het aan te raden om bij je uitgever aan te dringen op het aanbrengen van een opt-out.

De snelle opkomst van ChatGPT

Door Anja Sicking op 7 juni 2023

Zal het geïndustrialiseerde taalgebruik van ChatGPT en andere artificiële intelligentie systemen het werk van schrijvers deels overnemen of hebben we te maken met de zoveelste hype van de techindustrie? In Nederland is het relatief rustig in de schrijverswereld in vergelijking met de Verenigde Staten, waar 15.000 scenaristen sinds begin mei staken.

De scenaristen staken niet alleen voor een hoger salaris en betere arbeidsvoorwaarden. Ze anticiperen ook op een toekomst waarin het werk dat ze doen mogelijk deels wordt overgenomen door AI-systemen. Ze willen nu al afspraken maken met producenten over het gebruik van AI (artificiële intelligentie) bij het schrijven van scripts. Ze staan lijnrecht tegenover de spelers uit de techindustrie, die juist willen dat AI in de toekomst een essentieel hulpmiddel zal zijn bij het maken van films en series. Mogelijk zullen acteurs zich binnenkort bij de stakende scenaristen aansluiten, dan komt Hollywood volledig plat te liggen. Sommige acteurs doen nu al mee, of zorgen ervoor dat foodtrucks langs de stakers rijden om eten te brengen. Bands treden gratis op. Tijdens een AI-conferentie vloog er een crowdfunded vliegtuig over filmstudio’s met een spandoek waarop stond: ‘Pay the writers, you AI-holes’.

Tekst op basis van statistiek

ChatGPT is een large language model (LLM) dat het techbedrijf OpenAI eind 2022 lanceerde. Een klets- of schrijfbot zou je het ook kunnen noemen. ChatGPT is getraind met (onder andere) een gigantische hoeveelheid digitale teksten, meer dan een mens ooit in zijn leven zou kunnen lezen. Het model kent aan al die reeksen woorden een ‘waarschijnlijkheid’ toe. Dat betekent dat het getraind is om het volgende woord te ‘berekenen’ aan de hand van de woorden die eraan voorafgaan. Hiervoor is enorm veel rekenkracht en opslagruimte in de cloud nodig, wat alleen reusachtige techbedrijven kunnen betalen. Andere bekende LLM’s zijn Bard, van Google, en LLaMA, van Meta.

Hoewel Lidwien Gevers in Het Journaal dolenthousiast zei dat je met ChaptGPT ‘de nieuwe Harry Potter kan schrijven’, begrijpt het grote taalmodel net zomin iets van de teksten die het produceert als een vertaalprogramma. Het niveau van de scripts, de verhalen of de literaire vertalingen die met LLM’s worden gegenereerd is op dit moment dan ook weinig indrukwekkend. De toneel- en scenarioschrijver Nathan Vecht legt in Nieuwsuur (14-5-23) uit hoe dat komt. ‘Er wordt een gemiddelde gezocht van alle scripts die gemaakt zijn. Maar wat een goed verhaal, een goed verhaal maakt, is juist dat het bovengemiddeld is.’

Digitale assistent

Tegelijk is het ook wél indrukwekkend wat LLM’s al kunnen. Een LLM kan binnen een minuut een sonnet over de tweede wet van de thermodynamica generen en dat in zevenentwintig talen vertalen.

Sommige scenaristen, vertalers, prozaïsten, dichters, journalisten en toneelschrijvers gebruiken ChatGPT al om ideeën op te doen, of als assistent. Helaas vindt het model die ideeën vaak in het werk van andere, menselijke schrijvers. Als een uitgewerkt idee letterlijk wordt overgenomen, kan een digitale assistent ‘hightechplagiaat’ plegen.

ChatGPT geeft wel (een deel van) de bronnen waarop de teksten die het taalmodel genereert zijn gebaseerd, maar die zijn lang niet altijd betrouwbaar. ChatGPT hallucineert soms, waarmee wordt bedoeld dat het informatie en ook bronnen verzint. De journalist Chris Moran schrijft The Guardian (6-4-23) dat deze krant soms als bron wordt genoemd bij artikelen die daar nooit in zijn verschenen. Om niet het risico te lopen uit fake-artikelen te citeren, zal een schrijver alle door een ChatGPT gegeven bronnen alsnog zelf moeten controleren.

Auteursrecht en ChatGPT

In de VS hebben grote media als CNN en Dow Jones (de uitgever van Wall Street Journal) al bezwaar gemaakt tegen het gebruik van het auteursrechtelijk beschermde werk van hun journalisten door OpenAI.

Nederlandse kranten en tijdschriften dienen ook als ‘voer’ voor de LLM’s.  Waarschijnlijk wordt het auteursrecht hierdoor in ons land op grote schaal door techbedrijven geschonden, hoewel de kwestie ingewikkeld ligt. Auteursbond-juriste Marloes van Rossum ging hier tijdens de workshop ‘AI en auteursrecht’ van de Auteursbond op in en zal hier in een volgend artikel meer over vertellen. Over het mogelijk schenden van het auteursrecht zijn al Kamervragen gesteld. Minister Adriaansens heeft gezegd dat OpenAI auteursrechtelijk beschermd werk niet zonder toestemming mag gebruiken voor het trainen van zijn AI-model. OpenAI heeft zelf toegegeven het internet af te schrapen.

Op dit moment is het nog onduidelijk wie de eigenaar is van de door LLM’s gegenereerde teksten. Degene die een prompt intikt en de tekst die uit de machine rolt als eerste publiceert? De techbedrijven?

‘Als een AI-model aan de haal gaat met wat journalisten produceren, en dat op een eigen manier presenteren aan het brede publiek, dan droogt de inkomstenstroom van uitgevers, waar journalisten van betaald worden op,’ aldus Herman Wolswinkel, directeur van NDP Nieuwsmedia (NRC 24-3-23). ‘Op basis van tests die we hebben gedaan krijgen we de indruk dat er artikelen van achter de betaalmuur worden gebruikt.’

Niets wijst erop dat politici voldoende hebben nagedacht over het beschermen van het auteursrecht, of over de veiligheid van LLM’s voordat die op de markt zijn toegelaten. Veel mensen hebben al gewaarschuwd dat betrouwbare nieuwsbronnen verder ondergesneeuwd kunnen raken door nepnieuws, zeker nu gebruikers van LLM’s vooraanstaande journalisten daarmee imiteren. Dit zou democratieën verder onder druk kunnen zetten. ‘Flood the zone with sh*t,’ noemde de topadviseur Steve Bannon het al in het Trump-tijdperk.

Informatie is zelden neutraal en LLM’s zijn daardoor zelden onbevooroordeeld. ChatGPT is getraind met 300 miljard woorden die van het internet zijn gehaald, ook van sites waarop discriminerende informatie staat, die het taalmodel reproduceert, ondanks de filters. Dit zal de discriminatie van bepaalde groepen in stand houden.

Bedrijven, zoals Microsoft, doen enorme investeringen (10 miljard) in LLM’s, die moeten worden terugverdiend. Wie (een deel van) zijn tekst laat schrijven door een LLM, laat zijn pen door een bedrijf vasthouden. Een bedrijf met een bepaald belang, zoals het industrialiseren van ons taalgebruik.

Verbeeldingskracht

De essayist Jan Postma zei in een interview dat het veel verbeeldingskracht vraagt om je een wereld voor te stellen waarin bepaalde technologie aan banden wordt gelegd. ‘Ik denk dat als je van mensen verwacht dat ze in het nu politieke beslissingen nemen over de wereld die ze willen, dat samenhangt met welke voorstelling ze zich kunnen maken van die wereld. Als die voorstelling heel beperkt is, dan kun je daar ook niet op anticiperen.’ (Jan Hanlo Podcast 23-4-23)

Als je de ontwikkeling van AI van de afgelopen vijf jaar naar voren klapt dan zou het kunnen dat de LLM’s heel snel veel beter worden dan ze nu zijn. Wat dat betreft hebben de stakende scriptschrijvers waarschijnlijk gelijk dat ze nu al invloed op deze ontwikkelingen eisen. Ze anticiperen op de gevolgen van de LLM’s op de middellange en lange termijn. Hun staking getuigt van verbeeldingskracht en het stemt hoopvol dat ze zich hebben verenigd.

De Auteursbond volgt de ontwikkelingen rond AI en wat die betekenen voor schrijvers en vertalers. We blijven je hierover informeren.