Techbedrijven lijken AI illegaal te trainen met beelden van Nederlandse makers
Het lijkt er sterk op dat de AI-modellen van OpenAI en Midjourney om afbeeldingen te genereren zonder toestemming zijn getraind met beelden van Nederlandse makers. Dat blijkt uit onderzoek van de NOS en wordt bevestigd door vier experts. Daarmee hebben de techbedrijven mogelijk inbreuk gemaakt op het auteursrecht.
OpenAI wilde niet inhoudelijk reageren op het onderzoek, maar verwees onder meer naar de mogelijkheid voor beeldmakers om bezwaar te maken. Midjourney heeft niet gereageerd op onze vragen.
Gele jurk
Voor het onderzoek vroegen we de AI-modellen afbeeldingen te genereren in de stijl van verschillende bekende Nederlandse beeldmakers, onder wie Erwin Olaf, Eddy van Wessel en Dick Bruna. Daarbij vroegen we enkel om de stijl na te bootsen, zonder verdere aanwijzingen.
Daarbij kwamen telkens karakteristieke eigenschappen van bekende werken naar voren. Zo genereerden de AI-modellen afbeeldingen van vrouwen in een gele jurk, net zoals in een fotoserie van Erwin Olaf.
In het geval van Eddy van Wessel ontstonden er zwart-witafbeeldingen van oorlogsgebieden, scènes waar de fotograaf om bekendstaat. Ook werden afbeeldingen van Nijntje gegenereerd toen we om een afbeelding in de stijl van Dick Bruna vroegen. De rechthebbenden van Bruna geven geen toestemming om die afbeeldingen in dit artikel te gebruiken.
Opvallend is dat het maken van afbeeldingen in de stijl van bepaalde artiesten met DALL-E van OpenAI (het bedrijf achter ChatGPT) soms wordt geweigerd, omdat het in strijd is met hun voorwaarden. Door het opnieuw te proberen in een ander tabblad lukt het echter vaak alsnog.
De NOS legde de resultaten voor aan vier experts op het gebied van AI: Evangelos Kanoulas en Efstratios Gavves van de Universiteit van Amsterdam, Olya Kudina van de TU Delft en Noelle Cicilia van Brush AI. Zij zeggen allemaal dat hoewel het niet met 100 procent zekerheid te zeggen is, het er zeer sterk op lijkt dat de AI-modellen zijn getraind op de Nederlandse werken.
"Het gaat hier om een heel generieke omschrijving", zegt Kanoulas van de UvA. "Toch zijn de AI-modellen in staat om alleen op basis van iemands naam een associatie te maken met bijvoorbeeld een gele jurk."
Cicilia benadrukt dat een AI-model niet zelf creatief is. "Generatieve AI-modellen proberen slechts de data waarop ze zijn getraind zo goed mogelijk na te bootsen of te reproduceren."
"Als werken beschermd zijn, wordt een schending van het auteursrecht over het algemeen vrij snel aangenomen als iemand ermee aan de haal gaat", zegt Mirjam Elferink, advocaat intellectueel eigendomsrecht bij Elferink & Kortier.
Maar er is een uitzondering voor het verzamelen van openbare gegevens, legt Elferink uit. Deze uitzondering geldt bijvoorbeeld voor wetenschappelijke instellingen. Maar ook commerciële partijen kunnen hiervan gebruikmaken zolang rechthebbenden geen expliciet bezwaar hebben gemaakt: de zogeheten opt-out.
Voor de werken van Dick Bruna en Eddy van Wessel is er gebruikgemaakt van zo'n opt-out, waardoor mogelijk sprake is van een schending van het auteursrecht. Bij Erwin Olaf is dat niet het geval, zegt Shirley den Hartog, die nu zijn werk beheert: "We hebben voor zijn overlijden besproken dat het juist heel mooi zou zijn als mensen over de hele wereld met zijn werk bezig blijven."
Niet op de hoogte
"Het is goed om te weten dat de uitzondering op het auteursrecht in de wet is gekomen voordat deze AI-tools publiekelijk toegankelijk werden", zegt advocaat Elferink. Dat leidt volgens haar nu tot onduidelijkheid over de toepassing ervan op het trainen van AI-modellen.
"Het jammere is dat er in Nederland vooralsnog geen rechtszaken over dit onderwerp zijn geweest, waardoor de rechter zich nog niet over dit vraagstuk heeft kunnen uitspreken." In de Verenigde Staten lopen meerdere rechtszaken hierover tegen zowel OpenAI als Midjourney. Er zijn nog geen uitspraken.
Hanneke Holthuis, jurist bij beeldrechtenorganisatie Pictoright, vertelt dat veel beeldmakers niet bekend zijn met deze "kronkel van het auteursrecht". Niemand hield er volgens haar rekening mee dat opeens AI-modellen getraind zouden worden met publiekelijk beschikbare werken: "Je kan niet verwachten dat iemand een voorbehoud maakt voor iets wat op dat moment nog niet bestaat."
Opt-out
De Europese AI-wet, die sinds deze maand van kracht is, lijkt aan te sluiten bij de opt-outsystematiek. Beeldmakers moeten aangeven dat ze hun opt-outrecht willen gebruiken, techbedrijven moeten vervolgens transparant zijn over hoe modellen zijn getraind en kunnen aantonen dat ze geen inbreuk maken op auteursrecht.
Het probleem met opt-out is dat deze eigenlijk moet worden toegepast voordat AI getraind wordt met het werk, zegt Holthuis. "Eenmaal getraind, is het voor een AI-systeem moeilijk om specifieke data te 'ontleren'. Dit betekent dat werken die niet onder een opt-out zijn gepubliceerd voordat de AI werd getraind, mogelijk onomkeerbaar zijn gebruikt." Nederlandse beeldmakers kunnen op optoutnow.ai aangeven dat ze hun opt-outrecht willen gebruiken.