Brief regering : Beleidsreactie rapport Webharvesting
26 643 Informatie- en communicatietechnologie (ICT)
Nr. 1418 BRIEF VAN DE MINISTER VAN ONDERWIJS, CULTUUR EN WETENSCHAP
Aan de Voorzitter van de Tweede Kamer der Staten-Generaal
Den Haag, 2 oktober 2025
Op 23 mei jl. heeft mijn ambtsvoorganger uw Kamer het rapport «Het faciliteren van
webharvesting» toegezonden.1 Met deze brief reageer ik op dit rapport en geef ik invulling aan de motie Dekker-Abdulaziz,
waarin de regering is verzocht om in kaart te brengen wat de wettelijke, technische
en financiële obstakels zijn die in de weg staan van een mogelijke archivering van
het .nl-domein en hoe deze te overkomen.2
Achtergrond
Veel organisaties in Nederland verzamelen bronnen die nu of in de toekomst kunnen
bijdragen aan onze kennis over het verleden. Bibliotheken, archieven en musea zorgen
voor duurzame bewaring van deze bronnen, al dan niet vanuit een wettelijke taak, en
maken ze toegankelijk voor gebruikers.
Met de komst van het internet vindt steeds meer communicatie online plaats. Om internetbronnen
veilig te stellen voor de toekomst, ontplooit een aantal Nederlandse erfgoedinstellingen
webharvestingactiviteiten: het opslaan, bewaren en beschikbaar stellen van websites
binnen het Nederlandse webdomein.
Anders dan in een aantal andere Europese landen, biedt de Nederlandse wet geen grondslag
voor deze activiteiten. Dat betekent in de praktijk dat erfgoedinstellingen toestemming
moeten vragen aan alle betrokken (auteurs)rechthebbenden voor het verzamelen en bewaren
van websites. Meestal maken ze daartoe gebruik van een opt-out-procedure: rechthebbenden
krijgen bericht van een voornemen om content te harvesten; als zij daar geen bezwaar
tegen maken («opt-out»), vindt het harvesten plaats.
Deze procedure is echter heel tijdrovend. Daardoor is webharvesting op grote schaal,
bijvoorbeeld door een momentopname te maken van het hele Nederlandse webdomein (een
zogenaamde «nationale domeincrawl») nu niet mogelijk. Maar ook het uitvoeren van beredeneerde
selecties, bijvoorbeeld van online uitingen rond specifieke thema’s of gebeurtenissen,
is erg bewerkelijk. Bovendien ervaren erfgoedorganisaties en rechthebbenden bij het
uitvoeren van deze activiteiten een grote mate van rechtsonzekerheid.
Om die reden hebben de Koninklijke Bibliotheek (KB), de Koninklijke Vereniging Archiefsector
Nederland (KVAN) en het Nederlands Instituut voor Beeld en Geluid (NIBG) in een brief
aan de vaste commissie Onderwijs, Cultuur en Wetenschap van uw Kamer gepleit voor
het wettelijk faciliteren van webharvesting.3
Uw Kamer heeft de regering met de motie Dekker-Abdulaziz verzocht om in kaart te brengen
wat de wettelijke, technische en financiële obstakels zijn die in de weg staan van
een mogelijke archivering van het Nederlandse webdomein en hoe deze te overkomen.
Om hierin inzicht te krijgen, heeft mijn ambtsvoorganger een extern onderzoek uitgezet
bij PBLQ in samenwerking met Ecorys en Confider.
Scope van het onderzoek
Uitgangspunt voor het onderzoek was de vraag hoe de webharvestingactiviteiten van
erfgoedinstellingen (al dan niet wettelijk) gefaciliteerd kunnen worden. In antwoord
op deze vraag hebben de onderzoekers vier scenario’s ontwikkeld. Het rapport bespreekt
de voor- en nadelen van ieder scenario vanuit de volgende perspectieven: het informatie-
en erfgoedbelang, het belang van (auteurs)rechthebbenden, de bescherming van de persoonsgegevens
van betrokkenen, de kosten, de juridische risico’s, het draagvlak voor elk scenario
en de uitvoerbaarheid ervan (in zowel de technische als de organisatorische zin).4 Het onderzoek bouwt voort op een onderzoek naar webharvesting dat in 2021 is uitgevoerd
door het Instituut voor Informatierecht (IViR) van de Universiteit van Amsterdam in
opdracht van het Wetenschappelijk Onderzoek- en Datacentrum (WODC).5
Met het voorliggende onderzoek en deze reactie ga ik een stap verder dan waar de motie
Dekker-Abdulaziz mij om vroeg. Naast het in kaart brengen van mogelijke obstakels
voor webharvesting, levert het onderzoek ook een aantal concrete scenario’s op voor
het (wettelijk) faciliteren van webharvestingactiviteiten en een weging van de voor-
en nadelen van elk scenario. Daarbij is er ook aandacht voor aanvullende perspectieven,
zoals het draagvlak en de uitvoering.
Resultaten van het onderzoek
Vier scenario’s
Het rapport beschrijft de onderstaande vier scenario’s voor het al dan niet (wettelijk)
faciliteren van webharvestingactiviteiten in Nederland. Ook gaat het rapport in op
de afbakening van het nationaal webdomein.
1. Het faciliteren van centrale uitvoering door één instelling met loketfunctie voor
andere instellingen
In dit scenario krijgt één centrale instelling een wettelijke basis om zowel nationale
domeincrawls als beredeneerde selecties uit te voeren. Andere erfgoedinstellingen
kunnen een verzoek doen bij de centrale instelling om specifieke websites te harvesten,
waarbij de centrale instelling een loketfunctie heeft.
2. Het faciliteren van centrale uitvoering van de nationale domeincrawl en decentrale
uitvoering van beredeneerde selecties
Net als in het eerste scenario krijgt één centrale instelling een wettelijke basis
om nationale domeincrawls uit te voeren. Daarnaast krijgen één centrale instelling
en andere erfgoedinstellingen een wettelijke basis om beredeneerde selecties uit te
voeren.
3. Afspraken maken over uitvoering van webharvestingactiviteiten (consensusmodel)
In dit scenario worden door recht- en belanghebbenden expliciete en duidelijke afspraken
gemaakt over het uitvoeren van webharvestingactiviteiten, zowel ten aanzien van een
nationale domeincrawl als beredeneerde selecties. Dit wordt aangevuld met een notice-and-takedown-systeem.6 Deze afspraken kennen geen wettelijke basis. Daarmee zou dit scenario neerkomen op
een niet-wettelijk faciliteren van webharvestingactiviteiten.
4. Status quo (geen afspraken maken)
Met dit scenario blijft de huidige situatie in stand. Webharvestingactiviteiten worden
dus niet (wettelijk) gefaciliteerd, met als gevolg dat er geen nationale domeincrawl
plaats kan vinden. Wel voeren een aantal partijen (beperkt) beredeneerde selecties
uit, onder de condities die ook nu al gelden.
Voor het realiseren van scenario 1 en 2 is een wetswijziging nodig. Dat geldt niet
voor scenario 3 en 4.
Definitie nationaal webdomein
De motie Dekker-Abdulaziz spreekt over archivering van het .nl-domein. Dat een webpagina
gebruik maakt van het topleveldomein .nl is echter niet het enig mogelijke criterium
om het Nederlandse webdomein af te bakenen. Ook de taal van de tekst op een website
kan bijvoorbeeld een criterium zijn, of de geografische locatie waar de pagina gepubliceerd
is.
Het rapport wijst uit dat er twee mogelijke strategieën zijn om tot een standaard
definitie van het nationaal webdomein te komen.
1. Een strategie op basis van vooraf vastgelegde criteria die zoveel mogelijk automatiseerbaar
en objectief zijn. Een voorbeeld hiervan is het gebruik van top-level domeinen (pagina’s
met .nl, maar bijvoorbeeld ook .frl en .amsterdam).
2. Een strategie waarbij criteria niet vooraf vastgelegd zijn, maar via een vastgesteld
proces worden bepaald. Naast automatiseerbare en objectieve criteria kan het hierbij
ook gaan om criteria die om meer specifieke of individuele beoordeling vragen, zoals
criteria van culturele aard.
Een heldere definitie is noodzakelijk om duidelijkheid te verschaffen over het bereik
van het Nederlandse webdomein. Dit geeft rechthebbenden meer zekerheid, omdat het
zorgt voor grotere voorspelbaarheid en transparantie ten aanzien van wat binnen de
wettelijke kader gearchiveerd kan worden.
Beantwoording van de motie Dekker-Abdulaziz
De motie Dekker-Abdulaziz onderscheidt drie mogelijke obstakels voor archivering van
het.nl-domein en heeft de regering gevraagd deze in kaart te brengen en uit te zoeken
hoe deze te overkomen.
Wettelijke obstakels en hoe deze te overkomen
In 2021 hebben de onderzoekers van IViR reeds betoogd dat duurzame beschikbaarheid
van online informatie van belang is, bijvoorbeeld vanuit het perspectief van vrijheid
van meningsuiting, informatievrijheid en in het licht van het waarborgen van het recht
op wetenschap. Zij oordeelden destijds dat het legitiem en raadzaam is om maatregelen
te nemen die webharvesting mogelijk maken. Dit zal echter op zodanige wijze moeten
gebeuren dat andere fundamentele rechten niet te verregaand aangetast worden.7 IViR heeft daartoe al een aanzet gedaan. Het nu uitgevoerde onderzoek heeft geen
(nieuwe) fundamentele obstakels voor een (wettelijke) facilitering van webharvesting
langs deze lijnen blootgelegd. Wel moeten de randvoorwaarden voor het doorvoeren van
specifieke oplossingen nog beter in kaart gebracht worden.
Technische obstakels en hoe deze te overkomen
Zoals gezegd voeren verschillende erfgoedinstellingen in Nederland op kleine schaal
al webharvestingactiviteiten uit. Uit hun praktijk blijkt dat het technisch mogelijk
is om (delen van) het Nederlandse webdomein op te slaan, te bewaren en (beperkt) beschikbaar
te stellen. Er zijn daarmee op dit moment geen onoverkomelijke technische obstakels
voor het uitvoeren van webharvestingactiviteiten.
Financiële obstakels en hoe deze te overkomen
De instellingen die nu al webharvestingactiviteiten uitvoeren, maken daarvoor kosten
die ze dekken uit hun reguliere begroting. In het rapport wordt doorgerekend wat de
extra kosten zouden zijn als zij deze activiteiten zouden uitbreiden nadat ze (al
dan niet wettelijk) gefaciliteerd worden. De auteurs schatten deze extra kosten ruw
in op gemiddeld € 500.000 per jaar, maar dit is afhankelijk van het gekozen scenario
en de benodigde opslag over de jaren heen.
Het collectiebeleid van erfgoedinstellingen vormt in de praktijk de basis voor afwegingen
over de verdeling van middelen over verschillende taken. De keuze om kosten te maken
om webharvestingactiviteiten uit te voeren, beschouw ik als onderdeel van de afwegingen
die erfgoedinstellingen moeten maken bij de uitvoering van hun collectiebeleid. Daarbij
is het uitgangspunt dat de instellingen opereren binnen de huidige budgettaire kaders.
In het vervolgtraject wordt nader uitgewerkt of er financiële gevolgen zijn voor OCW
als gevolg van het wettelijk faciliteren van webharvesten en hoe deze mogelijke financiële
gevolgen binnen de OCW begroting opgevangen kunnen worden.
Beleidsreactie
Ik erken dat er met het harvesten van het Nederlandse web, een groot publiek belang
gemoeid is: de inhoud van het internet vormt (mede) het culturele erfgoed van Nederland,
en is een potentiële bron voor onderzoekers, nu en straks. Ik concludeer dat het wenselijk
is om de mogelijkheid tot het uitvoeren van webharvestingactiviteiten wettelijk te
faciliteren (zoals in scenario 1 of 2). Een wettelijke basis zorgt in mijn ogen voor
de beste balans tussen het informatie- en erfgoedbelang, het belang van (auteurs)rechthebbenden,
de bescherming van persoonsgegevens en de rechtszekerheid van zowel de rechthebbenden
als de partijen die webharvestingactiviteiten uitvoeren. Daarom start ik met de voorbereiding
van een wetstraject. Dit met als doel om de mogelijkheid tot wettelijke faciliteren
van webharvestingactiviteiten nader uit te werken.
In het consensusmodel (scenario 3) blijft er (rechts)onzekerheid bestaan voor alle
betrokken partijen, omdat een wettelijke grondslag voor het uitvoeren van webharvestingactiviteiten
ontbreekt. Tevens ontstaan er grote onzekerheden op het gebied van de bescherming
van persoonsgegevens, omdat er door de uitvoerende partijen waarschijnlijk geen beroep
kan worden gedaan op de uitzonderingsgronden van de AVG. Dit vind ik onwenselijk.
Bij een keuze voor de status quo (scenario 4) blijven de huidige drempels voor het
uitvoeren van webharvestingactiviteiten bestaan. Daarom heeft dit scenario niet mijn
voorkeur.
Vervolgproces
Ik ben voornemens om in 2026 te starten met de voorbereiding van een wetstraject.
Deze voorbereiding duurt tot eind 2027. Indien in deze fase blijkt dat er een concrete,
praktische route is naar wettelijke facilitering van webharvestingactiviteiten door
één of meer organisaties, wordt het wetstraject om dit mogelijk te maken begin 2028
gestart. Het streven is dan om het wetstraject eind 2029 af te ronden.
Nadere invulling
Verschillende vraagstukken moeten in het voorbereidende traject nog verder worden
uitgezocht. Enkele voorbeelden:
– Ten aanzien van scenario 2 zal in het voorbereidende traject gekeken worden in hoeverre
het mogelijk en wenselijk is om een wettelijke grondslag te creëren op basis waarvan
meerdere instellingen beredeneerde selecties kunnen uitvoeren. Erfgoedpartijen hebben
aangegeven dit van belang te vinden. Rechthebbenden wijzen in dit kader onder meer
op de noodzaak van duidelijkheid over welke partijen dan webharvestingactiviteiten
zouden kunnen uitvoeren en over de scope van beredeneerde selecties. In het voorbereidende
traject zal ook uitgezocht worden hoe voor die duidelijkheid gezorgd kan worden.
– Ten aanzien van scenario 1 en 2 vragen rechthebbenden om voorwaarden voor de beschikbaarstelling
van het geharveste materiaal. Ook de vraag hoe die voorwaarden juridisch verankerd
kunnen worden, zal meegenomen worden in het voorbereidende traject.
– Voor beide scenario’s moet nader worden uitgewerkt wat de reikwijdte is van het nationale
webdomein, inclusief de mate waarin dit juridisch dient te worden geëxpliciteerd.
– Daarnaast moet uitgezocht worden welke partij het beste geplaatst is om een nationale
domeincrawl uit te voeren. De bij het onderzoek betrokken erfgoedpartijen zien de
Koninklijke Bibliotheek als een geschikte kandidaat voor het uitvoeren van deze webharvestingactiviteit.
In het voorbereidende traject moet nagegaan worden hoe de mogelijkheid om een dergelijke
domeincrawl uit te voeren, juridisch goed belegd kan worden en wat dit organisatorisch
gezien vraagt van de betrokken partij.
Tot slot
Ik besef dat erfgoedinstellingen op korte termijn hun webharvestingactiviteiten verder
willen uitbreiden. Tegelijkertijd vind ik het van groot belang dat het proces richting
wettelijk faciliteren van webharvesting zorgvuldig verloopt, zodat er een duurzame
oplossing komt waarin de verschillende rechten en belangen goed worden geborgd én
die ook werkbaar is voor de partijen die webharvestingactiviteiten uitvoeren. Daartoe
zal in de komende jaren een zorgvuldige uitwerking volgen.
In de tussentijd kunnen webharvestingactiviteiten onder de huidige (beperkende) omstandigheden
doorgang vinden. Dit betekent dat erfgoedinstellingen die websites harvesten, hier
vooraf toestemming voor moeten vragen aan alle betrokken (auteurs)rechthebbenden.
Ik realiseer me dat de aanwas van webcollecties daarmee in de komende periode nog
beperkt zal zijn. Binnen de huidige wettelijke kaders is dit echter de beste manier
om de verschillende belangen die spelen, goed in balans te houden. Intussen blijf
ik alert op signalen van de betrokken partijen over de effecten van deze praktijk.
Eind 2027 wordt uw Kamer geïnformeerd over de uitkomsten van het voorbereidende traject.
De Minister van Onderwijs, Cultuur en Wetenschap, G. Moes
Ondertekenaars
-
Eerste ondertekenaar
G. Moes, minister van Onderwijs, Cultuur en Wetenschap