Een Nederlands consortium bouwt met 13,5 miljoen euro een eigen, AVG-proof taalmodel genaamd GPT-NL. Dit model is specifiek getraind op de Nederlandse taal en cultuur en draait op de nationale supercomputer Snellius, wat betekent dat gevoelige data binnen de EU-grenzen blijft. Het is geen publieke chatbot, maar een model dat organisaties in hun eigen AI-stack kunnen integreren voor specifieke, veilige toepassingen.

Wat er aan de hand is

Een team van 25 medewerkers bij onderzoeksinstituut TNO, onder leiding van productmanager Saskia Lensink, ontwikkelt het taalmodel GPT-NL. Het project kreeg in november 2023 groen licht en een subsidie van 13,5 miljoen euro van het ministerie van Economische Zaken. Naast TNO zijn het Nederlands Forensisch Instituut en ICT-coöperatie Surf betrokken. Surf stelde de rekenkracht van de nationale supercomputer Snellius beschikbaar voor de training. Sinds anderhalve maand draaien de eerste proefprojecten bij vier overheidsorganisaties en TNO zelf. Het ministerie van Binnenlandse Zaken onderzoekt bijvoorbeeld of GPT-NL de antwoorden van de gemeentelijke chatbot ‘Gem’ kan verbeteren. Lensink benadrukt dat het met dit budget gaat om een solide basis (“een Fiatje”) en niet om een topmodel (“een Ferrari”). De eerste keuze was om geen publieke chatbot te bouwen, maar een model dat organisaties zelf kunnen inzetten als aanvulling op hun bestaande AI-infrastructuur.

Wat dit betekent

Dit betekent een concreet alternatief voor Nederlandse bedrijven en organisaties die met AI willen werken maar worstelen met privacy (AVG), taalnauwkeurigheid en afhankelijkheid. Ten eerste biedt het een AVG-proof pad: omdat het model op Nederlandse infrastructuur draait, blijven gegevens binnen de EU, wat compliance eenvoudiger maakt. Ten tweede is het specifiek getraind op het Nederlands, wat kan leiden tot betere resultaten voor Nederlandstalige taken dan algemene internationale modellen. Ten derde vermindert het de strategische afhankelijkheid van Amerikaanse techgiganten als OpenAI en Google. Vooral voor sectoren waar vertrouwelijkheid en accurate Nederlandse taal cruciaal zijn – zoals de overheid, zorg, recht en financiële dienstverlening – kan dit een verschil maken. Het model is niet bedoeld als directe consumentendienst, maar als bouwsteen voor organisaties om zelf veilige toepassingen mee te ontwikkelen.

Hoe je dit kunt toepassen

De praktische toepassing hangt af van jouw situatie en de uiteindelijke beschikbaarheid van GPT-NL voor het MKB. Op basis van de doelstellingen van het project zijn dit mogelijke scenario’s voor de toekomst:

Als je in een sector werkt met strikte privacyregels, zoals de zorg of advocatuur. Je zou kunnen onderzoeken of een lokaal getraind model zoals GPT-NL, waarbij patiënt- of cliëntdata nooit een server in de VS passeren, een veiligere manier biedt om documenten samen te vatten of administratie te ondersteunen. Dit kan de compliance-last verlichten.

Als je een webshop of dienstverlener runt met veel Nederlandstalige klantcontacten. Een mogelijkheid is om te kijken of een specifiek op Nederlands getraind model nauwkeuriger en natuurlijker kan omgaan met klantvragen, reviews of productbeschrijvingen dan een algemeen model, wat de klanttevredenheid kan verhogen.

Als je een overheidsinstantie of non-profit bent die toegankelijke informatie moet verstrekken. Je zou kunnen overwegen om een model als GPT-NL te gebruiken om complexe beleidsteksten om te zetten in begrijpelijke taal voor burgers, in de wetenschap dat de verwerking volledig binnen de Nederlandse wetgeving plaatsvindt.

Als je als ontwikkelaar of IT-dienstverlener werkt voor het MKB. Een optie is om je te verdiepen in hoe je Europese, privacyvriendelijke AI-modellen kunt integreren in je aanbod. Dit kan een onderscheidend verkoopargument worden voor klanten die waarde hechten aan data-soevereiniteit.

Het is belangrijk te benadrukken dat GPT-NL zich nog in de proeffase bevindt bij een beperkt aantal organisaties. Voor directe toepassing in het MKB is het raadzaam de ontwikkelingen bij TNO en partners in de gaten te houden voor toekomstige licentie- of toegangsmogelijkheden.

Bron: Sprout