Het Nederlandse taalmodel GPT-NL ontwikkelt zich tot een serieus, soeverein alternatief voor grote commerciële AI’s zoals die van OpenAI. Het belangrijkste verschil zit in de bron: GPT-NL is uitsluitend getraind op data die rechtmatig zijn verkregen, veelal afkomstig van Nederlandse nieuwsmedia. Voor ondernemers en professionals die waarde hechten aan dataveiligheid, compliance en hoogwaardige Nederlandstalige verwerking, opent dit nieuwe mogelijkheden. Het model, een initiatief van TNO, NFI en SURF, is klaar met de voorbereidende training en wordt nu in de praktijk getest.
Een model gebouwd op Nederlandse grondslag
De kern van GPT-NL is de dataset. Waar internationale modellen vaak gevoed worden met alles wat online te vinden is, gebruikt dit model alleen materiaal met een duidelijke, rechtmatige herkomst. Volgens TNO is dit een fundamenteel ander uitgangspunt. Het doel is een generatieve AI te creëren die op een veilige manier kan omgaan met hooggevoelige informatie. Voor organisaties in sectoren zoals zorg, recht of overheidsdiensten, waar privacy en compliance niet onderhandelbaar zijn, kan dit een doorslaggevend voordeel zijn. Het model presteert volgens productmanager Saskia Lensink op taken zoals samenvatten al beter dan oudere generaties commerciële modellen.
Praktijktoepassingen bij launching customers
De ontwikkeling is nu de fase van praktijktesten ingegaan met een eerste groep gebruikers. Deze ’launching customers’ laten zien waar de kracht van een lokaal model kan liggen. De overheidsdienst Ictu test of GPT-NL haar chatbot Gem kan verbeteren. De website Overheid.nl vergelijkt de antwoorden van GPT-NL met die van haar huidige commerciële digitale assistent. Kennismanagementbureau PNA onderzoekt of het model kan helpen bij het schrijven van begrijpelijker teksten voor ambtenaren. Daarnaast test TNO zelf de on-premises inzet, wat cruciaal is voor werk met hoge eisen aan security. Het Nederlands Forensisch Instituut verfijnt het model specifiek op forensische data om te kijken of het betere resultaten behaalt bij het analyseren van terabytes aan bewijsmateriaal.
De schaal en het potentieel
Het project opereert op een bescheiden schaal met een budget van 13,5 miljoen euro en ongeveer twee dozijn betrokken mensen. Dit is klein vergeleken met de miljardeninvesteringen in Amerikaanse modellen. Die bescheidenheid is tegelijkertijd zijn kracht: het is een gerichte, controleerbare ontwikkeling met een duidelijk mandaat voor veiligheid en Nederlandse taal. Het toont aan dat een kwalitatief hoogstaand taalmodel niet per se het domein hoeft te zijn van techgiganten, maar ook vanuit een specifieke, lokale behoefte kan ontstaan.
Hoe kun je dit vandaag toepassen?
De concrete toepassing voor jouw bedrijf hangt af van je specifieke situatie en behoefte aan data-soevereiniteit. Een mogelijkheid is om de ontwikkelingen rond GPT-NL te volgen als je werkt met gevoelige, Nederlandstalige informatie en op zoek bent naar een alternatief voor de grote cloud-gebaseerde AI’s. Via geprompt.nl/stel-je-vraag kun je een vraag stellen die we uitwerken tot een artikel op maat.
De toepassingen in dit artikel zijn suggesties op basis van het bronartikel, geen gevalideerd advies.
Bron: Computable