Zijn telefoon bleef maar overgaan, vertelde dataspecialist Jesse Luk, nadat NRC Handelsblad een lang artikel publiceerde over zijn software om bijstandsfraude op te sporen. Drie Nederlandse gemeenten testen inmiddels of ze met het pakket van Totta Datalab de pakkans van fraudeurs kunnen vergroten.
Totta heeft zelflerende software ontwikkeld, die gevoed is met de gegevens van duizenden geregistreerde bijstandsfraudeurs. Hun datapatronen zijn in kaart gebracht, en daaruit is een algoritme gedestilleerd. Nu kan Totta’s model op basis van het verleden de huidige fraudeurs herkennen. Daarnaast kijkt de data-analyse naar uitschieters, via een zogeheten anomaliedetector: daarmee identificeren ze mensen die flink van het gemiddelde afwijken. Totta’s aanname is dat ook zij fraudeurs zijn.
Nadat Totta’s data-analyse mogelijke fraudeurs heeft aangewezen, zoeken controleurs uit of de verdenking terecht is. Dat moet ook wel: bij zulke beslissingen is de menselijke toets verplicht. Een computer mag niet zelfstandig beslissen dat iemands uitkering moet worden gestopt, noch vaststellen dat iemand een misdrijf heeft begaan.
Hoe accuraat is Totta’s analyse? Luk is opgetogen: van de honderd mogelijke fraudeurs die zijn model aanwijst, stellen controleurs nadien bij de helft metterdaad fraude vast. Maar daarbij zitten ook gevallen die de gemeenten al ontdekt hadden. De toegevoegde waarde schat Luk op 25 tot 30 procent.
Maar dat betekent ook – en dat is vrij ernstig – dat Totta in de helft van de gevallen mensen als mogelijke fraudeurs aanwijst, terwijl er na uitgebreid onderzoek niets van die beschuldiging kan worden hardgemaakt. Daarover haalt Totta de schouders op: bij de helft waarbij nader onderzoek géén fraude aantoonde, konden toch nog best fraudeurs zitten, stelt Luk. Mogelijk was het menselijke onderzoek simpelweg minder effectief dan zijn algoritmes…?
Op een bijeenkomst met Totta afgelopen week in Pakhuis de Zwijger vroeg ik door. Is het niet vreemd dat zelfs nadat menselijk onderzoek – waarbij bovendien veel meer datasets in stelling kunnen worden gebracht dan Totta mag gebruiken – Totta eerder twijfelt aan de capaciteiten en middelen van de controleurs, dan aan zijn eigen algoritmes? Is het niet een schending van burgerrechten dat mensen nu worden aangemerkt als verdachten, op basis van gegevens over andermans gedrag in het verleden? En is het geen ondermijning van rechtsstatelijke principes, wanneer een invasief onderzoek – want invasief is het per definitie, wat die controleurs doen – nu niet langer worden getriggerd door daadwerkelijke, concrete aanwijzingen, maar op grond van een theoretisch vermoeden?
Daar had Luk niet echt antwoord op. Mooi toch dat we fraude zo beter kunnen opsporen? En hun datamodel was zelflerend, dan haal je die systeemfoutjes er toch uiteindelijk vanzelf uit? Maar een fijn verdienmodel is het wel, die ondermijning van de rechtsstaat.