Number10 schreef op donderdag 21 oktober 2021 @ 14:29:
[...]
Ik bedenk net dat we compleet offtopic aan het
Vermoedelijk doel je op
dit vonnis van de rechtbank over de marechaussee, maar of dat vonnis stand gaat houden betwijfel ik ten zeerste. In dat geval was er ook (volgens de rechtbank althans) soort van een grondslag, omdat er eerst een ander selectie plaatsvond en het in die gevallen een hulpmiddel was.
Yep, je hebt gelijk. Bedankt en excuses voor het zoeken.
Maar het is echt kletskoek natuurlijk. Het leidt er zoals je zelf noemt vooral toe dat sommige mensen keer op keer als 'verdacht' worden aangemerkt. terwijl er helemaal geen feitelijke aanleiding toe is.
Eens.
[...]
Maar mijn punt is los van de AI ellende en andere nare gevolgen dat er ook technisch iemand categorieën moet gaan aanbrengen in een database om iets te kunnen onderzoeken. Waarom zou je dat in vredesnaam gaan zitten doen en de keuze voor variabelen is nogal bepalend voor de uitkomst. Als je de schoenkleur niet codeert, dan is er ook niks te correleren. Maar goed ook, want het zegt natuurlijk niks, net als vage dingen als 'etniciteit' of 'cultuur'.
Ligt er aan. Machine Learning kan relatief simpel zijn: Je traint een model met data en wanneer klaar gooi je er soort gelijke data in en je krijgt terug hoe waarschijnlijk iets is.
Als je een model traint met schoenkleuren en hoeveel klinkers hun naam heeft dan krijg je een model terug waarmee je een potentieel moordenaar "kan vinden" op basis van schoenkleur. Je krijgt ook de waarschijnlijkheid terug.
Bij het aanleveren van de trainingsdata moet je wel classificeren (in dit geval een ja/nee) maar hoef je geen categorieën aan te brengen.
Probleem is wel dat met slechte data en/of slechte classificatie je natuurlijk ook een rampzalig model krijgt.
[...]
Dat laatste geloof ik niet. Sowieso is een 'profiel' al vaag, laat staan een 'etnisch' profiel. Wat is dat dan? Zie ook het vonnis wat dat betreft. De politie gaat toch ook niet op Oost- of Zuid-Nederlands accent profileren? Zie je het voor je? Iemand spreekt met een zachte g en dat zou dan iets zeggen over de kans op xyz?
Uh... NOS: Zuid-Limburg zoekt contactcentra-medewerkers: 'Klanten ervaren zachte g als prettig'
Meer voor de bühne dan voor jou en mij, maar toch even toelichting.
Een etniciteit is een sociaal-culturele identiteit met gezamenlijke kenmerken als nationaliteit, verwantschap, religie, taal, fysieke kenmerken, cultuur of geschiedenis en de daaraan ontleende normen en waarden die een groep mensen of een aantal bevolkingsgroepen verbindt.
En een profiel is niks anders dan eigenschappen van een persoon.
Het profiel van je vingers, in andere woorden vingerafdrukken, is een goed profiel om iemand te veroordelen als het overeenkomt met wat op het moordwapen zit. Echter hoeft die persoon nog steeds niet de dader te zijn.
Het profiel van cultuur is een zeer slecht profiel als de verdachte uit een land komt waar het gebruikelijk is om moordwapens te bezitten.
Het zijn vooral de vele datapunten (lees: profielen)
samen waarop een gewogen
aanname gemaakt kan worden. Ik ga hierbij even vanuit dat men het juist doet en dat de aanname niet direct leidt tot een conclusie. Big "if" uiteraard en ik ben me bewust dat ik de vele risico's onderbelicht laat.
Er wordt steeds gedaan alsof er een of andere predictieve waarde zit aan het verzamelen van allerlei variabelen, maar die moeten op z'n minst causaal gerelateerd zijn wil je er iets mee. Een signalement is uiteraard nuttig in de opsporing, maar verder toch niet? Hooguit gebruiken ze dat nog als bewijsmiddel, maar het coderen van lichaamskenmerken uit een signalement lijkt mij echt compleet onzinnig.
Ik denk te begrijpen waar je heen wilt, maar...
1. We hebben het over preventief en subjectief handelen. Die twee moeten we niet door elkaar halen
2. En directe correlatie (zoals "ik zag iets blauws uit de winkel rennen") en indirecte correlatie (zoals "bij de vorige diefstal was er ook iemand betrokken die iets groens droeg") zijn twee verschillende dingen.
Qua wat ik vermoed dat je punt is ben ik iets genuanceerde. Je kan het gebruiken, maar het is zeer risicovol omdat de trainingset al een preventief heeft en er altijd uitzonderingen zijn.
Oké, slecht voorbeeld
"Doubt—the concern that my views may not be entirely correct—is the true friend of wisdom and (along with empathy, to which it’s related) the greatest enemy of polarization." -- Václav Havel