Terugkomend op de blog van 14 dagen
geleden, gaan we hier verder in op machineleren. Gedragingen van mensen op de
sociale media, kunnen gemeten worden en in verband gebracht worden met
resultaten van (psychologische) testen. Eén van de meest beroemde voorbeelden
vormt het onderzoek van Youyou et al. (2015) waarin zij het geven van een like
op een item in verband brachten met de 5 kenmerken van persoonlijkheid die het
Big5 persoonlijkheidsmodel onderscheidt: extraversie, vriendelijkheid,
openheid, zorgvuldigheid en emotionele stabiliteit. Wat is er nodig om een
machine te kunnen laten "leren" welke items indien ze geliked worden
bijdragen aan welk aspect van persoonlijkheid?
Ten eerste moeten items minimaal 25 likes hebben, het liefst aanzienlijk meer. Ten tweede moeten we van heel veel gebruikers zowel alle likes hebben, als de uitslagen van een Big5 persoonlijkheidstest. De persoonlijkheidstest vormt het uitgangspunt, want de machine (het algoritme) wordt vanuit deze data gesuperviseerd. Mensen die extravert zijn, bijvoorbeeld "liken" items met spetterende actie wel, en meer statische beelden niet (of iets willekeurig anders). Het algoritme stelt een op zichzelf eenvoudige vergelijking op:
Vriendelijkheid = a(item-x) + b(item-y) ... zn(item-n)
Dit wordt het least absolute shrinkage and selection
operator (Lasso) algoritme genoemd. De coëfficiënten (a, b etc.) in de
vergelijking kunnen een positieve of een negatieve waarde hebben. Waardering
van plaatje item-x, of gebeurtenis item-y hangt positief, of negatief samen met
de eigenschap vriendelijkheid. Juist doordat er heel veel data is, kan met het
algoritme vrij precies ingeschat worden welke items positief, of negatief laden
op elk van de 5 vermeende persoonskenmerken, en welke eigenschappen er in feite
niet toe doen. Van eigenschappen die er niet toe blijken te doen, of slechts
een beetje, wordt de coëfficiënt op 0 gezet (shrinkage, krimpen). Van de
eigenschappen die er wel toe doen, wordt vervolgens de coëfficiënt systematisch
versterkt. Op deze wijze "construeert" het algoritme dus als het ware
een reeks items waarvan het wel of niet "liken" geldt als een
alternatieve versie van de persoonlijkheidstest. Het aantal componenten in de
Lasso vergelijking wordt gelimiteerd: coëfficiënten boven een bepaalde waarde
(criterium) worden "versterkt", beneden een bepaalde waarde op 0
gezet en zo uit de vergelijking gehaald. Het criterium kan aan de hand van het
maximaal aantal toegestane componenten worden bepaald.
In het onderzoek van Youyou et al kon het algoritme
vanaf 70 likes de persoonlijkheid beter voorspellen dan vrienden, bij 150 likes
beter dan familieleden en bij 300 likes beter dan de proefpersoon zelf.
Uiteraard werkt dit alleen bij items die zeer veel in de sociale netwerken zijn
gedeeld en indien er van een grote groep mensen de resultaten van de 5
subschalen van de big5 bekend zijn. Echter, en daar zit het gevaar van dit type
onderzoek, de fit wordt nooit beter dan het model dat als supervisor geldt, dus
hier de Big5 persoonlijkheidstest. Het gegeven dat de Big 5 ooit ontworpen is
door middel van Likertscale vragen die via een 5 factorenanalyse model zijn
gerangschikt, draagt bij aan de onderscheidenheid van de 5 sub schalen, maar
zegt niets over de werkelijkheid van de persoonlijkheidsstructuur. Juist omdat
de big 5 op grond van factoranalyse is ontstaan, is het niet gek dat de 5 items
tamelijk onderscheidend samenhangen met andere patronen van menselijk gedrag.
Het zou een denkfout zijn, om in het vinden van
correspondentie tussen de 5 persoonlijkheidsfactoren en door patroonherkenners
gevonden clusters een rechtvaardiging van het persoonlijkheidsmodel te vinden.
We weten bijvoorbeeld niet of de eigenschappen wel echt over bijvoorbeeld introversie
of extraversie gaan, of iemand niet beide eigenschappen tegelijk kan bezitten,
maar afhankelijk van de context 1 van de 2 eigenschappen kan tonen, of de
eigenschappen over de tijd veranderen, of zelfs wat de eigenschappen precies
betekenen. Het machineleer algoritme kent de persoon niet beter dan de
collega's, de vrienden of de persoon zelf. De machine kan "slechts"
na voldoende "supervised learning" trials (iteraties) de correlatie
tussen het klikgedrag op Facebook en de gescoorde Big5 factoren beter bepalen
dan personen. Predictief vervangt ze hiermee de Big5 vragenlijst. Maar dichter
bij de persoonlijkheid van mensen dan met de Big5 vragenlijst komen we hier
niet mee. Garbage in stays garbage out. Met andere woórden, uiteindelijk
blijft psychologie een vak van het verhaal, van het argument, ook al kan
datamining/machineleren enorm helpen!
Geen opmerkingen:
Een reactie posten