vrijdag 5 oktober 2018

Machineleren en Facebook.

Terugkomend op de blog van 14 dagen geleden, gaan we hier verder in op machineleren. Gedragingen van mensen op de sociale media, kunnen gemeten worden en in verband gebracht worden met resultaten van (psychologische) testen. Eén van de meest beroemde voorbeelden vormt het onderzoek van Youyou et al. (2015) waarin zij het geven van een like op een item in verband brachten met de 5 kenmerken van persoonlijkheid die het Big5 persoonlijkheidsmodel onderscheidt: extraversie, vriendelijkheid, openheid, zorgvuldigheid en emotionele stabiliteit. Wat is er nodig om een machine te kunnen laten "leren" welke items indien ze geliked worden bijdragen aan welk aspect van persoonlijkheid?

Ten eerste moeten items minimaal 25 likes hebben, het liefst aanzienlijk meer. Ten tweede moeten we van heel veel gebruikers zowel alle likes hebben, als de uitslagen van een Big5 persoonlijkheidstest. De persoonlijkheidstest vormt het uitgangspunt, want de machine (het algoritme) wordt vanuit deze data gesuperviseerd. Mensen die extravert zijn, bijvoorbeeld "liken" items met spetterende actie wel, en meer statische beelden niet (of iets willekeurig anders). Het algoritme stelt een op zichzelf eenvoudige vergelijking op: 

Vriendelijkheid = a(item-x) + b(item-y) ... zn(item-n) 

Dit wordt het least absolute shrinkage and selection operator (Lasso) algoritme genoemd. De coëfficiënten (a, b etc.) in de vergelijking kunnen een positieve of een negatieve waarde hebben. Waardering van plaatje item-x, of gebeurtenis item-y hangt positief, of negatief samen met de eigenschap vriendelijkheid. Juist doordat er heel veel data is, kan met het algoritme vrij precies ingeschat worden welke items positief, of negatief laden op elk van de 5 vermeende persoonskenmerken, en welke eigenschappen er in feite niet toe doen. Van eigenschappen die er niet toe blijken te doen, of slechts een beetje, wordt de coëfficiënt op 0 gezet (shrinkage, krimpen). Van de eigenschappen die er wel toe doen, wordt vervolgens de coëfficiënt systematisch versterkt. Op deze wijze "construeert" het algoritme dus als het ware een reeks items waarvan het wel of niet "liken" geldt als een alternatieve versie van de persoonlijkheidstest. Het aantal componenten in de Lasso vergelijking wordt gelimiteerd: coëfficiënten boven een bepaalde waarde (criterium) worden "versterkt", beneden een bepaalde waarde op 0 gezet en zo uit de vergelijking gehaald. Het criterium kan aan de hand van het maximaal aantal toegestane componenten worden bepaald.

In het onderzoek van Youyou et al kon het algoritme vanaf 70 likes de persoonlijkheid beter voorspellen dan vrienden, bij 150 likes beter dan familieleden en bij 300 likes beter dan de proefpersoon zelf. Uiteraard werkt dit alleen bij items die zeer veel in de sociale netwerken zijn gedeeld en indien er van een grote groep mensen de resultaten van de 5 subschalen van de big5 bekend zijn. Echter, en daar zit het gevaar van dit type onderzoek, de fit wordt nooit beter dan het model dat als supervisor geldt, dus hier de Big5 persoonlijkheidstest. Het gegeven dat de Big 5 ooit ontworpen is door middel van Likertscale vragen die via een 5 factorenanalyse model zijn gerangschikt, draagt bij aan de onderscheidenheid van de 5 sub schalen, maar zegt niets over de werkelijkheid van de persoonlijkheidsstructuur. Juist omdat de big 5 op grond van factoranalyse is ontstaan, is het niet gek dat de 5 items tamelijk onderscheidend samenhangen met andere patronen van menselijk gedrag.

Het zou een denkfout zijn, om in het vinden van correspondentie tussen de 5 persoonlijkheidsfactoren en door patroonherkenners gevonden clusters een rechtvaardiging van het persoonlijkheidsmodel te vinden. We weten bijvoorbeeld niet of de eigenschappen wel echt over bijvoorbeeld introversie of extraversie gaan, of iemand niet beide eigenschappen tegelijk kan bezitten, maar afhankelijk van de context 1 van de 2 eigenschappen kan tonen, of de eigenschappen over de tijd veranderen, of zelfs wat de eigenschappen precies betekenen. Het machineleer algoritme kent de persoon niet beter dan de collega's, de vrienden of de persoon zelf. De machine kan "slechts" na voldoende "supervised learning" trials (iteraties) de correlatie tussen het klikgedrag op Facebook en de gescoorde Big5 factoren beter bepalen dan personen. Predictief vervangt ze hiermee de Big5 vragenlijst. Maar dichter bij de persoonlijkheid van mensen dan met de Big5 vragenlijst komen we hier niet mee. Garbage in stays garbage out. Met andere woórden, uiteindelijk blijft psychologie een vak van het verhaal, van het argument, ook al kan datamining/machineleren enorm helpen!

Geen opmerkingen:

Een reactie posten

Ik ben er weer! Een jaar geleden hield het op. Als je spreekt van hoofd en hart, was ik volledig gaan samenvallen met mijn hoofd. De verbind...