Ik wil dat het Dunning-Kruger-effect echt is. Voor het eerst beschreven in een baanbrekende 1999 paper door David Dunning en Justin Kruger, dit effect is de lieveling van journalisten die willen uitleggen waarom domme mensen niet weten dat ze dom zijn geweest. Er is zelfs een video van een fantastische pastiche van Turandots beroemde aria, Nessun dorma, die het Dunning-Kruger effect verklaart. “Ze weten niet, “zegt de operazanger op het hoogtepunt,” dat ze niet weten.,”
Ik was van plan om een heel kort artikel te schrijven over het Dunning-Kruger effect en het voelde als het schieten van vis in een vat. Hier is het effect, hoe het werd ontdekt, wat het betekent. Einde verhaal.
maar toen ik de academische literatuur dubbel controleerde, begon twijfel te sluipen. Terwijl ik probeerde de kritiek die was geuit op de oorspronkelijke studie te begrijpen, viel ik in een konijnenhol, sprak met een paar statistiekgerichte mensen, correspondeerde met Dr.Dunning zelf, en probeerde te begrijpen of onze hersenen echt bevooroordeeld waren om onze competentie te overschatten in activiteiten waar we slecht in zijn…, of als het gevierde effect slechts een luchtspiegeling was, veroorzaakt door de eigenaardige manier waarop we met getallen kunnen spelen.
hebben we ons vertrouwen in het Dunning-Kruger-effect overdreven?
een verkeerd begrepen effect
de belangrijkste fout die mensen maken over het Dunning-Kruger effect, heeft volgens Dr.Dunning te maken met wie er het slachtoffer van wordt. “Het effect gaat over ons, niet over hen,” schreef hij aan mij. “De les van het effect ging altijd over hoe we nederig en voorzichtig over onszelf moesten zijn.”Het Dunning-Kruger effect gaat niet over domme mensen., Het gaat vooral over ons allemaal als het gaat om dingen waar we niet erg competent in zijn.
In een notendop werd het Dunning-Kruger effect oorspronkelijk gedefinieerd als een vooroordeel in ons denken. Als ik slecht ben in Engelse grammatica en ik moet een quiz beantwoorden om mijn kennis van engelse grammatica te testen, zou dit vooroordeel in mijn denken Me, volgens de theorie, doen geloven dat ik een hogere score zou krijgen dan ik eigenlijk zou doen. En als ik uitblink in Engelse grammatica, dicteert het effect dat ik waarschijnlijk lichtjes zou onderschatten hoe goed ik het zou doen., Ik zou kunnen voorspellen dat ik een 70% score zou krijgen terwijl mijn werkelijke score 90% zou zijn. Maar als mijn werkelijke score 15% was (omdat ik slecht ben in grammatica), zou ik hoger over mezelf denken en een score van 60% voorspellen. Deze discrepantie is het effect, en men denkt dat het te wijten is aan een specifiek probleem met het vermogen van onze hersenen om zijn vaardigheden te beoordelen.
Dit is wat studenten aan het eind van de jaren negentig hebben meegemaakt voor Dunning en Kruger ‘ s onderzoeksproject. er waren beoordelingen van grammatica, humor en logisch redeneren., Iedereen werd gevraagd hoe goed ze dachten dat ze deden en iedereen werd ook objectief beoordeeld, en de twee werden vergeleken.
sindsdien zijn vele studies uitgevoerd die dit effect op andere gebieden van kennis hebben gemeld. Dr. Dunning vertelt me dat hij gelooft dat het effect “meer te maken heeft met verkeerd geïnformeerd zijn in plaats van ongeïnformeerd.”Als mij het kookpunt van Mercurius wordt gevraagd, is het duidelijk dat mijn hersenen het antwoord niet hebben. Maar als men mij vraagt wat de hoofdstad van Schotland is, denk ik misschien dat ik genoeg Weet om Glasgow te zeggen, maar het blijkt Edinburgh te zijn., Dat is verkeerde informatie en het drukt op die vertrouwensknop in mijn hersenen.
dus zaak gesloten, toch? Integendeel. In 2016 en 2017 werden twee papers gepubliceerd in een wiskundetijdschrift genaamd Numeracy. De auteurs stelden daarin dat het Dunning-Kruger-effect een luchtspiegeling was. En daar ben ik het mee eens.
het effect is in de ruis
de twee papers, door Dr.Ed Nuhfer en collega ‘ s, betoogden dat het Dunning-Kruger effect kan worden gerepliceerd met behulp van willekeurige gegevens. “We geloofden toen allemaal dat het papier geldig was,” vertelde Dr. Nuhfer me via e-mail., “De redenering en het argument waren zo logisch. We hebben het nooit weerlegd; we waren zelfs fans van dat papier.”In Dr. Nuhfer’ s eigen papers, die zowel computergegenereerde gegevens als resultaten van werkelijke mensen die een wetenschappelijke geletterdheid test, zijn team weerlegd de bewering dat de meeste mensen die ongeschoolde zijn zich niet bewust zijn van het (“een klein aantal zijn: we zagen ongeveer 5-6% dat past in onze gegevens”) en in plaats daarvan toonde aan dat zowel experts en beginners onderschatten en overschatten hun vaardigheden met dezelfde frequentie. “Het is gewoon dat experts doen dat over een smaller bereik,” schreef hij me.,
Het duurde weken om mijn hersenen om dit alles heen te wikkelen. Ik rekruteerde een man-en-vrouw team, Dr. Patrick E. McKnight (van de Afdeling Psychologie van George Mason University, ook in de adviesraad van Sense over wetenschap en STATS.org) en Dr. Simone C. McKnight (van Global Systems Technologies, Inc.), om me te helpen begrijpen wat er aan de hand was. Patrick McKnight geloofde niet alleen in het bestaan van het Dunning-Kruger-effect: hij leerde het om zijn studenten te waarschuwen om zich bewust te zijn van wat ze eigenlijk wisten versus wat ze dachten te weten. Maar na het repliceren van Dr., Nuhfer ’s bevindingen met behulp van een ander platform (de statistical computing language R in plaats van Nuhfer’ s Microsoft Excel), raakte hij ervan overtuigd dat het effect was slechts een artefact van hoe het ding dat werd gemeten inderdaad werd gemeten.
We hadden lange gesprekken over dit terwijl ik bleef pushen. Als scepticus, ik ben gemakkelijk verleid door verhalen van het soort “alles wat je weet over dit is verkeerd.”Dat is mijn vooroordeel. Om het te overwinnen, bleef ik de advocaat van de duivel spelen met de McKnights om er zeker van te zijn dat we niets zouden vergeten., Elke keer als ik voelde dat mijn begrip kristalliseerde, de twijfel zou kruipen in de volgende dag en mijn discussie met de McKnights zou hervatten.
uiteindelijk bereikte ik een punt waar ik er vrij zeker van was dat het Dunning-Kruger-effect geen vooroordeel in ons denken was, maar slechts een artefact was. Hier is dan de eenvoudigste verklaring die ik heb voor waarom het effect echt lijkt te zijn.
om een effect van de menselijke psychologie echt te laten zijn, kan het niet rigoureus worden gerepliceerd met behulp van willekeurige ruis., Als het menselijk brein voorbestemd was om hoofden te kiezen wanneer een munt wordt omgedraaid, zou je dit kunnen vergelijken met willekeurige voorspellingen (kop of munt) gemaakt door een computer en de vooringenomenheid zien. Een mens zou meer hoofden roepen dan de computer zou doen omdat de computer willekeurige weddenschappen maakt terwijl de mens bevooroordeeld is naar hoofden. Met het Dunning-Kruger effect is dit niet het geval. Willekeurige gegevens bootsen het effect echt goed na.
Het effect zoals oorspronkelijk beschreven in 1999 maakt gebruik van een zeer eigenaardig type grafiek., “Deze grafiek, voor zover ik weet, is vrij ongebruikelijk voor de meeste gebieden van de wetenschap,” Patrick McKnight vertelde me. In het originele experiment deden de studenten een test en werden ze gevraagd om hun score te raden. Daarom had elke student twee datapunten: de score die ze dachten te krijgen (zelfbeoordeling) en de score die ze daadwerkelijk kregen (prestaties). Om deze resultaten te visualiseren, scheidden Dunning en Kruger iedereen in kwartielen: zij die presteerden in de onderste 25%, zij die scoorden in de bovenste 25%, en de twee kwartielen in het midden., Voor elk kwartiel werden de gemiddelde Prestatiescore en de gemiddelde zelfbeoordelde score uitgezet. Dit resulteerde in de beroemde Dunning-Kruger grafiek.
op deze manier uitgezet, lijkt het erop dat degenen in de onderste 25% dachten dat ze het veel beter deden dan ze deden, en degenen in de top 25% onderschat hun prestaties. Men dacht dat dit te wijten was aan het menselijk brein: de ongeschoolden zijn zich er niet van bewust., Maar als we het menselijk brein uit de vergelijking verwijderen, krijgen we dit:
de bovenstaande Dunning-Kruger grafiek werd gemaakt door Patrick McKnight met behulp van computer gegenereerde resultaten voor zowel zelf-beoordeling en prestaties. De nummers waren willekeurig. Er was geen vooroordeel in de codering dat deze fictieve studenten zou doen vermoeden dat ze het echt goed hadden gedaan toen hun werkelijke score erg laag was. En toch kunnen we zien dat de twee lijnen griezelig lijken op die van Dunning en Kruger ‘ s baanbrekende experiment. Een soortgelijke simulatie werd gedaan door Dr., Phillip Ackerman en collega ‘ s drie jaar na de oorspronkelijke Dunning-Kruger paper, en de resultaten waren vergelijkbaar.
Het meten van iemands perceptie van iets, inclusief zijn eigen vaardigheden, is beladen met moeilijkheden. Hoe goed ik denk dat ik deed op mijn test vandaag zou kunnen veranderen als het hele ding werd gedaan morgen, wanneer mijn stemming kan verschillen en mijn zelfvertrouwen kan wankelen. Deze meting van de zelfbeoordeling is dus tot op zekere hoogte onbetrouwbaar., Deze onbetrouwbaarheid-soms enorm, soms niet-betekent dat elk echt psychologisch effect dat wel bestaat, als kleiner wordt gemeten in de context van een experiment. Dit wordt demping genoemd als gevolg van onbetrouwbaarheid. “Scores van boeken, artikelen en hoofdstukken benadrukken het probleem met meetfouten en verzwakte effecten,” Patrick McKnight schreef me. In zijn simulatie met willekeurige metingen wordt het zogenaamde Dunning-Kruger-effect sterker zichtbaar naarmate de meetfout toeneemt., “We hebben geen geval in de geschiedenis van de wetenschappelijke ontdekking,” vervolgde hij, “waar een bevinding verbetert door het verhogen van de meetfout. Niemand.”
verbreekt de spreuk
wanneer ik “Dunning-Kruger effect” plug in Google News, krijg ik meer dan 8.500 hits van media zoals de New York Times, New Scientist en de CBC. Velen onderschrijven het effect gewoon als een echte vooringenomenheid van de hersenen, dus het is geen wonder dat mensen zich niet bewust zijn van de academische kritiek die bestaat sinds het effect voor het eerst werd gepubliceerd. Het is niet alleen Dr. Nuhfer en zijn Rekenpapieren., Andere academische critici hebben bijvoorbeeld met de vinger gewezen op regressie naar het gemiddelde.
maar zoals Patrick McKnight aangeeft, treedt regressie tot het gemiddelde op wanneer dezelfde maat in de loop van de tijd wordt genomen en we de evolutie ervan volgen. Als ik mijn temperatuur elke ochtend opneem en op een dag een koorts piek, zal diezelfde maatregel (hopelijk) de volgende dag dalen en terugkeren naar zijn Gemiddelde waarde als mijn koorts afneemt. Dat is regressie naar het gemiddelde., Maar in de context van het Dunning-Kruger-effect wordt niets gemeten in de tijd, en zelfbeoordeling en prestaties zijn totaal verschillende maten, dus regressie tot het gemiddelde mag niet van toepassing zijn. De onbetrouwbaarheid van de self-assessment meting zelf is echter een sterke kanshebber om een goed deel van wat Dunning, Kruger, en andere wetenschappers die sindsdien hebben gemeld dit effect in andere contexten eigenlijk beschreven verklaren.
Dit verhaal is nog niet voorbij., Er zal ongetwijfeld meer inkt vloeien in wetenschappelijke tijdschriften over dit onderwerp, dat toch een gezond onderdeel is van wetenschappelijk onderzoek. Het bestuderen van protonen en elektronen is relatief eenvoudig omdat deze deeltjes geen eigen geest hebben; het bestuderen van de menselijke psychologie, in vergelijking, is veel moeilijker omdat het aantal variabelen dat wordt jongleren ongelooflijk hoog is. Het is dus heel gemakkelijk voor bevindingen in de psychologie om echt te lijken als ze dat niet zijn.
zijn er domme mensen die zich niet realiseren dat ze dom zijn? Zeker, maar dat was nooit waar het Dunning-Kruger effect over ging., Zijn er mensen die zeer zelfverzekerd en arrogant zijn in hun onwetendheid? Absoluut, maar ook hier meten Dunning en Kruger in 1999 geen vertrouwen of arrogantie. Er zijn andere effecten bekend bij psychologen, zoals de overmoed bias en de beter-dan-gemiddelde bias (waar de meeste automobilisten geloven dat ze ver boven het gemiddelde, wat geen wiskundige zin heeft), dus als het Dunning-Kruger effect overtuigend wordt aangetoond dat niets anders dan een luchtspiegeling, het betekent niet dat het menselijk brein is brandschoon., En als onderzoekers blijven geloven in het effect tegenover zware kritiek, is dit geen paradoxaal voorbeeld van het Dunning-Kruger-effect. In de originele klassieke experimenten kregen studenten geen feedback bij het maken van hun zelfbeoordeling. Het is eerlijk om te zeggen dat onderzoekers zich nu in een andere positie bevinden.
De woorden “Dunning-Kruger effect” zijn gebruikt als een bezwering door zowel journalisten als sceptici om domheid en incompetentie weg te verklaren. Het is misschien tijd om die spreuk te verbreken.,
Take-home message:
– Het Dunning-Kruger – effect werd oorspronkelijk beschreven in 1999 als de observatie dat mensen die slecht zijn in een bepaalde taak denken dat ze veel beter zijn dan ze zijn, terwijl mensen die er erg goed in zijn de neiging hebben hun competentie te onderschatten
-Het Dunning-Kruger-effect ging nooit over “domme mensen die niet weten dat ze dom zijn” of over “onwetende mensen die erg arrogant zijn en vertrouwen hebben in hun gebrek aan kennis.,”
– omdat het effect kan worden gezien in willekeurige, computer-gegenereerde gegevens, is het misschien geen echte fout in ons denken en bestaat het dus niet echt
@CrackedScience