Uitbijter
Een uitbijter is een kwantitatief gegeven dat ver van het gemiddelde afligt. Vaak wordt de maximale afwijking op 3 standaarddeviaties gezet, maar dat is niet echt terecht. Een belangrijke vraag is wat je met een uitbijter moet doen. Moet je hem weglaten, laten staan , of ....
Stel dat in een onderzoek de volgende reeks gegevens is gevonden:
In deze tabel valt op dat die ene persoon wel een erg hoog maandelijks inkomen heeft. Dit is een echte uitbijter: de waarde ligt ver van het gemiddelde en ook zonder dat te berekenen is dat meer dan 3 standaarddeviaties.
Eerst nagaan of de waarde van de uitbijter correct is
Het is onduidelijk waar die aparte score van die uitbuiter aan ligt. Het kan zijn dat er bij het invoeren van de gegevens een typ-fout is gemaakt. Als dat kan moet je dat opzoeken in de originele vragenlijst of scoreformulier en als het fout is moet je de correcte score opnemen in je databestand. Het kan ook de werkelijke waarde zijn: deze persoon verdient inderdaad zo veel. Iemand kan bijvoorbeeld zijn school niet hebben afgemaakt maar heeft wel een eigen bedrijf opgezet en verdient daar goed mee.
De uitbijter weglaten?
Na de vraag of het een correcte waarde is, komt er de vraag wat je er als onderzoeker mee moet. Als je het weglaat tast je de werkelijkheid aan, want het is wel een reëel gegeven. Als je het laat staan, zouden de resultaten uit de statische analyses een verkeerd algemeen beeld kunnen opleveren.
Mijn advies
Mijn advies is: doe de analyses twee keer. Een keer met en een keer zonder de uitbijters.
© Foeke van der Zee (versie 2023). hulpbijonderzoek.nl/online-woordenboek
- specialist in Onderzoek en Statistiek
- auteur van boeken over onderzoeksmethodologie
- oprichter van en coach bij Hulp bij Onderzoek
Aan uitbijter gerelateerde trefwoorden:
- standaarddeviatie
- representativiteit
Uitbijters kunnen de representativiteit aantasten. Uitbijters weglaten ook. In ons paper beschrijven we 6 gangbare opvattingen over representativiteit. Naar mijn mening is er slechts één correct.