Dummy-variabele of indicatorvariabele
Een dummy-variabele is een indicator-variabele die de waarde 0 of 1 kan hebben. De waarde 0 betekent niet aanwezig of niet van toepassing en de waarde 1 juist wel van toepassing of aanwezig.
In regressieanalyse wordt (normaliter) alleen gebruik gemaakt van variabelen op interval of ratio niveau. Het kan echter voorkomen dat er een variabele in het analysemodel moet worden opgenomen die op nominaal niveau is gemeten. Een voorbeeld van een dergelijke variabele is het geslacht van de respondent. Deze variabele kan in het analysemodel worden opgenomen als een dummy-variabele met de waarden 0 en 1.
Het kan ook voorkomen dat de variabele gemeten is op 3 niveaus. De opleiding van de respondent kan zijn vastgesteld als laag, midden of hoog. In dat geval moet je gebruik maken van twee dummy-variabelen. Het opnemen van een dummy-variabele in een regressieanalyse en het weglaten van de variabelen op interval en ratio niveau, verandert de statistische analyse in een variantieanalyse.
Rekentechnisch liggen variantieanalyse en regressieanalyse dus dicht tegen elkaar aan. Wil je een dummy-variabele als een interactievariabele opnemen dan moet je ook die variabele eerst centreren of standaardiseren, want vermenigvuldigen met 0 leidt per definitie tot 0 en vermenigvuldigen met 1 levert de waarde van de andere op. Dat leidt tot rare, onbetrouwbare uitkomsten in de regressieanalyse. Dit is overigens een visie die nog niet algemeen (door iedere docent) wordt gedeeld.
Hoe gebruik je een dummy-variabele in regressieanalyse?
Dat is te veel om hier in het kort te vertellen. In onze Cursus Statistiek en SPSS wordt veel aandacht besteed aan het gebruik van dummy's. Voor meer informatie is het raadzaam deze video's te bekijken.
© Foeke van der Zee (versie 2023). hulpbijonderzoek.nl/online-woordenboek
- specialist in Onderzoek en Statistiek
- auteur van boeken over onderzoeksmethodologie
- oprichter van en coach bij Hulp bij Onderzoek
Aan dummy-variabele gerelateerde trefwoorden:
- het niveau van een variabele (4 niveaus: nominaal, ordinaal, interval en ratio)
- univariate regressieanalyse (slechts 1 voorspellende variabele)
- multipele regressieanalyse (met meerdere voorspellende variabelen)
- variantieanalyse