Cronbachs alfa

Dit is de formule voor Cronbachs alfa

Laten we het eerst eens abstract zeggen: Cronbachs alfa is een maat voor interne consistentie of voor de homogeniteit van de vragen die je hebt opgenomen in een vragenlijst of test. Een hoge score, zeg groter dan 0,70, wijst op een hoge mate van betrouwbaarheid zodat je een somscore kunt maken. Iedereen die veel onderzoek verricht, snapt meteen wat hier bedoeld wordt, maar als beginnend onderzoeker zul je je achter de oren krabben en je afvragen wat hier nu allemaal staat. Dat leggen we je graag even uit.

In wat voor situatie bereken je Cronbachs alfa

Je kunt je voorgenomen hebben de tevredenheid over de woning te onderzoeken. Je kunt dan de vraag stellen "Hoe tevreden bent u met de woning waar u momenteel woont?" met vijf antwoordmogelijkheden die lopen van heel tevreden tot heel ontevreden. Dan krijg je niet zo'n genuanceerd beeld. De meeste mensen zullen zeggen dat ze tevreden zijn met hun woning. Als dat 80% van de respondenten is, dan heb je een grove maat die bovendien ook heel weinig varieert en daardoor zullen analyses met deze variabele niet veel statistische significante resultaten vertonen. Dat kan beter.


Daarom kun je de vraag ook een aantal keer stellen, maar dan met kleine verschillen, zoals:

- In welke mate bent u tevreden met de woonkamer?

- In welke mate bent u tevreden met de keuken?

- In welke mate bent u tevreden met de slaapkamers?

- In welke mate bent u tevreden met het onderhoud van de woning?

- In welke mate bent u tevreden met de tuin?

- In welke mate bent u tevreden met het balkon?

- In welke mate bent u tevreden met de garage?


Je krijgt nu een heel genuanceerd beeld. Je kunt nu zonder nadenken besluiten de scores op deze vragen bij elkaar op te tellen en aangeven dat deze somscore de "tevredenheid over de woning" weergeeft. In de wetenschap mag je echter geen uitspraak doen die niet is onderbouwd. Mag je de antwoorden op deze vragen wel bij elkaar optellen? Of anders geformuleerd: meten deze vragen wel hetzelfde concept? Hoe kun je dat onderbouwen? Of je de antwoorden op de items bij elkaar op mag tellen, kun je onderbouwen door Cronbachs alfa te berekenen.

Hoe bereken je Cronbachs alfa?

Hiernaast (of hieronder) staat de formule.

Nou is zo'n formule verder helemaal niet zo interessant, want ieder statistisch programma rekent deze voor je uit, maar toch is het wel belangrijk om te benadrukken dat het aantal items minimaal 2 moet zijn, want anders wordt k - 1 nul en delen door nul mag niet.

Het maximale aantal items is onbegrensd. Je mag k dus zo groot maken als je zelf wilt.

Over de varianties kun je niks zeggen. Dat kun je pas achteraf vaststellen, nadat je de gegevens hebt verzameld. Er geldt echter wel de voorwaarde dat de varianties van alle items ongeveer even groot moeten zijn.


Hoe je in SPSS Cronbachs alfa berekent leer ik je in een video. Zie voor meer informatie in ons Kenniscentrum Onderzoek en Statistiek.

Berekenen van Cronbachs alfa met SPSS




Hoe interpreteer je Cronbachs alfa?

De uitkomst uit deze formule is maximaal 1. De minimale waarde kan kleiner zijn dan 0 en er is - in theorie - geen minimum.

Door ervaring wijs geworden, hebben onderzoekers wel een duimregel vastgelegd. Men zegt dat waarden die groter zijn dan 0,70 een voldoende hoge score hebben om over deze items een somscore te berekenen. Als je met deze nieuwe variabele analyses gaat uitvoeren, dan levert dat meestal wel ergens een statistisch significant resultaat op.


En als de score kleiner is dan 0,70? Tja, er zijn ook onderzoekers die met minder genoegen nemen en alle scores boven de 0,60 als acceptabel rekenen. Zijn de scores 

lager dan hebben zij er ook geen vertrouwen meer in. Mijn ervaring is dat hoe kleiner Cronbachs alfa wordt, des te meer ruis je meet. Je krijgt dan analyseresultaten die niet goed zijn te interpreteren of die de ene keer wel iets interessants opleveren en de andere keer niet.


Overigens, als je een vragenlijst of test hebt afgenomen en Cronbachs alfa is kleiner dan 0,70, dan kun je aangeven dat deze score weliswaar te laag is volgens de geldende opvattingen, maar dat je bij gebrek aan beter toch een somscore gaat maken. Het alternatief is dat je de somscore helemaal weglaat en dat betekent dat je dit aspect helemaal niet meer kunt meenemen in je onderzoek. Dat is vaak ook niet gewenst. De resultaten met de nieuw te creëren variabele zullen meestal tegen vallen, maar goed beter iets dan niets.

Hoe kun je Cronbachs alfa verhogen

De waarde uit de formule kun je op twee manieren verhogen, maar dat moet je wel in een vroegtijdig stadium doen.


De eerste manier is: er voor zorgen dat de items die je samen wilt nemen qua inhoud dicht bij elkaar liggen. Oftewel, ze moeten allemaal ongeveer hetzelfde meten. Vragen als "Heeft u leuke collega's" en "Collega's helpen me als ik het zwaar heb" en "Ik heb vriendelijke collega's" zullen qua score allemaal dicht bij elkaar liggen. Tussen deze items zal - naar alle waarschijnlijkheid - een hoge correlatie zijn. Items die hoog met elkaar correleren zorgen voor een hoge Cronbachs alfa. Zorg er dus voor dat de items die je opneemt in je vragenlijst of test in hetzelfde domein liggen. Om op dit aspect te controleren laat je tussen de items ook altijd de correlaties berekenen. Bij voorkeur liggen de correlaties allemaal ergens tussen de 0,30 en 0,40, maar dat is moeilijk (op voorhand) te realiseren. Zijn de correlaties lager, dan hangen de items als los zand aan elkaar; ze meten wat anders. Is de correlatie hoog (zeg meer dan 0,80), dan meet je twee keer hetzelfde en zou je bij wijze van spreken één van de twee items weg kunnen laten.


Vind je bij één item allemaal negatieve correlaties dan heb je die vraag vermoedelijk negatief gesteld. Bijvoorbeeld bij een concept dat gaat over 'vriendelijke collega's' komt één vraag  voor over hekel hebben aan je collega's. Deze ene vraag zal dan negatief correleren met de rest. Om dat op te lossen

moet je de vraag omschalen, dat wil zeggen dat de score 5 een 1 moet worden, de score 4 een 2 etc. Op die manier krijg je dan items die allemaal in dezelfde richting wijzen: een hoge score komt overeen met positieve waardering (of een lage score komt overeen met een positieve waardering. Wil je dat niet dan moet je alle andere items omschalen). Ik zeg het vaak zo: je moet er voor zorgen dat alle "neuzen dezelfde kant op wijzen". Als een item tegendraads is, heeft dat een desastreus effect op je Cronbachs alfa.


De tweede manier is: neem meer items op die over hetzelfde concept gaan of in het hetzelfde domein liggen. Dus in plaats van 2 of 3 vragen over "contact met je collega's" bedenk je er een stuk of 12. Ze moeten wel ongeveer in hetzelfde domein liggen, bijvoorbeeld contact tussen collega's. Een vraag over het lenen van geld van je collega's, ligt in een iets ander domein en zal dus niet bijdragen aan een hoge Cronbachs alfa. 

Om na te gaan of alle items wel in hetzelfde domein liggen, kun je factoranalyse uitvoeren. Op die manier kun je bepalen of je een of meerdere items weg moet laten. Als Cronbachs alfa hoger wordt als je het item weglaat, dan doe je dat. Van de 12 items hou je er dan een beperkt aantal over, zeg 8. Over deze items bereken je dan de somscore of een gemiddelde.


Tussen beide aspecten bestaat een pay-off. Als de items sterk met elkaar samenhangen kun je met weinig items volstaan om het concept dat je wilt meten, goed vast te stellen. Is het een moeilijk te meten concept, zorg er dan voor dat je veel items opneemt die over dit onderwerp gaan.

Cronbachs alfa is een vorm van betrouwbaarheid


Betrouwbaarheid kun je op verschillende manieren vaststellen. Er zijn theoretisch gezien vier manieren te onderscheiden die op twee dimensies liggen: je stelt twee keer dezelfde vraag of twee bijna aan elkaar gelijke vragen. Je kunt dat doen op één meetmoment of of twee meetmomenten. Nu ontstaat er een spraakverwarring m.b.t. Cronbachs alfa.

Als je twee keer precies dezelfde vraag stelt, heet dat interne consistentie. Cronbach (1960) zelf noemt de naar hem genoemde maat ook een vorm van interne consistentie. Maar ja, het is niet altijd precies dezelfde vraag en het zijn er niet altijd twee. Als er veel meer vragen worden gesteld, wil je graag weten of die vragen uit hetzelfde domein komen. Drenth (1975) noemt dit daarom homogeniteit. Hij vraagt zich af of alle vragen uit 'een homogene groep van mogelijk te stellen vragen' komen.


Over de naamgeving moet je je niet te veel zorgen maken. Of je het nu interne consistentie of homogeniteit noemt, maakt voor de score en de interpretatie helemaal niet uit.

Somscore, gemiddelde of rapportcijfer

Als Cronbachs alfa hoog genoeg is, kun je een somscore berekenen. Voordat je dat doet, moet je eerst controleren of er niet toch problemen zijn. Zo moeten alle items dezelfde schaal hebben. Meestal gebruik je een 5-punts Likertschaal, bijvoorbeeld helemaal mee eens tot helemaal mee oneens, of erg goed tot erg slecht. Er mag niet plotseling een 3- of een 9-puntsschaal tussen zitten. In al het voorgaande ben ik daar impliciet van uitgegaan, want anders mag je Cronbachs alfa niet berekenen, maar bij deze heb ik dat nu heel expliciet gezegd.


Een tweede aspect waar je op moet letten, is het aantal cases waarover Cronbachs alfa is berekend. In ons allereerste voorbeeld, staat ook een vraag over de garage. Niet iedereen heeft een garage en dus zal ook niet iedereen deze vraag hebben beantwoord. Dat zou ertoe hebben kunnen leiden dat de berekende Cronbachs alfa over veel minder cases gaat. Zeer waarschijnlijk heb je deze vraag al weggelaten bij het berekenen van een aantal Cronbachs alfa's over reeksen items, maar het hoeft niet. En als het slechts om een beperkt aantal case gaat, dan valt het je waarschijnlijk niet eens op.


Als je een somscore gaat berekenen, dan doe je dat gewoonlijk over de cases die alle vragen hebben beantwoord. Als een persoon een vraag niet heeft beantwoord, dan wordt er voor deze persoon geen somscore berekend. Deze persoon valt dus uit: hij krijgt geen totaalscore.

In SPSS is er ook een procedure (zie video's over SPSS) waarmee je de score over het aantal items kunt berekenen. Als dus 7 van de 8 vragen zijn beantwoord, dan wordt er een score berekend over 7 items. Dat is vervelend, want deze persoon kan nooit de maximale score halen. Ter illustratie even een voorbeeld:


Persoon A heeft 8 vragen beantwoord met steeds een 5. Zijn score wordt:

5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 = 8 * 5 = 40

Persoon B heeft 7 vragen beantwoord met steeds een 5. Zijn score wordt:

5 + 5 + 5 + 5 + 5 + 5 + 5 = 7 * 5 = 35

Persoon B kan dus nooit de maximale score van 40 punten halen. Als je het gemiddelde berekent, dan scoren beide personen wel allebei de maximale score: 5. Daarom is het altijd beter om het gemiddelde te berekenen en geen somscore.


Er is nog een andere reden om liever een gemiddelde te berekenen dan een somscore. Als je twee schalen hebt waarvan de een bestaat uit 8 items op een schaal van 1 to 5 is de theoretische minimale waarde 8 en de maximale waarde 40. De andere schaal bestaat uit 4 items; de minimale waarde is nu 4 en de maximale waarde 20. Hierdoor zijn de scores moeilijker met elkaar te vergelijken, want de ene keer betekent een score van 20 de maximale score en een ander keer onder het (theoretisch verwachte) midden. Als je voor beide schalen het gemiddelde uitrekent dan zijn de scores op beide schalen goed met elkaar te vergelijken.

De scores van 1 tot 5 zijn ook voor Nederlanders goed te begrijpen. In het buitenland worden deze scores vaak ook gebruikt voor het rapport. In Amerika is een A "very good" en E "very bad" en in Duitsland is een 1 ook het hoogste rapportcijfer en een 5 het laagste. In Nederland zouden we een 5 als hoogste score willen interpreteren en een 1 als laagste score. Je kunt het beste er voor zorgen dat alle positieve scores hogere cijfers krijgen. Dat vergemakkelijkt het interpreteren van de resutaten.


Hoewel bijna niemand het doet zou je de score ook om kunnen rekenen naar een rapportcijfer. De score 1 betekent dan zeer slecht en een score 10 zeer goed. Daarvoor moet je dan wel een wat ingewikkelder formule gebruiken, want anders loopt de score niet van 1 tot 10. Dit is die formule:



Als je de score voor ieder individu berekent die alle items hebben ingevuld, maakt het voor de statistische analyses helemaal niet uit of je de somscore, de gemiddelde score of het rapportcijfer gebruikt.

Paper over het presenteren van Cronbachs alfa

Als je kwantitatief onderzoek doet, dan is dit paper onontbeerlijk. Er wordt ook aandacht besteed aan het presenteren van Cronbachs alfa in lopende tekst en in tabellen.

Het paper is niet gratis, maar voor 5 euro zul je er geen buil aan vallen. Voor zover ik weet, staat deze informatie in nog geen enkel boek.

Was dit goede informatie?

Waarmee kan ik je nog meer helpen?

24/7 online hulp

Heel veel informatie staat in ons kenniscentrum. Dit is ingedeeld in:

   Video-tutorials over onderzoek en methodologie

   Papers en handleidingenS

   Video-tutorials over statistiek

   Video-tutorials over SPSS

persoonlijke hulp

 Neem (tijdens kantoortijden!) telefonisch contact met ons op. Zo mogelijk helpen we je meteen, maar mocht het niet uitkomen, dan maken we een afspraak.


Bel: 050 - 542 2163

of mail naar: mail@hulp-bij-onderzoek.nl

Met onze video's leer je het sneller en makkelijker!

SPSS

Tutorials

€29,50

SPSS-video's





Statistiek Tutorials

€39,50

Statistiek-video's





Beide


€49,50

Statistiek-video's

SPSS-video's




Alles


€60,-

Statistiek-video's

SPSS-video's

Methodologie-video's

Papers & handleidingen

Missie

Ik vind het belangrijk dat jij goed onderzoek kunt verrichten, want

met goed onderzoek krijg je betere informatie.

Met betere informatie kun je betere beslissingen maken.

Met betere beslissingen, kun je een betere (mooiere, schonere, vriendelijkere ...) wereld maken.

Ik help je graag.