Nominale data verzamelen en analyseren | Uitleg & voorbeelden
Je kunt de data voor variabelen met een nominaal meetniveau verdelen over verschillende categorieën, waarbij iedere waarde maar tot één categorie kan behoren. Bovendien kunnen de categorieën niet worden gerangschikt.
Een voorbeeld van een nominale variabele is “vervoersmiddelen”. Hierbij zou je de data kunnen verdelen over de categorieën auto, bus, trein, tram, fiets en metro. Iedere waarde kan maar in één categorie vallen (want iets kan bijvoorbeeld niet zowel een auto als een metro zijn). Je kunt de genoemde categorieën niet rangschikken op een betekenisvolle manier. Het maakt immers niet uit of je de rangschikking begint of eindigt met de auto.
Meetniveaus
Het meetniveau geeft aan hoe precies de data zijn verzameld. Er zijn vier meetniveaus: nominaal, ordinaal, interval en ratio. Een hoger meetniveau is altijd complexer en preciezer.
Het nominale meetniveau is het minst precieze en het minst complexe niveau. De data kunnen wel worden gelabeld, maar niet worden gerangschikt. Ook zijn de afstanden tussen de categorieën niet gelijk (het is niet vast te stellen of de afstand tussen een auto en metro even groot is als de afstand tussen een metro en trein) en er is geen betekenisvol nulpunt.
Voorbeelden van nominale data
In het geval van een nominaal meetniveau past iedere respons of observatie maar in één categorie. Nominale data kunnen worden uitgedrukt in woorden of getallen, maar zelfs als je numerieke labels gebruikt om je data in te voeren, kun je geen berekeningen uitvoeren met de data.
Variabele | Categorieën |
---|---|
Postcode |
|
Boomsoorten |
|
Muziekstijlen |
|
Genres |
|
Variabelen die je maar op twee manieren kunt coderen (bijvoorbeeld ja/nee, waar/onwaar) worden binair of dichotoom genoemd. Aangezien ook hier de volgorde van de labels niet uitmaakt, vallen binaire variabelen onder nominale variabelen.
Hoe verzamel je nominale data?
Je kunt bijvoorbeeld nominale data verzamelen door open of gesloten enquêtevragen te stellen. Als de variabele waarin je geïnteresseerd bent maar uit enkele categorieën bestaat, kun je het beste gesloten vragen gebruiken (zoals meerkeuzevragen).
Wat is je gender? | Man Vrouw Anders Ik beantwoord deze vraag liever niet |
---|---|
Ben je in het bezit van een smartphone? | Ja Nee |
Wat je favoriete filmgenre? | Romantiek Actie Detective Animatie Musical Komedie Thriller |
Als de variabele waarin je geïnteresseerd bent heel veel mogelijke categorieën heeft of als je niet alle categorieën weet, kun je het beste open vragen gebruiken.
Hoe analyseer je nominale data?
Je kunt je nominale data organiseren en visualiseren met behulp van tabellen en diagrammen. Vervolgens kun je de lezer descriptieve statistieken over je data presenteren. Deze statistieken zeggen iets over de frequentieverdeling en de centrale tendens. Let hierbij wel op het type statistiek dat je gebruikt, want niet alle centrummaten en spreidingsmaten zijn toepasbaar op nominale data.
Nederlands Nederlands Engels Nederlands Nederlands Nederlands Engels Engels Duits |
Duits Nederlands Nederlands Nederlands Nederlands Engels Engels Duits Nederlands |
Duits Nederlands Nederlands Engels Engels Nederlands Duits Nederlands Nederlands |
Verdeling of spreiding
Om inzicht te krijgen in de data, kun je een automatische frequentietabel opvragen, zodat je het aantal responses per categorie (Nederlands, Engels, Duits) ziet.
Moedertaal | Frequentie |
---|---|
Nederlands | 15 |
Engels | 7 |
Duits | 5 |
Moedertaal | Percentage |
---|---|
Nederlands | 55,6% |
Engels | 25,9% |
Duits | 18,5% |
Vervolgens kun je deze tabellen eventueel visualiseren door diagrammen te gebruiken, zoals een cirkeldiagram (relatief) of een staafdiagram. Doe dit echter alleen als de visualisering iets toevoegt aan de tekst.
Centrummaten
De centrummaten geven een indicatie van het zwaartepunt van je data. De modus, het gemiddelde en de mediaan zijn de drie meest gebruikte centrummaten. In het geval van nominale data kun je alleen de modus gebruiken.
Om de mediaan vast te stellen, moet je de data namelijk kunnen rangschikken van laag naar hoog. Voor het gemiddelde moet je berekeningen kunnen uitvoeren, zoals optellen en delen. Je kunt nominale data over categorieën verdelen, maar het is niet mogelijk om de data te rangschikken of op te tellen.
Daarom kun je alleen de centrummaat “modus” gebruiken om de centrale tendens van nominale data te beschrijven. De modus is de vaakst voorkomende waarde.
Statistische toetsen voor nominale data
Inferentiële of toetsende statistiek kan worden gebruikt om wetenschappelijke hypothesen over je data te toetsen. In het geval van nominale data gebruik je non-parametrische statistische toetsen, omdat parametrische toetsen gepaard gaan met statistische aannames (zoals normaal verdeelde data). Deze aannames zijn niet toepasbaar op nominale data, omdat de categorieën niet betekenisvol kunnen worden gerangschikt.
De chi-kwadraattoets (chi-squared test) is een non-parametrische toets die wordt gebruikt voor categorische variabelen. Er zijn drie varianten:
- De aanpassingstoets (om te onderzoeken of de gevonden verdeling correspondeert met de verwachte verdeling).
- De onafhankelijkheidstoets (om te onderzoeken of twee variabelen gerelateerd zijn).
- De homogeniteitstoets (om te onderzoeken of meerdere steekproeven uit dezelfde verdeling afkomstig zijn).
De aanpassingstoets (goodness of fit) wordt gebruikt voor datasets met één variabele, en de onafhankelijkheidstoets (chi-square test of independence) wordt gebruikt voor datasets met twee variabelen.
Je gebruikt de aanpassingstoets als je data hebt verzameld uit één populatie door middel van een aselecte steekproef. Om te toetsen hoe representatief je steekproef is, vergelijk je de frequentieverdeling van je steekproef met de verwachte verdeling van de bredere populatie om te bepalen of de werkelijkheid overeenkomt met de verwachting.
Met de onafhankelijkheidstoets kun je onderzoeken of een relatie tussen twee categorische vairabelen significant is.
Veelgestelde vragen
- Waarom zijn meetniveaus van belang?
-
Het niveau waarop je een variabele meet, bepaalt hoe je je data kunt analyseren.
Afhankelijk van het meetniveau kun je diverse descriptieve statistieken gebruiken om je data samen te vatten. Ook kun je inferentiële statistiek (ook wel toetsende of verklarende statistiek genoemd) gebruiken om te bepalen of je resultaten de hypothese ondersteunen of weerleggen.
- Hoe bepaal ik welk meetniveau ik moet gebruiken?
-
Sommige variabelen gaan gepaard met een vaststaand meetniveau. Zo worden gender of etniciteit altijd op nominaal niveau gemeten, omdat je de categorieën niet kunt rangschikken.
Bij andere variabelen kun je het meetniveau wel kiezen. De variabele “studenteninkomen” kan bijvoorbeeld op ordinaal of rationiveau worden gemeten.
- Op ordinaal niveau zou je vijf groepen kunnen creëren met een bepaald bereik (bijvoorbeeld 0 – 499, 500 – 799, 800 – 1099, 1100 – 1999 en 2000 – 2299). Participanten kruisen dan het juiste bereik aan.
- Op rationiveau zou je naar het exacte inkomen vragen.
Als je kunt kiezen, is het beter om op rationiveau te meten, zodat je de data op meer manieren kunt analyseren. Hoe hoger je meetniveau, hoe preciezer de data.
- Wat zijn de vier meetniveaus?
-
Meetniveaus laten zien hoe precies variabelen worden gemeten. Er zijn vier meetniveaus (of meetschalen) die van laag naar hoog kunnen worden gerangschikt.
- Nominaal: De data kunnen alleen worden gecategoriseerd (geen rangorde).
- Ordinaal: De data kunnen worden gecategoriseerd en gerangschikt.
- Interval: De data kunnen worden gecategoriseerd en gerangschikt en er zijn gelijke intervallen tussen de categorieën.
- Ratio: De data kunnen worden gecategoriseerd en gerangschikt, de intervallen zijn gelijk, en er is een absoluut of betekenisvol nulpunt.
- Wat zijn nominale data?
-
Nominale data kunnen worden verdeeld over categorieën (waarbij ieder datapunt maar in één categorie hoort) en de categorieën kunnen niet worden gerangschikt op een logische of natuurlijke manier.
Een voorbeeld van een nominale variabele is “vervoersmiddel”. Deze zou bijvoorbeeld uit de categorieën fiets, auto, bus, trein, metro en tram kunnen bestaan. Die vervoersmiddelen kunnen niet op een logische manier worden geordend, want het maakt bijvoorbeeld niet uit of je start met de fiets of de auto.
In het geval van een ordinale variabele, zoals “opleidingsniveau” zou je de opleidingsniveaus vmbo, havo, vwo wel op een logische manier kunnen rangschikken.
Het nominale meetniveau is het minst complexe en minst precieze meetniveau.
- Wat zijn de verschillen tussen nominale en ordinale data?
-
Het nominale meetniveau verschilt van het ordinale meetniveau, omdat nominale data alleen gecategoriseerd kunnen worden, maar ordinale data ook gerangschikt kunnen worden.
Een voorbeeld van een nominale variabele is “Kledingwinkels”. Je kunt de data bijvoorbeeld verdelen over Zara, H&M, Only en Primark, maar je kunt die kledingwinkels niet op een natuurlijke, logische manier rangschikken.
Een voorbeeld van een ordinale variabele is “Leeftijd”. Je kunt de data bijvoorbeeld verdelen over 0-18, 19-34, 35-49 en 50+, en deze categorieën kun je in een logische volgorde zetten.
Citeer dit Scribbr-artikel
Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.