De t-verdeling (t-distribution) begrijpen | Met voorbeelden
De t-verdeling (ook wel t-distribution of Student’s t-distribution genoemd) wordt gebruikt als de data bij benadering normaal verdeeld zijn (en dus een klokvorm volgen), maar waarbij de populatievariantie onbekend is. De variantie in een t-verdeling wordt geschat op basis van het aantal vrijheidsgraden van de dataset (totaal aantal waarnemingen min 1).
De t-verdeling is een variant op de normale verdeling, maar deze wordt gebruikt voor kleinere steekproeven, waarbij de variantie onbekend is.
Bij statistiek wordt de t-verdeling meestal gebruikt om:
- De kritische waarden voor een betrouwbaarheidsinterval te vinden als de data ongeveer normaal verdeeld zijn.
- De corresponderende p-waarde te vinden van een statistische toets die de t-verdeling gebruikt (t-toets, regressieanalyse).
Wat is een t-verdeling?
De t-verdeling is een variant op de normale verdeling die wordt gebruikt voor kleinere steekproeven. Normaal verdeelde gegevens vormen een klokvorm als je ze plot in een grafiek. Hierbij zijn er meer waarnemingen in de buurt van het gemiddelde dan in de staarten.
Het is een meer conservatieve vorm van de standaardnormale verdeling (ook wel z-verdeling of standard normal distribution genoemd). Dit betekent dat de t-verdeling een lagere kansdichtheid geeft voor het centrum en een hogere kansdichtheid voor de staarten dan de standaard normaleverdeling.
T-verdeling en de standaardnormale verdeling
Naarmate het aantal vrijheidsgraden (totaal aantal waarnemingen min 1) toeneemt, zal de t-verdeling steeds dichter bij de standaardnormale verdeling (z-verdeling) komen te liggen, totdat ze nagenoeg hetzelfde zijn.
Boven 30 vrijheidsgraden komt de t-verdeling ongeveer overeen met de z-verdeling. Daarom gebruik je voor grote steekproeven de z-verdeling in plaats van de t-verdeling.
De z-verdeling wordt verkozen boven de t-verdeling, omdat de variantie bekend is bij de z-verdeling. Bij de t-verdeling wordt de variantie slechts geschat op basis van het aantal vrijheidsgraden. Hierdoor kunnen nauwkeurigere schattingen worden gemaakt met behulp van de z-verdeling.
T-verdeling en t-scores
Een t-score is het aantal standaarddeviaties van het gemiddelde in een t-verdeling. Je kunt een t-score opzoeken in een t-tabel of een online calculator voor de t-score gebruiken.
Bij statistiek worden t-scores voornamelijk gebruikt om de volgende waarden te bepalen:
- De boven- en ondergrenzen van een betrouwbaarheidsinterval als de data ongeveer normaal verdeeld zijn.
- De p-waarde van de teststatistiek voor t-toetsen en regressieanalyses.
T-scores en betrouwbaarheidsintervallen
Betrouwbaarheidsintervallen gebruiken t-scores om de boven- en ondergrenzen van het voorspellingsinterval te berekenen. De t-score die wordt gebruikt om de boven- en ondergrenzen te bepalen, wordt ook wel de kritische waarde van t of t* genoemd.
T-scores en p-waarden
Statistische toetsen leveren een teststatistiek op die aangeeft hoe ver je data verwijderd zijn van de nulhypothese van de statistische toets. Vervolgens wordt een p-waarde berekend die uitdrukt hoe waarschijnlijk het is dat je data zouden voorkomen als de nulhypothese waar zou zijn.
De teststatistiek voor t-toetsen en regressieanalyses is de t-score. Hoewel de meeste statistische programma’s (zoals SPSS) automatisch de bijbehorende p-waarde voor de t-score berekenen, kun je de waarden ook opzoeken in een t-tabel, waarbij je de vrijheidsgraden en t-score gebruikt om de p-waarde te vinden.
De t-score die gepaard gaat met een p-waarde die kleiner is dan het significantieniveau alfa, wordt de kritische waarde van t, of t* genoemd.
Veelgestelde vragen
- Wat is een t-verdeling?
-
De t-verdeling (ook wel t-distribution of Student’s t-distribution genoemd) wordt gebruikt als de data bij benadering normaal verdeeld zijn (en dus een klokvorm volgen), maar waarbij de populatievariantie onbekend is. De variantie in een t-verdeling wordt geschat op basis van het aantal vrijheidsgraden van de dataset (totaal aantal waarnemingen min 1).
De t-verdeling is een variant op de normale verdeling, maar deze wordt gebruikt voor kleinere steekproeven, waarbij de variantie onbekend is.
- Wat is een t-score?
-
Een t-score is het aantal standaarddeviaties van het gemiddelde in een t-verdeling. Je kunt een t-score opzoeken in een t-tabel of een online calculator voor de t-score gebruiken.
Bij statistiek worden t-scores voornamelijk gebruikt om de volgende waarden te bepalen:
- De boven- en ondergrenzen van een betrouwbaarheidsinterval als de data ongeveer normaal verdeeld zijn.
- De p-waarde van de teststatistiek voor t-toetsen en regressieanalyses.
- Wat is het verschil tussen de t-verdeling en de standaardnormale verdeling?
-
De t-verdeling is een meer conservatieve vorm van de standaardnormale verdeling (ook wel z-verdeling of standard normal distribution genoemd). Dit betekent dat de t-verdeling een lagere kansdichtheid geeft voor het centrum en een hogere kansdichtheid voor de staarten dan de standaard normaleverdeling.
- Wat is een normale verdeling?
-
Er zijn twee parameters die bepalen hoe de normale verdeling eruitziet: het gemiddelde en de standaarddeviatie.
- Binnen één standaarddeviatie ligt 68,2% van de observaties (34,1% + 34,1%), binnen twee standaarddeviaties 95,2% en binnen drie standaarddeviaties 99,6%.
- De centrummaten (gemiddelde, modus en mediaan) hebben bij een normale verdeling dezelfde waarde.
- De data zijn symmetrisch verdeeld, zonder skewness (zero skew).
Citeer dit Scribbr-artikel
Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.