Meteen naar document

Samenvatting Onderzoekspracticum kwantitatieve data-analyse

Vak

Onderzoekspracticum kwantitatieve data-analyse (S13131)

22 Documenten
Studenten deelden 22 documenten in dit vak
Universiteit

Open Universiteit

Studiejaar: 2014/2015
Geüpload door:
Anonieme student
Dit document is geüpload door een student, net als jij, die anoniem wil blijven.
Open Universiteit

Reacties

inloggen of registreren om een reactie te plaatsen.

Preview tekst

(15) - Vergelijken van meer dan twee gemiddelden: ANOVA

vergelijken van gemiddelede scores van meer dan twee onafhankelijke groepen

gebruikmaken van de variantieanalyse

Waarom kunt u niet simpelweg een aantal t‐toetsen doen waarmee u de verschillende gemiddelden met elkaar vergelijkt?

De hypothese : de statistiekkennis voorafgaande aan de statistiekcursus is groter bij studenten die een hogere vooropleiding hebben. Om deze hypothese te toetsen moet voor elk type vooropleiding de gemiddelde score berekend worden voor statistiekkennis voorafgaande aan de cursus. Deze vijf gemiddelden worden vervolgens met elkaar vergeleken. Met een t‐toets kunnen telkens twee gemiddelden vergeleken worden. Er zijn dan tien t‐toetsen nodig om alle vijf gemiddelden te vergelijken:

  1. lager onderwijs en vmbo,
  2. lager onderwijs en mbo/havo,
  3. lager onderwijs en vwo,
  4. lager onderwijs en hbo of hoger,
  5. vmbo en mbo/havo,
  6. vmbo en vwo,
  7. vmbo en hbo of hoger,
  8. mbo/havo en vwo,
  9. mbo/havo en hbo of hoger, en
  10. vwo en hbo of hoger.

Deze werkwijze heeft een groot bezwaar. Bij het uitvoeren van elke statistische analyse loopt u steeds de kans op een Type I fout.(*) Als u nu voor het trekken van een conclusie meer dan één toets nodig hebt, wordt het risico dat u een conclusie trekt die niet juist is groter. Waarom is dat het geval?

Vb : In hypothesetoetsend onderzoek worden er steeds twee hypothesen met elkaar vergelijken: de nulhypothese (er is geen verschil tussen gemiddelden) en de alternatieve hypothese (er is wel een verschil tussen de gemiddelden).

De toets die toegepast wordt (bijvoorbeeld de t‐toets of de F‐toets van een variantieanalyse) geeft aan of de alternatieve hypothese geaccepteerd wordt dan wel verworpen. Deze toets levert een bepaalde toetswaarde (t of F).

Als de kans klein is dat een bepaalde toetswaarde aan toeval toegeschreven moet worden, dan wordt aangenomen dat de gemiddelden significant verschillen en wordt de alternatieve hypothese geaccepteerd en de nulhypothese verworpen.

Normalerwijze wordt er in hypothesetoetsend onderzoek een kans van 5% als grens gehanteerd. Dat betekent het volgende. Als de kans dat een bepaalde toetswaarde aan toeval toegeschreven moet worden, kleiner is dan 5% of gelijk is aan 5%, dan wordt de alternatieve hypothese geaccepteerd en de nulhypothese verworpen.

 De kans dat de nulhypothese in dat geval toch waar is, is kleiner dan of gelijk aan 5%. Hij wordt dus verworpen, maar er is een (kleine) kans (namelijk hooguit 5%) dat hij onterecht wordt verworpen.  De kans dat de nulhypothese terecht wordt verworpen, is 95%, ofwel 1 ‐ .05 = .95.

  • kanskapitalisme : Als er tien toetsen uitgevoerd worden dan kunnen de kansen dat de nulhypothese terecht wordt verworpen, worden vermenigvuldigd.

 Dat betekent dat de kans dat alle tien nulhypothesen terecht worden verworpen gelijk is aan .95 * .95 * .95 * .95 * .95 *.95 * .95 * .95 * .95 * .95 = .599.  Er kan nu berekend worden hoe groot de kans is dat er ten minste één nulhypothese onterecht wordt verworpen. Die kans is 1 – .599 = .401 ofwel 40%.  Als er tien toetsen uitgevoerd worden, zal dus de waarschijnlijkheid dat er in ieder geval één nulhypothese onterecht wordt verworpen, toenemen van 5% tot 40%, en dat is dus veel groter dan het normaal geaccepteerde criterium van 5%.  Dit percentage neemt toe met het aantal toetsen dat er uitgevoerd wordt. Bij drie toetsen is het 14% en bij tien toetsen is het, zoals hierboven vermeld, 40%. Het is dus niet zo nauwkeurig om de verschillen tussen meer dan twee groepen met t‐toetsen te gaan bekijken. Als er meer dan twee groepen met t‐toetsen vergeleken worden, is de kans dat een of meer nulhypothesen onterecht verworpen worden, dus groter dan 5%. Dit wordt kanskapitalisatie genoemd.

(*) Type I en Type II fouten en het onderscheidingsvermogen schematisch weergegeven Beslissing op grond van steekproef Ware toestand in de populatie Ho is waar Ho is niet waar Ho wordt niet verworpen Juiste beslissing (1 – α) Type II fout (β) Ho wordt verworpen Type I fout (α) Juiste beslissing (1 – β)

Variantieanalyse

alternatieve hypothese :

 (in de populatie) de gemiddelde score op de statistiekkennis verschillend bij studenten met een verschillende vooropleiding: H1: ten minste één μ is anders.

 wordt getoetst via variantieanalyse. Hiertoe worden eerst de gemiddelden berekend voor de te vergelijken groepen.

Zijn de verschillen tussen de gemiddelden groot genoeg om te kunnen zeggen dat de vijf groepen verschillen in statistiekkennis? = er is een zekere spreiding tussen de vijf groepsgemiddelden rondom het algehele gemiddelde. Een maat voor de spreiding is de variantie.

‘tussen‐groepen‐variantie’ ofwel de ‘between groups variance’

‘binnen‐groepen‐variantie’, ofwel de ‘within groups variance’ = De variantie tussen de groepsgemiddelden.

Hoe groter deze variantie is, hoe meer de groepsgemiddelden uit elkaar liggen.

Wanneer er een systematisch verschil is tussen groepen, dan zal de ‘between groups variance’ groot zijn, en zullen de groepsgemiddelden verder uit elkaar liggen.

binnen elk van de groepen een spreiding van individuele scores rondom het groepsgemiddelde.

Variantieanalyse :

  • de verhouding tussen de ‘between groups variance’ en de ‘within groups variance’ uitgerekend, die uitgedrukt wordt in de zogenoemde F‐waarde.
  • Als de nulhypothese juist is (de gemiddelden van de groepen verschillen niet van elkaar) dan is er geen systematisch verschil tussen de groepen. Echter, gemiddelden van groepen zijn vrijwel nooit helemaal gelijk; er is altijd wel een beetje verschil. Dat verschil wordt veroorzaakt door toevallige factoren. De ‘between groups variance’ en de ‘within groups variance’ worden dan beide veroorzaakt door toevallige factoren en zijn daarom allebei ongeveer gelijk. De waarde van F zal dan in de buurt van de 1 liggen.
  • Als er wel een systematisch verschil is dan zal er een grote ‘between groups variance’ zijn. De ‘between groups variance’ zal dan groot zijn in vergelijking met de ‘within groups variance’. Als gevolg hiervan zal de waarde van F groter zijn dan 1.
  • Net als bij de t‐toets is er een kans dat de F‐waarde aan toeval toegeschreven moet worden, de p‐ waarde. Wanneer die kans kleiner is dan .05 of gelijk is aan .05 dan wordt de nulhypothese verworpen en wordt er geconcludeerd dat er verschillen zijn tussen de gemiddelden. En net als bij de t‐toets wordt er bij de variantieanalyse meestal een significantieniveau van 5% gehanteerd (p ≤ .05). Omdat de uitkomst van de toets betrekking heeft op verschillen tussen gemiddelden, wordt er bij een variantieanalyse altijd tweezijdig getoetst.
  • Een alternatieve hypothese kan aan de hand van de F‐waarde en de p‐waarde niet geaccepteerd of verworpen worden. De F‐waarde geeft immers slechts aan dat er verschillen zijn, maar geeft geen specifieke informatie over welke groepen van elkaar verschillen.
  • Om te weten welke gemiddelden hoger of lager zijn dan andere gemiddelden moeten er post‐ hoctoetsen (oftewel ‘achteraf’‐ toetsen) uitgevoerd worden, die successievelijk de gemiddelden met elkaar vergelijken. (Er is een groot aantal verschillende post‐hoctoetsen.)

‐ de data zijn afkomstig van populaties waarin de scores normaal verdeeld zijn;

‐ voor de groepen die vergeleken worden, zijn de varianties van de scores ongeveer gelijk (dit noemt men: homogeniteit van de varianties); bij de post‐hocanalyses zijn er aparte toetsen voor het geval dat de varianties van de te vergelijken groepen verschillen;

‐ de scores van de te vergelijken groepen zijn onafhankelijke (i., ze komen van verschillende groepen proefpersonen).

Wanneer de scores niet onafhankelijk zijn (wanneer er dus bijvoorbeeld scores van een voormeting vergeleken worden met scores van een nameting bij dezelfde respondenten) dan kan men gebruikmaken van een repeated measures analyse. De repeated measure analyse is vergelijkbaar met een gepaarde t‐toets. In de volgende onderzoekspractica wordt nader ingegaan op repeated measures analyses.

Wanneer niet aan bovenstaande voorwaarden voor het uitvoeren van een ANOVA voldaan wordt, dan kan men gebruikmaken van nonparametrische toetsen (ook wel genoemd verdelingsvrije toetsen).

  • In plaats van de ANOVA kan men de Kruskal‐Wallis‐toets gebruiken, een toets die geen voorwaarden stelt aan de verdeling van de scores en die bruikbaar is bij afhankelijke variabelen van ordinaal niveau.

  • Voor afhankelijke variabelen van nominaal niveau kan men de Chikwadraattoets gebruiken. In de Methoden en Statistiek community vindt u verschillende bronnen over nonparametrische toetsen.

Om die verhouding juist en exact te kunnen berekenen moet daarom de ‘between groups sum of squares’ gedeeld worden door het aantal groepen dat vergeleken wordt en de ‘within groups sum of squares’ door het aantal studenten. Door immers de ‘between groups sum of squares’ te delen door het aantal groepen en door de ‘within groups sum of squares’ te delen door het aantal studenten wordt de gemiddelde ‘between groups sum of squares’ ofwel de ‘between groups mean square’ en de gemiddelde ‘within groups sum of squares’ ofwel ‘within groups mean square’ berekend.

Was dit document nuttig?

Samenvatting Onderzoekspracticum kwantitatieve data-analyse

Vak: Onderzoekspracticum kwantitatieve data-analyse (S13131)

22 Documenten
Studenten deelden 22 documenten in dit vak

Universiteit: Open Universiteit

Was dit document nuttig?
(15) - Vergelijken van meer dan twee gemiddelden: ANOVA
vergelijken van gemiddelede scores van
meer dan twee onafhankelijke groepen
gebruikmaken van de variantieanalyse
Waarom kunt u niet simpelweg een aantal ttoetsen doen waarmee u de verschillende gemiddelden met elkaar
vergelijkt?
De hypothese : de statistiekkennis voorafgaande aan de statistiekcursus is groter bij studenten die een hogere
vooropleiding hebben.
Om deze hypothese te toetsen moet voor elk type vooropleiding de gemiddelde score berekend worden voor
statistiekkennis voorafgaande aan de cursus. Deze vijf gemiddelden worden vervolgens met elkaar vergeleken.
Met een ttoets kunnen telkens twee gemiddelden vergeleken worden. Er zijn dan tien ttoetsen nodig om alle
vijf gemiddelden te vergelijken:
1) lager onderwijs en vmbo,
2) lager onderwijs en mbo/havo,
3) lager onderwijs en vwo,
4) lager onderwijs en hbo of hoger,
5) vmbo en mbo/havo,
6) vmbo en vwo,
7) vmbo en hbo of hoger,
8) mbo/havo en vwo,
9) mbo/havo en hbo of hoger, en
10) vwo en hbo of hoger.
Deze werkwijze heeft een groot bezwaar. Bij het
uitvoeren van elke statistische analyse loopt u steeds
de kans op een Type I fout.(*) Als u nu voor het
trekken van een conclusie meer dan n toets nodig
hebt, wordt het risico dat u een conclusie trekt die
niet juist is groter. Waarom is dat het geval?
Vb : In hypothesetoetsend onderzoek worden er steeds twee hypothesen met elkaar vergelijken: de nulhypothese (er is geen
verschil tussen gemiddelden) en de alternatieve hypothese (er is wel een verschil tussen de gemiddelden).
De toets die toegepast wordt (bijvoorbeeld de ttoets of de Ftoets van een variantieanalyse) geeft aan of de alternatieve
hypothese geaccepteerd wordt dan wel verworpen. Deze toets levert een bepaalde toetswaarde (t of F).
Als de kans klein is dat een bepaalde toetswaarde aan toeval toegeschreven moet worden, dan wordt aangenomen dat de
gemiddelden significant verschillen en wordt de alternatieve hypothese geaccepteerd en de nulhypothese verworpen.
Normalerwijze wordt er in hypothesetoetsend onderzoek een kans van 5% als grens gehanteerd. Dat betekent het volgende. Als de
kans dat een bepaalde toetswaarde aan toeval toegeschreven moet worden, kleiner is dan 5% of gelijk is aan 5%, dan wordt de
alternatieve hypothese geaccepteerd en de nulhypothese verworpen.
De kans dat de nulhypothese in dat geval toch waar is, is kleiner dan of gelijk aan 5%. Hij wordt dus
verworpen, maar er is een (kleine) kans (namelijk hooguit 5%) dat hij onterecht wordt verworpen.
De kans dat de nulhypothese terecht wordt verworpen, is 95%, ofwel 1 .05 = .95.
- kanskapitalisme : Als er tien toetsen uitgevoerd worden dan kunnen de kansen dat de nulhypothese terecht wordt verworpen,
worden vermenigvuldigd.
Dat betekent dat de kans dat alle tien nulhypothesen terecht worden verworpen gelijk is aan .95 * .95 * .95 *
.95 * .95 *.95 * .95 * .95 * .95 * .95 = .599.
Er kan nu berekend worden hoe groot de kans is dat er ten minste n nulhypothese onterecht wordt
verworpen. Die kans is 1 .599 = .401 ofwel 40.1%.
Als er tien toetsen uitgevoerd worden, zal dus de waarschijnlijkheid dat er in ieder geval n nulhypothese
onterecht wordt verworpen, toenemen van 5% tot 40.1%, en dat is dus veel groter dan het normaal
geaccepteerde criterium van 5%.
Dit percentage neemt toe met het aantal toetsen dat er uitgevoerd wordt. Bij drie toetsen is het 14.1% en bij
tien toetsen is het, zoals hierboven vermeld, 40.1%. Het is dus niet zo nauwkeurig om de verschillen tussen
meer dan twee groepen met ttoetsen te gaan bekijken. Als er meer dan twee groepen met ttoetsen
vergeleken worden, is de kans dat een of meer nulhypothesen onterecht verworpen worden, dus groter dan 5%.
Dit wordt kanskapitalisatie genoemd.
(*) Type I en Type II fouten en het onderscheidingsvermogen schematisch weergegeven
Beslissing
op grond van steekproef
Ware toestand in de populatie
Ho is niet waar
Ho wordt niet verworpen
Type II fout (β)
Ho wordt verworpen
Juiste beslissing (1 β)