Chi-Square-test: betekenis, toepassingen en gebruik

Na het lezen van dit artikel zul je leren over: - 1. Betekenis van Chi-Square-test 2. Niveaus van significantie van Chi-Square-test 3. Chi-Square-test onder nul-hypothese 4. Geldigheidsvoorwaarden 5. Additieve eigenschap 6. Toepassingen 7. Gebruik.

Betekenis van Chi-Square-test:

De Chi-kwadraat (χ 2 ) test vertegenwoordigt een bruikbare methode om experimenteel verkregen resultaten te vergelijken met de theoretisch te verwachten hypothesen.

Chi-square is dus een maat voor de feitelijke divergentie van de waargenomen en verwachte frequenties. Het is overduidelijk dat het belang van een dergelijke maatregel zeer groot zou zijn in steekproevenstudies, waarbij we steevast de verschillen tussen theorie en feit moeten bestuderen.

Chi-vierkant zoals we hebben gezien, is een maatstaf voor divergentie tussen de verwachte en waargenomen frequenties en als dusdanig als er geen verschil is tussen verwachte en waargenomen frequenties is de waarde van Chi-vierkant 0.

Als er een verschil is tussen de waargenomen en de verwachte frequenties, zou de waarde van Chi-kwadraat groter zijn dan 0. Dat wil zeggen, hoe groter het Chi-kwadraat, des te groter de kans op een reële divergentie van experimenteel waargenomen uit verwachte resultaten.

Als de berekende waarde van chikwadraat erg klein is in vergelijking met de tabelwaarde, geeft dit aan dat de divergentie tussen werkelijke en verwachte frequenties erg klein is en bijgevolg is de fit goed. Als, aan de andere kant, de berekende waarde van chikwadraat erg groot is in vergelijking met de tabelwaarde, geeft dit aan dat de divergentie tussen verwachte en waargenomen frequenties erg groot is en bijgevolg is de fit slecht.

Om Chi-square te evalueren, voeren we tabel E in met de berekende waarde van chikwadraat en het juiste aantal vrijheidsgraden. Het aantal df = (r - 1) (c - 1) waarin r het aantal rijen is en c het aantal kolommen waarin de gegevens zijn getabelleerd.

Dus in 2 x 2 tabel zijn de vrijheidsgraden (2 - 1) (2 - 1) of 1. Net zo in de tabel 3 x 3, zijn de vrijheidsgraden (3 - 1) (3 - 1) of 4 en in 3 x 4 tabel de vrijheidsgraden zijn (3 - 1) (4 - 1) of 6.

Niveau's van betekenis van Chi-Square-test:

De berekende waarden van χ 2 (Chi-kwadraat) worden vergeleken met de tabelwaarden om te concluderen of het verschil tussen verwachte en waargenomen frequenties te wijten is aan de fluctuaties in de bemonstering en als zodanig significant of dat het verschil te wijten is aan een andere reden en als zo belangrijk. De divergentie van theorie en feit wordt altijd getest in termen van bepaalde waarschijnlijkheden.

De kansen geven de mate van afhankelijkheid aan die we op de getrokken conclusie kunnen plaatsen. De tabelwaarden van χ 2 zijn beschikbaar op verschillende waarschijnlijkheidsniveaus. Deze niveaus worden niveaus van significantie genoemd. Meestal wordt de waarde van χ 2 op .05 en .01 niveau van significantie voor de gegeven vrijheidsgraden uit de tabellen gezien.

Als de berekende waarde van χ 2 groter is dan de getabelleerde waarde, wordt deze als significant beschouwd. Met andere woorden, de discrepantie tussen de waargenomen en verwachte frequenties kan niet worden toegeschreven aan het toeval en we verwerpen de nulhypothese.

We concluderen dus dat het experiment de theorie niet ondersteunt. Aan de andere kant als de berekende waarde van χ 2 minder is dan de overeenkomstige getabelleerde waarde, wordt er gezegd dat deze niet significant is op het vereiste significantieniveau.

Dit houdt in dat de discrepantie tussen waargenomen waarden (experiment) en de verwachte waarden (theorie) kan worden toegeschreven aan toeval, dat wil zeggen fluctuaties van bemonstering.

Chi-Square-test onder nul-hypothese:

Stel dat we een reeks waargenomen frequenties krijgen die we met een bepaald experiment hebben verkregen en we willen testen of de experimentele resultaten een bepaalde hypothese of theorie ondersteunen. Karl Pearson ontwikkelde in 1990 een test voor het testen van de significantie van de discrepantie tussen experimentele waarden en de theoretische waarden verkregen onder een bepaalde theorie of hypothese.

Deze test staat bekend als χ 2 -test en wordt gebruikt om te testen of de afwijking tussen waarneming (experiment) en theorie kan worden toegeschreven aan toeval (fluctuaties van bemonstering) of dat het echt te wijten is aan de ontoereikendheid van de theorie om te passen bij de waargenomen gegevens.

Onder de nul-hypothese stellen we dat er geen significant verschil is tussen de waargenomen (experimentele) en de theoretische of hypothetische waarden, dat wil zeggen, er is een goede compatibiliteit tussen theorie en experiment.

De vergelijking voor chikwadraat (χ 2 ) wordt als volgt vermeld:

waarin f o = frequentie van voorkomen van waargenomen of experimenteel bepaalde feiten

f e = verwachte frequentie van voorkomen op een bepaalde hypothese.

Dus chikwadraat is de som van de waarden verkregen door het kwadraat van het verschil tussen waargenomen en verwachte frequenties te delen door de verwachte frequenties in elk geval. Met andere woorden, de verschillen tussen waargenomen en verwachte frequenties worden in het kwadraat verdeeld en gedeeld door het verwachte aantal in elk geval, en de som van deze quotiënten is χ 2 .

Verschillende illustraties van de chikwadraattoets zullen de bovenstaande discussie verduidelijken. De verschillen tussen fo en fe zijn altijd + ve geschreven.

1. Het testen van de divergentie van waargenomen resultaten van die verwacht op de hypothese van gelijke waarschijnlijkheid (nulhypothese):

Voorbeeld 1:

Zesennegentig onderwerpen wordt gevraagd hun mening te uiten tegenover de stelling "Moet AIDS-educatie worden geïntegreerd in het curriculum van de hogere secundaire fase" door F (gunstig), I (onverschillig) of U (ongunstig) te markeren.

Er werd opgemerkt dat 48 gemarkeerde 'F', 24 'I' en 24 'U':

(i) Test of de waargenomen resultaten aanzienlijk afwijken van de te verwachten resultaten als er geen voorkeuren in de groep zijn.

(ii) Test de hypothese dat "er geen verschil is tussen voorkeuren in de groep".

(iii) interpreteer de bevindingen.

Oplossing:

De volgende stappen kunnen worden gevolgd voor de berekening van x 2 en het trekken van de conclusies:

Stap 1:

Bereken de verwachte frequenties (f e ) die overeenkomen met de waargenomen frequenties in elk geval onder een bepaalde theorie of hypothese.

In ons voorbeeld is de theorie van gelijke waarschijnlijkheid (nulhypothese). Op de tweede rij wordt de verdeling van te verwachten antwoorden op de nulhypothese gelijk gekozen.

Stap 2:

Bereken de afwijkingen (fo - f e ) voor elke frequentie. Elk van deze verschillen is vierkant en gedeeld door zijn f e (256/32, 64/32 en 64/32).

Stap 3:

Voeg deze waarden toe om te berekenen:

Stap 4:

De vrijheidsgraden in de tabel worden berekend uit de formule df = (r - 1) (c - 1) tot (3 - 1) (2 - 1) of 2.

Stap 5:

Zoek de berekende (kritische) waarden van χ 2 op voor 2 df op een bepaald significantieniveau, meestal 5% of 1%.

Met df = 2 is de waarde van χ 2 significant op .01-niveau 9.21 (tabel E). De verkregen χ 2- waarde van 12> 9.21.

ik. Vandaar dat de gemarkeerde afwijking groot is.

ii. De nulhypothese wordt afgewezen.

iii. We concluderen dat onze groep echt de voorkeur geeft aan de propositie.

We verwerpen de 'gelijke antwoord'-hypothese en concluderen dat onze groep voorstander is van de stelling.

Voorbeeld 2:

Het aantal auto-ongevallen per week in een bepaalde gemeenschap was als volgt:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Zijn deze frequenties in overeenstemming met de overtuiging dat de omstandigheden van het ongeval dezelfde waren gedurende deze 10 weken durende periode?

Oplossing:

Nul-hypothese - Stel de nulhypothese op dat de gegeven frequenties (van het aantal ongevallen per week in een bepaalde gemeenschap) consistent zijn met de overtuiging dat de ongevalsomstandigheden hetzelfde waren gedurende de periode van 10 weken.

Aangezien het totale aantal ongevallen over de 10 weken is:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Onder de nulhypothese moeten deze ongevallen uniform worden verdeeld over de periode van 10 weken en daarom is het verwachte aantal ongevallen voor elk van de 10 weken 100/10 = 10.

Omdat de berekende waarde van χ 2 = 26, 6 groter is dan de getabelleerde waarde, 21.666. Het is significant en de nulhypothese afgewezen op .01 niveau van significantie. Daarom concluderen we dat de ongevalsomstandigheden zeker niet uniform (hetzelfde) zijn gedurende de periode van 10 weken.

2. Testen van de divergentie van waargenomen resultaten van die verwacht in de hypothese van een normale verdeling:

De hypothese kan, in plaats van even waarschijnlijk te zijn, de normale verdeling volgen. Een voorbeeld illustreert hoe deze hypothese kan worden getest door chikwadraat.

Voorbeeld 3:

Tweehonderd verkopers zijn in drie groepen ingedeeld, zeer goed, bevredigend en slecht, door consensus van verkoopmanagers.

Verschilt deze verdeling van rating aanzienlijk van de verwachting als verkoopcapaciteit normaal wordt verdeeld in onze populatie van verkopers?

We hebben de hypothese opgesteld dat verkoopvermogen normaal verdeeld is. De normale curve strekt zich uit van - 3σ tot + 3σ. Als het verkoopvermogen normaal wordt verdeeld, kan de basislijn worden onderverdeeld in drie gelijke segmenten, dat wil zeggen

(+ 1σ tot + 3σ), (- 1σ tot + 1σ) en (- 3σ tot - 1σ) vertegenwoordigen respectievelijk goede, bevredigende en slechte verkopers. Door te verwijzen naar tabel A, vinden we dat 16% van de gevallen ligt tussen + 1σ en + 3σ, 68% tussen - 1σ en + 1σ en 16% tussen - 3σ en - 1σ. In geval van ons probleem 16% van 200 = 32 en 68% van 200 = 136.

df = 2. P is kleiner dan .01

De berekende χ 2 = 72.76

De berekende χ 2 van 72.76> 9.21. Daarom is P kleiner dan .01.

.˙. De discrepantie tussen de waargenomen frequenties en de verwachte frequenties is behoorlijk groot. Op deze grond moet de hypothese van een normale verdeling van het verkoopvermogen in deze groep worden afgewezen. Daarom concluderen we dat de verdeling van ratings anders is dan verwacht.

3. Chi-square test als onze verwachtingen gebaseerd zijn op vooraf bepaalde resultaten:

Voorbeeld 4:

In een experiment over het fokken van erwten heeft een onderzoeker de volgende gegevens verkregen:

De theorie voorspelt het aandeel bonen in vier groepen A, B, C en D moet 9: 3: 3: 1 zijn. In een experiment met 1600 bonen waren de aantallen in vier groepen 882, 313, 287 en 118. Is dit de experimentresultaten ondersteunen de genetische theorie? (Test op .05-niveau).

Oplossing:

We hebben de nulhypothese opgezet dat er geen significant verschil is tussen de experimentele waarden en de theorie. Er is met andere woorden een goede overeenkomst tussen theorie en experiment, dat wil zeggen, de theorie ondersteunt het experiment.

Sinds de berekende χ 2 -waarde van 4.726 <7.81 is dit niet significant. Vandaar dat nul nul hypothese kan worden geaccepteerd op .05 niveau van significantie en we kunnen concluderen dat de experimentele resultaten de genetische theorie ondersteunen.

4. De Chi-square-test wanneer tabelinvoeren klein zijn:

Wanneer tabelinvoeren klein zijn en wanneer de tabel 2 x 2-voudig is, dat wil zeggen df = 1, is χ 2 onderhevig aan een aanzienlijke fout tenzij een correctie voor continuïteit (Yates 'Correctie genoemd) wordt gemaakt.

Voorbeeld 5:

Veertig ratten kregen de gelegenheid om uit twee routes te kiezen. Het bleek dat 13 gekozen verlichte routes (dat wil zeggen, routes met meer verlichting) en 27 koos donkere routes.

(i) Test de hypothese dat verlichting geen verschil maakt in de voorkeur van de ratten voor routes (Test op .05-niveau).

(ii) Test of de ratten een voorkeur hebben voor donkere routes.

Oplossing:

Als verlichting geen voorkeur heeft voor routes, dwz als H 0 waar is, zou de evenredige voorkeur 1/2 zijn voor elke route (dwz 20).

In ons voorbeeld moeten we .5 van elk (f o - f e ) verschil aftrekken om de volgende reden:

De gegevens kunnen als volgt worden getabelleerd:

Wanneer de verwachte vermeldingen in 2 x 2-voudige tabel hetzelfde zijn als in ons probleem, kan de formule voor chikwadraat als volgt in een enigszins kortere vorm worden geschreven:

(i) De kritische waarde van χ 2 op .05-niveau is 3.841. De verkregen χ 2 van 4.22 is meer dan 3.841. Vandaar dat de nulhypothese wordt afgewezen op .05-niveau. Blijkbaar is licht of donker een factor in de keuze van de rat voor routes.

(ii) In ons voorbeeld moeten we een eenzijdige toets maken. Als we tabel E invoeren, vinden we dat χ 2 van 4.22 een P = .043 heeft (door interpolatie).

.˙. P / 2 = .0215 of 2%. Met andere woorden, er zijn 2 kansen in 100 dat een dergelijke afwijking zou optreden.

Daarom markeren we dat de divergentie significant is op niveau 02.

Daarom concluderen we dat de ratten een voorkeur hebben voor donkere routes.

5. De Chi-square test van onafhankelijkheid in contingentietabellen:

Soms kunnen we situaties tegenkomen waarbij we moeten testen of er een relatie (of associatie) is tussen twee variabelen of attributen. Met andere woorden: χ 2 kan worden gemaakt als we de relatie willen onderzoeken tussen kenmerken of attributen die in twee of meer categorieën kunnen worden ingedeeld.

We kunnen bijvoorbeeld worden verplicht om te testen of de oogkleur van vader wordt geassocieerd met de oogkleur van zonen, of de sociaaleconomische status van het gezin wordt geassocieerd met de voorkeur van verschillende merken van een product, of het onderwijs van het paar en de gezinsgrootte zijn gerelateerd, of een bepaald vaccin een controlerend effect heeft op een bepaalde ziekte, enz.

Om een ​​test te maken, maken we een einde van een contingentietabel om f e (verwachte frequentie) voor elke cel van de contingentietabel te berekenen en berekenen we vervolgens χ 2 met behulp van de formule:

Null hypothese:

χ 2 is berekend met de aanname dat de twee attributen onafhankelijk van elkaar zijn, dwz er is geen relatie tussen de twee attributen.

De berekening van de verwachte frequentie van een cel is als volgt:

Voorbeeld 6:

In een bepaald voorbeeld van 2.000 gezinnen zijn 1.400 gezinnen consumenten van thee, waarbij 1236 hindoefamilies zijn en 164 niet-hindoes.

En 600 gezinnen zijn geen consumenten van thee, waar 564 hindoefamilies zijn en 36 niet-hindoes. Gebruik χ 2 - test en geef aan of er een significant verschil is tussen het drinken van thee bij hindoeïstische en niet-hindoeïstische gezinnen.

Oplossing:

De bovenstaande gegevens kunnen worden gerangschikt in de vorm van een 2 x 2 contingentietabel zoals hieronder weergegeven:

We hebben de nulhypothese (Ho) opgesteld dat de twee attributen te weten: 'consumptie van thee' en de 'gemeenschap' onafhankelijk zijn. Met andere woorden, er is geen significant verschil tussen de consumptie van thee bij hindoeïstische en niet-hindoeïstische gezinnen.

Omdat de berekende waarde van χ 2, namelijk 15.24 veel groter is dan de getabelleerde waarde van χ 2 op .01 significantieniveau; de waarde van χ 2 is zeer significant en de nulhypothese wordt afgewezen.

Daarom concluderen we dat de twee gemeenschappen (hindoes en niet-hindoes) aanzienlijk verschillen wat betreft de consumptie van thee onder hen.

Voorbeeld 7:

Onderstaande tabel toont de gegevens die zijn verkregen tijdens een epidemie van cholera.

Test de effectiviteit van inenting bij het voorkomen van de aanval van cholera.

Oplossing:

We hebben de nulhypothese (Ho) opgesteld, dat de twee attributen te weten, inenting en afwezigheid van aanval van cholera niet geassocieerd zijn. Deze twee attributen in de gegeven tabel zijn onafhankelijk.

Op basis van onze hypothese kunnen we de verwachte frequenties als volgt berekenen:

Berekening van (f e ):

De vijf procentwaarde van χ 2 voor 1 df is 3.841, wat veel minder is dan de berekende waarde van χ 2 . Dus in het licht hiervan is conclusie duidelijk dat de hypothese onjuist is en inenting en afwezigheid van aanval van cholera zijn geassocieerd.

Voorwaarden voor de geldigheid van Chi-Square-test:

De Chi-square-teststatistiek kan worden gebruikt als aan de volgende voorwaarden wordt voldaan:

1. N, de totale frequentie, moet redelijk groot zijn, zeg groter dan 50.

2. De steekproefwaarnemingen moeten onafhankelijk zijn. Dit houdt in dat geen enkel item tweemaal of meer in de steekproef mag worden opgenomen.

3. De beperkingen op de celfrequenties, indien aanwezig, moeten lineair zijn (dat wil zeggen, ze moeten geen vierkante en hogere vermogenskrachten van de frequenties omvatten) zoals Σf o = Σf e = N.

4. Geen enkele theoretische frequentie mag klein zijn. Klein is een relatieve term. Bij voorkeur zou elke theoretische frequentie groter moeten zijn dan 10 maar in ieder geval niet minder dan 5.

Als een theoretische frequentie lager is dan 5, kunnen we de χ 2- test als zodanig niet toepassen. In dat geval gebruiken we de techniek van "pooling" die bestaat uit het optellen van de frequenties die kleiner zijn dan 5 met de voorgaande of volgende frequentie (frequenties), zodat de resulterende som groter is dan 5 en dienovereenkomstig de vrijheidsgraden aanpast.

5. De gegeven verdeling mag niet worden vervangen door relatieve frequenties of verhoudingen, maar de gegevens moeten in de originele eenheden worden vermeld.

6. Yates-correctie moet worden toegepast in speciale omstandigheden wanneer df = 1 (dwz in 2 x 2 tabellen) en wanneer de celinvoer klein is.

7. χ 2 -test wordt meestal gebruikt als een niet-directionele test (dwz we maken een tweezijdige toets). Er kunnen echter gevallen zijn waarin χ 2 tests kunnen worden gebruikt bij het maken van een eenzijdige toets.

In de eenzijdige test verdubbelen we de P-waarde. Met bijvoorbeeld df = 1 is de kritieke waarde van χ 2 op 05-niveau 2.706 (2.706 is de waarde geschreven onder .10 niveau) en de kritieke waarde van; χ 2 op .01 niveau is 5.412 (de waarde is geschreven onder het .02-niveau).

De eigenschap Additive Property of Chi-Square:

χ 2 heeft een zeer nuttige eigenschap van optellen. Als een aantal voorbeeldstudies in hetzelfde veld zijn uitgevoerd, kunnen de resultaten samen worden gepoold om een ​​goed idee te krijgen van de werkelijke positie.

Stel dat tien experimenten zijn uitgevoerd om te testen of een bepaald vaccin effectief is tegen een bepaalde ziekte. Nu zullen we hier tien verschillende waarden hebben van χ 2 en tien verschillende waarden van df.

We kunnen de tien χ 2 toevoegen om één waarde te verkrijgen en op dezelfde manier kunnen tien waarden van df ook bij elkaar worden opgeteld. We zullen dus één waarde van χ 2 en één waarde van vrijheidsgraden hebben. Nu kunnen we de resultaten van al deze tien experimenten samen gecombineerd testen en de waarde van P. ontdekken.

Stel dat er vijf onafhankelijke experimenten zijn uitgevoerd op een bepaald gebied. Stel dat er in elk geval één df was en dat de volgende waarden van χ 2 werden verkregen.

Nu op 5% significantieniveau (of voor P - .05) is de waarde χ 2 voor een df 3.841. Uit de hierboven gegeven berekende waarden van χ 2 valt op dat in slechts één geval, namelijk experiment nr. 3, de waargenomen waarde van χ 2 minder is dan de getabelleerde waarde van 3.841.

Het betekent dat, wat dit experiment betreft, het verschil onbeduidend is, maar in de resterende vier gevallen is de berekende waarde van χ 2 meer dan 3.841 en als zodanig is het verschil tussen de verwachte en de werkelijke frequenties significant op 5% significant. .

Als we alle waarden van χ 2 optellen, krijgen we (4.3 + 5.7 + 2.1 + 3.9 + 8.3) of 24.3. Het totaal van de vrijheidsgraden is 5. Het betekent dat de berekende waarde van χ 2 voor 5 df 24, 3 is.

Als we in de tabel van χ 2 kijken, zien we dat op 5% significantieniveau voor 5 df de waarde van χ 2 11.070 is. De berekende waarde van χ 2 die 24, 3 is, is veel hoger dan de getabelleerde waarde en als zodanig kunnen we concluderen dat het verschil tussen waargenomen en verwachte frequenties significant is.

Zelfs als we een significantieniveau van 1% nemen (of P = .01), is de tabelwaarde van χ 2 slechts 15.086. Dus de kans om een ​​waarde van χ 2 te krijgen gelijk aan of meer dan 24.3 als gevolg van samplingfluctuaties is veel minder dan zelfs .01 of met andere woorden, het verschil is significant.

Toepassingen van Chi-Test:

De toepassingen van χ 2 -teststatistieken kunnen worden besproken zoals hieronder vermeld:

1. Het testen van de divergentie van waargenomen resultaten van verwachte resultaten wanneer onze verwachtingen gebaseerd zijn op de hypothese van gelijke waarschijnlijkheid.

2. Chi-kwadraat test wanneer verwachtingen zijn gebaseerd op normale verdeling.

3. Chi-kwadraat test wanneer onze verwachtingen gebaseerd zijn op vooraf bepaalde resultaten.

4. Correctie voor discontinuïteit of Yates-correctie bij de berekening van χ 2 .

5. Chi-square test van onafhankelijkheid in contingentietabellen.

Gebruik van Chi-Square-test:

1. Hoewel de test wordt uitgevoerd in termen van frequenties, kan deze het best conceptueel worden beschouwd als een test over verhoudingen.

2. χ 2- test wordt gebruikt bij het testen van de hypothese en is niet nuttig voor schatting.

3. Chi-square test kan worden toegepast op complexe contingentietabel met verschillende klassen.

4. Chi-square-test heeft een zeer nuttige eigenschap, dat wil zeggen 'de eigenschap additief'. Als een aantal voorbeeldstudies in hetzelfde veld worden uitgevoerd, kunnen de resultaten samen worden gepoold. Dit betekent dat χ 2 -waarden kunnen worden toegevoegd.