Concept van Chi-Square-test

In dit artikel zullen we het hebben over het concept van de chikwadraattoets.

De chi-kwadraat test werd gebruikt om te testen dat allelen segregeren op Mendeliaanse principes. Het is een vergelijking van verwachte en waargenomen aantallen vereist. Het wordt gebruikt in statistieken voor het beoordelen van de significantie van de steekproefgegevens. Prof Fisher ontwikkelde een chi-kwadraattest. Symbolisch geschreven als X 2 (uitgesproken als Ki-vierkant).

Het is een statistische meting met behulp waarvan het mogelijk is om de significantie te bepalen van het verschil tussen de waargenomen genotypische getallen (frequenties) en de verwachte aantallen (frequenties) verkregen uit een of ander hypothetisch universum.

Of de experimentele en voorspelde ratio in goede overeenstemming is of niet. Dit zou getest kunnen worden door Chi square Test. Deze test bepaalt dat in de loop van een experimentprocedure met betrekking tot kwantitatieve gegevens enige variatie, die "experimentele fout" wordt genoemd, kan worden toegeschreven aan toevallige fouten alleen.

Dit kan worden berekend met de volgende formule:

X 2 = Σ = (waargenomen waarde - verwachte waarde) 2 / verwachte waarde

Laten we het voorbeeld nemen van de verhouding van fenotype en genotype van experimenten uitgevoerd door Mendel. Door toepassing van X 2 laten de resultaten zien dat de waargenomen frequenties in overeenstemming zijn met de voorspelde verhoudingen. De gegevens van de daadwerkelijke experimenten van Mendel worden gegeven in de volgende tabel. De variaties in de verwachte en voorspelde ratio zijn alleen te wijten aan experimentele fouten.

Mendel observeerde in zijn experiment de verhouding als 9: 3: 3: 1 in dihybride kruising in de F2-generatie, terwijl de verhouding in monohybride kruising in F2-generatie 1: 2: 1 was. Hij vond 315 ronden, gele zaden, 101 rondjes, groene zaden, 108 rimpel, gele zaden en 32 rimpelige, groene zaden.

Dus de verwachte aantallen van elk fenotype zijn 556 (9/16) = 312, 75 ronde, gele zaden; 556 (3/16) = 104, 25 ronde. Groene zaden; 556 (3/16) = 104, 25 rimpel, gele zaden en 556 (1/16) = 34, 75 rimpel, groene zaden. Chi-square zal laten zien of het verschil tussen de werkelijke en de voorspelde ratio te wijten is aan een experimentele fout of niet.

De berekende Chi-kwadraatwaarde is 0, 470, die wordt verkregen door toepassing van de volgende formule:

X 2 = Σ = (waargenomen waarde - verwachte waarde) 2 / verwachte waarde

Mate van vrijheid is vereist voor de berekening van X 2, het aantal onafhankelijke beperkingen bepaalt het aantal vrijheidsgraden (of df). De mate van vrijheid is een maat voor het aantal onafhankelijke variabelen dat aanwezig is in een bepaald experiment.

Er wordt gesteld dat de kans op fouten slechts één onafhankelijke variabele beïnvloedt. In Mendels-experimenten die hierboven zijn vermeld, zijn de variabelen slechts 4, dus de vrijheidsgraad is 4-1 = 3. Het aantal van drie willekeurige fenotypeklassen wordt bepaald, het aantal van de vierde klasse wordt vastgesteld.

Om de waarschijnlijkheid te weten te komen, moeten we de Chi-square tabel raadplegen.

De tabel is gegeven als onder:

De hypothese is nooit overeengekomen of niet akkoord gegaan door de P-waarde. De resultaten van de onderzoeker die aanvaardbaar of onaanvaardbaar zijn met betrekking tot de hypothese, evalueren, de resultaten van de Chi-vierkant waarnemingen. De 5 procentpunten (0-05) op de tafel worden meestal gekozen als een willekeurige standaard voor het bepalen van de significantie of de goodness of fit.

Tabelwaarde van X 2 voor 3 vrijheidsgraden op 5% niveau is 7, 82, een chikwadraatwaarde is 0, 47, wat lager is dan de tabelwaarde en daarom is deze correct. Met andere woorden, er kan worden gezegd dat een waarschijnlijkheid op een significantieniveau van 5% 7, 82 is, wat meer / groter is, vandaar dat de hypothese correct is. Als het minder dan 5% is, wordt het afgewezen.

Laten we nog een voorbeeld nemen om de toepassing van chikwadraattests te begrijpen. Genetische theorie stelt dat kinderen met één ouder van bloedgroep A en de ander van bloedgroep B altijd van een van de drie typen A, AB, B zijn en dat het aandeel van de drie typen gemiddeld 1: 2 is : 1. Een steekproef van 300 kinderen werd verzameld - 30% bleek type A, 45% - type AB en de rest - type B te zijn.

De tabelwaarde X 2 voor (3 - 1) 2d.f. op 5% (0, 05) niveau van significantie is 5, 99. De berekende waarde van chikwadraat is 4.5, wat minder is dan de tabelwaarde en kan worden toegeschreven aan de kans op fouten van het experiment. Dit ondersteunt de theoretische hypothese van de theorie van overerving (segregatie van allelen) dat A, AB en B in de verhouding van 1: 2: 1 staan.

Een ander voorbeeld in dit verband is als volgt:

Het aandeel van de boon in vier groepen, namelijk A, B, C en D, moet 9: 3: 3: 1 zijn. Een boer zaaide 1600 bonen. De resultaten van zijn experiment laten zien dat in vier groepen de gegevens 882, 313, 287 en 118 zijn. Ondersteunt het experimentele resultaat de theorie dat ze in de verhouding van 9: 3: 3: 1 zitten?

Als we de nulhypothese aannemen dat de experimentresultaten de theorie ondersteunen, zijn de verwachte frequenties:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900, 300, 300, 100

Dus:

De tabelwaarde van X 2 voor 3 df op 5% significantieniveau = 7.815.

Omdat de berekende waarde van X 2 kleiner is dan de tabelwaarde, kan de hypothese worden geaccepteerd en zijn de resultaten in lijn met de theorie.

De Chi-square-test wordt ook gebruikt om te bepalen of de populatie in Hardy-Weinberg Equilibrium is.

Een gebruik van de Hardy-Weinberg-methode is om de frequentie van individuele homozygote voor een schadelijk recessief allel te voorspellen. Deze auteurs hebben ontdekt dat een random-parende populatie (panmictisch) zonder mutaties, geen selectiedruk, geen genetische drift en geen migratie, de relatieve frequenties van elk gen (allel) de neiging hebben constant te blijven van generatie op generatie.

De wet vertelt genotype frequenties aan genfrequenties in willekeurig parende populaties, de allelen die segregeren op een gegeven locus kunnen gemakkelijk de verwachte genotype frequenties in die populatie berekenen. Dit staat bekend als de Wet Hardy-Weinberg of wordt vaak de wet van het bevolkingsevenwicht genoemd.

Zodra we de frequenties van de allelen in de populatie kennen, is het mogelijk om de frequenties te berekenen waarmee het genotype bij de nakomelingen van die generatie zal voorkomen. De populatie van seksueel reproducerende diploïde organismen op een locus met twee allelen bij de frequenties p en q, na één generatie van willekeurige paring, zouden de frequenties van het genotype AA, Aa en aa zijn p 2, 2 pq, q 2 zijn .

Laten we een voorbeeld nemen dat twee allelen van het gen AA domineren, terwijl aa ie, de allelen een recessief gen zijn. Volgens de erfelijkheidswetten van Mendel zou de genotype-ratio 25% AA (homozygote dominant) zijn, 50 zou Aa (heterozygoot) en 25% zou aa (homozygoot recessief) zijn.

De statistische formule voor deze wet is p 2 + 2pq + q 2 . Volgens de wetten van Mendel moet het volgende een genetische combinatie zijn.

Dit toont aan dat allelen constant blijven van generatie op generatie.

De toepassing van de chikwadraattoets verschilt enigszins van de toepassing van de wet van Hardy-Weinberg, omdat deze zich bezighoudt met frequenties van verwacht genotype in plaats van getallen. De mate van vrijheid wordt genomen n-2 in plaats van n-1.