Studie-aantekeningen over Chi-Square-test

Dit artikel geeft een studienota over de chi-kwadraattest.

De X 2 -toets (Grieks letter X 2 Uitgesproken als Ki-kwadraat) is een methode om te evalueren of frequenties die empirisch zijn waargenomen significant verschillen van die welke zouden worden verwacht onder een bepaalde set van theoretische aannames. Stel bijvoorbeeld dat de politieke voorkeur en woonplaats of geboortekerk cross-geclassificeerd zijn en de gegevens samengevat in de volgende 2 × 3-contingentietabel.

In de tabel is te zien dat de verhoudingen van stedelijke mensen 38/48 = 0, 79, 20/46 = 0, 34 en 12/18 = 0, 67 (afgerond tot twee decimalen) zijn voor de drie politieke partijen in het land. We zouden dan willen weten of deze verschillen statistisch significant zijn.

Hiertoe kunnen we een nulhypothese voorstellen die veronderstelt dat er geen verschillen zijn tussen de drie politieke partijen met betrekking tot de geboorte. Dit betekent dat de verhoudingen van stedelijke en landelijke mensen naar verwachting gelijk zouden zijn voor elk van de drie politieke partijen.

Op basis van de aanname dat de nulhypothese correct is, kunnen we een set frequenties berekenen die zou worden verwacht gezien deze marginale totalen. Met andere woorden, we kunnen het aantal personen dat de voorkeur geeft aan de Congrespartij berekenen, die we op basis van de bovenstaande aanname zouden verwachten om stedelingen te zijn en dit cijfer te vergelijken met de werkelijk waargenomen persoon.

Als de nulhypothese waar is, kunnen we een gemeenschappelijke verhouding berekenen als:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Met dit geschatte aandeel verwachten we 48 x (0.625) = 30 personen aangesloten bij het Congres, 46 x (0.625) = 28.75 personen gelieerd aan Janata Party en 18 x (0.625) = 11.25 personen aangesloten bij Lok Dal vanaf de 70 stedelingen. Aftrekken deze cijfers van de respectieve waargenomen cijfers van de respectieve maten van de drie monsters, vinden we 48 - 30 = 18 aangesloten bij het Congres, 46 - 28.75 = 17.25 aangesloten bij Janata en 18 - 11.25 = 6.25 personen aangesloten bij Lok Dal van 42 personen van het platteland.

Deze resultaten worden getoond in de volgende tabel, waar verwachte frequenties zijn. getoond tussen haakjes.

Om de houdbaarheid van de nulhypothese te testen, vergelijken we de verwachte en waargenomen frequenties. De vergelijking is gebaseerd op de volgende X 2- statistiek.

X 2 = Σ (O-E) 2 / E

waarbij O staat voor waargenomen frequenties en E voor de verwachte frequenties.

Graden van vrijheid :

Het aantal vrijheidsgraden betekent het aantal onafhankelijke beperkingen dat ons is opgelegd in een contingentietabel.

Het volgende voorbeeld illustreert het concept:

Stel dat de twee attributen A en B onafhankelijk zijn, in welk geval de

verwachte frequentie of de cel AB zou 40 × 30/60 = 20 zijn. Zodra dit is geïdentificeerd, worden de frequenties van de resterende drie cellen automatisch vastgezet. Dus voor cel, aB moet de verwachte frequentie 40 - 20 = 20 zijn, evenzo moet voor cel AB deze 30 - 20 = 10 zijn en voor aB moet deze 10 zijn.

Dit betekent dat we voor de 2 × 2-tafel slechts één eigen keuze hebben, terwijl we in de resterende drie cellen geen vrijheid hebben. De vrijheidsgraden (df) kunnen dus worden berekend met de formule:

df - (c - 1) (r - 1)

waarbij df staat voor de vrijheidsgraden, c voor het aantal kolommen en r voor het aantal rijen.

Dus in tabel 2 x 3 (tabel 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Niveau van betekenis :

Zoals eerder vermeld, wordt de chikwadraattoets gebruikt om te onderzoeken of het verschil tussen waargenomen en verwachte frequenties te wijten is aan de fluctuaties in de bemonstering en als zodanig onbetekenend of contrair, of het verschil te wijten is aan een andere reden en als zodanig significant.

Voordat we de conclusie trekken dat het verschil significant is, zetten onderzoekers een hypothese op, vaak aangeduid als een nulhypothese (gesymboliseerd als Ho ) in tegenstelling tot de onderzoekshypothese (H 1 ) die is opgezet als een alternatief voor Ho .

Meestal, hoewel niet altijd, stelt de nulhypothese dat er geen verschil is tussen verschillende groepen of geen relatie tussen variabelen, terwijl een onderzoekshypothese een positieve of een negatieve relatie kan voorspellen.

Met andere woorden, nulhypothese veronderstelt dat er geen niet-steekproeffouten zijn en dat het verschil te wijten is aan alleen toeval. Dan wordt de waarschijnlijkheid van het optreden van een dergelijk verschil bepaald.

De waarschijnlijkheid geeft de mate van afhankelijkheid aan die we op de gevolgtrekking kunnen plaatsen. De tabelwaarden van chikwadraat zijn beschikbaar op verschillende waarschijnlijkheidsniveaus. Deze niveaus worden niveaus van significantie genoemd. We kunnen uit de tabel de waarden van chikwadraat op bepaalde niveaus van significantie achterhalen.

Gewoonlijk (in het probleem van de sociale wetenschappen) wordt de waarde van chikwadraat op 0, 05 of 0, 01 niveaus van significantie van de gegeven vrijheidsgraden uit de tabel gezien en vergeleken met de waargenomen waarde van chikwadraat. Als de waargenomen waarde of y 1 meer is dan de tabelwaarde bij 0, 05, betekent dit dat het verschil significant is.

Mate van vrijheid :

Om de chikwadraattoets te gebruiken, is de volgende stap het berekenen van de vrijheidsgraden: stel dat we een 2 x 2-kruistabel hebben zoals die in figuur 1.

We kennen de rij en de kolomtotalen r t 1 en r t 2 - en c t 1 en c t 2 . Het aantal vrijheidsgraden kan worden gedefinieerd als het aantal celwaarden dat we vrij kunnen specificeren.

In Fig. 1 zijn, zodra we de ene waarde van Rij 1 hebben gespecificeerd (aangeduid door middel van de check in de figuur), de tweede waarde in die rij en de waarden van de tweede rij (aangegeven met X) al bepaald; we zijn niet vrij om deze te specificeren omdat we de rijtotalen en kolomtotalen kennen. Dit toont aan dat we in een 2 x 2 contingentietabel vrij zijn om slechts één waarde te specificeren.

Procedure :

Berekening voor Chi-square:

Chi-vierkant als een test van Goodness of Fit:

In het vorige gedeelte gebruikten we het chikwadraat als een test van onafhankelijkheid; dat is of een nulhypothese moet worden aanvaard of afgewezen. De x-tests kunnen ook worden gebruikt om te beslissen of er een significant verschil is tussen een waargenomen frequentieverdeling en een theoretische frequentieverdeling.

Op deze manier kunnen we bepalen hoe goed de fit is van de waargenomen en verwachte frequenties. Dat wil zeggen, de fit zou als goed worden beschouwd als er geen significante divergentie is tussen de waargenomen en verwachte gegevens wanneer de curve van de waargenomen frequenties super wordt opgelegd aan de curve van verwachte frequenties.

We moeten echter onthouden dat, zelfs als verhoudingen in de cellen onveranderd blijven, de chikwadraatwaarde direct varieert met het totale aantal gevallen (N). Als we het aantal gevallen verdubbelen, wordt de chikwadraatwaarde verdubbeld; als we het aantal gevallen verdrievoudigen, verdrievoudigen we ook chikwadraat, enzovoort.

De implicaties hiervan kunnen worden geïllustreerd aan de hand van een voorbeeld:

In het huidige voorbeeld is de chikwadraatwaarde 3, 15. Op basis hiervan kunnen we vanzelfsprekend concluderen dat de relatie geen significante is.

Stel nu dat er gegevens zijn verzameld over 500 gevallen met de volgende resultaten:

Chi-kwadraatwaarde zoals berekend uit de figuren, is nu 6, 30, wat het dubbele is van de waarde die is bereikt in het vorige voorbeeld. De waarde 6.30 is statistisch significant. Hadden we de resultaten uitgedrukt in percentages, dan zou er geen verschil in interpretatie zijn geweest.

De bovenstaande voorbeelden illustreren een zeer belangrijk punt, namelijk dat chikwadraat recht evenredig is met N. Daarom zouden we een maatregel nodig hebben die niet alleen wordt beïnvloed door een verandering in het aantal gevallen. De maat phi (ǿ) biedt deze faciliteit, dat wil zeggen de eigenschap die we in onze maat wensen. Deze maat is eenvoudigweg een verhouding tussen de chikwadraatwaarde en het numerieke totaal van de bestudeerde gevallen.

De maat phi (ø) wordt gedefinieerd als:

Ø = √x 2 / n

dat wil zeggen, de vierkantswortel van chikwadraat gedeeld door het aantal gevallen.

Dus, door deze formule toe te passen op de twee hierboven aangehaalde voorbeelden krijgen we, in het eerste geval:

Dus, de maat ø in tegenstelling tot de chikwadraat geeft hetzelfde resultaat als de verhoudingen in de vergelijkbare cellen identiek zijn.

G. Udny Yule heeft nog een andere coëfficiënt van associatie voorgesteld die gewoonlijk wordt aangeduid als "Q" (beter bekend als Yule's Q) die de associatie meet in? x 2 tafel. De coëfficiënt van associatie (Q) wordt verkregen door de verhouding tussen het verschil en de som van de kruisproducten van de diagonale cellen te berekenen, als cellen van de 2x2-tabel worden aangeduid als in de volgende tabel:

ac / b + ad + be

waar a, b, c en d verwijzen naar de celfrequenties.

De coëfficiënt van associatie Q varieert tussen min één en plus één (+1) als zijnde kleiner of groter dan ad. Q bereikt zijn limiet van +1 wanneer een van de cellen nul is, dat wil zeggen, de associatie is voltooid (de correlatie is perfect). Q is nul als de variabelen onafhankelijk zijn (dat wil zeggen, wanneer er geen koppeling is), dat wil zeggen, bij een advertentie. = zijn en. Q = 0.

Toepassing van de bovenstaande formule wordt geïllustreerd in het volgende voorbeeld:

Laten we Yule's coëfficiënt van associatie tussen burgerlijke staat en prestaties in onderzoek berekenen op basis van de gegevens in de volgende tabel:

Vervangen van de bovenstaande waarden in de formule van de Yule:

Er is dus een licht negatief verband tussen de burgerlijke staat en de prestaties tijdens het onderzoek.

We kunnen het probleem ook vanuit een ander gezichtspunt bekijken.

Het percentage gehuwde studenten dat niet geslaagd is, is = 60 × 100/150 = 40.

Het percentage ongehuwde studenten dat niet geslaagd is, = 100 × 100/350 = 28, 57 (ong.)

Dus 40 procent van de getrouwde studenten en bijna 29 procent van de ongehuwde studenten faalden in het onderzoek. Vandaar dat de slechte prestaties van studenten te wijten zijn aan de burgerlijke staat.

Causale gevolgtrekkingen kunnen zeer veilig worden vastgesteld in een experimentele situatie. We hebben dit probleem overwogen bij het omgaan met experimentele ontwerpen. In de sociale wetenschappen is het erg moeilijk om een ​​experiment op te zetten, dus de meeste onderzoeken zijn niet-experimenteel. Analytische procedures zijn echter bedacht om conclusies te trekken over causale relaties in niet-experimentele studies.

Voor zover de meeste sociale onderzoeken een studie van de monsters van de 'bevolking' inhouden en trachten generalisaties naar deze 'populatie' te trekken, is het noodzakelijk, in het belang van de wetenschap, te weten in hoeverre generalisaties die aldus zijn getrokken gerechtvaardigd.

Stel dat in een onderzoek naar steekproeven van mannelijke en vrouwelijke studenten onze resultaten significante verschillen tonen tussen de twee steekproeven in termen van het aantal uren dat zij aan studies besteden.

We kunnen ons afvragen of de verschillen die worden waargenomen de echte verschillen tussen de mannelijke en vrouwelijke studenten weerspiegelen, of dat de twee 'populaties' van studenten feitelijk gelijk zijn in termen van de uren die ze aan studies besteden, maar de monsters die uit deze 'populaties' worden getrokken. want het onderzoek zou in deze mate kunnen verschillen van 'toeval'.

Een aantal statistische procedures is ontworpen om ons in staat te stellen een dergelijke vraag te beantwoorden in termen van de waarschijnlijkheidsverklaringen.

Wanneer we steekproeven vergelijken of het verschil tussen experimentele en controlegroepen bestuderen, willen we gewoonlijk een aantal hypotheses testen over de aard van het ware verschil tussen de 'populaties' die verondersteld worden vertegenwoordigd te zijn door de monsters die bestudeerd worden.

In de sociale wetenschappen houden we ons meestal bezig met een relatief grove hypothese (de vrouwelijke studenten besteden bijvoorbeeld meer tijd aan hun studie dan de mannelijke studenten).

We zijn meestal niet in de positie om een ​​meer specifieke of exacte hypothese te overwegen (bijv. Die in exacte termen het verschil tussen de twee 'populaties' specificeren). Stel dat onze gegevens laten zien dat de steekproef van vrouwelijke studenten gemiddeld vier uur besteedt aan studies, terwijl het aantal mannelijke studenten slechts twee uur bedraagt.

Het is duidelijk dat de bevindingen van onze stalen in overeenstemming zijn met de hypothese, dat wil zeggen dat vrouwelijke studenten meer tijd aan hun studie besteden dan hun mannelijke tegenhangers. Maar we moeten voortdurend de mogelijkheid in gedachten houden dat de bevindingen op basis van onze steekproeven misschien niet precies hetzelfde zijn als de bevindingen die we zouden hebben verkregen als we in feite twee 'populaties' hadden bestudeerd.

Nu willen we inschatten of we nog steeds meer tijd zouden hebben doorgebracht met studies onder vrouwelijke studenten, als we de totale 'bevolking' hadden bestudeerd. Zo'n schatting is mogelijk als we de 'nulhypothese' testen.

De 'nulhypothese' stelt dat de 'populaties' niet verschillen in termen van kenmerken die bestudeerd worden. In dit geval zou een 'nulhypothese' stellen dat in de grotere 'populatie' van studenten als geheel, subgroepen van de vrouwelijke en mannelijke studenten niet verschillen wat betreft de tijd die ze aan hun studie besteden.

Er zijn verschillende statistische technieken ontwikkeld, de tests van significantie genoemd, die ons helpen de waarschijnlijkheid te schatten dat onze twee steekproeven, in de mate waarin ze dat doen, toevallig zouden verschillen, zelfs als er feitelijk geen verschil is tussen de twee overeenkomstige 'populaties' van mannen en vrouwelijke studenten met betrekking tot tijd besteed aan studies.

Van de verschillende methoden voor het testen van significantie hangt de beslissing welke methode geschikt zal zijn voor een bepaald onderzoek af van de aard van de gebruikte metingen en de verdeling van de kenmerken (bijv. Studieuren, aantal kinderen, salarisverwachtingen enz. ).

De meeste van deze toetsingen van significantie gaan ervan uit dat de metingen een intervalschaal vormen en dat de verdeling van de karakteristiek een normale curve benadert. In sociaal onderzoek komen deze aannames zelden overeen met de realiteit. Recente statistische ontwikkelingen hebben echter een oplossing opgeleverd, in de vorm van niet-parametrische tests die niet op deze aannames steunen.

We zouden moeten proberen om op dit punt de reden te begrijpen waarom de 'nulhypothese' zou moeten worden getest wanneer onze werkelijke interesse ligt in het testen van een hypothese (alternatieve hypothese, zoals het wordt genoemd) die stelt dat er een verschil is tussen de twee 'populaties' vertegenwoordigd door de monsters.

De reden is gemakkelijk te waarderen. Omdat we het ware beeld in de 'populatie' niet kennen, is het beste wat we kunnen doen om gevolgtrekkingen te maken op basis van onze steekproef.

Als we twee voorbeelden vergelijken, zijn er natuurlijk twee mogelijkheden:

(1) Ofwel, de populaties die door het monster worden vertegenwoordigd, zijn hetzelfde of

(2) Ze zijn anders.

Onze monsters van twee 'populaties' zijn verschillend met betrekking tot sommige attributen; uren besteed aan studies in ons voorbeeld. Het is duidelijk dat dit kan gebeuren als de twee 'populaties' die de monsters vertegenwoordigen, in feite verschillen met betrekking tot het genoemde attribuut.

Dit vormt echter geen definitief bewijs dat deze 'populaties' verschillen, omdat er altijd de mogelijkheid bestaat dat de monsters niet exact overeenkomen met de 'populaties' die ze beweren te vertegenwoordigen.

We moeten daarom ruimte laten voor de mogelijkheid dat het element van het toeval dat bij de selectie van een steekproef is betrokken, ons monsters heeft gegeven die van elkaar verschillen, hoewel de twee 'populaties' waaruit ze zijn samengesteld, feitelijk niet van elkaar verschillen.

De vraag die we misschien willen stellen, is daarom:

"Kunnen we mogelijk monsters hebben die van elkaar verschillen in de mate waarin ze dat doen, zelfs als de 'populaties' waaruit ze zijn getekend niet verschilden? 'Dit is precies de vraag die een' nulhypothese 'beantwoordt.

De 'nulhypothese' helpt ons in te schatten wat de kansen zijn dat de twee monsters die in deze mate verschillen, zouden zijn ontleend aan twee 'populaties' die feitelijk op elkaar lijken: 5 op de 100? 1 op 100? of wat dan ook.

Als de statistische significantie-test suggereert dat het onwaarschijnlijk is dat twee in dit opzicht verschillende monsters konden worden getrokken uit 'populaties' die in feite vergelijkbaar zijn, kunnen we concluderen dat de twee 'populaties' waarschijnlijk van elkaar verschillen.

Een punt dat in gedachten moet worden gehouden, is dat alle statistische tests van significantie en dus alle generalisaties van de monsters naar de populaties ervan uitgaan dat de monsters niet worden geselecteerd op een manier die vertekening zou kunnen hebben betekend bij het proces van het trekken van de monsters.

Met andere woorden, de aanname is dat de steekproef die we hebben geselecteerd op een zodanige manier is getekend dat alle gevallen of items in de 'populatie' een gelijke of precieze kans hadden om in de steekproef te worden opgenomen.

Als deze aanname niet gerechtvaardigd is, worden de toetsen van betekenis zinloos en niet-toepasbaar. Met andere woorden, de toetsingen van significantie zijn alleen van toepassing wanneer het waarschijnlijkheidsprincipe is gebruikt bij het selecteren van het monster.

Om terug te komen op onze illustratie, stel dat onze bevindingen geen verschil laten zien tussen de twee steekproeven: wat betekent dat zowel mannelijke als vrouwelijke studenten in onze steekproef evenveel tijd aan hun studie besteden.

Kunnen we dan zeggen dat de twee 'populaties' van mannelijke en vrouwelijke studenten vergelijkbaar zijn in termen van dit kenmerk? Natuurlijk kunnen we dit niet met zekerheid zeggen, omdat de mogelijkheid bestaat dat de monsters hetzelfde zijn als de populaties in werkelijkheid verschillen.

Maar om terug te keren naar het geval waarin de twee monsters van elkaar verschillen, kunnen we bevestigen dat de twee populaties die ze vertegenwoordigen waarschijnlijk verschillen als we de 'nulhypothese' kunnen afwijzen; dat wil zeggen, als we kunnen aantonen dat het verschil tussen de twee steekproeven onwaarschijnlijk is als de bovenstaande 'populaties' niet van elkaar verschillen.

Maar nogmaals, er is een kans dat we het mis kunnen hebben om de 'nulhypothese' te verwerpen, omdat het waarschijnlijk is dat zelfs hoogst onwaarschijnlijke gebeurtenissen soms plaatsvinden.

Er is ook een andere kant aan. Net zoals we misschien ongelijk hebben in het afwijzen van de 'nulhypothese', is het ook waarschijnlijk dat we het mis hebben om de 'nulhypothese' te accepteren. Dat wil zeggen, zelfs als onze statistische significantie-test erop wijst dat steekproefverschillen gemakkelijk door toeval zijn ontstaan, ook al zijn de 'populaties' vergelijkbaar, toch kan het waar zijn dat de 'populaties' inderdaad verschillen.

Met andere woorden, we worden altijd geconfronteerd met het risico van een van de twee soorten fouten:

(1) We kunnen de 'nulhypothese' afwijzen wanneer het in feite waar is,

(2) We kunnen de 'nulhypothese' accepteren als het in feite vals is.

Het eerste type fout, we kunnen de Type I-fout noemen. Dit houdt in dat de twee 'populaties' verschillen als ze in feite hetzelfde zijn.

Het tweede type fout kan de Type II-fout worden genoemd. Dit houdt in dat de twee 'populaties' hetzelfde zijn, terwijl ze in feite verschillen.

Het risico van het maken van de Type I-fout wordt bepaald door het significantieniveau dat we bereid zijn te accepteren in onze statistische tests, bijvoorbeeld 0, 05, 0, 01, 0, 001, etc. (dat is 5 in 100, 1 in 100 en 1 in 1000) Dus als we bijvoorbeeld besluiten dat de populaties echt verschillen wanneer een significantietoets aantoont dat het verschil tussen de twee monsters naar verwachting bij toeval niet meer dan 5 keer in 100 optreedt.

Dit betekent dat als de twee 'populaties' die door de steekproef worden vertegenwoordigd in feite vergelijkbaar waren (in termen van een bepaald attribuut), we dan 5 kansen in 100 accepteren dat we de 'nulhypothese' niet goedkeuren. We kunnen het risico van het maken van Type I-fouten natuurlijk minimaliseren door ons criterium voor het afwijzen van de nulhypothese, strenger en strakker te maken.

We kunnen bijvoorbeeld het significantieniveau bij 0, 01 bepalen, dwz we zouden de 'nulhypothese' alleen afwijzen als uit de test blijkt dat het verschil in de twee 'steekproeven' slechts één keer per honderd toevallig is verschenen.

Wat we in essentie zeggen, is dat we de 'nulhypothese' zullen afwijzen als uit de test blijkt dat uit een honderdtal monsters van een aangewezen grootte, gekozen uit de respectieve 'populaties' door het waarschijnlijkheidsbeginsel te gebruiken, slechts één steekproef verschil zal tonen in termen van de attributen voor zover dit wordt gezien in de twee onderzochte monsters.

Het criterium voor het afwijzen van de 'nulhypothese' kan nog strenger worden gemaakt door het significantieniveau verder te verhogen. Maar de moeilijkheid is hier dat de fouten van Type I en Type II zo met elkaar in verband staan ​​dat hoe meer we ons beschermen tegen het maken van een Type I-fout, hoe kwetsbaarder we zijn om een ​​Type II-fout te maken.

Nadat we de mate van risico op type I-fout hebben bepaald die we willen uitvoeren, is de enige manier om de kans op Type II-fouten te verkleinen grotere steekproeven te nemen en statistische tests te gebruiken die de beschikbare relevante informatie maximaal benutten.

De situatie met betrekking tot de Type II-fout kan op een zeer precieze manier worden geïllustreerd aan de hand van een "openingskarakteristiek". Het gedrag van deze curve hangt af van hoe groot het monster is. Hoe groter het monster, hoe minder waarschijnlijk het is dat we een hypothese zullen accepteren die een toestand suggereert die ver verwijderd is van de realiteit van de realiteit.

Voor zover de relatie tussen de Type I- en Type II-fouten omgekeerd is, is het noodzakelijk om een ​​redelijk evenwicht te vinden tussen de twee soorten risico's.

In de sociale wetenschappen is het bijna een gevestigde praktijk of conventie geworden om de 'nulhypothese' af te wijzen wanneer uit de test blijkt dat het verschil tussen de monsters bij toeval niet meer dan 5 keer op 100 zou voorkomen. Maar de conventies zijn nuttig wanneer er is geen andere redelijke gids.

De beslissing over hoe de balans tussen de twee soorten fouten moet worden gemaakt, moet door de onderzoeker worden genomen. In sommige gevallen is het belangrijker om zeker te zijn van het afwijzen van een hypothese wanneer deze vals is dan deze niet te accepteren wanneer deze waar is. In andere gevallen kan het omgekeerde waar zijn.

In sommige landen wordt het bijvoorbeeld belangrijker geacht om een ​​hypothese van schuld af te wijzen wanneer deze vals is dan om deze hypothese niet te accepteren als het waar is, dat wil zeggen, een persoon wordt als niet schuldig beschouwd zolang er een redelijke twijfel bestaat over zijn schuld. In bepaalde andere landen wordt iemand die beschuldigd wordt van een misdrijf als schuldig beschouwd totdat hij heeft aangetoond dat hij schuldig is.

Bij veel onderzoek is er natuurlijk geen duidelijke basis om te beslissen of een Type I- of Type II-fout duurder zou zijn en dus maakt de onderzoeker gebruik van het conventionele niveau bij het bepalen van statistische significantie. Maar er kunnen enkele studies zijn waarin een type fout duidelijk duurder en schadelijker is dan de andere.

Stel dat in een organisatie is gesuggereerd dat een nieuwe methode voor taakverdeling efficiënter zou zijn en stel ook dat deze methode veel kosten zou vergen.

Als een experiment bestaat uit twee groepen personeel - één die werkt als experimentele groep en de andere als controlegroep - wordt opgezet om te testen of de nieuwe methode echt nuttig is voor de organisatiedoelstellingen en als wordt verwacht dat de nieuwe methode zou leiden tot veel kosten, de organisatie zou het niet willen adopteren tenzij er een aanzienlijke zekerheid was dat het superieur was.

Met andere woorden, het zou duur zijn om een ​​Type 1-fout te maken, dat wil zeggen, concluderen dat de nieuwe methode beter is, terwijl dat in feite niet zo is.

Als de nieuwe methode kosten met zich zou meebrengen die ongeveer hetzelfde waren als de oude methode, dan is type II-fout ongewenst en schadelijker omdat dit ertoe kan leiden dat het management de nieuwe methode niet goedkeurt wanneer het in feite superieur is en als zodanig heeft lange-termijn voordelen voor de organisatie in petto.

Alle generalisaties van de steekproef naar de 'populatie' is eenvoudig een verklaring van de statistische waarschijnlijkheid. Laten we zeggen dat we besloten hebben om te werken met een 0.05 significantieniveau. Dit betekent dat we de 'nulhypothese' alleen zullen afwijzen als het steekproefverschil van de grootte die we hebben waargenomen naar verwachting bij toeval niet meer dan 5 keer in 100 optreedt.

Natuurlijk accepteren we de 'nulhypothese' als een dergelijk verschil naar verwachting meer dan 5 keer op 100 bij toeval voorkomt. Nu is de vraag: vertegenwoordigt onze bevinding een van die vijf keer wanneer een dergelijk verschil mogelijk toevallig verschenen?

Deze vraag kan niet definitief worden beantwoord op basis van een geïsoleerde bevinding. Het kan echter mogelijk zijn dat we hier iets over zeggen als we de patronen in onze bevindingen onderzoeken.

Stel dat we geïnteresseerd zijn in het testen van de effecten van een film op de houding tegenover een specifiek overheidsprogramma, bijvoorbeeld gezinsplanning. We moeten, laten we zeggen, er alles aan doen om de gewenste condities voor experimenten maximaal te houden.

Stel nu dat we als enige maatstaf voor de houding ten opzichte van het programma slechts één item gebruiken, namelijk de houding ten opzichte van het uit elkaar plaatsen van kinderen en vinden dat degenen die de film zagen gunstiger neigen naar dit onderwerp dan degenen die de film niet hebben gezien.

Stel nu dat de statistische test aantoont dat het verschil niet bij toeval zou zijn ontstaan ​​door willekeurige fluctuaties van steekproeven meer dan eens in de twintig. Logischerwijs betekent dit ook dat het bij toeval één keer in de twintig (of 5 keer in 100) kan zijn verschenen. Zoals we hebben opgemerkt, hebben we geen definitieve manier om te weten of onze steekproef een van de vijf op de honderd is. Wat kunnen we nu het beste doen?

Laten we zeggen dat we aan respondenten veertig verschillende vragen hebben gesteld, die redelijke indicatoren zijn van de houding ten opzichte van het regeringsprogramma voor gezinswelzijn. Als we een betrouwbaarheidsniveau van 5% gebruiken en als we 100 vragen stellen, kunnen we verwachten dat we statistisch significante verschillen vinden die te wijten zijn aan het toeval op 5 van hen.

Dus van onze 40 vragen over verschillende items, kunnen we verwachten dat we statistisch significante verschillen zullen vinden op 2 van hen. Maar stel dat we dat daadwerkelijk vinden op 25 van de 40 vragen over degenen die zagen dat de film positievere attitudes had vergeleken met degenen die de film niet zagen.

We kunnen, in dit geval, veel veiliger zijn door te concluderen dat er een echt verschil in attitudes is (hoewel uit de statistische test blijkt dat het verschil bij elke vraag 5 keer per 100 keer bij toeval is ontstaan).

Laten we nu aannemen dat van de 40 vragen, antwoorden op slechts één, dat wil zeggen, op de tussenruimte van kinderen, een statistisch significant verschil vertoonden tussen de twee groepen die werden blootgesteld aan film en die niet). Dit verschil had net zo goed bij toeval kunnen ontstaan.

Aan de andere kant kan het zijn dat de inhoud van de film feitelijk de meningen op dit punt heeft beïnvloed, maar niet op andere (zoals die met betrekking tot steriliteitsoperaties). Maar tenzij onze hypothese van tevoren heeft voorspeld dat de kans groter is dat de film de houding ten opzichte van de afstand van kinderen beïnvloedt dan de houding tegenover een van de andere 39 vragen, zijn we niet gerechtigd deze interpretatie te geven.

Een dergelijke interpretatie, dat wil zeggen één die wordt gebruikt om de bevindingen na het verschijnen ervan uit te leggen, staat bekend als de 'post-factum'-interpretatie, omdat hier uitleg wordt gegeven om de bevindingen te rechtvaardigen, ongeacht wat ze zijn. Het hangt van de vindingrijkheid van de onderzoeker af welke uitleg hij kan uitvinden om deze bevindingen te rechtvaardigen. Hij kan daarom zelfs de tegenovergestelde bevindingen rechtvaardigen.

Merton heeft er heel duidelijk op gewezen dat de post-factuminterpretaties bedoeld zijn om observaties te "verklaren". De methode van post-factum uitleg is volledig flexibel. Als de onderzoeker vindt dat werklozen geneigd zijn minder boeken te lezen dan eerder, kan dit worden "verklaard" door de hypothese dat angst als gevolg van werkloosheid de concentratie beïnvloedt en dus lezen moeilijk wordt.

Als echter geconstateerd wordt dat werklozen meer boeken lezen dan voorheen (wanneer ze in loondienst zijn), kan een nieuwe post-factumverklaring worden ingeroepen; de verklaring is dat werklozen meer vrije tijd hebben en daarom lezen ze meer boeken.

De kritische test van een verkregen relatie (tussen variabelen) is niet de post-factum-redenering en verklaring daarvoor; het is eerder het vermogen om het te voorspellen of om andere relaties op basis daarvan te voorspellen. Onze eerder onvoorspelbare bevinding van een verschil in houding ten opzichte van de afstand van kinderen, hoewel statistisch significant, kan dus niet worden beschouwd als vastgesteld door de studie die we hebben uitgevoerd.

Omdat statistische uitspraken waarschijnlijkheidsverklaringen zijn, kunnen we nooit volledig vertrouwen op alleen het statistische bewijs om te beslissen of we een hypothese al dan niet als waar accepteren.

Vertrouwen in de interpretatie van een onderzoeksresultaat vereist niet alleen statistisch vertrouwen in de betrouwbaarheid van de bevinding (dat wil zeggen dat de verschillen waarschijnlijk niet bij toeval zijn ontstaan), maar daarnaast ook enig bewijsmateriaal over de geldigheid van vooronderstellingen van het onderzoek.

Dit bewijsmateriaal is noodzakelijk indirect. Het komt voort uit de congruentie van de gegeven onderzoeksresultaten met andere kennis die de tand des tijds heeft doorstaan ​​en vandaar dat er veel zekerheid is.

Zelfs in het meest rigoureus gecontroleerde onderzoek vereist het vestigen van vertrouwen in de interpretatie van iemands resultaten of in de toerekening van causale relaties replicatie van onderzoek en het relateren van de bevindingen aan die van andere studies.

Het is noodzakelijk op te merken dat zelfs als uit statistische tests en de resultaten van een aantal studies blijkt dat er inderdaad een consistent verschil is tussen twee groepen of een consistente relatie tussen twee variabelen, dit nog steeds niet het bewijs vormt voor de reden voor de relatie.

Als we causale gevolgtrekkingen willen maken (bijv. X produceert Y), moeten we aannames behalen die verder gaan dan die vereist voor het vaststellen van het bestaan ​​van een relatie. Het is ook opmerkelijk dat een resultaat niet sociaal of psychologisch significant is, alleen maar omdat het statistisch significant is. Veel statistisch significante verschillen kunnen in praktisch sociaal taalgebruik triviaal zijn.

Een gemiddeld verschil van minder dan één IQ-punt tussen de stedelijke en landelijke bevolking kan bijvoorbeeld statistisch significant zijn, maar niet zo in het praktische dagelijkse leven. In tegendeel, er zijn gevallen waarin een klein maar betrouwbaar verschil grote praktische betekenis heeft.

In een grootschalige enquête kan bijvoorbeeld een verschil van de helft of één procent honderdduizenden mensen vertegenwoordigen en kan bewustzijn van het verschil van belang zijn voor belangrijke beleidsbeslissingen. Daarom moet de onderzoeker zich naast het bezig houden met de statistische significantie van zijn bevindingen ook bezig houden met hun sociale en psychologische betekenissen.

Oorzaken van causale relaties:

Vanwege duidelijke moeilijkheden kunnen dergelijke rigide experimentele ontwerpen zelden worden uitgewerkt in sociaalwetenschappelijk onderzoek. De meeste vragen in sociale wetenschappen zijn niet-experimenteel van aard.

In dergelijke studies zijn er bepaalde empirische obstakels bij het bepalen of een relatie tussen variabelen causaal is of niet. Er is herhaaldelijk vermeld dat een van de moeilijkste taken in de analyse van gegevens over sociaal gedrag het vaststellen van oorzaak en gevolg-relaties is.

Een problematische situatie dankt zijn oorsprong en het proces van worden, niet alleen voor één factor, maar voor een complex van verschillende factoren en sequenties.

Het proces van ontwarren van deze elementen vormt een grote uitdaging voor de sociologische verbeeldingskracht en stelt de vaardigheid van onderzoekers om te testen. Het is gevaarlijk om een ​​'one-track'-verklaring te volgen die tot de oorzaak leidt. Het is absoluut noodzakelijk om te zoeken naar een hele reeks causale factoren die over het algemeen een belangrijke rol spelen bij het tot stand brengen van complexe sociale situaties.

Zoals Karl Pearson treffend opmerkt, "geen fenomeen of opeenvolgend stadium heeft slechts één oorzaak; alle voorafgaande fasen zijn opeenvolgende oorzaken; wanneer we wetenschappelijk oorzaken aangeven, beschrijven we in feite de opeenvolgende stadia van een routine van ervaring. "

Yule en Kendall hebben het feit erkend dat statistieken "moeten accepteren voor analyse, gegevens die onderhevig zijn aan de invloed van een groot aantal oorzaken en moeten proberen uit de gegevens zelf te achterhalen welke oorzaken de belangrijkste zijn en hoeveel van het waargenomen effect te wijten is aan de werking van elk. "

Paul Lazarsfeld heeft de fasen gevolgd die betrokken zijn bij de techniek die hij 'onderscheidingsvermogen' noemt. Hij bepleit het gebruik ervan bij het bepalen van causale relaties tussen variabelen. Lazarsfeld legt deze procedure vast:

(a) Verifiëring van een vermeend voorval als onder:

Om dit te verifiëren, moet worden nagegaan of de persoon de vermeende situaties daadwerkelijk heeft ervaren. Zo ja, hoe manifesteert het voorval zich en onder welke voorwaarden, in zijn directe leven?

Welke redenen zijn gevorderd voor de overtuiging dat er een specifieke koppeling is tussen twee variabelen, bijvoorbeeld verlies van werk en verlies van autoriteit? Hoe correct is de redenering van de persoon in dit specifieke geval?

(b) Proberen te ontdekken of de vermeende toestand consistent is met objectieve feiten van het vorige leven van deze persoon.

(c) Het testen van alle mogelijke verklaringen voor de waargenomen toestand.

(d) Het verklaren van die verklaringen die niet in overeenstemming zijn met het patroon van gebeurtenissen.

Het is heel begrijpelijk dat de meeste moeilijkheden of obstakels voor het vaststellen van causale relaties niet-experimentele studies het sterkst treffen. In niet-experimentele onderzoeken waarbij het van belang is om causale relaties tussen twee variabelen vast te stellen, moet de onderzoeker vervangende waarborgen vinden die duidelijk zijn ingebouwd in de experimentele onderzoeken.

Veel van deze waarborgen komen binnen op het moment van het verzamelen van planningsgegevens, in de vorm van het verzamelen van informatie over een aantal variabelen die misschien wel de alternatieve voorwaarden zijn voor het produceren van het veronderstelde effect.

Door dergelijke extra variabelen in de analyse te introduceren, benadert de onderzoeker sommige van de controles die inherent zijn aan experimenten. Niettemin blijft het trekken van conclusies over causaliteit altijd enigszins gevaarlijk in niet-experimentele studies.

We zullen nu enkele van de problemen bespreken en de strategieën om ze te overwinnen, met betrekking tot het trekken van conclusies over causaliteit in niet-experimentele studies. Als een niet-experimenteel onderzoek wijst naar een relatie of associatie tussen twee variabelen, zeg X en Y, en als de onderzoeksinteresse zich in causale relaties bevindt, in plaats van in het simpele feit van associatie tussen variabelen, heeft de analyse slechts de eerste stap gezet.

De onderzoeker moet verder (naast associatie tussen X en Y) overwegen of Y (effect) vóór X (de veronderstelde oorzaak) zou kunnen zijn opgetreden, in welk geval Y niet het effect van X kan zijn.

Naast deze overweging moet de onderzoeker nadenken over de vraag of andere factoren dan X (de veronderstelde oorzaak) Y (het veronderstelde effect) kunnen hebben veroorzaakt. Dit wordt over het algemeen gedaan door extra variabelen in de analyse in te voeren en te onderzoeken hoe de relatie tussen X en Y wordt beïnvloed door deze verdere variabelen.

Als de relatie tussen X en Y aanhoudt zelfs wanneer andere vermoedelijk effectieve en mogelijk alternatieve variabelen worden geïntroduceerd, blijft de hypothese dat X de oorzaak van Y is, houdbaar.

Als de relatie tussen het eten van een bepaalde seizoensfruit (X) en koude (Y) niet verandert, zelfs als andere variabelen zoals leeftijd, temperatuur, staat van de spijsvertering, enz. In de analyse worden geïntroduceerd, kunnen we de hypothese dat X leidt tot Y als houdbaar.

Maar het is mogelijk in geen enkel geval dat de introductie van andere extra variabelen de relatie tussen X en Y kan veranderen. Het kan verminderen om de relatie tussen X en Y volledig te elimineren of het kan de relatie in één groep verbeteren en het verminderen in een andere.

Als de relatie tussen X (eten van seizoensfruit) en Y (koud) verhoogd is in een subgroep gekarakteriseerd door Z (slechte staat van digestie) en verminderd in subgroep die niet wordt gekenmerkt door Z (normale spijsvertering), dan kan concluderen dat Z de voorwaardelijke voorwaarde is voor de relatie tussen X en Y.

Dit betekent met andere woorden dat we conditie (Z) hebben kunnen specificeren waaronder de relatie tussen X en Y zit. Als de introductie van Z in de analyse de relatie tussen X en Y vermindert of volledig wegneemt, kunnen we veilig concluderen dat X geen Y-producent is, dat wil zeggen dat de relatie tussen X en Y 'onecht' is of dat we hebben het proces gevolgd waardoor X naar Y leidt (di via Z).

Laten we ons nu buigen over de situatie waarin we terecht kunnen concluderen dat de relatie tussen X en Y onecht is.

Een schijnbare relatie tussen twee variabelen X en Y wordt als onecht beschouwd als de bijbehorende variatie niet het gevolg is van een verbinding daartussen, maar van het feit dat elk van hen (X en Y) gerelateerd is aan een derde variabele (Z) of een combinatie van variabelen die niet dienen als een link in het proces waardoor X naar Y leidt.

De situatie die een oneigenlijke relatie kenmerkt, kan worden geschematiseerd als onder:

Het doel hier is om de oorzaak van Y, de afhankelijke variabele (laten we zeggen de geldverwachtingen door afgestudeerden) te bepalen. De relatie (gebroken lijn) tussen X de onafhankelijke variabele (laten we zeggen de cijfers verkregen door studenten) en de geldelijke verwachting van afgestudeerden (Y) is waargenomen in de loop van de analyse van gegevens.

Een andere variabele (Z) wordt geïntroduceerd om te zien hoe de relatie tussen X en Y zich gedraagt ​​met de invoer van deze derde factor. Z is de derde factor (laten we zeggen het inkomensniveau van de ouders van studenten). We vinden dat de introductie van deze factor de relatie tussen X en Y vermindert.

Dat wil zeggen, het blijkt dat de relatie tussen een hogere rang in het examen en hogere monetaire verwachtingen zichzelf niet ophoudt, maar aanzienlijk wordt verminderd wanneer we de derde variabele introduceren, dat wil zeggen, het niveau van het inkomen van de ouders.

Een dergelijke introductie van Z brengt aan het licht dat niet X maar Z waarschijnlijk een bepalende factor van Y is. Dus de relatie tussen X en Y (in het diagram weergegeven met een stippellijn) is onecht, terwijl de relatie tussen Z en Y is een echte. Laten we dit illustreren met behulp van hypothetische gegevens.

Veronderstel dat in de loop van de analyse van gegevens in een onderzoek werd vastgesteld dat er een significante correlatie bestaat tussen de cijfers of afdelingen (I, II, III) die studenten hebben behaald in het onderzoek en het salaris dat zij verwachten voor een baan die ze kunnen worden aangesteld.

Zo werd bijvoorbeeld geconstateerd dat over het algemeen de eerste divisies onder studenten een hogere vergoeding verwachtten ten opzichte van de tweede divisies en de tweede divisies meer verwachtten dan de derde divisies.

De volgende tabel illustreert de hypothetische stand van zaken:

Uit de tabel blijkt duidelijk dat er een basis is om te veronderstellen dat de cijfers van de studenten hun verwachtingen over salarissen bepalen. Laten we nu eens veronderstellen dat de onderzoeker op de een of andere manier op het idee komt dat het inkomensniveau van de ouders (X) een van de belangrijke variabelen zou kunnen zijn die de verwachtingen van de studenten over salarissen bepalen of beïnvloeden (Y). Aldus wordt Z geïntroduceerd in de analyse.

Stel dat de volgende tabel de relatie tussen de variabelen weergeeft:

Notitie:

HML in de horizontale rij, die elke categorie van de cijfers van de leerlingen verdeelt, staat respectievelijk voor het hoge inkomensniveau van de ouders, een gemiddeld ouderinkomen en een laag ouderschapsniveau van het inkomen. De bovenstaande tabel laat duidelijk zien dat de relatie tussen X en Y minder significant is geworden in vergelijking met de relatie tussen Z en Y. '

Om een ​​duidelijker beeld te krijgen, kunnen we de volgende tabel bekijken (een versie van tabel B zonder de categorieën van X) die de relatie tussen Z en, dat wil zeggen, het inkomenniveau van de ouders en de monetaire verwachtingen van studenten laat zien:

We kunnen heel duidelijk aan de tafel zien dat, ongeacht hun cijfers, de monetaire verwachtingen van de studenten zeer sterk worden beïnvloed door de ouderlijke niveaus van inkomen (Z).

We zien dat een overweldigend aantal studenten (dwz 91, 5%) met hoge geldverwachtingen afkomstig zijn uit de hoge ouderlijke inkomensgroep, 92% met bescheiden monetaire verwachtingen van een gematigde ouderlijke inkomensgroep en ten slotte, 97% met lage monetaire verwachtingen van de lage ouderlijke inkomensgroep.

Als we deze afbeelding vergelijken met de afbeelding weergegeven in tabel A, kunnen we zeggen dat de relatie tussen X en Y onecht is, dat wil zeggen dat het cijfer van de studenten niet primair het niveau van de geldverwachtingen van de studenten heeft bepaald.

In tabel A wordt opgemerkt dat studenten die een hogere graad behalen een significante tendens vertonen in de richting van hogere geldverwachtingen, terwijl de studenten van lagere rang een zeer uitgesproken concentratie hebben in de lagere monetaire-verwachtingen.

Maar wanneer we de derde variabele van het inkomen van de ouders introduceren, wordt het opkomende beeld duidelijk genoeg om de conclusie te rechtvaardigen dat de reële factordifferentiële niveaus van monetaire verwachtingen het niveau van het ouderlijk inkomen zijn.

In tabel C zien we een zeer sterke en formidabele concentratie van studentenkwesties die overeenkomen met de drie hieronder genoemde combinaties, namelijk hogere monetaire verwachtingen en hoger ouderlijk inkomen, gematigde monetaire verwachtingen en gematigd ouderlijk inkomen en lagere monetaire verwachtingen en lager inkomen van de ouders, dat wil zeggen 5%, 92, 1% en 1% respectievelijk.

Het proces in kwestie en een relatie tussen variabelen traceren: Zoals eerder is vermeld, kunnen we, als een derde factor Z de relatie tussen de onafhankelijke variabele X en de afhankelijke variabele Y vermindert of wegneemt, concluderen dat de relatie tussen X en Y onecht is, of dat we in staat zijn geweest het proces te volgen waarmee X naar Y leidt.

We zullen nu de omstandigheden bekijken die de conclusie zouden kunnen rechtvaardigen dat het proces van de relatie tussen X en Y is opgespoord via een derde factor Z.

Stel dat in een onderzoek de onderzoekers ontdekten dat kleinere gemeenschappen een hogere gemiddelde intimiteitsscore hadden, waarbij de intimiteitsscore een maatstaf was voor de intimiteit van de associatie tussen leden van een gemeenschap die tot stand kwam met behulp van een intimiteitsschaal.

Stel dat ze ook hebben ontdekt dat de middelgrote community's een lagere intimiteitsscore hadden in vergelijking met de kleine community's en big-size communities hadden de laagste gemiddelde intimiteitsscore. Een dergelijke bevinding suggereert dat de grootte van de gemeenschap de intimiteit van associatie tussen leden van de gemeenschap bepaalt.

Met andere woorden, de observaties rechtvaardigen de conclusie dat de leden die in een kleine gemeenschap wonen een grotere intimiteit van associatie hebben, terwijl de grote gemeenschappen worden gekenmerkt door een mindere intimiteit van associatie tussen de leden.

De volgende tabel geeft de hypothetische gegevens weer:

In de tweede kolom van de tabel zijn voorbeelden weergegeven die overeenkomen met elk van de community's.

In de tweede kolom van de tabel zijn voorbeelden weergegeven die overeenkomen met elk van de community's. In kolom 3 zijn de gemiddelde intimiteitsscores weergegeven die overeenkomen met typen gemeenschappen die zijn berekend op basis van de antwoorden op bepaalde items op een schaal die betrekking heeft op de dagelijkse associaties tussen leden.

Uit de tabel blijkt dat de gemiddelde intimiteitsscores omgekeerd evenredig zijn met de grootte van de community, dat wil zeggen, kleiner de grootte, hoe groter de intimiteitsscore en omgekeerd, hoe groter de grootte, hoe lager de intimiteitsscore.

Stel nu dat de onderzoekers het idee kregen dat de drie soorten gemeenschappen zouden verschillen in termen van kansen die ze bieden voor interactie tussen leden, voor zover de woonarrangementen, residentiële patronen, algemeen gedeelde hulpprogramma's enz. Een dergelijke associatie zouden bevorderen.

De onderzoekers zouden dus de derde factor introduceren in de analyse van het interactiepotentieel, dat wil zeggen de mate waarin de omstandigheden waarin personen leven waarschijnlijk kansen bieden voor interactie tussen henzelf.

Om na te gaan de hypothese dat het voornamelijk was door verschillen in residentiële patronen, woonvormen, gemeenschappelijk gedeelde voorzieningen, enz., Dat de drie soorten gemeenschappen verschillen in interactie tussen leden van een gemeenschap veroorzaakten, zouden de onderzoekers de omvang van gemeenschap en interactie-potentieel gezamenlijk in relatie tot de gemiddelde intimiteitsscore.

De infractie-potentiaal is dus de derde variabele Z die in de analyse wordt geïntroduceerd. Het interactiepotentieel is geclassificeerd, laten we zeggen, in een laag interactiepotentieel (b) medium interactiepotentieel, en (c) hoog interactiepotentieel.

De volgende tabel geeft de hypothetische gegevens weer:

Lezend over de rijen in de tabel, zien we dat het interactiepotentieel sterk gerelateerd is aan de intimiteitsscore van de communityleden, ongeacht de grootte van de community.

Dat wil zeggen, of we nu de rij voor kleine gemeenschappen, voor de middelgrote gemeenschappen of voor de grote gemeenschappen beschouwen, er is in beide gevallen een toename van de gemiddelde intimiteitsscore met een toename van het interactiepotentieel. Bovendien wordt het, door de ingangen over de rijen te lezen, duidelijk dat de grootte van de gemeenschap en het interactiepotentieel een significante correlatie hebben.

Ongeveer tweederde van de respondenten in een kleine gemeenschap leeft bijvoorbeeld in omstandigheden met een hoog interactiepotentieel; we vinden ook dat een veel kleiner deel van de gematigde gemeenschapsgemeenschappen leeft onder hoge interactiepotentiële omstandigheden en een zeer klein deel van de grote gemeenschapsgemeenschappen onder omstandigheden met hoge interactiepotentialen.

Nu lezen we de intimiteitsscores in de kolommen om te ontdekken dat de relatie tussen het type gemeenschap en de intimiteit van associatie aanzienlijk is verminderd. In feite, voor mensen die leven onder omstandigheden met een hoge interactiepotentieel, verkrijgt geen definitieve relatie tussen de omvang van de gemeenschap en de intimiteitsscore.

Uit deze reeks relaties kunnen de onderzoekers concluderen dat de omgekeerde relatie tussen de omvang van de gemeenschap en de intimiteitsscore wel degelijk goed is, maar dat een van de belangrijkste manieren waarop een bepaald type gemeenschap intimiteit onder zijn leden aanmoedigt, is door het aanbieden van kansen die de mate van interactie tussen hen vergroten.

Met andere woorden, de kleine gemeenschappen worden gekenmerkt door een hogere gemiddelde intimiteitsscore omdat hun kleine omvang een omgeving biedt voor vele mogelijkheden voor een hoge mate van interactie tussen leden. Big-size communities, aan de andere kant, worden gekenmerkt door een relatief lagere intimiteitsscore.

Maar de lagere intimiteitsscore is niet te wijten aan de omvang van de gemeenschap als zodanig, maar aan het feit dat een grote gemeenschap geen kansen biedt voor een hogere interactie tussen leden, zoals de kleine gemeenschappen doen.

Vandaar dat de onderzoekers eerder dan concluderen dat de relatie tussen de omvang van de gemeenschap en de gemiddelde intimiteitsscore onder leden onecht is, zou kunnen concluderen dat ze in staat zijn geweest om het proces te volgen waarmee X {ie, het type gemeenschap) Y beïnvloedt. (de intimiteitsscore).

De eerste vereiste de conclusie dat de relatie tussen de variabelen X en Y onecht was en de laatste de conclusie dat het proces van X naar Y kan worden getraceerd via Z (X naar Z naar Y). In beide gevallen reduceerde of elimineerde de introductie van een derde variabele Z de relatie tussen hen (X en Y).

Een verschil kan echter worden opgemerkt. In het eerste voorbeeld was de variabele Z (dat wil zeggen het inkomensniveau van de ouders) duidelijk voorafgaand aan de andere twee variabelen (cijfer van studenten in het examen en de monetaire verwachtingen van studenten).

In het tweede voorbeeld, de derde variabele Z (interactie-potentieel geboden door de gemeenschappen) niet vóór de veronderstelde causale variabele (grootte van de gemeenschap). Het was ermee gelijk en kan worden gezien als erna beginnen.

De tijdreeks van de variabelen is dus een belangrijke overweging bij het bepalen of een schijnbare causale relatie onecht is. Dat wil zeggen, als de derde variabele Z, die de relatie tussen de oorspronkelijk gerelateerde variabelen X en Y verwijdert of wegneemt, concluderen we meestal dat de schijnbare causale relatie tussen variabelen X en Y onecht is.

Maar als de derde variabele Z bekend is of verondersteld is te zijn opgetreden op dezelfde tijdstippen als X of na X, kan het zijn om te concluderen dat het proces waarmee X naar Y leidt is getraceerd. Dus om een ​​zekere mate van vertrouwen in causale relatie afgeleid van studies die niet-experimenteel van aard zijn, is het noodzakelijk om hen te onderwerpen aan de kritische test van het elimineren van de andere mogelijk relevante variabelen.

Om deze reden is het belangrijk om in de loop van het onderzoek gegevens te verzamelen over dergelijke mogelijk invloedrijke variabelen, andere dan die waarmee de hypothese van het onderzoek centraal betrokken is.

Eerder werd al gesteld dat de introductie van een derde variabele in de analyse tot gevolg kan hebben dat de relatie binnen een subgroep wordt geïntensiveerd en dat deze in een andere subgroep wordt verkleind. Als dat het geval is, zeggen we dat we een voorwaarde (Z) hebben opgegeven waaronder de relatie tussen X en Y geldt.

Laten we nu het proces van specificatie illustreren. Stel dat we in een community study toevallig een relatie tussen inkomen en opleidingsniveau identificeren.

Dit wordt getoond in de onderstaande tabel:

We zien in de tabel dat de relatie tussen opleiding en inkomen vrij duidelijk is. Hoger het onderwijs, in het algemeen, hoger het percentage gevallen dat een jaarlijks inkomen van Rs.5.000 / - en hoger verdient. We kunnen echter besluiten dat de relatie nadere specificatie vereist.

Dat wil zeggen dat we misschien meer willen weten over de omstandigheden waaronder deze relatie ontstaat. Veronderstel dat de gedachte ons opvalt dat het feit van de respondenten die in de stedelijke industriële gemeenschap wonen, de voordelen van het onderwijs voor de bezoldigde tewerkstelling positief zou kunnen beïnvloeden, en daarmee de weerspiegeling in het inkomen.

In deze veronderstelling introduceren we de derde factor Z, dwz de respondenten die in de stedelijke industriële gemeenschap wonen en degenen die in de niet-industriële plattelandsgemeenschap wonen, in de analyse en zien ze hoe deze de oorspronkelijke relatie tussen X en Y beïnvloedt ( dat wil zeggen opleiding en inkomen).

Stel dat we een afbeelding krijgen zoals weergegeven in de volgende tabel:

We kunnen duidelijk zien dat tabel B een heel andere relatie weergeeft tussen inkomen en onderwijs voor de mensen die in de niet-industriële plattelandsgemeenschap wonen in vergelijking met die voor degenen die in de stedelijk-industriële gemeenschap wonen. We zien dat voor mensen die in de industriële steden wonen, de relatie tussen opleiding en inkomen iets hoger is dan de oorspronkelijke relatie.

Maar voor degenen die in de niet-industriële plattelandsgemeenschappen wonen, is de relatie in de bovenstaande tabel aanzienlijk lager dan de oorspronkelijke relatie.

Zo heeft de introductie van de derde factor en de opsplitsing van de oorspronkelijke relatie op basis van de derde factor (Z) geholpen om een ​​voorwaarde te specificeren waaronder de relatie tussen X en Y meer uitgesproken is, evenals de voorwaarde waaronder de relatie is minder uitgesproken.

Evenzo stel dat we in de loop van een onderzoek vaststellen dat mensen die tot de hogere inkomenscategorie behoren over het algemeen een kleiner aantal kinderen hebben in vergelijking met die in de lagere inkomenscategorie. Stel dat we (op basis van een theoretische oriëntatie) denken dat de factor van wonen in de stad belangrijk kan zijn bij het beïnvloeden van de relatie.

Als we deze factor introduceren, veronderstellen we dat de oorspronkelijke relatie tussen het inkomensniveau en het aantal kinderen meer uitgesproken wordt in de stad en dat deze minder uitgesproken wordt onder de plattelandsbewoners, dan hebben we een toestand Z (di stadswoning) geïdentificeerd ) waaronder de relatie beslissend versterkt of uitgesproken wordt.

De bevindingen van een onderzoek interpreteren:

Tot nu toe hebben we ons vooral beziggehouden met de procedures die samen, wat we gewoonlijk noemen, de analyse van gegevens vormen. De taak van de onderzoeker is echter onvolledig als hij stopt met het presenteren van zijn bevindingen in de vorm van empirische generalisaties die hij kan bereiken door de analyse van gegevens.

Een onderzoeker die bijvoorbeeld zijn onderzoek afrondt door te stellen dat "de ongehuwde mensen een hogere zelfmoord hebben in vergelijking met de getrouwde mensen", voldoet nauwelijks aan zijn algemene verplichting aan de wetenschap, hoewel de empirische generalisatie die hij heeft uiteengezet heeft wel enige waarde op zichzelf.

De onderzoeker in het grotere belang van de wetenschap moet ook proberen aan te tonen dat zijn waarneming wijst naar bepaalde onderliggende relaties en processen die aanvankelijk verborgen zijn voor het oog. Met andere woorden, de onderzoeker moet aantonen dat zijn waarneming een betekenis heeft, veel breder en dieper, dan degene die hij lijkt te hebben op het maaiveld.

Om terug te keren naar ons voorbeeld van zelfmoord, moet de onderzoeker kunnen aantonen dat zijn opmerking dat "de ongehuwde mensen worden gekenmerkt door zelfmoord" in feite de diepere relatie tussen sociale cohesie en zelfmoordpercentage weerspiegelt (de theorie van Durkheim).

Zodra de onderzoeker in staat is de relaties en processen bloot te leggen die ten grondslag liggen aan zijn concrete bevindingen, kan hij abstracte verbanden leggen tussen zijn bevindingen en verschillende andere.

In essentie gaat het werk van de onderzoeker veel verder dan het verzamelen en analyseren van gegevens. Zijn taak strekt zich uit tot het interpreteren van de bevindingen van zijn studie. Het is door interpretatie dat de onderzoeker de echte betekenis van zijn bevindingen kan begrijpen, dat wil zeggen dat hij kan begrijpen waarom de bevindingen zijn wat ze zijn.

Zoals eerder gezegd, is interpretatie het zoeken naar bredere en meer abstracte betekenissen van de onderzoeksresultaten. Deze zoekopdracht omvat het bekijken van de onderzoeksresultaten in het licht van andere gevestigde kennis, een theorie of een principe. Deze zoekopdracht heeft twee belangrijke aspecten.

Het eerste aspect betreft het streven naar continuïteit in onderzoek door de resultaten van een bepaald onderzoek te koppelen aan die van een ander. Het is door interpretatie dat de onderzoeker het abstracte principe onder de concrete empirische waarnemingen kan ontrafelen of begrijpen.

Nadat deze abstracte gemeenschappelijke noemer is onderscheiden, kan de onderzoeker gemakkelijk zijn bevindingen koppelen aan die van andere studies uitgevoerd in diverse omgevingen, verschillend in detailaangelegenheden, maar als gevolg van hetzelfde abstracte principe op het niveau van bevindingen.

Onnodig te zeggen dat de onderzoeker op basis van de erkenning van het abstracte theoretische principe dat aan zijn bevinding ten grondslag ligt, verschillende voorspellingen over de concrete wereld van gebeurtenissen vrij onverklaarbaar lijkt te doen op het gebied van zijn bevindingen. Nieuwe onderzoeken kunnen dus worden gestart om voorspellingen te testen en begrijpelijkerwijs zouden dergelijke studies een relatie hebben met de eerste studie van de onderzoeker.

In een enigszins andere betekenis is interpretatie noodzakelijkerwijze betrokken bij de overgang van verkennend onderzoek naar experimenteel onderzoek. De interpretatie van de bevindingen van de eerste categorie van onderzoeken leidt vaak tot hypothesen voor de laatste.

Omdat een verkennend onderzoek geen hypothese heeft om mee te beginnen, moeten de bevindingen of conclusies van een dergelijk onderzoek worden geïnterpreteerd als een 'post-factum'-interpretatie vaak een gevaarlijk spel is met gevaarlijke implicaties. Een dergelijke interpretatie houdt een zoektocht in naar een peetvader in de aard van een theorie of een beginsel dat de bevindingen van het onderzoek zou aannemen (dwz uitleggen).

Deze zoektocht blijkt vaak een oefening van de onderzoeker om zijn bevindingen te rechtvaardigen door een geschikte theorie te vinden die bij zijn bevindingen past. Het gevolg is dat vrij vaak tegenstrijdige conclusies hun 'peetvaders' in diverse theorieën kunnen vinden.

Dit aspect van post-factuminterpretatie, bestaande uit pogingen om de onderzoeksresultaten te rationaliseren, moet duidelijk in gedachten worden gehouden bij het voortzetten ervan. Soms is er echter geen ander alternatief voor.

Ten tweede leidt interpretatie tot het vaststellen van verklarende concepten. Zoals opgemerkt, impliceert interpretatie van bevindingen inspanningen om uit te leggen waarom de waarnemingen of bevindingen zijn, wat ze zijn. Bij het vervullen van deze taak staat de theorie centraal.

Het is een sensibilisator en een gids voor de onderliggende factoren en processen (verklarende basen) onder de bevindingen. Onder de observaties van de onderzoeker in de loop van een studie, ligt een reeks factoren en processen die zijn observaties van de empirische wereld zouden kunnen verklaren. Theoretische interpretatie onthult deze factoren.

De taak van de onderzoeker is om de relaties die hij tijdens zijn studie heeft waargenomen te verklaren, door de onderliggende processen bloot te leggen die hem een ​​dieper inzicht in deze relaties verschaffen en te wijzen op de rol van bepaalde basisfactoren die in het probleemgebied van zijn onderzoek werkzaam zijn.

Interpretatie heeft dus een tweeledig doel. Ten eerste geeft het inzicht in de algemene factoren die lijken te verklaren wat er in de loop van een studie is waargenomen en ten tweede, het biedt een theoretische conceptie die op zijn beurt kan dienen als leidraad voor verder onderzoek.

Het is op deze manier dat de wetenschap cumulatief de basisprocessen, die het gedeelte van de empirische wereld vormen waarmee een onderzoeker zich bezighoudt, met succes ontkoppelt.

Interpretatie is zo onlosmakelijk verweven met de analyse dat het meer als een speciaal aspect van analyse moet worden opgevat in plaats van als een afzonderlijke of afzonderlijke operatie. Tot slot zijn we geneigd om te citeren van prof. C. Wright Mills, die de essentie heeft genoemd van alles wat betrokken is bij de analyse (met interpretatie) van gegevens.

Mills zegt: "Je zult dus ontdekken en beschrijven, typen instellen voor het bestellen van wat je hebt ontdekt, focussen en het organiseren van ervaring door items op naam te onderscheiden. Deze zoektocht naar een bestelling zal ervoor zorgen dat je patronen en trends opzoekt en relaties vindt die typisch en causaal kunnen zijn. Je zult in het kort zoeken naar de betekenis van wat je bent tegengekomen of wat kan worden geïnterpreteerd als een zichtbaar teken van iets dat betrokken lijkt te zijn in wat je probeert te begrijpen; je zult het tot de essentie verdoezelen; dan zal je zorgvuldig en systematisch deze met elkaar in verband brengen om een ​​soort werkmodel te vormen .... "

"Maar altijd tussen alle details zoek je naar indicatoren die kunnen wijzen op de hoofdafwijking, de onderliggende vormen en tendensen van de samenleving in zijn specifieke periode." Nadat een onderzoek is beëindigd, wordt de verklaring afgelegd dat roept een hele reeks nieuwe vragen op en problemen kunnen worden gemaakt.

Sommige van de nieuwe vragen vormen de basis voor nieuwe onderzoeksondernemingen en formulering van nieuwe theorieën die oude theorieën zullen wijzigen of vervangen. Dit is inderdaad wat onderzoek betekent. Het dient om nieuwe en bredere wegen van intellectueel avontuur te openen en simuleert de zoektocht naar meer kennis evenals meer wijsheid in het gebruik ervan.