Analyse van gegevens: 4 stappen

Dit artikel werpt licht op de vier hoofdstappen die betrokken zijn bij de analyse van gegevens. De stappen zijn: 1. Vaststelling van categorieën of classificatie van gegevens 2. Codering 3. Tabulatie 4. Statistische analyse van gegevens.

Stap # 1. Vaststelling van categorieën of classificatie van gegevens :

Sociaalwetenschappelijk onderzoek omvat over het algemeen een grote variëteit aan reacties op verschillende soorten vragen of stimuli die worden gepresenteerd aan de steekproef of 'populatie' van respondenten. Deze antwoorden kunnen verbaal of non-verbaal zijn.

Het is duidelijk dat als een groot aantal verschillende soorten reacties zodanig moeten worden georganiseerd dat ze kunnen worden gebruikt bij het beantwoorden van de onderzoeksvragen of bij het trekken van generalisaties, ze moeten worden gegroepeerd in een beperkt aantal categorieën of klassen. Om een eenvoudig voorbeeld te geven, stel dat er een vraag aan de respondenten wordt gesteld: "Bent u voorstander van het objectieve typeonderzoek voor universiteitsstudenten?"

De antwoorden van de respondenten kunnen mogelijk worden gegroepeerd in vier brede categorieën, zoals onder:

(a) "Ja" antwoorden.

(b) "Geen" antwoorden.

(d) "Heeft niet gereageerd."

Stel dat een andere vraag aan de respondenten is: "Naar welke sociale klasse zou je zeggen dat je thuishoort?"

De antwoorden van de respondenten kunnen worden gegroepeerd in de volgende categorieën:

(a) Hoogste klasse.

(b) Middenklasse.

(d) "Kan niet zeggen."

(e) Andere reacties (zoals: "Ik geloof niet in sociale klassen." "Het maakt nauwelijks uit waar ik hoor" enz.).

Een voorwaarde voor het nemen van een beslissing over de categorieën die moeten worden ingesteld voor het groeperen van de gegevens, is dat de onderzoeker een geschikt classificatiebeginsel moet kiezen. De onderzoeksvraag of hypothese, als die al is geformuleerd, biedt een goede logische basis voor het selecteren van een classificerend principe.

Stel dat de hypothese in een onderzoek is:

"Studenten die een ervaring hebben gehad met studeren in multidisciplinaire scholen zullen een gunstiger houding hebben tegenover het systeem van co-educatie."

Hier, uiteraard, zal een van de principes van classificatie van antwoorden zijn of de respondent al dan niet ervaring heeft met co-educatief systeem. Een andere basis om antwoorden te classificeren is de mate van favourableness of unfavourabeness uitgedrukt in het systeem van co-educatie. Andere grondslagen van classificatie kunnen ook worden ingeroepen, afhankelijk van welke verdere associaties moeten worden onderzocht.

De eerste basis van classificatie zou twee categorieën antwoorden opleveren:

(a) Ze zeiden dat ze eerder ervaring hadden met co-educatie;

(b) Ze zeiden dat ze geen ervaring hadden met co-educatie.

Deze twee categorieën bevatten in zichzelf de hele reeks antwoorden (ervan uitgaande dat geen enkele respondent weigerde te antwoorden of niet reageerde of een ander antwoord gaf.) Geen enkele reactie op bovenstaande aanname valt buiten het bereik van deze twee categorieën. Deze twee categorieën vormen samen wat bekend staat als een 'categorieset'.

Een 'categorieset' moet voldoen aan de volgende drie vereisten:

(1) De categorieën moeten worden afgeleid van één enkel classificatiebeginsel. Deze eis is tamelijk begrijpelijk, omdat als meer dan één classificatieprincipe wordt gebruikt, een enkele reactie door meer dan één categorie kan worden geclaimd.

De categorieën zullen dus niet onafhankelijk van elkaar zijn. Als we bijvoorbeeld drie categorieën hebben die de categorieset vormen, bijvoorbeeld man, vrouw, kind, uiteraard afgeleid van twee classificerende principes, namelijk respectievelijk geslacht en leeftijd, dan kan elk geval (respondent) worden gedekt door meer dan één categorie in de categorieset.

Een kind kan bijvoorbeeld ook een man zijn, een vrouw kan ook een kind zijn enzovoort. Het classificatieprincipe kan echter een samengesteld principe zijn, dat wil zeggen dat het uit twee of meer criteria bestaat, namelijk een mannelijk kind, een vrouwelijk kind, enz.

(2) De tweede vereiste is dat de categorieset uitputtend moet zijn, dat wil zeggen dat het mogelijk moet zijn om elk antwoord in een van de categorieën binnen de set te plaatsen. 'Geen antwoord' moet worden weggelaten bij gebrek aan een geschikte categorie in de set waarin het zal worden opgenomen.

Wat ook de antwoorden zijn, het moet worden afgedekt door een categorie in de set. Bijvoorbeeld, als de mensen van de wereld zouden worden geclassificeerd op basis van hun rasvoorraad, zou de categorie-set bestaan uit drie categorieën, namelijk (a) Caegrooid, (b) Negroid en (c) Mongoloïde, zou duidelijk niet een uitputtende categorie zijn die in overeenstemming is met de hierboven beschreven eis, omdat deze geen enkele categorie bevat waarin veel van de Indiase mensen (en enkele anderen) een plaats kunnen vinden.

(3) De laatste vereiste is een uitvloeisel van de eerste vereiste, namelijk dat de categorieën binnen de set elkaar wederzijds moeten uitsluiten; dat wil zeggen, de categorieën mogen elkaar niet overlappen. Er zou dus geen antwoord worden opgeëist door meer dan één categorie binnen de set.

Het opstellen van categorieën voor gegevens kenmerkend voor sociale wetenschappen is niet altijd een gemakkelijke taak. Het classificatieprincipe kan vaak een samengestelde zijn (in tegenstelling tot eenvoudige, unitaire). De taak om alle elkaar uitsluitende categorieën te benoemen die samen het totale universum van responsen zouden uitputten, op basis van een samengesteld classificatieprincipe, is inderdaad een veeleisende, veeleisende verbeeldingskracht.

Het is in dergelijke gevallen een grote hulp om de attributen die het samenstellingsprincipe van classificatie vormen te reduceren tot symbolen of codes en door middel van de techniek van Booleaanse expansie het volledige bereik van mogelijke categorieën uit de categorieset uit te zetten.

Laten we een heel eenvoudig voorbeeld nemen. Stel dat de onderzoeker drie attributen overweegt, bijvoorbeeld geslacht (mannelijk of vrouwelijk), leeftijd (jonger dan 21 jaar of ouder dan 21 jaar) en burgerlijke staat (gehuwd of ongehuwd) als bestanddelen van zijn enkelvoudige (maar samengestelde) principe van classificatie en reduceert deze tot symbolen zoals onder:

Man = S, vrouw = S̅

Beneden 21 jaar = A, Boven 21 jaar = A̅

Gehuwd = M, Single = M̅

De resulterende categorieset zal de uitputtende totaliteit zijn bestaande uit alle mogelijke combinaties van deze drie attributen die het samengestelde classificatieprincipe omvatten. De mogelijke combinaties, dwz categorieën, zijn 2 ³ = 2 x 2 x 2 = 8 in aantal.

Deze zijn als onder:

(1) SAM

(2) S̅ AM

(3) S A̅ M

(4) SA M̅

(5) S̅ A̅ M

(6) S̅ A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

Decodering, dat wil zeggen, in de plaats komen van de echte connotaties voor de symbolen, we krijgen acht elkaar uitsluitende categorieën die lezen als onder:

(1) Mannen onder de 21 jaar en getrouwd.

(2) Vrouwtjes jonger dan 21 jaar en getrouwd.

(3) Mannetjes boven de 21 jaar en getrouwd.

(4) Mannen jonger dan 21 jaar en ongehuwd.

(5) Vrouwtjes boven de 21 jaar en getrouwd.

(6) Vrouwtjes jonger dan 21 jaar en ongehuwd.

(7) Mannen ouder dan 21 jaar en ongehuwd.

(8) Vrouwtjes boven de 21 jaar en ongehuwd.

Om dezelfde reden, als het samengestelde classificatieprincipe bestaat uit vier attributen, zullen we 2 ⁴ = 2x 2 x 2 x 2 hebben, dwz 16 wederzijds exclusieve categorieën. Het moet nu duidelijk zijn hoe deze manier van categoriseren, in plaats van intuïtie, de taak van classificatie veel eenvoudiger en fool-proof maakt.

Het is duidelijk dat het opstellen van een reeks categorieën relatief eenvoudig is als de antwoorden die de respondenten tijdens het onderzoek hebben gekregen vrij eenvoudig en duidelijk zijn en de categorieën eenvoudig op een eenduidige manier kunnen worden gedefinieerd. Hoewel dit de manier is waarop categorieën altijd moeten worden gedefinieerd, is de taak veel moeilijker met bepaalde soorten inhoud.

Stel dat de onderzoeker in een onderzoek aan de mannelijke studenten vroeg: "Hoe zou je zeggen dat vrouwelijke studenten het gevoel hebben in hetzelfde college met mannelijke studenten als jij te studeren?" De antwoorden zullen waarschijnlijk variëren van indicaties van zeer gunstige attitudes (toegeschreven aan vrouwelijke studenten ) op imputaties van zeer ongunstige attitudes. Stel dat dit enkele antwoorden zijn van respondenten.

(1) Ze houden van het idee. '

(2) 'Ik denk niet dat ze er bezwaar tegen hebben.'

(3) 'Ze denken dat het ze verlaagt.'

(4) Ik kom niet in contact met hen, dus ik zou het niet weten. '

(5) 'Ze haten het.'

(6) 'Sommigen vinden het leuk, anderen niet.'

(7) 'Ze willen hier studeren, zodat ze kunnen zeggen dat ze niet minder zijn dan de mannetjes.'

(8) 'In een puur damescollege zouden ze veel missen, dus ze lijken het hier leuk te vinden.'

Met betrekking tot de bovenstaande antwoorden zou het niet moeilijk zijn om een eenvoudige reeks categorieën te ontwikkelen op basis van het classificerende principe van gunstige versus ongunstige attitudes die aan meisjesstudenten worden toegeschreven. Maar we vinden dat zowel gunstige als ongunstige antwoorden verschillende betekenissen overbrengen.

De mannelijke student die zegt: "Zij (de meisjesstudenten) willen hier studeren, zodat ze kunnen zeggen dat ze niet minder dan mannetjes zijn" brengt iets anders over dan iemand die zegt: "Ze houden van het idee." Op dezelfde manier zegt de mannelijke student die zegt, "Ze denken dat het hen verlaagt" is opnieuw iets anders zeggen dan degene die zegt: "Ze haten het."

Dus we zien dat twee attributen, namelijk:

(1) Toerekening van gunstige of ongunstige attitudes tegenover meisjes, en

(2) Expliciete verwijzing of afwezigheid van een verwijzing naar uitkeringen of schade aan de ondersteuning van gunstige of ongunstige attitudes zijn twee belangrijke bestanddelen van een samengesteld beginsel van classificatie.

De categorieën in de categorie-set in overeenstemming met de ideale vereisten van een eerder besproken categorietype kunnen worden neergezet als onder:

(1) Gunstige houding toegeschreven aan meisjestudenten, uitgelegd in termen van voordelen die ze ontlenen aan het studeren in hetzelfde college met mannelijke studenten (bijvoorbeeld, 7e en 8e antwoorden).

(2) Gunstige houding toegeschreven aan meisjes zonder expliciete verwijzing naar de voordelen van studeren in hetzelfde college met mannen (bijv. Verklaring nr. 1).

(3) Neutrale of accommoderende houding toegeschreven aan meisjes (bijvoorbeeld verklaring nr. 1).

(4) Ongunstige houding toegeschreven aan meisjes, uitgelegd in termen van nadelen (negatieve voordelen) die ze voortbrengen uit het studeren in hetzelfde college met mannelijke studenten.

(5) Ongunstige houding toegeschreven aan meisjes zonder expliciete verwijzing naar nadelen of verliezen als gevolg van co-educatie (bijv. Verklaring nr. 5).

(6) Andere antwoorden, kan niet zeggen, geen antwoord, weet niet (bijvoorbeeld, verklaring nr. 4).

De bovenstaande illustratie zou een idee geven hoe complex een classificatie in sociale wetenschappen kan zijn. Het werken met dergelijke complexe categorieën vereist veel zorg en moeite bij het classificeren. Zelfs wanneer categorieën zorgvuldig zijn uitgewerkt, zal hun gebruik grotere problemen opleveren dan het gebruik van categorieën die nauwkeuriger en nauwkeuriger worden gedefinieerd.

Als een mannelijke student in het bovenstaande voorbeeld zegt: "Ze vinden het goed hier, ze weten waarom" het is een onbesproken vraag of deze verklaring al dan niet een voordeel inhoudt. Er moeten dus aanvullende regels worden opgesteld om dergelijke antwoorden te behandelen.

Het moet gezegd worden, zelfs ten koste van een herhaling, dat hoewel het in principe mogelijk is om veel attributen van antwoorden te gebruiken voor het formuleren van categoriesets, dit in de praktijk vaak onnodig, oneconomisch en onredelijk is omdat niet al deze classificerende principes houd rekening met het doel van de studie.

Laten we nu eens kijken naar het probleem van het selecteren van een classificatieprincipe voor het categoriseren van ongestructureerd materiaal (dwz informatie verzameld door ongestructureerde hulpmiddelen).

In onderzoeken met gestructureerde instrumenten voor het verzamelen van gegevens die relevant zijn voor duidelijk geformuleerde onderzoeksvragen of hypothesen, wordt het juiste principe voor classificatie van antwoorden vrij duidelijk voorgeschreven door de aard van de vragen en de beveiligde antwoorden.

Bij het werken met ongestructureerd materiaal of gegevens is het eerste probleem echter om tot beslissingen te komen over welke aspecten van het materiaal moeten worden gecategoriseerd, dwz welke classificerende principes moeten worden gebruikt bij het vaststellen van categorieën.

In verkennende studies die in de definitie niet beginnen met een goed geformuleerd probleem of een expliciete hypothese, is de beslissing over de classificerende principes moeilijk te bereiken. Op het moment van gegevensverzameling weet de onderzoeker niet welke aspecten het belangrijkst blijken te zijn.

Hij moet daarom een grote hoeveelheid gegevens van ongestructureerde aard verzamelen. In de loop van de analyse wordt de onderzoeker geconfronteerd met het probleem om niet alleen met ongestructureerde materialen om te gaan, maar ook met een groot aantal ervan.

Het is raadzaam om bij het analyseren van gegevens van een verkennend onderzoek een werkhypothese te ontwikkelen die werkbare bevredigende classificerende principes oplevert. De onderzoeker moet zorgvuldig door al zijn materiaal lezen, voortdurend alert zijn op de latente aanwijzingen in gegevens. Zulke aanwijzingen worden vaak geborgd door materialen te bestuderen over onderwerpen of situaties die contrasteren met degene die hij bestudeert.

Een dergelijke studie helpt de onderzoeker om de belangrijke verschillen tussen de twee situaties te zien. Een andere procedure om dergelijke aanwijzingen te krijgen, is door iemands gevallen samen te stellen in groepen die een verwantschap lijken te hebben of bij elkaar lijken te horen en zich dan af te vragen wat hem ertoe bracht te voelen dat de gevallen die hij in een enkele groep plaatste, op elkaar lijken.

Nog een andere benadering die aanwijzingen voor het formuleren van een werkhypothese kan stimuleren, is om zaken op te merken die verrassend lijken, hetzij op basis van bepaalde theoretische verwachtingen of gezond verstand, en vervolgens op zoek te gaan naar een mogelijke verklaring van de verrassende of onverwachte verschijnselen.

Er moet echter worden bedacht dat zelfs bij een duidelijke hypothese, de analyse van ongestructureerd materiaal speciale problemen oplevert. Ten eerste bestaat er altijd de mogelijkheid dat informatie over een bepaald punt in sommige documenten ontbreekt.

Er is ook de waarschijnlijkheid dat een groot deel van het materiaal geen directe invloed heeft op de hypothese. Bovendien is er het probleem om te beslissen over de grootte van eenheden van het materiaal waarop de categorieën moeten worden toegepast.

Als een onderzoeker bijvoorbeeld casestudy's gebruikt die door welzijnsinstellingen worden bijgehouden, moet hij beslissen welke eenheid (bijv. Klanten, verklaringen, handelingen, maatschappelijk werkers, sessies met de cliënt of het hele dossier) het meest geschikt is om antwoorden op zijn specifieke onderzoeksvragen.

Stap # 2. Codering:

Codering bestaat uit het toewijzen van symbolen, meestal cijfers aan elk antwoord die in een vooraf bepaalde klasse vallen. Met andere woorden, codering kan worden beschouwd als het classificatieproces dat nodig is voor de daaropvolgende tabellering. Door middel van codering worden de onbewerkte gegevens omgezet in symbolen die getabelleerd en geteld kunnen worden.

Deze transformatie is echter niet automatisch, het gaat om een groot oordeel van de kant van de codeerder. 'Coder' is de officiële titel voor een persoon die de verantwoordelijkheid krijgt om bepaalde codes aan antwoorden te geven nadat de opgenomen notities naar het kantoor zijn gebracht.

Er moet echter aan worden herinnerd dat het oordeel over de reactie waaraan een bepaalde code moet worden toegekend, vaak wordt gemaakt door iemand anders dan degene die de officiële code-coder gebruikt.

Codering kan plaatsvinden op drie verschillende punten in een onderzoek waarbij elk, verschillende soorten personen verantwoordelijk kunnen zijn voor het toewijzen van codes aan de onbewerkte gegevens. In veel van de onderzoeken kan de respondent zelf worden gevraagd om codes toe te wijzen aan zijn eigen reactie of situatie.

Dit geldt voor veel poll-type en multiple-choice vragen. Bijvoorbeeld wanneer de respondent wordt gevraagd om aan te geven in welke van de klassen (zeg inkomensgroepen) hij hoort, bijvoorbeeld (a) onder 3000 roepies pm, (b) Rs. 3001 / - tot Rs. 6000 / - pm, (c) Rs. 6001 / - tot Rs. 9000 / - pm, (d) Rs. 9001 / - en hoger codeert de respondent zijn reactie eenvoudigweg door zijn positie tussen de gegeven alternatieven af te vinken.

Het tweede punt waarop de codering kan plaatsvinden, is wanneer in de loop van de gegevensverzameling de interviewer of waarnemer de antwoorden van de proefpersonen categoriseert. Dit wordt gedaan wanneer een interviewer of waarnemer een beoordelingsschaal gebruikt om de reactie of het gedrag van een persoon te beschrijven.

Het laatste punt waarop codering kan plaatsvinden, is natuurlijk wanneer de onbewerkte ongecategoriseerde gegevens (vooral verzameld door ongestructureerde gegevensverzamelingsinstrumenten) in het projectbureau worden gedeponeerd en de officiële codeerders hier hun oordeel uitspreken om bepaalde codes aan bepaalde antwoorden of gegevens.

Laten we de voor- en nadelen van codering door de officiële codeerders op kantoor en de codering van de interviewers of waarnemers in de loop van de gegevensverzameling in het veld kort vergelijken en vergelijken.

De interviewers of waarnemers zijn in staat om zowel de situatie als het gedrag van het individu op te merken. Ze beschikken dus over meer informatie om hun oordeel te baseren op de juiste indeling van antwoorden in vergelijking met de codeerders die werken op basis van schriftelijke gegevens die mogelijk geen volledig beeld geven van de werkelijke betekenis van de reactie.

Een ander voordeel van codering door gegevensverzamelaars is dat zowel tijd als arbeid kan worden bespaard.

Integendeel, codering op kantoor door coders heeft bepaalde signaalvoordelen. Codering van complexe gegevens die tijd voor reflectie vergen, moet met opzet door de bureau-codeerders worden gedaan. Ter plekke is een coderingsoordeel van gegevensverzamelaars misschien niet zo onderscheidend als beslissingen die met meer tijd voor beraadslaging worden gemaakt.

Het oordeel van gegevensverzamelaars kan gekleurd zijn door vele factoren, namelijk uiterlijkheden van de respondent, accenten en antwoorden op eerdere vragen, maniërismen, etc. Ten tweede bestaat het gevaar dat de gegevensverzamelaars niet uniform zijn bij het coderen van antwoorden.

Vergelijkbaarheid van gegevens verkregen van een groot aantal respondenten wordt dus belemmerd. Ten derde kunnen de interviewers of waarnemers hun eigen persoonlijke referentiekaders ontwikkelen met betrekking tot het materiaal dat ze coderen. Dit zou de neiging hebben om hun categorisaties na enige tijd onbetrouwbaar te maken. Een gemeenschappelijk referentiekader is gemakkelijker te verkrijgen en te onderhouden in de kantoorcoderingsbewerking dan in het veld.

Laten we enkele van de belangrijke problemen bespreken die verband houden met de betrouwbaarheid van codering. Er zijn veel dingen die kunnen werken om het oordeel over codeerders onbetrouwbaar te maken. Sommige van de factoren kunnen voortkomen uit de te categoriseren gegevens, sommige uit de aard van de categorieën die moeten worden toegepast en weer andere kunnen afkomstig zijn van de codeerders zelf.

We zullen nu kort enkele van deze factoren bespreken en de manieren waarop ze kunnen worden beschermd.

Veel van de problemen die optreden bij codering zijn het gevolg van de tekortkomingen in de gegevens. Vaak leveren de gegevens niet voldoende relevante informatie voor een betrouwbare codering. Dit kan te wijten zijn aan ontoereikende en ontoereikende procedures voor het verzamelen van gegevens. Deze problemen kunnen echter over het algemeen worden opgelost door het zorgvuldig bewerken van gegevens. Het proces dat bestaat uit het kritisch bekijken van de gegevens om hun kwaliteit te verbeteren voor codering die bekend staat als bewerken.

Wanneer de gegevensverzamelaar zijn materiaal aanlevert bij het projectbureau, bestaat nog steeds de mogelijkheid om veel potentiële coderingsproblemen te elimineren. Een zorgvuldig onderzoek van de gegevens zodra ze worden verzameld en indien nodig, een systematische ondervraging van de interviewers of waarnemers helpt veel coderingsproblemen voorkomen.

Niet alleen helpt bewerken bij het voorkomen van latere codeerproblemen, het kan ook de kwaliteit van de gegevensverzameling aanzienlijk verbeteren door erop te wijzen waar de interviewers of waarnemers instructies verkeerd hebben begrepen of misschien niet voldoende gedetailleerde gegevens hebben vastgelegd.

In feite moet het bewerken worden uitgevoerd in de loop van het vooraf testen van het interview of de observatieschema-training van de interviewers of waarnemers en in feite gedurende de hele periode van gegevensverzameling. Bewerken op het projectbureau gaat een lange weg in het verwijderen van codeerproblemen.

Aldus moet de bewerking worden uitgevoerd terwijl de interviewers of waarnemers gemakkelijk ter beschikking kunnen worden gesteld voor ondervraging. Bij het bewerken wordt zorgvuldig gekeken naar het interview of observatieschema's.

Deze moeten worden gecontroleerd op:

(1) Volledigheid: de redactie moet zien dat alle items naar behoren zijn ingevuld. Een lege ruimte naast een vraag in een interviewschema kan bijvoorbeeld betekenen: 'geen antwoord' of 'Weet niet' of weigering om antwoord of niet-toepasbaarheid van de vraag, of de vraag is weggelaten door toezicht, etc.

(2) De redacteur moet het interview of de waarnemingsschema's onderzoeken om erachter te komen of het handschrift of de symbolen of codes die door de interviewer of waarnemer zijn toegekend, gemakkelijk door de codeerder kunnen worden begrepen.

Het is altijd raadzaam om de leesbaarheid te controleren wanneer het materiaal wordt ingeleverd en indien nodig om de interviewer of waarnemer te laten herschrijven. Als dit niet gebeurt, kan de codering vastlopen in een fase waarin de interviewers of waarnemers niet gemakkelijk kunnen worden teruggeroepen voor ondervraging.

(3) Het bewerken omvat ook het onderzoeken van de schema's voor begrijpelijkheid. Het gebeurt vaak dat een opgenomen antwoord volkomen begrijpelijk is voor de interviewer of waarnemer, maar niet begrijpelijk voor de codeerder, omdat de context van gedrag of respons niet bekend is bij de codeerder. Systematische bevraging van de gegevensverzamelaars zal verwarring en onduidelijkheden wegnemen en de kwaliteit van de codering aanzienlijk verbeteren.

(4) De gegevens moeten ook worden onderzocht of gecontroleerd om na te gaan of er bepaalde inconsistenties zijn met betrekking tot de antwoorden die in de planning zijn opgenomen.

Een respondent zou bijvoorbeeld in reactie op een van de eerdere vragen kunnen zeggen dat hij nog nooit mensen van een bepaalde groep had ontmoet en toch, in antwoord op een latere vraag, hij misschien iets gezegd had over het bezoeken van bepaalde mensen uit deze groep in de loop van zijn rondes. Als dat het geval is, is het duidelijk nodig om deze inconsistentie te onderzoeken en deze te verduidelijken door de gegevensverzamelaars te ondervragen.

(5) Het is ook noodzakelijk om de mate van uniformiteit te controleren waarmee de interviewers instructies hebben gevolgd bij het verzamelen en vastleggen van gegevens. Codering kan worden belemmerd als een antwoord wordt opgenomen in andere eenheden dan die welke in de instructies worden vermeld.

(6) Er dient op te worden gewezen dat een bepaald antwoord voor het doel van het onderzoek eenvoudig irrelevant lijkt. Dit gebeurt waarschijnlijk als een vraag niet duidelijk is gewerkt of niet op een intelligente manier is gesteld. De gegevens moeten daarom zorgvuldig worden onderzocht met het oog op het scheiden van de ongepaste reacties van de geschikte.

De waarde van de categorisering van gegevens hangt natuurlijk af van de degelijkheid van de gebruikte categorieën. Het is noodzakelijk dat de categorieën naast relevant te zijn voor het doel van onderzoek ook worden gedefinieerd vanuit een conceptueel oogpunt.

Codering zal onbetrouwbaar zijn als de categorieën niet duidelijk zijn gedefinieerd in termen van indicatoren die van toepassing zijn op gegevens, hier en nu. In de praktijk worden de categorieën gedefinieerd aan de hand van voorbeelden uit de gegevens in de hand. Het is zeer nuttig als illustraties uit gegevens niet alleen weergeven wat voor soort reacties de categorie typeren, maar ook helpen om de grenslijn tussen ogenschijnlijk vergelijkbare categorieën te onderscheiden.

Het is duidelijk dat de kwaliteit van de codering wordt beïnvloed door de competentie van de codeerders. De opleiding van codeerders is dus een belangrijke stap in elk onderzoek.

De opleiding van programmeurs kan in de volgende fasen verlopen:

Allereerst worden de verschillende codes uitgelegd aan de hand van de code (codeerders) en geïllustreerd met voorbeelden uit de te categoriseren gegevens.

Ten tweede oefenen alle trainee-coders vervolgens een steekproef uit van de gegevens, problemen die zich voordoen, worden door de codeerders besproken als een groep met de supervisor om gemeenschappelijke procedures en definities te ontwikkelen.

Ten derde worden aanwijzingen die voortvloeien uit praktijkcodering gebruikt om herzieningen in de categorieën uit te voeren om ze beter toepasbaar te maken op het materiaal en om de procedures en definities die zich tijdens de voorlopige codering hebben ontwikkeld schriftelijk vast te leggen.

Ten vierde werken op een bepaald moment in de oefenperiode, wanneer relatief weinig nieuwe problemen optreden, de codeerders op een identiek deel van de gegevens zonder overleg met elkaar of met de supervisor. De consistentie of de betrouwbaarheid van de codering wordt dan berekend om te bepalen of het haalbaar is om te beginnen met coderen met de juiste ernst.

Afhankelijk van de resultaten van betrouwbaarheids- of consistentiecontroles, kan worden besloten om de categorieën te verwijderen die te onbetrouwbaar lijken of om meer tijd te besteden aan het trainen van codeerders of om codeerders te elimineren die het meest inconsistent zijn enzovoort.

Ten slotte worden periodieke controles uitgevoerd om ervoor te zorgen dat codeurs niet achteloos worden met meer ervaring of dat ze geen persoonlijke idiosyncratische methoden ontwikkelen om nieuwe problemen in het materiaal aan te pakken. Om uniformiteit te garanderen, en beslissingen te nemen nadat de codering is begonnen, moet dit onverwijld aan alle codeerders worden meegedeeld.

Uiteraard zal de consistentie en geschiktheid waarmee een bepaald type antwoord wordt toegewezen aan een bepaalde categorie van grote invloed zijn op de uitkomst van de analyse, vandaar dat het belangrijk is om de betrouwbaarheid van de codering te controleren en de overeenkomst tussen codeerders te verhogen als mogelijk.

Het is natuurlijk moeilijk om een bepaald niveau van betrouwbaarheid in te stellen als de te bereiken standaard. Verschillende soorten materiaal hebben verschillende moeilijkheidsgraden om betrouwbaarheid te bereiken. In de regel geldt: hoe meer gestructureerd het te coderen materiaal en dus eenvoudiger de gebruikte categorieën, hoe hoger de betrouwbaarheid.

Opgemerkt moet worden dat de soorten codes die in een onderzoek worden gebruikt, verschillen naargelang de gegevens per machine of met de hand moeten worden getabelleerd. Als de gegevens handmatig moeten worden gesorteerd, is een woordbeschrijving van de klassen bevredigend.

Ook kunnen afkortingen of letters van alfa-bates, bijvoorbeeld 'Y voor Ja, ' N 'voor Nee, etc., worden gebruikt. Machinetabellen daarentegen vereisen dat klassen worden uitgedrukt in numerieke symbolen, omdat de machines alleen met numerieke gegevens kunnen worden ingevoerd.

Mechanische tabellen vereisen het gebruik van ponskaarten. Het aantal verschillende klassen dat op de ponskaart kan worden weergegeven, is echter beperkt. In ieder geval kunnen alle codes die voor machinetabellen worden gebruikt ook worden gebruikt voor handentabellen.

Als codes op ponskaarten moeten worden geplaatst waarvan twee formaten algemeen worden gebruikt, dwz 80 kolomkaarten en de 54 kolomkaarten, is het wenselijk om tien op minder klassen / categorieën te gebruiken voor de meeste informatie- of responsinformatie.

De ponskaart bevat 10 genummerde spaties en een X en Y in elke kolom die een totaal van 12 codes maken die kunnen worden gebruikt. Het is een nogal ingewikkelde procedure om meer dan één type item in een kolom te krijgen. Geboorte- en leeftijdscodes kunnen bijvoorbeeld niet in een enkele kolom worden geponsd, tenzij slechts zes leeftijdsgroepen voor elk worden gebruikt.

Stap # 3. Tabulatie:

Tabulatie is een onderdeel van het technische proces in de statistische analyse van de gegevens. Het essentiële element in de tabellen is de samenvatting van de resultaten in de vorm van statistische tabellen.

Pas wanneer onbewerkte gegevens in groepen worden verdeeld en het aantal gevallen in deze verschillende groepen wordt meegeteld, kan de onderzoeker bepalen wat zijn resultaten zijn en zijn bevindingen aan de consument overbrengen in een vorm die kan gemakkelijk worden begrepen.

Tabellen zijn uiteraard afhankelijk van het vaststellen van categorieën voor onbewerkte gegevens, bewerken en coderen van respons (ponsen en de kaarten door machines laten lopen voor mechanische tabellering en sorteren en tellen voor handentabellen).

Ervaren onderzoekers ontwikkelen over het algemeen tabellenplannen op ongeveer hetzelfde moment als zij de instrumenten voor het verzamelen van gegevens opstellen of construeren en bemonsteringsplannen maken. De onervaren onderzoekers houden zich zelden bezig met tabellarische plannen totdat de gegevens zijn verzameld. Natuurlijk is het voor de onderzoeker onmogelijk om het volledige bereik van de tabellen te voorzien dat vervolgens gewenst wordt.

Hij zou voldoende bekend moeten zijn met zijn onderzoeksprobleem of het onderwerp van onderzoek om tabellen te kunnen opstellen die een antwoord zullen geven op de vragen die aanleiding hebben gegeven tot het onderzoek. De onderzoeker moet in staat zijn om adequate tabellarische plannen op te stellen als hij de bevindingen uit de eerdere onderzoeken gebruikt die elementen gemeen hebben met die waarvoor de plannen worden opgesteld.

In verkennende studies is een betere en veiligere procedure om het gegevensverzamelingsinstrument te testen op een steekproef van de populatie van het type dat in het definitieve onderzoek zou worden behandeld. Op deze manier kunnen in het algemeen enkele aanwijzingen worden verkregen over wat voor soort tabel betekenisvol is.

Tabellering, kan volledig worden gedaan door handmatige methoden; dit wordt handentabel genoemd. Als alternatief kan dit worden gedaan door mechanische methoden die gebruikmaken van automatische en snelle energiemachines voor het grootste deel van de gegevens, waarbij het proces bekend staat als mechanische tabulatie.

De onderzoeker moet beslissen voordat hij gedetailleerde tabellarische plannen voor zijn studie opstelt, welke tabelmethode hij zou gebruiken. Deze beslissing zal gebaseerd zijn op verschillende overwegingen, zoals kosten, tijd, personeel, enz.

Zowel handentabellen als mechanische tabellering hebben hun respectievelijke voordelen en beperkingen. De aandacht van de onderzoeker voor deze verdiensten en punten is beter in te schatten welke methode geschikt is voor zijn probleem.

We zullen kort ingaan op de voordelen van deze twee tabulatiemethoden:

(1) Mechanische tabellen omvatten veel administratief werk en gespecialiseerde operaties. Natuurlijk vergemakkelijkt dit de snelheid, maar de snelheid is misschien niet altijd een adequate compensatie voor extra administratief werk.

(2) Als niet naar het aantal en het type van de gewenste tabellen is besloten voordat de tabellaringen beginnen. machinetabellen kunnen nuttiger zijn. Maar als handtabellen als efficiënt wordt beschouwd, wordt de volgorde waarin verschillende sorteringen en tellingen worden gedaan, voorafgaand aan de tabel bepaald.

(3) Een belangrijk voordeel van machinetabellen is dat het cross-classificaties mogelijk maakt. In grootschalige onderzoeken waarin veel variabelen moeten worden gecorreleerd of gecrosslcateerd, verdient de machinetabellen de voorkeur.

Het is om deze reden dat mechanische tabulatie wordt gebruikt in studies die veel onderlinge correlaties tussen variabelen vereisen. Maar als het totale aantal respondenten klein is, kan een handmatige telling ervan in overeenstemming met het cross-classificerende principe relatief economisch zijn.

(4) Als er veel gecodeerde informatie is en er meerdere ponskaarten nodig zijn voor elk geval, kan handentabeling de voorkeur hebben.

(5) Als het wenselijk is om de gegevens in een vorm gereed te houden voor nieuwe tabellen op relatief korte termijn, zijn ponskaarten meestal nuttig. Mechanische tabulatie is handig voor periodieke onderzoeken of enquêtes waarbij hetzelfde type informatie met regelmatige tussenpozen moet worden verzameld.

(6) Het proces van sorteren en tellen heeft minder kans op fouten als het met de machine wordt gedaan dan met de hand. Fouten kunnen, natuurlijk, optreden in de machinetabellering en wanneer ze dat doen, zijn ze vaak erg moeilijk te identificeren en te controleren.

Fouten die worden ontdekt tijdens codering, bewerking of veldwerkstadia van de enquête, kunnen machinelabelwerk in de weg staan. Het is daarom vaak wenselijk om naast het veldwerk verder te gaan met handentabellen.

(7) De kosten van tabellering zijn een belangrijk punt van zorg van de onderzoeker. Machinetabellen brengen vaak veel hogere kosten met zich mee, omdat de meeste ponskaarten, kosten voor ponsen en verifiëren, machinekosten voor sorteermachines en tabulatiemachines en kosten voor het inhuren van gespecialiseerde services van specifieke typen machinebedieners vaak veel hoger zijn dan die in de hand. tabel.

(8) Een andere belangrijke overweging is tijd. In de mechanische tabellering wordt het werk van de tabellering als zodanig in een zeer korte tijd gedaan, maar de voorbereidende stadia, maar ook de training, supervisie en mogelijke niet-beschikbaarheid van bepaalde soorten machines in huur die resulteren in dislocatie van het werk, dragen onvermijdelijk bij aan verspilling. van tijd.

(9) De overwegingen van gemak kunnen nauwelijks worden genegeerd. Als de mechanische tabellering de verzending van onbewerkte gegevens naar een kantoor ver van het projectkantoor vereist, worden ongemakken veroorzaakt door verpakking, transport, enz. Veroorzaakt.

(10) Ten slotte kan de hoeveelheid te registreren en analyseren commentaarmateriaal ook van invloed zijn op de keuze van de tabulatiemethoden. In sommige opinieonderzoeken zijn de woordcombinaties van informanten belangrijk. De handcodekaart die in de handtabel alleen wordt gebruikt, kan ruimte bieden voor dergelijke opmerkingen of opmerkingen.

Machines die tabellarij bewerken, zijn van vele soorten. De ontwikkelingen op dit gebied zijn de afgelopen jaren extreem snel geweest. Sommige machines sorteren en tellen eenvoudig kaarten, anderen sorteren, tellen en drukken de resultaten, weer anderen zijn uitgerust om de meest gecompliceerde statistische bewerkingen of berekeningen uit te voeren.

Deze laatstgenoemde machines zijn uiterst complex en moeten voor een bepaalde bewerking door een specialist in de lijn worden geprogrammeerd. A table is an exhibit of the numerical data systematically arranged in labelled columns (vertical) and rows (horizontal).

A simple or elementary table indicates simple counts of the frequencies with which the various categories in each set occur in the data, for example, the number of people in the sample who have attended high school but not passed, the number of people who have attended college but not graduated and so on. The table given below simply points out the frequencies of visits of fifty respondents to the cinema.

In research, we are often interested in finding out the correlation between two or more variables, eg, education and income and fertility, simple tables (illustrated above) showing frequency distribution of the respondents in respect of a single characteristic, eg, education or income or fertility, do not help us see the relationship among two or more variables.

The way to see the relationship is by preparing cross-tables or breakdown tables. Such tables make possible the grouping of cases that occur jointly in two or more categories, for example, tabulation of the number of cases that are high in education, low in income and have between 2 and 3 children, or the number of cases that are low in education, low in income and have between 4 and 5 children and so on. The most elementary form of cross-tabulation the students are familiar with is the college time-table.

Suppose a researcher wants to see the relationship among three variables, viz., occupation, income and fertility. He must employ a scheme of tabulation that will afford all possible combinations of the different categories of these three variables.

Cross- tabulation of the data on a hypothetical sample of 100 persons may be presented as under:

In the above table, we have indicated the number of children in rows. This variable of fertility has been divided into five categories, ie, no issue, 1 to 2 issues, 3 to 4, 5 to 6, 7 and above. So in the margin on the left hand, we have these 5 categories of fertility. We have indicated the income of 100 respondents in columns.

The income variable has been sub-divided into five categories, ie, below Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Thus, we have five columns corresponding to these categories.

Again since we have one more variable, ie, occupation to accommodate, the columns for income have each been sub-divided into two parts corresponding to the two categories in which the occupations have been divided, ie, white collar occupation and blue-collar occupation.

Thus, we have ten vertical columns, corresponding to income and occupation. The number of horizontal rows we have for the categories of the fertility variable is five. Thus, we have ten columns crossed by five rows making up the body of the table.

The intersection of the columns and rows has effected 50 (fifty) cells or boxes. Each of these boxes or cells houses a particular number of cases which are different from those in other cells either in respect of income or occupation, in fertility or in any two of these or in all of these. Let us read the table to get some idea as to what it represents.

Out of the total sample of 100 cases, there are 25 who have between 3 and 4 issues. Of these 25, reading from the left-hand side, 5 persons (with between 3 and 4 children) have income below Rs.200/- and are employed in white-collar occupations.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.