Eșantionare sistematică - KamilTaylan.blog
1 mai 2021 22:41

Eșantionare sistematică

Ce este eșantionarea sistematică?

Eșantionarea sistematică este un tip de metodă de eșantionare a probabilității în care membrii eșantionului dintr-o populație mai mare sunt selectați în funcție de un punct de plecare aleatoriu, dar cu un interval periodic fix. Acest interval, numit interval de eșantionare, este calculat prin împărțirea dimensiunii populației la dimensiunea eșantionului dorit. Deși populația eșantionului a fost selectată în prealabil, eșantionarea sistematică este considerată în continuare ca fiind aleatorie dacă intervalul periodic este determinat în prealabil și punctul de plecare este aleatoriu.

Chei de luat masa

  • Eșantionarea sistematică este o metodă de eșantionare a probabilității în care un eșantion aleatoriu, cu un interval periodic fix, este selectat dintr-o populație mai mare.
  • Intervalul periodic fix, numit interval de eșantionare, se calculează prin împărțirea dimensiunii populației la dimensiunea eșantionului dorit.
  • Alte avantaje ale acestei metodologii includ eliminarea fenomenului de selecție grupată și o probabilitate redusă de contaminare a datelor.
  • Dezavantajele includ supra-sau sub-reprezentarea anumitor tipare și un risc mai mare de manipulare a datelor.

Înțelegerea eșantionării sistematice

Deoarece eșantionarea simplă aleatorie a unei populații poate fi ineficientă și consumatoare de timp, statisticienii apelează la alte metode, cum ar fi eșantionarea sistematică. Alegerea mărimii eșantionului printr-o abordare sistematică se poate face rapid. Odată ce un punct de plecare fix a fost identificat, este selectat un interval constant pentru a facilita selectarea participanților.

Eșantionarea sistematică este preferabilă eșantionării simple aleatorii atunci când există un risc redus de manipulare a datelor. Dacă un astfel de risc este mare atunci când un cercetător poate manipula lungimea intervalului pentru a obține rezultatele dorite, o tehnică simplă de eșantionare aleatorie ar fi mai potrivită.

populațiilor normale,  cu excepția cazului în care există o caracteristică aleatorie în mod disproporționat cu fiecare eșantion de date „ n ” (ceea ce este puțin probabil). Cu alte cuvinte, o populație trebuie să prezinte un grad natural de aleatoriu de-a lungul metricei alese. Dacă populația are un tip de tipar standardizat, riscul alegerii accidentale a cazurilor foarte frecvente este mai evident.

În cadrul eșantionării sistematice, ca și în cazul altor metode de eșantionare, trebuie selectată o populație țintă înainte de selectarea participanților. O populație poate fi identificată pe baza oricărui număr de caracteristici dorite care se potrivesc scopului studiului realizat. Unele criterii de selecție pot include vârsta, sexul, rasa, locația, nivelul de educație și / sau profesia.



Există mai multe metode de eșantionare a unei populații pentru inferența statistică; eșantionarea sistematică este o formă de eșantionare aleatorie.

Exemple de eșantionare sistematică

Ca exemplu ipotetic de eșantionare sistematică, să presupunem că într-o populație de 10.000 de persoane, un statistician selectează fiecare 100 de persoane pentru eșantionare. Intervalele de eșantionare pot fi, de asemenea, sistematice, cum ar fi alegerea unui nou eșantion de extras din fiecare 12 ore.

Ca un alt exemplu, dacă doriți să selectați un grup aleatoriu de 1.000 de persoane dintr-o populație de 50.000 utilizând eșantionarea sistematică, toți participanții potențiali trebuie să fie plasați într-o listă și un punct de plecare ar fi selectat. Odată ce lista este formată, fiecare a 50-a persoană din listă (începând numărarea la punctul de plecare selectat) va fi aleasă ca participant, din moment ce 50.000 / 1.000 = 50.

De exemplu, dacă punctul de plecare selectat a fost 20, a 70-a persoană din listă ar fi aleasă urmată de 120, și așa mai departe. Odată ce a fost atins sfârșitul listei și dacă sunt necesari participanți suplimentari, contorul ajunge la începutul listei pentru a termina numărul.

Eșantionare sistematică vs. Eșantionare cluster

Eșantionarea sistematică și eșantionarea în grup diferă în ceea ce privește modul în care extrag punctele de eșantionare din populația inclusă în eșantion. Eșantionarea în grupuri descompune populația în grupuri, în timp ce eșantionarea sistematică utilizează intervale fixe de la populația mai mare pentru a crea eșantionul.

Eșantionarea sistematică selectează un punct de plecare aleatoriu din populație, iar apoi se prelevează un eșantion din intervale fixe regulate ale populației, în funcție de mărimea acesteia. Eșantionarea clusterelor împarte populația în clustere și apoi ia un eșantion simplu aleatoriu din fiecare cluster.

Eșantionarea în cluster este considerată mai puțin precisă decât alte metode de eșantionare. Cu toate acestea, poate economisi costuri la obținerea unui eșantion. Eșantionarea în cluster este o procedură de eșantionare în doi pași. Poate fi folosit atunci când completarea unei liste a  întregii populații  este dificilă. De exemplu, ar putea fi dificil să construiești întreaga populație a clienților unui magazin alimentar pentru a fi intervievați.

Cu toate acestea, o persoană ar putea crea un subset aleatoriu de magazine, care este primul pas al procesului. Al doilea pas constă în intervievarea unui eșantion aleatoriu al clienților magazinelor respective. Acesta este un proces manual simplu, care poate economisi timp și bani.

Limitări ale eșantionării sistematice

Un risc pe care statisticienii trebuie să îl ia în considerare atunci când efectuează eșantionare sistematică implică modul în care este organizată lista utilizată cu intervalul de eșantionare. Dacă populația plasată pe listă este organizată într-un model ciclic care se potrivește cu intervalul de eșantionare, eșantionul selectat poate fi părtinitor.

De exemplu, departamentul de resurse umane al unei companii dorește să aleagă un eșantion de angajați și să întrebe ce părere au despre politicile companiei. Angajații sunt grupați în echipe de câte 20, fiecare echipă fiind condusă de un manager. Dacă lista utilizată pentru a alege dimensiunea eșantionului este organizată cu echipe grupate împreună, statisticianul riscă să aleagă doar manageri (sau deloc manageri) în funcție de intervalul de eșantionare.

întrebări frecvente

Care sunt avantajele eșantionării sistematice?

Eșantionarea sistematică este ușor de realizat și ușor de înțeles, motiv pentru care este, în general, favorizată de cercetători. Presupunerea centrală, că rezultatele reprezintă majoritatea populațiilor normale, garantează că întreaga populație este eșantionată în mod egal. De asemenea, eșantionarea sistematică oferă un grad sporit de control în comparație cu alte metodologii de eșantionare datorită procesului său. Eșantionarea sistematică are, de asemenea, un factor de risc scăzut, deoarece există șanse mici ca datele să poată fi contaminate.

Care sunt dezavantajele eșantionării sistematice?

Principalul dezavantaj al eșantionării sistematice este că este necesară dimensiunea populației. Fără a cunoaște numărul specific de participanți la o populație, eșantionarea sistematică nu funcționează bine. De exemplu, dacă un statistician ar dori să examineze vârsta persoanelor fără adăpost dintr-o anumită regiune, dar nu poate obține cu exactitate câte persoane fără adăpost există, atunci nu vor avea o dimensiune a populației sau un punct de plecare. Un alt dezavantaj este că populația trebuie să prezinte o cantitate naturală de aleatorie, altfel riscul de a alege instanțe similare este crescut, învingând scopul eșantionului.

În ce se diferențiază eșantionarea în grup și sistematică?

Eșantionarea în grup și eșantionarea sistematică diferă în modul în care extrag punctele de eșantionare din populația inclusă în eșantion. Eșantionarea clusterelor împarte populația în clustere și apoi ia un eșantion simplu aleatoriu din fiecare cluster. Eșantionarea sistematică selectează un punct de plecare aleatoriu din populație, iar apoi se prelevează un eșantion din intervale fixe regulate ale populației, în funcție de mărimea acesteia. Eșantionarea în cluster este susceptibilă la o eroare de eșantionare mai mare decât eșantionarea sistematică, deși poate fi un proces mai ieftin.