1 mai 2021 22:27

Eșantionare aleatorie stratificată

Ce este eșantionarea aleatorie stratificată?

Eșantionarea aleatorie stratificată este o metodă de eșantionare care implică împărțirea unei populații în subgrupuri mai mici cunoscute sub numele de straturi. În eșantionarea aleatorie stratificată sau stratificare, straturile sunt formate pe baza atributelor sau caracteristicilor comune ale membrilor, cum ar fi venitul sau nivelul de educație.

Eșantionarea aleatorie stratificată se mai numește eșantionare proporțională aleatorie sau eșantionare aleatorie.

Chei de luat masa

  • Eșantionarea aleatorie stratificată permite cercetătorilor să obțină un eșantion de populație care reprezintă cel mai bine întreaga populație studiată.
  • Eșantionarea aleatorie stratificată implică împărțirea întregii populații în grupuri omogene numite straturi.
  • Eșantionarea aleatorie stratificată diferă de eșantionarea aleatorie simplă, care implică selectarea aleatorie a datelor dintr-o întreagă populație, astfel încât fiecare eșantion posibil este la fel de probabil să apară.

Cum funcționează eșantionarea aleatorie stratificată

Atunci când finalizează analiza sau cercetarea unui grup de entități cu caracteristici similare, un cercetător poate constata că dimensiunea populației este prea mare pentru a putea finaliza cercetarea. Pentru a economisi timp și bani, un analist poate adopta o abordare mai fezabilă prin selectarea unui grup mic din populație. Grupul mic este denumit dimensiunea eșantionului, care este un subset al populației care este utilizat pentru a reprezenta întreaga populație. Un eșantion poate fi selectat dintr-o populație prin mai multe moduri, dintre care una este metoda de eșantionare aleatorie stratificată.

O eșantionare aleatorie stratificată implică împărțirea întregii populații în grupuri omogene numite straturi (plural pentru strat). Probele aleatorii sunt apoi selectate din fiecare strat. De exemplu, luați în considerare un cercetător academic care ar dori să știe numărul de studenți MBA din 2007 care au primit o ofertă de muncă în termen de trei luni de la absolvire.

În curând va descoperi că au existat aproape 200.000 de absolvenți de MBA pentru anul respectiv. Ar putea decide să eșantion simplu aleatoriu de 50.000 de absolvenți și să conducă un sondaj. Mai bine, el ar putea împărți populația în straturi și putea lua un eșantion aleatoriu din strate. Pentru a face acest lucru, el va crea grupuri de populație bazate pe sex, interval de vârstă, rasă, țară de naționalitate și carieră. Un eșantion aleatoriu din fiecare strat este preluat într-un număr proporțional cu dimensiunea stratului în comparație cu populația. Aceste subseturi ale stratelor sunt apoi reunite pentru a forma un eșantion aleatoriu.

[Important: eșantionarea stratificată este utilizată pentru a evidenția diferențele dintre grupurile dintr-o populație, spre deosebire de eșantionarea simplă aleatorie, care tratează toți membrii unei populații ca fiind egali, cu o probabilitate egală de a fi eșantionați.]

Exemplu de eșantionare aleatorie stratificată

Să presupunem că o echipă de cercetare dorește să stabilească GPA a studenților din întreaga SUA Echipa de cercetare are dificultăți în colectarea datelor de la toți cei 21 de milioane de studenți; decide să ia un eșantion aleatoriu din populație folosind 4.000 de studenți.

Acum presupuneți că echipa se uită la diferitele atribute ale participanților eșantion și se întreabă dacă există diferențe între GPA și majorele studenților. Să presupunem că se constată că 560 de studenți sunt specializări în limba engleză, 1.135 sunt specializări în științe, 800 sunt specializări în informatică, 1.090 sunt specialități în inginerie și 415 sunt specializări în matematică. Echipa dorește să utilizeze un eșantion aleatoriu stratificat proporțional în care stratul eșantionului este proporțional cu eșantionul aleatoriu din populație.

Să presupunem că echipa cercetează  demografia  studenților din Statele Unite și găsește procentul din ceea ce studenții sunt majori: 12% majoră în limba engleză, 28% majoră în științe, 24% majoră în informatică, 21% majoră în inginerie și 15% major în matematică. Astfel, cinci straturi sunt create din procesul de eșantionare aleatorie stratificat.

Echipa trebuie apoi să confirme că stratul populației este proporțional cu stratul din eșantion; totuși, ei găsesc că proporțiile nu sunt egale. Echipa trebuie apoi să re-probeze 4.000 de studenți din populație și să aleagă aleatoriu 480 de limbi engleze, 1.120 științe, 960 informatică, 840 inginerie și 600 de studenți la matematică.

Cu acestea, are un eșantion stratificat proporțional aleatoriu de studenți, care oferă o reprezentare mai bună a studenților universitari din SUA Cercetătorii pot evidenția apoi strat specific, pot observa diferite studii ale studenților americani și pot observa diferitele medii ale punctelor.

Simplu aleatoriu versus mostre aleatorii stratificate

Eșantioanele simple aleatorii  și eșantioanele stratificate sunt ambele instrumente statistice de măsurare. Un eșantion simplu aleatoriu este utilizat pentru a reprezenta întreaga populație de date. Un eșantion stratificat aleator împarte populația în grupuri mai mici sau straturi, pe baza caracteristicilor comune.

Eșantionul simplu aleatoriu este adesea utilizat atunci când există foarte puține informații disponibile despre populația de date, atunci când populația de date are mult prea multe diferențe pentru a fi împărțite în diferite subseturi sau când există o singură caracteristică distinctă între populația de date.

De exemplu, o companie de bomboane poate dori să studieze obiceiurile de cumpărare ale clienților săi pentru a determina viitorul liniei sale de produse. Dacă există 10.000 de clienți, acesta poate folosi alege 100 din acești clienți ca eșantion aleatoriu. Apoi poate aplica ceea ce găsește de la cei 100 de clienți la restul bazei sale. Spre deosebire de stratificare, va prelua 100 de membri pur la întâmplare, fără a lua în considerare caracteristicile lor individuale.

Stratificare proporțională și disproporționată

Eșantionarea aleatorie stratificată asigură faptul că fiecare subgrup al unei populații date este reprezentat în mod adecvat în întreaga populație eșantion a unui studiu de cercetare. Stratificarea poate fi proporțională sau disproporționată. Într-o metodă stratificată proporțională, dimensiunea eșantionului fiecărui strat este proporțională cu dimensiunea populației stratului.

De exemplu, dacă cercetătorul a dorit un eșantion de 50.000 de absolvenți care utilizează intervalul de vârstă, eșantionul aleatoriu stratificat proporțional va fi obținut folosind această formulă: (dimensiunea eșantionului / dimensiunea populației) x dimensiunea stratului. Tabelul de mai jos presupune o dimensiune a populației de 180.000 absolvenți MBA pe an.

Mărimea eșantionului stratelor pentru absolvenții de MBA în vârsta cuprinsă între 24 și 28 de ani este calculată ca (50.000 / 180.000) x 90.000 = 25.000. Aceeași metodă este utilizată pentru celelalte grupe de vârstă. Acum că este cunoscută dimensiunea eșantionului de straturi, cercetătorul poate efectua eșantionări simple aleatorii în fiecare strat pentru a-și selecta participanții la sondaj. Cu alte cuvinte, 25.000 de absolvenți din grupa de vârstă 24-28 vor fi selectați aleatoriu din întreaga populație, 16.667 absolvenți din intervalul de vârstă 29-33 vor fi selectați aleatoriu din populație și așa mai departe.

Într-un eșantion disproporționat stratificat, dimensiunea fiecărui strat nu este proporțională cu dimensiunea sa în populație. Cercetătorul poate decide să eșantioneze 1/2 din absolvenții din grupa de vârstă 34-37 și 1/3 din absolvenții din grupa de vârstă 29-33.

Este important să rețineți că o persoană nu se poate încadra în mai multe straturi. Fiecare entitate trebuie să se încadreze într-un singur strat. Având subgrupuri suprapuse înseamnă că unii indivizi vor avea șanse mai mari de a fi selectați pentru sondaj, ceea ce neagă complet conceptul de eșantionare stratificată ca tip de eșantionare de probabilitate.



Managerii de portofoliu pot utiliza eșantionarea stratificată aleatorie pentru a crea portofolii prin reproducerea unui indice, cum ar fi un indice de obligațiuni.

Avantajele eșantionării aleatorii stratificate

Principalul avantaj al eșantionării stratificate aleatorii este că surprinde caracteristicile cheie ale populației din eșantion. Similar unei medii ponderate, această metodă de eșantionare produce caracteristici în eșantion care sunt proporționale cu populația totală. Eșantionarea aleatorie stratificată funcționează bine pentru populațiile cu o varietate de atribute, dar este altfel ineficientă dacă nu se pot forma subgrupuri.

Stratificarea dă o eroare mai mică în estimare și o precizie mai mare decât metoda simplă de eșantionare aleatorie. Cu cât diferențele dintre straturi sunt mai mari, cu atât este mai mare câștigul în precizie.

Dezavantaje ale eșantionării aleatorii stratificate

Din păcate, această metodă de cercetare nu poate fi utilizată în fiecare studiu. Dezavantajul metodei este că trebuie îndeplinite mai multe condiții pentru ca aceasta să fie utilizată corect. Cercetătorii trebuie să identifice fiecare membru al unei populații studiate și să-i clasifice pe fiecare dintre ei într-o singură subpopulație. În consecință, eșantionarea stratificată aleatorie este dezavantajoasă atunci când cercetătorii nu pot clasifica cu încredere fiecare membru al populației într-un subgrup. De asemenea, găsirea unei liste exhaustive și definitive a unei întregi  populații  poate fi o provocare.

Suprapunerea poate fi o problemă dacă există subiecți care se încadrează în mai multe subgrupuri. Când se efectuează eșantionare simplă aleatorie, cei care se află în mai multe subgrupuri sunt mai predispuși să fie aleși. Rezultatul ar putea fi o denaturare sau o reflectare inexactă a populației.

Exemplele de mai sus ușurează: studenții, absolvenții, bărbații și femeile sunt grupuri clar definite. Cu toate acestea, în alte situații ar putea fi mult mai dificil. Imaginați-vă încorporând caracteristici precum rasa, etnia sau religia. Procesul de sortare devine mai dificil, făcând eșantionarea stratificată aleatorie o metodă ineficientă și mai puțin decât ideală.