Test cu două cozi
Ce este un test cu două cozi?
În statistici, un test cu două cozi este o metodă în care aria critică a unei distribuții este bilaterală și testează dacă un eșantion este mai mare sau mai mic decât un anumit interval de valori. Este utilizat în testarea ipotezei nule și testarea semnificației statistice. Dacă eșantionul testat se încadrează în oricare dintre zonele critice, se acceptă ipoteza alternativă în locul ipotezei nule.
Chei de luat masa
- În statistici, un test cu două cozi este o metodă în care aria critică a unei distribuții este dublă și testează dacă un eșantion este mai mare sau mai mic decât un interval de valori.
- Este utilizat în testarea ipotezei nule și testarea semnificației statistice.
- Dacă eșantionul testat se încadrează în oricare dintre zonele critice, se acceptă ipoteza alternativă în locul ipotezei nule.
- Prin convenție, testele cu două cozi sunt utilizate pentru a determina semnificația la nivelul de 5%, ceea ce înseamnă că fiecare parte a distribuției este redusă la 2,5%.
Înțelegerea unui test cu două cozi
Un concept de bază al statisticii inferențiale este testarea ipotezelor, care determină dacă o afirmație este adevărată sau nu este dată unui parametru de populație. Un test de ipoteză conceput pentru a arăta dacă media unui eșantion este semnificativ mai mare decât și semnificativ mai mică decât media unei populații este denumită test cu două cozi. Testul cu două cozi își ia numele din testarea zonei sub ambele cozi a unei distribuții normale, deși testul poate fi utilizat în alte distribuții non-normale.
Un test cu două cozi este conceput pentru a examina ambele părți ale unui interval de date specificat, așa cum este desemnat de distribuția de probabilitate implicată. Distribuția probabilității ar trebui să reprezinte probabilitatea unui rezultat specificat pe baza unor standarde prestabilite. Acest lucru necesită setarea unei limite care desemnează cele mai mari (sau superioare) și cele mai mici (sau mai mici) valori variabile acceptate incluse în interval. Orice punct de date care există peste limita superioară sau sub limita inferioară este considerat în afara intervalului de acceptare și într-o zonă denumită intervalul de respingere.
Nu există un standard inerent în ceea ce privește numărul de puncte de date care trebuie să existe în intervalul de acceptare. În cazurile în care este necesară precizia, cum ar fi crearea de medicamente, se poate institui o rată de respingere de 0,001% sau mai puțin. În cazurile în care precizia este mai puțin critică, cum ar fi numărul de produse alimentare dintr-o pungă de produse, o rată de respingere de 5% poate fi adecvată.
Eșantionare aleatorie
Un test cu două cozi poate fi, de asemenea, utilizat practic în timpul anumitor activități de producție într-o firmă, cum ar fi producerea și ambalarea bomboanelor la o anumită instalație. Dacă unitatea de producție desemnează 50 de bomboane pe pungă ca obiectiv, cu o distribuție acceptabilă de 45 până la 55 de bomboane, orice pungă găsită cu o sumă sub 45 sau peste 55 este considerată în intervalul de respingere.
Pentru a confirma că mecanismele de ambalare sunt calibrate corespunzător pentru a îndeplini rezultatul scontat, se poate lua o probă aleatorie pentru a confirma exactitatea. Un eșantion simplu aleatoriu ia o porțiune mică, aleatorie din întreaga populație pentru a reprezenta întregul set de date, în care fiecare membru are o probabilitate egală de a fi ales.
Pentru ca mecanismele de ambalare să fie considerate exacte, se dorește în medie 50 de bomboane pe sac cu o distribuție adecvată. În plus, numărul de pungi care se încadrează în intervalul de respingere trebuie să se încadreze în limita de distribuție a probabilității considerată acceptabilă ca o rată de eroare. Aici, ipoteza nulă ar fi că media este 50, în timp ce ipoteza alternativă ar fi că nu este 50.
Dacă, după efectuarea testului cu două cozi, scorul z cade în regiunea de respingere, ceea ce înseamnă că deviația este prea departe de media dorită, atunci pot fi necesare ajustări la instalație sau echipament asociat pentru a corecta eroarea. Utilizarea regulată a metodelor de testare cu două cozi poate contribui la asigurarea producției rămâne în limite pe termen lung.
Aveți grijă să observați dacă un test statistic este cu două sau două cozi, deoarece acest lucru va influența foarte mult interpretarea unui model.
Two-Tailed vs. Test cu o singură coadă
Atunci când se stabilește un test de ipoteză pentru a arăta că media eșantionului ar fi mai mare sau mai mică decât media populației, aceasta este denumită un test cu o singură coadă. Testul cu o singură coadă își ia numele din testarea zonei sub una dintre cozile (părțile laterale) ale unei distribuții normale. Atunci când se folosește un test cu o singură coadă, un analist testează posibilitatea relației într-o direcție de interes și ignoră complet posibilitatea unei relații într-o altă direcție.
Dacă eșantionul testat se încadrează în zona critică unilaterală, ipoteza alternativă va fi acceptată în locul ipotezei nule. Un test cu o singură coadă este, de asemenea, cunoscut sub numele de ipoteză direcțională sau test direcțional.
Un test cu două cozi, pe de altă parte, este conceput pentru a examina ambele părți ale unui interval de date specificat pentru a testa dacă o probă este mai mare sau mai mică decât intervalul de valori.
Exemplu de test cu două cozi
Ca exemplu ipotetic, imaginați-vă că un nou agent de bursă (XYZ) susține că comisioanele sale de brokeraj sunt mai mici decât cele ale curentului dvs. broker de acțiuni (ABC). Datele disponibile de la o firmă de cercetare independentă indică faptul că media și abaterea standard a tuturor clienților brokerilor ABC sunt de 18 USD, respectiv 6 USD.
Se ia un eșantion de 100 de clienți ABC, iar taxele de brokeraj sunt calculate cu noile rate ale brokerului XYZ. Dacă media eșantionului este de 18,75 USD și abaterea standard a eșantionului este de 6 USD, se poate face vreo deducție cu privire la diferența facturii medii de brokeraj dintre brokerul ABC și XYZ?
- H 0 : Ipoteză nulă: medie = 18
- H 1 : Ipoteză alternativă: medie 18 (Aceasta este ceea ce vrem să dovedim.)
- Regiunea de respingere: Z = Z 2.5 (presupunând un nivel de semnificație de 5%, împărțit 2,5 pe fiecare parte).
- Z = (eșantion mediu – mediu) / (std-dev / sqrt (nr. De eșantioane)) = (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Această valoare Z calculată se încadrează între cele două limite definite de: – Z 2,5 = -1,96 și Z 2,5 = 1,96.
Aceasta concluzionează că nu există dovezi suficiente pentru a deduce că există vreo diferență între ratele brokerului dvs. existent și ale noului broker. Prin urmare, ipoteza nulă nu poate fi respinsă. Alternativ, valoarea p = P (Z 1,25) = 2 * 0,1056 = 0,2112 = 21,12%, care este mai mare de 0,05 sau 5%, duce la aceeași concluzie.
întrebări frecvente
Cum este proiectat un test cu două cozi?
Un test cu două cozi este conceput pentru a determina dacă o afirmație este adevărată sau nu este dată unui parametru de populație. Acesta examinează ambele părți ale unui interval de date specificat așa cum este desemnat de distribuția de probabilitate implicată. Ca atare, distribuția probabilității ar trebui să reprezinte probabilitatea unui rezultat specificat pe baza unor standarde prestabilite. Acest lucru necesită setarea unei limite care desemnează cele mai mari (sau superioare) și cele mai mici (sau mai mici) valori variabile acceptate incluse în interval. Orice punct de date care există peste limita superioară sau sub limita inferioară este considerat în afara intervalului de acceptare și revendicarea este respinsă.
Care este diferența dintre un test cu două cozi și un singur test?
Un test de ipoteză cu două cozi este conceput pentru a arăta dacă media eșantionului este semnificativ mai mare decât și semnificativ mai mică decât media unei populații. Testul cu două cozi își ia numele din testarea zonei de sub ambele cozi (părți) ale unei distribuții normale. Pe de altă parte, un test de ipoteză cu o singură coadă este configurat pentru a arăta că media eșantionului ar fi mai mare sau mai mică decât media populației. Testul cu o singură coadă își ia numele din testarea zonei sub una dintre cozile unei distribuții normale.
Ce este un scor Z?
Un scor Z descrie numeric relația unei valori cu media unui grup de valori și se măsoară în funcție de numărul abaterilor standard de la medie. Dacă scorul Z este 0, indică faptul că scorul punctului de date este identic cu scorul mediu, în timp ce scorurile Z de 1,0 și -1,0 ar indica valori cu o abatere standard peste sau sub medie. În majoritatea seturilor de date mari, 99% din valori au un scor Z între -3 și 3, ceea ce înseamnă că se află în cadrul a trei abateri standard peste și sub medie.