Ipoteza nulă
Ce este o ipoteză nulă?
O ipoteză nulă este un tip de ipoteză utilizată în statistici care propune că nu există nicio diferență între anumite caracteristici ale unei populații (sau proces de generare a datelor).
De exemplu, un jucător poate fi interesat dacă un joc de noroc este corect. Dacă este corect, atunci câștigurile așteptate pe joc ajung la 0 pentru ambii jucători. Dacă jocul nu este corect, atunci câștigurile așteptate sunt pozitive pentru un jucător și negative pentru celălalt. Pentru a testa dacă jocul este corect, jucătorul colectează date despre câștiguri din multe repetări ale jocului, calculează câștigurile medii din aceste date, apoi testează ipoteza nulă că câștigurile așteptate nu sunt diferite de zero.
Dacă câștigurile medii din datele eșantionului sunt suficient de departe de zero, atunci jucătorul va respinge ipoteza nulă și va încheia ipoteza alternativă – și anume, că câștigurile așteptate pe joc sunt diferite de zero. Dacă câștigurile medii din datele eșantionului sunt aproape de zero, atunci jucătorul nu va respinge ipoteza nulă, concluzionând în schimb că diferența dintre media din date și 0 este explicabilă doar din întâmplare.
Chei de luat masa
- O ipoteză nulă este un tip de conjectură utilizat în statistici care propune că nu există nicio diferență între anumite caracteristici ale unei populații sau proces de generare a datelor.
- Ipoteza alternativă propune că există o diferență.
- Testarea ipotezei oferă o metodă pentru a respinge o ipoteză nulă într-un anumit nivel de încredere. (Totuși, ipotezele nule nu pot fi dovedite.)
Cum funcționează o ipoteză nulă
Ipoteza nulă, cunoscută și sub numele de conjectură, presupune că orice fel de diferență între caracteristicile alese pe care le vedeți într-un set de date se datorează întâmplării. De exemplu, dacă câștigurile așteptate pentru jocurile de noroc sunt cu adevărat egale cu 0, atunci orice diferență între câștigurile medii din date și 0 se datorează întâmplării.
Ipotezele statistice sunt testate folosind un proces în patru pași. Primul pas este ca analistul să expună cele două ipoteze astfel încât doar una să poată avea dreptate. Următorul pas este formularea unui plan de analiză, care să prezinte modul în care datele vor fi evaluate. Al treilea pas este realizarea planului și analizarea fizică a eșantionului de date. Al patrulea și ultimul pas este să analizăm rezultatele și fie să respingem ipoteza nulă, fie să susținem că diferențele observate sunt explicabile doar din întâmplare.
Analiștii caută să respingă ipoteza nulă, deoarece acest lucru este o concluzie puternică. Acest lucru necesită dovezi puternice sub forma unei diferențe observate, care este prea mare pentru a fi explicată doar din întâmplare. Eșecul respingerii ipotezei nule – că rezultatele sunt explicabile doar din întâmplare – este o concluzie slabă, deoarece permite că alți factori decât șansa pot fi la locul de muncă, dar pot să nu fie suficient de puternici pentru a fi detectabili prin testul statistic utilizat.
Important
Analiștii caută să respingă ipoteza nulă de a exclude singura întâmplare ca explicație pentru fenomenele de interes.
Exemple de ipoteză nulă
Iată un exemplu simplu. Un director de școală susține că elevii din școala ei înregistrează în medie 7 la 10 la examene. Ipoteza nulă este că media populației este de 7,0. Pentru a testa această ipoteză nulă, înregistrăm note de 30 de elevi (eșantion) din întreaga populație de elevi ai școlii (să zicem 300) și calculăm media eșantionului respectiv.
Putem apoi să comparăm media eșantionului (calculat) cu media populației (ipotezată) de 7,0 și să încercăm să respingem ipoteza nulă. (Ipoteza nulă aici – că media populației este de 7,0 – nu poate fi dovedită folosind datele eșantionului; poate fi respinsă doar.)
Luați un alt exemplu: rentabilitatea anuală a unui anumit fond mutual se pretinde a fi de 8%. Să presupunem că există un fond mutual de 20 de ani. Ipoteza nulă este că randamentul mediu este de 8% pentru fondul mutual. Luăm un eșantion aleatoriu de rentabilități anuale ale fondului mutual pentru, să zicem, cinci ani (eșantion) și calculăm media eșantionului. Apoi comparăm media eșantionului (calculat) cu media populației (revendicate) (8%) pentru a testa ipoteza nulă.
Pentru exemplele de mai sus, ipotezele nule sunt:
- Exemplul A: Elevii din școală înregistrează o medie de 7 din 10 la examene.
- Exemplul B: randamentul mediu anual al fondului mutual este de 8% pe an.
Pentru a stabili dacă să respingem ipoteza nulă, ipoteza nulă (prescurtată H 0 ) se presupune, de dragul argumentului, că este adevărată. Apoi, intervalul probabil al valorilor posibile ale statisticii calculate (de exemplu, scorul mediu la testele de 30 de elevi) este determinat sub această prezumție (de exemplu, intervalul mediilor plauzibile ar putea varia de la 6,2 la 7,8 dacă media populației este de 7,0). Apoi, dacă media eșantionului este în afara acestui interval, ipoteza nulă este respinsă. În caz contrar, se spune că diferența este „explicabilă doar prin întâmplare”, fiind în intervalul care este determinat doar de întâmplare.
Un punct important de remarcat este că testăm ipoteza nulă, deoarece există un element de îndoială cu privire la validitatea acesteia. Orice informație care este împotriva ipotezei nule declarate este capturată în ipoteza alternativă (H 1 ). Pentru exemplele de mai sus, ipoteza alternativă ar fi:
- Elevii înregistrează o medie care nu este egală cu 7.
- Randamentul mediu anual al fondului mutual nu este egal cu 8% pe an.
Cu alte cuvinte, ipoteza alternativă este o contradicție directă a ipotezei nule.
Testarea ipotezei pentru investiții
Ca exemplu legat de piețele financiare, presupunem că Alice vede că strategia ei de investiții produce randamente medii mai mari decât simpla cumpărare și deținere de acțiuni. Ipoteza nulă afirmă că nu există nicio diferență între cele două randamente medii, iar Alice este înclinată să creadă acest lucru până când va putea concluziona rezultate contradictorii.
Refutarea ipotezei nule ar necesita demonstrarea semnificației statistice, care poate fi găsită folosind o varietate de teste. Ipoteza alternativă ar stabili că strategia de investiții are un randament mediu mai mare decât o strategie tradițională de cumpărare și deținere.
Un instrument care poate fi utilizat pentru a determina semnificația statistică a rezultatelor este valoarea p. O valoare p reprezintă probabilitatea ca o diferență la fel de mare sau mai mare decât diferența observată între cele două randamente medii să poată apărea numai întâmplător.
O valoare p care este mai mică sau egală cu 0,05 este adesea utilizată pentru a indica dacă există dovezi împotriva ipotezei nule. Dacă Alice efectuează unul dintre aceste teste, cum ar fi un test folosind modelul normal, rezultând o diferență semnificativă între randamentele sale și randamentele de cumpărare și deținere (valoarea p este mai mică sau egală cu 0,05), ea poate atunci respinge ipoteza nulă și încheie ipoteza alternativă.