1 mai 2021 19:16

Valoarea P

Ce este valoarea P?

În statistici, valoarea p este probabilitatea de a obține rezultate cel puțin la fel de extreme ca rezultatele observate ale unui test de ipoteză statistică , presupunând că ipoteza nulă este corectă. Valoarea p este utilizată ca alternativă la punctele de respingere pentru a oferi cel mai mic nivel de semnificație la care  ar fi respinsă ipoteza nulă. O valoare p mai mică înseamnă că există dovezi mai puternice în favoarea ipotezei alternative.

Chei de luat masa

  • O valoare p este o măsură a probabilității ca o diferență observată să se fi produs doar prin întâmplare.
  • Cu cât valoarea p este mai mică, cu atât este mai mare semnificația statistică a diferenței observate.
  • Valoarea P poate fi utilizată ca alternativă la sau în plus față de nivelurile de încredere preselectate pentru testarea ipotezelor.

Cum se calculează valoarea P?

Valorile P se găsesc de obicei folosind tabele cu valori p sau foi de calcul / software statistice. Aceste calcule se bazează pe distribuția de probabilitate presupusă sau cunoscută a statisticii specifice testate. Valorile P sunt calculate din deviația dintre valoarea observată și o valoare de referință aleasă, având în vedere distribuția de probabilitate a statisticii, cu o diferență mai mare între cele două valori corespunzătoare unei valori p mai mici.

Matematic, valoarea p se calculează utilizând calculul integral din aria de sub curba de distribuție a probabilității pentru toate valorile statisticilor care sunt cel puțin la fel de departe de valoarea de referință ca și valoarea observată, relativ la aria totală de sub curba de distribuție a probabilității. Pe scurt, cu cât diferența dintre două valori observate este mai mare, cu atât este mai puțin probabil ca diferența să fie cauzată de șansa aleatorie simplă și acest lucru se reflectă printr-o valoare p mai mică.

Abordarea valorii P a testării ipotezei

Abordarea valorii p a testării ipotezelor utilizează probabilitatea calculată pentru a determina dacă există dovezi care să respingă ipoteza nulă. Ipoteza nulă, cunoscută și sub numele de conjectură, este revendicarea inițială despre o populație (sau un proces de generare a datelor). Ipoteza alternativă afirmă dacă parametrul populației diferă de valoarea parametrului populației menționată în conjectură.

În practică, nivelul de semnificație este declarat în prealabil pentru a determina cât de mică trebuie să fie valoarea p pentru a respinge ipoteza nulă. Deoarece diferiți cercetători folosesc niveluri diferite de semnificație atunci când examinează o întrebare, un cititor poate avea uneori dificultăți în a compara rezultatele din două teste diferite. Valorile P oferă o soluție la această problemă.

De exemplu, să presupunem că un studiu care a comparat randamentele de la două active particulare a fost întreprins de cercetători diferiți care au folosit aceleași date, dar niveluri de semnificație diferite. Cercetătorii ar putea ajunge la concluzii opuse cu privire la diferența dintre active. Dacă un cercetător a folosit un nivel de încredere de 90%, iar celălalt a cerut un nivel de încredere de 95% pentru a respinge ipoteza nulă și valoarea p a diferenței observate între cele două randamente a fost de 0,08 (corespunzând unui nivel de încredere de 92%), atunci primul cercetător ar descoperi că cele două active au o diferență care este semnificativă statistic, în timp ce al doilea nu ar găsi nicio diferență statistic semnificativă între randamente.

Pentru a evita această problemă, cercetătorii ar putea raporta valoarea p a testului ipotezei și ar permite cititorului să interpreteze   singuri semnificația statistică. Aceasta se numește abordare cu valoare p a testării ipotezelor. Un observator independent ar putea nota valoarea p și ar putea decide singură dacă aceasta reprezintă sau nu o diferență semnificativă statistic.

Exemplu de valoare P din lumea reală

Să presupunem că un investitor susține că performanța portofoliului de investiții este echivalentă cu cea a Indexului 500 Standard & Poor’s (S&P). Pentru a determina acest lucru, investitorul efectuează un test cu două cozi. Ipoteza nulă afirmă că randamentele portofoliului sunt echivalente cu randamentele S&P 500 pe o perioadă specificată, în timp ce ipoteza alternativă afirmă că randamentele portofoliului și randamentele S&P 500 nu sunt echivalente. (Dacă investitorul a efectuat un test cu o singură coadă, ipoteza alternativă ar stabili că randamentele portofoliului sunt fie mai mici, fie mai mari decât rentabilitățile S&P 500.)

Testul ipotezei valorii P nu utilizează neapărat un nivel de încredere preselectat la care investitorul ar trebui să reseteze ipoteza nulă că randamentele sunt echivalente. În schimb, oferă o măsură a cât de multe dovezi există pentru a respinge ipoteza nulă. Cu cât valoarea p este mai mică, cu atât sunt mai mari dovezile împotriva ipotezei nule. Astfel, dacă investitorul constată că valoarea p este 0,001, există dovezi puternice împotriva ipotezei nule, iar investitorul poate concluziona cu încredere rentabilitățile portofoliului, iar randamentele S&P 500 nu sunt echivalente.

Deși acest lucru nu oferă un prag exact cu privire la momentul în care investitorul ar trebui să accepte sau să respingă ipoteza nulă, acesta are însă un alt avantaj foarte practic. Testarea ipotezei valorii P oferă o modalitate directă de a compara încrederea relativă pe care o poate avea investitorul atunci când alege dintre mai multe tipuri diferite de investiții sau portofolii, în raport cu un punct de referință, cum ar fi S&P 500.

De exemplu, pentru două portofolii, A și B, a căror performanță diferă de S&P 500 cu valori p de 0,10 și respectiv 0,01, investitorul poate fi mult mai încrezător că portofoliul B, cu o valoare p mai mică, va arăta de fapt în mod constant diferit rezultate.