1 mai 2021 22:17

Semnificația statistică

Ce este semnificația statistică?

Semnificația statistică se referă la afirmația conform căreia un rezultat din datele generate de testare sau experimentare nu este probabil să apară aleatoriu sau întâmplător, ci este în schimb probabil atribuibil unei anumite cauze. Având semnificație statistică este important pentru disciplinele academice sau practicienii care se bazează foarte mult pe analiza datelor și cercetării, cum ar fi economia, finanțele, investițiile, medicina, fizica și biologia.

Semnificația statistică poate fi considerată puternică sau slabă. Atunci când se analizează un set de date și se fac testele necesare pentru a discerne dacă una sau mai multe variabile au un efect asupra rezultatului, o semnificație statistică puternică ajută la susținerea faptului că rezultatele sunt reale și nu cauzate de noroc sau întâmplare. Simplu spus, dacă o valoare p este mică, atunci rezultatul este considerat mai fiabil.

Problemele apar în testele de semnificație statistică, deoarece cercetătorii lucrează de obicei cu eșantioane de populații mai mari și nu cu populațiile în sine. Ca rezultat, eșantioanele trebuie să fie reprezentative pentru populație, astfel încât datele conținute în eșantion nu trebuie să fie părtinitoare în niciun fel. În majoritatea științelor, inclusiv în economie, semnificația statistică este relevantă dacă o cerere poate fi făcută la un nivel de 95% (sau uneori 99%).

Înțelegerea semnificației statistice

Calculul semnificației statistice (testarea semnificației) este supus unui anumit grad de eroare. Cercetătorul trebuie să definească în prealabil probabilitatea unei erori de eșantionare, care există în orice test care nu include întreaga populație.

Mărimea eșantionului este o componentă importantă a semnificației statistice prin faptul că eșantioanele mai mari sunt mai puțin predispuse la apariție. Doar eșantioanele reprezentative aleatorii trebuie utilizate în testarea semnificației. Nivelul la care se poate accepta dacă un eveniment este semnificativ statistic este cunoscut ca nivel de semnificație.

Cercetătorii folosesc o statistică de test cunoscută sub numele de valoarea p pentru a determina semnificația statistică: dacă valoarea p scade sub nivelul de semnificație, atunci rezultatul este semnificativ statistic. Valoarea p este o funcție a mijloacelor și abaterilor standard ale eșantioanelor de date.

Valoarea p indică probabilitatea sub care s-a produs rezultatul statistic dat, presupunând că singura șansă este responsabilă pentru rezultat. Dacă această probabilitate este mică, atunci cercetătorul poate conduce în siguranță șansa noastră ca cauză. Valoarea p trebuie să se încadreze sub nivelul de semnificație pentru ca rezultatele să fie cel puțin considerate semnificative statistic.

Opusul nivelului de semnificație, calculat ca 1 minus nivelul de semnificație, este nivelul de încredere. Indică gradul de încredere că rezultatul statistic nu a apărut întâmplător sau prin eroare de eșantionare. Nivelul obișnuit de încredere în multe teste statistice este de 95 la sută, ducând la un nivel obișnuit de semnificație sau valoare p de 5 la sută.

Chei de luat masa

  • Semnificația statistică se referă la afirmația că un rezultat din datele generate de testare sau experimentare este probabil să fie atribuit unei cauze specifice.
  • Dacă o statistică are o semnificație ridicată, atunci este considerată mai fiabilă.
  • Calculul semnificației statistice este supus unui anumit grad de eroare. 
  • Semnificația statistică poate fi interpretată greșit atunci când cercetătorii nu folosesc limbajul cu atenție în raportarea rezultatelor lor. 
  • Sunt folosite mai multe tipuri de teste de semnificație în funcție de cercetarea efectuată

consideratii speciale

Semnificația statistică nu indică întotdeauna semnificație practică, ceea ce înseamnă că rezultatele nu pot fi aplicate situațiilor de afaceri din lumea reală. În plus, semnificația statistică poate fi interpretată greșit atunci când cercetătorii nu folosesc limbajul cu atenție în raportarea rezultatelor lor. Pentru ca un rezultat este statistic semnificativ nu implică faptul că este nu  întâmplătoare, doar că probabilitatea de a fi aleatoare sale este mult redusă.

Doar pentru că două serii de date dețin o corelație puternică între ele nu implică cauzalitate. De exemplu, numărul filmelor în care actorul Nicolas Cage joacă într-un an dat este foarte puternic corelat cu numărul de înecări accidentale din piscine. Dar această corelație este falsă, deoarece nu există nicio afirmație cauzală teoretică care să poată fi făcută.

O altă problemă care poate apărea cu semnificația statistică este că datele anterioare și rezultatele acestor date, indiferent dacă sunt statistic semnificative sau nu, pot să nu reflecte condițiile în curs sau viitoare. În investiții, acest lucru se poate manifesta printr-un model de stabilire a prețurilor care se descompune în perioadele de criză financiară, deoarece corelațiile se schimbă și variabilele nu interacționează ca de obicei. Semnificația statistică poate ajuta, de asemenea, un investitor să discearnă dacă un model de stabilire a prețurilor activelor este mai bun decât altul.

Tipuri de teste de semnificație statistică

Sunt folosite mai multe tipuri de teste de semnificație în funcție de cercetarea efectuată. De exemplu, testele pot fi utilizate pentru unul, două sau mai multe eșantioane de date de diferite dimensiuni pentru medii, varianțe, proporții, date împerecheate sau nepereche sau distribuții diferite de date.

Ipoteza nulă

Toți acești factori au ceea ce se numește ipoteze nule, iar semnificația este adesea scopul testării ipotezelor în statistici. Cea mai comună ipoteză nulă este că parametrul în cauză este egal cu zero (indicând de obicei că o variabilă are efect zero asupra rezultatului interesului). Dacă puteți respinge ipoteza nulă cu o încredere de 95% sau mai bună, cercetătorii pot invoca semnificație statistică. Ipotezele nule pot fi, de asemenea, testate pentru egalitatea (mai degrabă decât egală cu zero) a efectului pentru două sau mai multe tratamente alternative – de exemplu, între un medicament și un placebo într-un studiu clinic.

Respingerea ipotezei nule, chiar dacă un grad foarte ridicat de semnificație statistică nu poate dovedi niciodată ceva, poate adăuga suport doar unei ipoteze existente. Pe de altă parte, eșecul respingerii unei ipoteze nule este adesea motiv pentru respingerea unei ipoteze.

Un test de semnificație statistică împarte o mare parte din aceeași matematică ca și cea a calculării unui interval de încredere. În situațiile obișnuite, o modalitate de a interpreta semnificația statistică este aceea că intervalul de încredere corespunzător de 95% nu conține valoarea zero. Chiar dacă se constată că o variabilă este semnificativă statistic, ea trebuie totuși să aibă sens în lumea reală.

În plus, un efect poate fi semnificativ statistic, dar poate avea doar un impact foarte mic. De exemplu, poate fi foarte puțin probabil din cauza șansei ca companiile care folosesc hârtie igienică cu două straturi în băile lor să aibă angajați mai productivi, dar îmbunătățirea productivității absolute a fiecărui lucrător este probabil minusculă.