1 mai 2021 18:50

Statistici neparametrice

Ce sunt statisticile neparametrice?

Statistica neparametrică se referă la o metodă statistică în care nu se presupune că datele provin din modele prescrise care sunt determinate de un număr mic de parametri; exemple de astfel de modele includ modelul de distribuție normală și modelul de regresie liniară. Statisticile neparametrice folosesc uneori date care sunt ordinale, ceea ce înseamnă că nu se bazează pe numere, ci mai degrabă pe un clasament sau ordine de fel. De exemplu, un sondaj care transmite preferințele consumatorilor, de la like la dislike, ar fi considerat date ordinale.

Statistica neparametrică include statistici descriptive neparametrice, modele statistice, inferență și teste statistice. Structura modelului modelelor nonparametrice nu este specificată a priori, ci este determinată din date. Termenul nonparametric nu înseamnă că astfel de modele nu au complet parametri, ci că numărul și natura parametrilor sunt flexibili și nu sunt fixați în prealabil. O histogramă este un exemplu de estimare neparametrică a unei distribuții de probabilitate.

Chei de luat masa

  • Statisticile neparametrice sunt ușor de utilizat, dar nu oferă precizia precisă a altor modele statistice.
  • Acest tip de analiză este adesea cel mai potrivit atunci când se ia în considerare ordinea a ceva, unde chiar dacă datele numerice se schimbă, rezultatele vor rămâne probabil aceleași.

Înțelegerea statisticilor nonparametrice

În statistici, statisticile parametrice includ parametri precum media, deviația standard, corelația Pearson, varianța etc. Această formă de statistică utilizează datele observate pentru a estima parametrii distribuției. Conform statisticilor parametrice, se presupune că datele provin dintr-o distribuție normală cu parametri necunoscuți μ (media populației) și σ2 (varianța populației), care sunt apoi estimate utilizând media eșantionului și varianța eșantionului.



Statisticile neparametrice nu fac nicio presupunere cu privire la dimensiunea eșantionului sau dacă datele observate sunt cantitative.

Statisticile neparametrice nu presupun că datele sunt extrase dintr-o distribuție normală. În schimb, forma distribuției este estimată sub această formă de măsurare statistică. În timp ce există multe situații în care se poate presupune o distribuție normală, există și câteva scenarii în care adevăratul proces de generare a datelor este departe de a fi distribuit în mod normal.

Exemple de statistici neparametrice

În primul exemplu, luați în considerare un analist financiar care dorește să estimeze valoarea la risc (VaR) a unei investiții. Analistul colectează date despre câștiguri din 100 de investiții similare pe un orizont de timp similar. Mai degrabă decât să presupună că câștigurile urmează o distribuție normală, ea folosește histograma pentru a estima distribuția nonparametric. A cincea percentilă a acestei histograme oferă apoi analistului o estimare nonparametrică a VaR.

Pentru un al doilea exemplu, luați în considerare un alt cercetător care dorește să știe dacă orele medii de somn sunt legate de frecvența cu care cineva se îmbolnăvește. Deoarece mulți oameni se îmbolnăvesc rar, dacă este deloc, iar alții ocazional se îmbolnăvesc mult mai des decât majoritatea celorlalți, distribuția frecvenței bolii este în mod clar neobișnuită, fiind înclinată la dreapta și predispusă la valori anterioare. Astfel, mai degrabă decât să utilizeze o metodă care presupune o distribuție normală pentru frecvența bolii, așa cum se face în analiza de regresie clasică, de exemplu, cercetătorul decide să utilizeze o metodă nonparametrică, cum ar fi analiza de regresie cuantilă.

consideratii speciale

Statisticile neparametrice au câștigat aprecieri datorită ușurinței lor de utilizare. Pe măsură ce necesitatea parametrilor este ușurată, datele devin mai aplicabile pentru o varietate mai mare de teste. Acest tip de statistici pot fi utilizate fără media, dimensiunea eșantionului, abaterea standard sau estimarea oricăror alți parametri înrudiți atunci când niciuna dintre aceste informații nu este disponibilă.

Întrucât statisticile neparametrice fac mai puține ipoteze cu privire la datele eșantion, aplicația sa este mai largă ca domeniu de aplicare decât statisticile parametrice. În cazurile în care testarea parametrică este mai adecvată, metodele neparametrice vor fi mai puțin eficiente. Acest lucru se datorează faptului că statisticile neparametrice aruncă unele informații disponibile în date, spre deosebire de statisticile parametrice.