Interval de încredere - KamilTaylan.blog
1 mai 2021 11:14

Interval de încredere

Ce este intervalul de încredere?

Un interval de încredere, în statistici, se referă la probabilitatea ca un parametru al populației să se încadreze între un set de valori pentru o anumită proporție de ori.

Chei de luat masa

  • Un interval de încredere afișează probabilitatea ca un parametru să se încadreze între o pereche de valori în jurul mediei.
  • Intervalele de încredere măsoară gradul de incertitudine sau certitudine într-o metodă de eșantionare.
  • Acestea sunt cel mai adesea construite folosind niveluri de încredere de 95% sau 99%.

Înțelegerea intervalului de încredere

Intervalele de încredere măsoară gradul de incertitudine sau certitudine într-o metodă de eșantionare. Ele pot lua orice număr de limite de probabilitate, cele mai frecvente fiind un nivel de încredere de 95% sau 99%. Intervalele de încredere sunt realizate folosind metode statistice, cum ar fi  testul t.

Statisticienii folosesc intervale de încredere pentru a măsura incertitudinea într-o variabilă eșantion. De exemplu, un cercetător selectează probe diferite în mod aleatoriu din aceeași populație și calculează un interval de încredere pentru fiecare probă pentru a vedea cum poate reprezenta valoarea reală a variabilei populației. Seturile de date rezultate sunt toate diferite; unele intervale includ parametrul adevărat al populației, iar altele nu.

Un interval de încredere este un interval de valori, delimitate deasupra și sub media statisticii, care probabil ar conține un parametru necunoscut al populației. Nivelul de încredere se referă la procentul de probabilitate sau certitudine că intervalul de încredere ar conține parametrul adevărat al populației atunci când trageți de multe ori un eșantion aleatoriu. Sau, în limba populară, „suntem siguri 99% ( nivel de încredere) că majoritatea acestor eșantioane (intervale de încredere) conțin parametrul populației adevărat”.

Cea mai mare concepție greșită cu privire la intervalele de încredere este că acestea reprezintă procentul de date dintr-un eșantion dat care se încadrează între limitele superioare și inferioare. De exemplu, s-ar putea interpreta în mod eronat intervalul de încredere de 99% menționat anterior de 70 până la 78 de inci ca indicând faptul că 99% din datele dintr-un eșantion aleatoriu se încadrează între aceste numere. Acest lucru este incorect, deși există o metodă separată de analiză statistică pentru a face o astfel de determinare. A face acest lucru implică identificarea deviației standard și medie a eșantionului și trasarea acestor cifre pe o curbă de clopot.



Încrederea intervalului și de încredere nivel sunt legate între ele, dar nu sunt exact la fel.

Calculul intervalului de încredere

Să presupunem că un grup de cercetători studiază înălțimile jucătorilor de baschet din liceu. Cercetătorii iau un eșantion aleatoriu din populație și stabilesc o înălțime medie de 74 inci.

Media de 74 inci este o estimare punctuală a populației. O estimare punctuală în sine are o utilitate limitată, deoarece nu relevă incertitudinea asociată cu estimarea; nu aveți o bună înțelegere a cât de departe ar putea fi acest eșantion mediu de 74 inci de media populației. Ceea ce lipsește este gradul de incertitudine din acest eșantion unic.

Intervalele de încredere oferă mai multe informații decât estimările punctuale. Prin stabilirea unui interval de încredere de 95% folosind media și deviația standard a eșantionului și presupunând o distribuție normală așa cum este reprezentată de curba clopotului, cercetătorii ajung la o limită superioară și inferioară care conține media reală 95% din timp.

Să presupunem că intervalul este între 72 inci și 76 inci. Dacă cercetătorii iau 100 de eșantioane aleatorii de la populația de jucători de baschet din liceu în ansamblu, media ar trebui să scadă între 72 și 76 de centimetri în 95 dintre aceste eșantioane.

Dacă cercetătorii doresc încredere și mai mare, ei pot extinde intervalul până la încredere de 99%. Dacă faceți acest lucru, invariabil se creează o gamă mai largă, deoarece face loc pentru un număr mai mare de mijloace de eșantionare. Dacă stabilesc intervalul de încredere de 99% ca fiind între 70 și 78 de inci, se pot aștepta ca 99 din 100 de probe evaluate să conțină o valoare medie între aceste numere.

 Un nivel de încredere de 90%, pe de altă parte, implică faptul că ne-am aștepta ca 90% din estimările intervalului să includă parametrul populației și așa mai departe.

întrebări frecvente

Ce dezvăluie un interval de încredere?

Un interval de încredere este un interval de valori, delimitate deasupra și sub media statisticii, care probabil ar conține un parametru de populație necunoscut. Nivelul de încredere se referă la procentul de probabilitate sau certitudine că intervalul de încredere ar conține parametrul adevărat al populației atunci când trageți de multe ori un eșantion aleatoriu.

Cum se utilizează intervalele de încredere?

Statisticienii folosesc intervale de încredere pentru a măsura incertitudinea într-o variabilă eșantion. De exemplu, un cercetător selectează probe diferite în mod aleatoriu din aceeași populație și calculează un interval de încredere pentru fiecare probă pentru a vedea cum poate reprezenta valoarea reală a variabilei populației. Seturile de date rezultate sunt diferite în cazul în care unele intervale includ parametrul adevărat al populației, iar altele nu.

Care este o concepție greșită comună despre intervalele de încredere?

Cea mai mare concepție greșită cu privire la intervalele de încredere este că acestea reprezintă procentul de date dintr-un eșantion dat care se încadrează între limitele superioare și inferioare. Cu alte cuvinte, ar fi incorect să presupunem că un interval de încredere de 99% înseamnă că 99% din datele dintr-un eșantion aleatoriu se încadrează între aceste limite. Ceea ce înseamnă de fapt este că se poate fi 99% sigur că intervalul va conține media populației.

Ce este un test T?

Intervalele de încredere sunt realizate folosind metode statistice, cum ar fi testul t. Un test t este un tip de statistică inferențială utilizat pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate de anumite caracteristici. Calculul unui test t necesită trei valori cheie ale datelor. Acestea includ diferența dintre valorile medii din fiecare set de date (numită diferența medie), abaterea standard a fiecărui grup și numărul de valori ale datelor din fiecare grup.