1 mai 2021 22:53

Definiția distribuției T

Ce este o distribuție T?

Distribuția T, cunoscută și sub numele de distribuția t a lui Student, este un tip de distribuție a probabilității care este similară cu distribuția normală, cu forma clopotului, dar are cozi mai grele. Distribuțiile T au șanse mai mari pentru valori extreme decât distribuțiile normale, de unde și cozile mai grase.

Chei de luat masa

  • Distribuția T este o distribuție continuă a probabilității scorului z atunci când deviația standard estimată este utilizată în numitor mai degrabă decât abaterea standard adevărată.
  • Distribuția T, ca și distribuția normală, este în formă de clopot și simetrică, dar are cozi mai grele, ceea ce înseamnă că tinde să producă valori care scad departe de media sa.
  • Testele T sunt utilizate în statistici pentru a estima semnificația.

Ce îți spune o distribuție T? 

Greutatea cozii este determinată de un parametru al distribuției T numit grade de libertate, cu valori mai mici care dau cozi mai grele și cu valori mai mari care fac distribuția T să semene cu o distribuție normală standard cu o medie de 0 și o deviație standard de 1. Distribuția T este, de asemenea, cunoscută sub numele de „Distribuția T a studentului”.

Când se ia un eșantion de n observații dintr-o populație distribuită în mod normal având media M și deviația standard D, media eșantionului, m și deviația standard a eșantionului, d, vor diferi de M și D din cauza aleatoriei eșantionului.

Un scor z poate fi calculat cu abaterea standard a populației ca Z = (x – M) / D, iar această valoare are distribuția normală cu media 0 și abaterea standard 1. Dar când se utilizează abaterea standard estimată, un scor t se calculează ca T = (m – M) / {d / sqrt (n)}, diferența dintre d și D face distribuția o distribuție T cu (n – 1) grade de libertate, mai degrabă decât distribuția normală cu media 0 și abaterea standard 1. 

Exemplu de utilizare a unei distribuții T.

Luați exemplul următor pentru modul în care distribuțiile t sunt utilizate în analiza statistică. Mai întâi, amintiți-vă că un interval de încredere pentru medie este un interval de valori, calculate din date, menite să capteze o medie „populațională”. Acest interval este m + – t * d / sqrt (n), unde t este o valoare critică din distribuția T.

De exemplu, un interval de încredere de 95% pentru rentabilitatea medie a mediei industriale Dow Jones în cele 27 de zile de tranzacționare anterioare 9/11/2001 este de -0,33%, (+/- 2.055) * 1,07 / sqrt (27), oferind un randament mediu (persistent) ca un număr între -0,75% și + 0,09%. Numărul 2.055, cantitatea de erori standard de ajustat, se găsește din distribuția T.

Deoarece distribuția T are cozi mai grase decât o distribuție normală, poate fi utilizată ca model pentru randamentele financiare care prezintă exces de kurtoză, ceea ce va permite un calcul mai realist al valorii la risc ( VaR ) în astfel de cazuri.

Diferența dintre o distribuție T și o distribuție normală 

Distribuțiile normale sunt utilizate atunci când se presupune că distribuția populației este normală. Distribuția T este similară cu distribuția normală, doar cu cozile mai grase. Ambele presupun o populație distribuită în mod normal. Distribuțiile T au o kurtoză mai mare decât distribuțiile normale. Probabilitatea de a obține valori foarte departe de medie este mai mare cu o distribuție T decât o distribuție normală.

Limitările utilizării unei distribuții T. 

Distribuția T poate distorsiona exactitatea față de distribuția normală. Neajunsul său apare numai atunci când este nevoie de o normalitate perfectă. Cu toate acestea, diferența dintre utilizarea unei distribuții normale și T este relativ mică.