1 mai 2021 12:16

Statisticile descriptive

Ce sunt statisticile descriptive?

Statisticile descriptive sunt coeficienți descriptivi scurți care rezumă un set de date dat, care poate fi fie o reprezentare a întregii populații, fie un eșantion al unei populații. Statisticile descriptive sunt împărțite în măsuri de tendință centrală și măsuri de variabilitate (răspândire). Măsurile de tendință centrală includ media, mediana și modul, în timp ce măsurile de variabilitate includ kurtosis și asimetrie.

Chei de luat masa

  • Statisticile descriptive rezumă sau descriu caracteristicile unui set de date.
  • Statistica descriptivă constă din două categorii de bază de măsuri: măsuri de tendință centrală și măsuri de variabilitate (sau răspândire).
  • Măsurile de tendință centrală descriu centrul unui set de date.
  • Măsurile de variabilitate sau răspândire descriu dispersia datelor în cadrul setului.

Înțelegerea statisticilor descriptive

Statisticile descriptive, pe scurt, ajută la descrierea și înțelegerea caracteristicilor unui anumit set de date, oferind rezumate scurte despre eșantion și măsurile datelor. Cele mai recunoscute tipuri de statistici descriptive sunt măsurători ale centrului: media, mediana și modul, care sunt utilizate la aproape toate nivelurile de matematică și statistici. Media sau media se calculează prin adăugarea tuturor cifrelor din setul de date și apoi împărțirea la numărul de cifre din set. De exemplu, suma următorului set de date este 20: (2, 3, 4, 5, 6). Media este 4 (20/5). Modul unui set de date este valoarea care apare cel mai des, iar mediana este figura situată în mijlocul setului de date. Este cifra care separă cifrele superioare de cele inferioare într-un set de date. Cu toate acestea, există tipuri mai puțin frecvente de statistici descriptive care sunt încă foarte importante.

Oamenii folosesc statistici descriptive pentru a reutiliza statistici cantitative greu de înțeles într-un set mare de date în descrieri de dimensiuni mici. De exemplu, media unui elev (GPA) oferă o bună înțelegere a statisticilor descriptive. Ideea unui GPA este că ia puncte de date dintr-o gamă largă de examene, clase și note și le face împreună pentru a oferi o înțelegere generală a performanței academice generale a unui student. GPA personal al unui student reflectă performanța academică medie.

Măsuri ale statisticii descriptive

Toate statisticile descriptive sunt fie măsuri ale tendinței centrale, fie măsuri ale variabilității, cunoscute și sub numele de măsuri ale dispersiei. Măsurile de tendință centrală se concentrează pe valorile medii sau medii ale seturilor de date, în timp ce măsurile de variabilitate se concentrează pe dispersia datelor. Aceste două măsuri utilizează grafice, tabele și discuții generale pentru a ajuta oamenii să înțeleagă semnificația datelor analizate.

Măsurile de tendință centrală descriu poziția centrală a unei distribuții pentru un set de date. O persoană analizează frecvența fiecărui punct de date din distribuție și o descrie folosind media, mediana sau modul, care măsoară cele mai frecvente tipare ale setului de date analizate.

Măsurile de variabilitate sau măsurile de răspândire ajută la analizarea gradului de răspândire a distribuției pentru un set de date. De exemplu, în timp ce măsurile de tendință centrală pot da unei persoane media unui set de date, nu descrie modul în care datele sunt distribuite în cadrul setului. Deci, în timp ce media datelor poate fi de 65 din 100, pot exista totuși puncte de date atât la 1, cât și la 100. Măsurile de variabilitate ajută la comunicarea acestui lucru prin descrierea formei și răspândirii setului de date. Gama, quartile, deviația absolută și varianța sunt toate exemple de măsuri ale variabilității.

Luați în considerare următorul set de date: 5, 19, 24, 62, 91, 100. Intervalul acestui set de date este 95, care se calculează scăzând cel mai mic număr (5) din setul de date din cel mai mare (100).

întrebări frecvente

De ce avem nevoie de statistici care descriu pur și simplu date?

Statisticile descriptive sunt folosite pentru a descrie sau rezuma caracteristicile unui eșantion sau a unui set de date, cum ar fi media unei variabile, deviația standard sau frecvența. Statistici deduse. Acest tip de statistici ne poate ajuta să înțelegem proprietățile colective ale elementelor unui eșantion de date. Aceste măsuri ne pot oferi o idee despre distribuția probabilității  sau „forma” generală a datelor, care poate fi descrisă pe o diagramă, cum ar fi o histogramă sau un punct. Cunoașterea eșantionului mediu, varianță și distribuție a unei variabile ne poate ajuta să înțelegem lumea din jurul nostru.

Ce sunt abaterea medie și standard?

Acestea sunt două statistici descriptive utilizate în mod obișnuit. Media este nivelul mediu observat într-o anumită bucată de date, în timp ce deviația standard descrie varianța sau modul în care sunt distribuite datele observate în acea variabilă în jurul valorii medii.

Pot fi folosite statistici descriptive pentru a face inferențe sau predicții?

Nu. În timp ce aceste descriptive sunt utile în înțelegerea atributelor datelor, tehnicile statistice inferențiale – o ramură separată a statisticilor – sunt necesare pentru a înțelege modul în care variabilele interacționează între ele într-un set de date.