1 mai 2021 20:20

Quartile

Ce este un quartile?

O quartilă este un termen statistic care descrie o împărțire a observațiilor în patru intervale definite pe baza valorilor datelor și a modului în care acestea se compară cu întregul set de observații. 

Înțelegerea Quartile

Pentru a înțelege quartila, este important să înțelegem  mediana  ca o  măsură a tendinței centrale. Mediana din statistici este valoarea medie a unui set de numere. Este punctul în care exact jumătate din date se află sub și peste valoarea centrală.

Deci, având în vedere un set de 13 numere, mediana ar fi al șaptelea număr. Cele șase numere care preced această valoare sunt cele mai mici numere din date, iar cele șase numere după mediană sunt cele mai mari numere din setul de date dat. Deoarece mediana nu este afectată de valori extreme sau valori aberante în distribuție, uneori este preferată  medie.

Mediana este un estimator robust al locației, dar nu spune nimic despre modul în care datele sunt distribuite sau dispersate de ambele părți ale valorii sale. Aici intervine quartila. Cuartila măsoară răspândirea valorilor peste și sub medie prin împărțirea distribuției în patru grupuri.

Chei de luat masa

  • Cvartila măsoară răspândirea valorilor peste și sub medie prin împărțirea distribuției în patru grupuri.
  • O cuartilă împarte datele în trei puncte – o cuartilă inferioară, mediană și cuartilă superioară – pentru a forma patru grupuri ale setului de date.
  • Cuartilele sunt utilizate pentru a calcula intervalul intercuartil, care este o măsură a variabilității în jurul medianei.

Cum funcționează Quartile

La fel cum mediana împarte datele în jumătate, astfel încât 50% din măsurătoare se află sub mediană și 50% se află deasupra acesteia, quartila împarte datele în sferturi, astfel încât 25% din măsurători sunt mai mici decât quartila inferioară, 50 % sunt mai mici decât mediana și 75% sunt mai mici decât quartila superioară.

O quartilă împarte datele în trei puncte – o quartilă inferioară, o mediană și o quartilă superioară – pentru a forma patru grupe ale setului de date. Cuartila inferioară, sau prima cuartilă, este notată ca Q1 și este numărul mijlociu care se încadrează între cea mai mică valoare a setului de date și mediana. A doua quartilă, Q2, este, de asemenea, mediana. Cvartila superioară sau a treia, denumită Q3, este punctul central care se află între mediana și cel mai mare număr al distribuției.

Acum putem identifica cele patru grupuri formate din quartile. Primul grup de valori conține cel mai mic număr până la Q1; al doilea grup include Q1 până la mediană; al treilea set este mediana la Q3; a patra categorie cuprinde Q3 până la cel mai înalt punct de date din întregul set.

Fiecare quartilă conține 25% din totalul observațiilor. În general, datele sunt aranjate de la cel mai mic la cel mai mare:

  1. Prima quartilă: cel mai mic 25% din numere
  2. A doua quartilă : între 25,1% și 50% (până la mediană)
  3. A treia quartilă: 50,1% până la 75% (peste medie)
  4. Al patrulea quartil: cel mai mare 25% din numere

Exemplu de Quartile

Să presupunem că distribuția scorurilor de matematică într-o clasă de 19 elevi în ordine crescătoare este:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Mai întâi, marcați mediana, Q2, care în acest caz este a 10- a valoare: 75.

Q1 este punctul central dintre cel mai mic scor și mediana. În acest caz, Q1 se încadrează între primul și al cincilea scor: 68. [Rețineți că mediana poate fi inclusă și atunci când se calculează Q1 sau Q3 pentru un set impar de valori. Dacă ar fi să includem mediana de ambele părți ale punctului de mijloc, atunci Q1 va fi valoarea de mijloc dintre primul și al 10- lea scor, care este media punctajului al cincilea și al șaselea – (al cincilea + al șaselea) / 2 = ( 68 + 69) / 2 = 68,5].

Q3 este valoarea medie dintre Q2 și cel mai mare scor: 84. [Sau dacă includeți mediana, Q3 = (82 + 84) / 2 = 83].

Acum că avem quartile noastre, să le interpretăm numerele. Un scor de 68 (Q1) reprezintă prima quartilă și este a 25- a  percentilă. 68 este mediana jumătății inferioare a scorului stabilit în datele disponibile – adică mediana scorurilor de la 59 la 75.

Q1 ne spune că 25% din scoruri sunt mai mici de 68 și 75% din scorurile clasei sunt mai mari. Q2 (mediana) este a 50- a  percentilă și arată că 50% din scoruri sunt mai mici de 75, iar 50% din scoruri sunt peste 75. În cele din urmă, Q3, a 75- a percentilă, arată că 25% din scoruri sunt mai mare și 75% sunt mai mici de 84.

consideratii speciale

Dacă punctul de date pentru Q1 este mai departe de mediană decât Q3 este de mediană, atunci putem spune că există o dispersie mai mare între valorile mai mici ale setului de date decât printre valorile mai mari. Aceeași logică se aplică dacă Q3 este mai departe de Q2 decât Q1 este de mediană.

Alternativ, dacă există un număr par de puncte de date, mediana va fi media celor două numere din mijloc. În exemplul nostru de mai sus, dacă am fi avut 20 de studenți în loc de 19, mediana scorurile lor va fi  media aritmetică  a 10 – lea și 11 – lea număr.

Cuartilele sunt utilizate pentru a calcula intervalul intercuartil, care este o măsură a variabilității în jurul medianei. Gama intercuartilă este calculată pur și simplu ca diferență între primul și al treilea quartil: Q3 – Q1. De fapt, este intervalul din jumătatea mijlocie a datelor care arată cât de răspândite sunt datele.

Pentru seturile de date mari, Microsoft Excel are o funcție QUARTILE pentru a calcula quartile.