Definiție medie winsorizată - KamilTaylan.blog
2 mai 2021 2:08

Definiție medie winsorizată

Ce înseamnă media câștigată?

Media winsorizată este o metodă de mediere care inițial înlocuiește cele mai mici și cele mai mari valori cu observațiile cele mai apropiate de acestea. Acest lucru se face pentru a limita efectul valorilor aberante sau valorilor extreme anormale, sau valorilor aberante, asupra calculului. După înlocuirea valorilor, formula medie aritmetică este apoi utilizată pentru a calcula media câștigată.

chei de luat masa

  • Media câștigată este o metodă de mediere care implică înlocuirea celor mai mici și mai mari valori ale unui set de date cu observațiile cele mai apropiate de acestea.
  • Atenuează efectele valorilor aberante prin înlocuirea acestora cu valori mai puțin extreme.
  • Media câștigată nu este aceeași cu media tăiată, care implică eliminarea punctelor de date spre deosebire de înlocuirea lor – deși rezultatele celor două tind să fie apropiate.

Formula pentru media câștigată

Mijloacele câștigate sunt exprimate în două moduri. O medie „k n ” câștigată se referă la înlocuirea celor mai mici și mai mari observații „k”, unde „k” este un număr întreg. O medie câștigată „X%” implică înlocuirea unui procent dat de valori de la ambele capete ale datelor.

Media câștigată este obținută prin înlocuirea celor mai mici și mai mari puncte de date, apoi însumând toate punctele de date și împărțind suma la numărul total de puncte de date.

Ce vă spune Winsorized?

Media câștigată este mai puțin sensibilă la valori aberante, deoarece le poate înlocui cu valori mai puțin extreme. Adică, este mai puțin sensibil la valori aberante față de media aritmetică. Cu toate acestea, dacă o distribuție are cozi de grăsime, efectul eliminării celor mai mari și mai mici valori din distribuție va avea o influență redusă din cauza gradului ridicat de variabilitate în cifrele de distribuție.

Exemplu de utilizare a mediei winsorizate

Să calculăm media câștigată pentru următorul set de date: 1, 5, 7, 8, 9, 10, 34. În acest exemplu, presupunem că media câștigată este în prima ordine, în care înlocuim cele mai mici și cele mai mari valori cu cele mai apropiate observații ale acestora.

Setul de date apare acum după cum urmează: 5, 5, 7, 8, 9, 10, 10. Luarea unei medii aritmetice a noului set produce o medie câștigată de 7,7 sau (5 + 5 + 7 + 8 + 9 + 10 + 10) împărțit la 7. Rețineți că media aritmetică ar avea mai mare – 10,6. Media câștigată în câștig reduce efectiv influența valorii 34 ca valoare anterioară.

Sau luați în considerare o medie de 20% câștigată în câștig, care ia 10% de sus și 10% de jos și le înlocuiește cu următoarea lor valoare cea mai apropiată. Vom câștiga următoarele seturi de date: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Cele două cele mai mici și cele mai mari puncte de date – 10% din cele 20 de puncte de date – vor fi înlocuite cu următoarea lor valoare cea mai apropiată. Astfel, noul set de date este după cum urmează: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Media câștigată este 33,9, sau totalul datelor (678) împărțit la numărul total de puncte de date (20).

Media winsorizată vs. Media redusă

Media câștigată include modificarea punctelor de date, în timp ce media tăiată implică eliminarea punctelor de date. Este obișnuit ca media câștigată și media tăiată să fie apropiate sau uneori egale în valoare una cu cealaltă.

Limitări ale mediei câștigate

Un dezavantaj major pentru mijloacele winsorizate este că acestea introduc în mod natural o anumită părtinire în setul de date. Prin reducerea influenței valorilor aberante, analiza este modificată pentru o analiză mai bună, dar elimină, de asemenea, informații despre datele subiacente.