1 mai 2021 22:11

Corelație falsă

Ce este corelația falsă

În statistici, o corelație falsă, sau falsitate, se referă la o conexiune între două variabile care pare cauzală, dar nu este. Relațiile false au adesea aspectul unei variabile care o afectează pe alta. Această corelație falsă este adesea cauzată de un al treilea factor care nu este evident în momentul examinării, numit uneori un factor confuz.

Chei de luat masa

  • Corelația falsă sau falsitatea este atunci când doi factori apar în mod casual, dar nu sunt.
  • Apariția unei relații cauzale se datorează adesea unei mișcări similare pe o diagramă care se dovedește a fi coincidență sau cauzată de un al treilea factor „confuz”.
  • Corelația falsă poate fi adesea cauzată de dimensiuni mici ale eșantionului sau de puncte finale arbitrare.

Cum funcționează corelația falsă

Când două variabile aleatorii se urmăresc îndeaproape pe un grafic, este ușor de suspectat o corelație sau o relație între cei doi factori, în care o schimbare îl afectează pe celălalt. Lăsând deoparte „cauzalitatea”, un alt subiect, această observație poate duce cititorul graficului să creadă că mișcarea variabilei A este legată de mișcarea variabilei B sau invers. dar uneori, la o examinare statistică mai atentă, mișcările aliniate sunt coincidente sau cauzate de un al treilea factor care afectează primii doi. Aceasta este o corelație falsă. Cercetările efectuate cu eșantioane mici sau obiective arbitrare sunt particularități susceptibile de fals.

Exemplu de corelații false

Nu este prea dificil să descoperiți corelații interesante. Mulți se vor dovedi a fi falsi, totuși. Pentru speciile masculine de pe Wall Street, două corelații false false implică femei și sport. Originarea din anii 1920 este teoria lungimii fustei, care susține că lungimile fustei și direcția pieței bursiere sunt corelate. Dacă lungimea fustei este lungă, înseamnă că piața de valori este în scădere; dacă sunt scurte, piața crește. La sfârșitul lunii ianuarie se vorbește despre așa-numitul indicator Super Bowl, ceea ce sugerează că o victorie a echipei AFC înseamnă probabil că piața de valori va scădea în anul următor, în timp ce o victorie a echipei NFC prevede o creștere a piaţă. Din 1966, indicatorul a avut o rată de precizie de 80%. Este o piesă de conversație distractivă, dar probabil nu este un lucru pe care un consilier financiar serios l-ar recomanda ca strategie de investiții pentru clienți.

Iată câteva alte exemple de corelații false false:

  • Înecile cresc atunci când cresc vânzările de înghețată. Se poate părea că vânzările crescute de înghețată provoacă mai mult înec, dar în realitate, creșterea căldurii poate determina mai mulți oameni să înoate, precum și să cumpere mai multe înghețate.
  • Rata uciderilor din SUA din 2006-2011 a scăzut la același ritm ca și utilizarea Microsoft Internet Explorer.
  • Executivii care spun vă rog și vă mulțumesc mai des se bucură de performanțe de distribuire mai bune.
  • Oamenii care poartă echipamentul echipei Oakland Raiders sunt mai predispuși să comită infracțiuni.

Cum se identifică corelațiile falsificate

Statisticienii și alți oameni de știință care analizează date trebuie să fie mereu în căutarea unor relații false. Există numeroase metode pe care le folosesc, inclusiv:

  • Asigurarea unui eșantion reprezentativ adecvat.
  • Obținerea unei dimensiuni adecvate a eșantionului.
  • Fiți precaut cu privire la obiectivele arbitrare.
  • Controlând cât mai multe variabile externe posibil.
  • Folosind o ipoteză nulă și verificând o valoare p puternică.