Corelație spuroasă
Ce este corelația spuroasăÎn statistici, o corelație spuroasă, sau spuriție, se referă la o conexiune între două variabile care apare cauzal, dar nu este. Relațiile spuroase au adesea aspectul unei variabile care afectează alta. Această corelație spuroasă este adesea cauzată de un al treilea factor care nu este evident în momentul examinării, uneori numit factor de confuzie.
Cheie de luat cu cheie
- Corelația spuriosă sau spuriția este atunci când doi factori apar în relație întâmplătoare, dar nu sunt.
- Apariția unei relații de cauzalitate se datorează adesea mișcării similare pe un grafic care se dovedește a fi coincidentă sau cauzată de un al treilea factor „confuz”.
- Corelația înfiorătoare poate fi adesea cauzată de mărimi mici ale eșantionului sau de obiective arbitrare.
Cum funcționează corelația spuriosă
Când două variabile aleatorii se urmăresc reciproc îndeaproape pe un grafic, este ușor să suspectăm o corelație sau o relație între cei doi factori, unde o schimbare îl afectează pe celălalt. Renunțând la „cauzalitate”, un alt subiect, această observație poate determina cititorul graficului să creadă că mișcarea variabilei A este legată de mișcarea din variabila B sau invers. dar uneori, la examinarea statistică mai atentă, mișcările aliniate sunt coincidente sau cauzate de un al treilea factor care afectează primii doi. Aceasta este o corelație spuroasă. Cercetările efectuate cu dimensiuni mici de eșantion sau cu obiective finale arbitrare sunt particularități susceptibile de a fi înfiorătoare.
Exemplu de corelații spuroase
Nu este prea dificil să descoperi corelații interesante. Cu toate acestea, mulți se vor dovedi a fi spuriosi. Pentru speciile de sex masculin de pe Wall Street, două corelații spuroase populare implică femei și sport. Originară în anii 1920 este teoria lungimii fustei, care susține că lungimile fustei și direcția pieței bursiere sunt corelate. Dacă lungimile fustei sunt lungi, asta înseamnă că piața bursieră este în scădere; dacă sunt scurte, piața este în creștere. Spre sfârșitul lunii ianuarie, se vorbește despre așa-numitul indicator Super Bowl, care sugerează că o victorie a echipei AFC înseamnă că piața bursieră va scădea în anul următor, în timp ce o victorie a echipei NFC prevede o creștere a piaţă. Din 1966, indicatorul a avut o rată de precizie de 80%. Este o piesă de conversație amuzantă, dar probabil că nu este un lucru pe care un consilier financiar serios l-ar recomanda ca strategie de investiții pentru clienți.
Iată câteva exemple suplimentare de corelații spurice comune:
- Depunerile cresc când vânzările de înghețată cresc. Se poate părea că vânzările crescute de înghețată provoacă mai multe înecuri, dar, în realitate, creșterea căldurii poate determina mai mulți oameni să înoate, precum și să cumpere mai multă înghețată.
- Rata omorurilor din SUA în perioada 2006-2011 a scăzut în același ritm cu utilizarea Microsoft Internet Explorer.
- Executivii care spun vă rog și vă mulțumesc mai des se bucură de o performanță mai bună la partajare.
- Persoanele care poartă echipamentul echipei Oakland Raiders sunt mai susceptibile de a comite infracțiuni.
Cum să localizați corelațiile spuroase
Statisticii și alți oameni de știință care analizează datele trebuie să fie în permanență în căutarea relațiilor spuroase. Există numeroase metode pe care le folosesc, inclusiv:
- Asigurarea unui eșantion reprezentativ adecvat.
- Obținerea unei dimensiuni adecvate a eșantionului.
- Fiind precauți de obiectivele arbitrare.
- Controlul pentru cât mai multe variabile exterioare.
- Utilizarea unei ipoteze nule și verificarea unei valori p puternice.