Lažna korelacija
Kaj je lažna korelacijaV statistiki se lažna korelacija ali lažno povezovanje nanaša na povezavo med dvema spremenljivkama, ki se zdi vzročna, vendar ni. Lažni odnosi imajo pogosto videz ene spremenljivke, ki vpliva na drugo. To lažno korelacijo pogosto povzroči tretji dejavnik, ki med pregledom ni očiten, včasih ga imenujemo zmeden dejavnik.
Ključni odvzemi
- Lažna korelacija ali napačnost je, kadar sta dva dejavnika videti po naključju povezana, vendar nista.
- Pojav vzročne zveze je pogosto posledica podobnega gibanja na grafikonu, ki se izkaže za naključnega ali ga povzroči tretji "zmeden" dejavnik.
- Lažna korelacija lahko pogosto povzroči majhne velikosti vzorcev ali poljubne končne točke.
Kako deluje lažna korelacija
Kadar dve naključni spremenljivki tesno sledita drug drugemu na grafu, je enostavno sumiti na korelacijo ali razmerje med obema faktorjema, kadar sprememba vpliva na drugega. Če odložimo drugo temo, lahko to opazovanje bralca grafikona prepriča, da je gibanje spremenljivke A povezano z gibanjem v spremenljivki B ali obratno. včasih pa so po natančnejšem statističnem pregledu poravnana gibanja naključna ali jih povzroči tretji dejavnik, ki vpliva na prva dva. To je lažna korelacija. Raziskave z majhnimi velikostmi vzorcev ali poljubnimi končnimi točkami so posebnosti, dovzetne za lažljivost.
Primer lažnih korelacij
Odkrivati zanimive korelacije ni preveč zahtevno. Vendar se bo marsikdo izkazal za lažnega. Za moško vrsto na Wall Streetu dva priljubljena lažna razmerja vključujejo ženske in šport. V dvajsetih letih 20. stoletja je teorija dolžine krila, ki drži, da so dolžine krila in smer borze korelirane. Če so dolžine krila dolge, to pomeni, da borza propada; če bodo kratki, trg narašča. Konec januarja se govori o tako imenovanem kazalcu Super Bowl, kar kaže na to, da zmaga ekipe AFC verjetno pomeni, da bo borza v prihodnjem letu padla, medtem ko zmaga ekipe NFC pomeni povečanje števila trg. Od leta 1966 ima kazalnik natančnost 80%. To je zabaven kos pogovorov, a verjetno ne nekaj, kar bi resni finančni svetovalec priporočil kot naložbeno strategijo za stranke.
Tu je še nekaj primerov pogostih lažnih korelacij:
- Utopitve se povečajo, ko se poveča prodaja sladoleda. Morda se zdi, da povečana prodaja sladoleda povzroči več utopitve, v resnici pa lahko naraščajoča vročina več ljudi plava, pa tudi kupujejo več sladoleda.
- Stopnja umorov v ZDA v obdobju 2006–2011 se je znižala na isto stopnjo kot Microsoft Internet Explorer.
- Vodstveni delavci, ki se izrečejo prosim in se vam pogosteje zahvaljujejo boljši uspešnosti delitve.
- Ljudje, ki nosijo orodje ekipe Oakland Raiders, so bolj verjetno, da bodo storili kazniva dejanja.
Kako opaziti lažne korelacije
Statistiki in drugi znanstveniki, ki analizirajo podatke, morajo biti ves čas pozorni na lažne odnose. Obstajajo številne metode, ki jih uporabljajo, med drugim:
- Zagotavljanje ustreznega reprezentativnega vzorca.
- Pridobitev ustrezne velikosti vzorca.
- Pazimo na poljubne končne točke.
- Nadzor za čim več zunanjih spremenljivk.
- Uporaba ničelne hipoteze in preverjanje močne p-vrednosti.