Glavni » voditelji podjetij » Chi kvadrat (χ2) Statistična opredelitev

Chi kvadrat (χ2) Statistična opredelitev

voditelji podjetij : Chi kvadrat (χ2) Statistična opredelitev
Kaj je statistika kvadrata?

Khi kvadrat ( χ 2 ) statistika je test, ki meri, kako se pričakovanja primerjajo z dejanskimi opaženimi podatki (ali rezultati modela). Podatki, uporabljeni pri izračunu statistike o kvadratnih hihih, morajo biti naključni, surovi, medsebojno izključujoči, sestavljeni iz neodvisnih spremenljivk in dobljeni iz dovolj velikega vzorca. Na primer, rezultati metanja kovanca 100-krat ustrezajo tem kriterijem.

Chi kvadratni testi se pogosto uporabljajo pri testiranju hipotez.

Formula za kvadrat Chi je

χc2 = ∑ (Oi − Ei) 2Kje drugje: c = stopnja svobodeO = opazovana vrednost (e) E = pričakovana vrednost (e) \ začeti {poravnano} & \ chi ^ 2_c = \ seštevek \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kjer:} \\ & c = \ besedilo {stopnja svobode} \\ & O = \ besedilo {opazovana vrednost (-e)} \\ & E ​​= \ besedilo {pričakovana vrednost (s )} \\ \ konec {poravnano} χc2 = ∑Ei (Oi −Ei) 2, kjer je: c = stopnja svobodeO = opazovana vrednost (e) E = pričakovana vrednost (i)

Kaj vam pove statistika o kvadraturi Chi?

Obstajata dve glavni vrsti kvadratnih testov chi: test neodvisnosti, ki postavlja vprašanje odnosa, na primer: "Ali obstaja razmerje med spolom in ocenami SAT?"; in test dobrega prileganja, ki sprašuje nekaj takega, kot je "Če se kovanec vrže 100-krat, ali bo prišel glave 50-krat, repov pa 50-krat?"

Za te teste se uporabljajo stopnje svobode, da se ugotovi, ali je mogoče določeno ničelno hipotezo zavrniti na podlagi skupnega števila spremenljivk in vzorcev v poskusu.

Na primer, če upoštevamo študente in izbiro predmeta, velikost vzorca 30 ali 40 študentov verjetno ni dovolj velika, da bi ustvarila pomembne podatke. Pridobivanje enakih ali podobnih rezultatov študije z velikostjo vzorca 400 ali 500 študentov je bolj veljavno.

V drugem primeru razmislite, da bi kovanec vrgli 100-krat. Pričakovani rezultat, da bi 100-krat metali pošteni kovanec, je, da se bodo glave dvignile 50-krat, repi pa 50-krat. Dejanski rezultat je lahko, da se glave dvignejo 45-krat, repi pa 55-krat. Čisti kvadratna statistika prikazuje vsa neskladja med pričakovanimi in dejanskimi rezultati.

Ključni odvzemi

  • Khi kvadrat (χ 2 ) statistika je test, ki meri, kako se pričakovanja primerjajo z dejanskimi opaženimi podatki.
  • Obstajata dve glavni vrsti kvadratnih preizkušenj chi: test neodvisnosti podatkov in preizkus ustreznosti modela.
  • S temi testi se lahko ugotovi, ali je mogoče določeno ničelno hipotezo pri testiranju hipotez zavrniti.

Primer testa za kvadraturo Chi

Predstavljajte si, da je bila naključna anketa izvedena med 2000 različnimi volivci, moškimi in ženskami. Ljudje, ki so se odzvali, so bili razvrščeni po spolu in glede na to, ali so republikanski, demokratični ali neodvisni. Predstavljajte si mrežo s stolpci z oznako republikanski, demokratični in neodvisni ter dvema vrsticama z moškimi in ženskami. Predpostavimo, da so podatki 2.000 vprašanih:

RepublikanskiDemokrataNeodvisnaSkupaj
Moški400300100800
Ženska5006001001200
Skupaj9009002002000

Prvi korak za izračun statistike chi kvadrata je iskanje pričakovanih frekvenc. Te se izračunajo za vsako "celico" v mreži. Ker obstajata dve kategoriji spola in tri kategorije političnega pogleda, je skupno šest pričakovanih pogostnosti. Formula pričakovane frekvence je:

E (r, c) = n (r) × c (r) nikjer: r = vrstica v vprašanju = stolpec v vprašanju = ustrezen skupek \ začetek {poravnano} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {kjer:} \\ & r = \ besedilo {zadevna vrstica} \\ & c = \ besedilo {zadeva v stolpcu} \\ & n = \ besedilo {ustrezno skupno } \\ \ konec {poravnano} E (r, c) = nn (r) × c (r), kjer: r = vrstica v vprašanju = stolpec v vprašanju = ustrezen skupni znesek

V tem primeru so pričakovane frekvence:

  • E (1, 1) = (900 x 800) / 2, 000 = 360
  • E (1, 2) = (900 x 800) / 2, 000 = 360
  • E (1, 3) = (200 x 800) / 2, 000 = 80
  • E (2, 1) = (900 x 1200) / 2, 000 = 540
  • E (2, 2) = (900 x 1200) / 2000 = 540
  • E (2, 3) = (200 x 1200) / 2 000 = 120

Nato so te vrednosti uporabljene za izračun statistike chi kvadrata po naslednji formuli:

Chi-kvadrat = ∑ [O (r, c) −E (r, c)] 2E (r, c) kjer: O (r, c) = opaženi podatki za dano vrstico in stolpec \ začni {poravnano} & \ besedilo {Chi-kvadrat} = \ vsota \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kjer:} \\ & O (r, c) = \ besedilo {opazovani podatki za dano vrstico in stolpec} \\ \ konec {poravnano} Chi-kvadrat = ∑E (r, c) [O (r, c) -E (r, c)] 2, kjer: O (r, c) = opaženi podatki za dano vrstico in stolpec

V tem primeru je izraz za vsako opaženo vrednost:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • 0 (2, 3) = (100 - 120) 2/120 = 3, 33

Statistična statistika chi je potem enaka vsoti teh vrednosti ali 32, 41. Nato lahko pogledamo tabelo s statističnimi podatki či, da glede na stopnje svobode v naši postavi vidimo, ali je rezultat statistično pomemben ali ne.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Opredelitev stopenj svobode Stopnje svobode se nanaša na največje število logično neodvisnih vrednosti, ki so v vzorcu podatkov vrednosti, ki se lahko spreminjajo. več Opredelitev T-testa T-test je vrsta inferencialne statistike, ki se uporablja za ugotavljanje, ali obstaja pomembna razlika med sredstvi dveh skupin, ki sta lahko v določenih značilnostih povezani. več Kaj nam kaže obratna korelacija Inverzna korelacija, znana tudi kot negativna korelacija, je nasprotno razmerje med dvema spremenljivkama, tako da se gibljeta v nasprotnih smereh. več Kako deluje preostalo standardno odstopanje Preostali standardni odklon je statistični izraz, ki se uporablja za opis razlike v standardnih odstopanjih opazovanih vrednosti v primerjavi s predvidenimi vrednostmi, ki jih kažejo točke v regresijski analizi. več Kako deluje analiza variacije (ANOVA) Analiza variacije (ANOVA) je orodje za statistično analizo, ki loči skupno spremenljivost, ki jo najdemo v podatkovnem nizu, na dve komponenti: naključne in sistematične dejavnike. več Korelacija Korelacija Korelacija je statistično merilo, kako se dva vrednostna papirja premikata med seboj. več partnerskih povezav
Priporočena
Pustite Komentar