Chi kvadrat (χ2) Statistična opredelitev
Kaj je statistika kvadrata?Khi kvadrat ( χ 2 ) statistika je test, ki meri, kako se pričakovanja primerjajo z dejanskimi opaženimi podatki (ali rezultati modela). Podatki, uporabljeni pri izračunu statistike o kvadratnih hihih, morajo biti naključni, surovi, medsebojno izključujoči, sestavljeni iz neodvisnih spremenljivk in dobljeni iz dovolj velikega vzorca. Na primer, rezultati metanja kovanca 100-krat ustrezajo tem kriterijem.
Chi kvadratni testi se pogosto uporabljajo pri testiranju hipotez.
Formula za kvadrat Chi je
χc2 = ∑ (Oi − Ei) 2Kje drugje: c = stopnja svobodeO = opazovana vrednost (e) E = pričakovana vrednost (e) \ začeti {poravnano} & \ chi ^ 2_c = \ seštevek \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kjer:} \\ & c = \ besedilo {stopnja svobode} \\ & O = \ besedilo {opazovana vrednost (-e)} \\ & E = \ besedilo {pričakovana vrednost (s )} \\ \ konec {poravnano} χc2 = ∑Ei (Oi −Ei) 2, kjer je: c = stopnja svobodeO = opazovana vrednost (e) E = pričakovana vrednost (i)
Kaj vam pove statistika o kvadraturi Chi?
Obstajata dve glavni vrsti kvadratnih testov chi: test neodvisnosti, ki postavlja vprašanje odnosa, na primer: "Ali obstaja razmerje med spolom in ocenami SAT?"; in test dobrega prileganja, ki sprašuje nekaj takega, kot je "Če se kovanec vrže 100-krat, ali bo prišel glave 50-krat, repov pa 50-krat?"
Za te teste se uporabljajo stopnje svobode, da se ugotovi, ali je mogoče določeno ničelno hipotezo zavrniti na podlagi skupnega števila spremenljivk in vzorcev v poskusu.
Na primer, če upoštevamo študente in izbiro predmeta, velikost vzorca 30 ali 40 študentov verjetno ni dovolj velika, da bi ustvarila pomembne podatke. Pridobivanje enakih ali podobnih rezultatov študije z velikostjo vzorca 400 ali 500 študentov je bolj veljavno.
V drugem primeru razmislite, da bi kovanec vrgli 100-krat. Pričakovani rezultat, da bi 100-krat metali pošteni kovanec, je, da se bodo glave dvignile 50-krat, repi pa 50-krat. Dejanski rezultat je lahko, da se glave dvignejo 45-krat, repi pa 55-krat. Čisti kvadratna statistika prikazuje vsa neskladja med pričakovanimi in dejanskimi rezultati.
Ključni odvzemi
- Khi kvadrat (χ 2 ) statistika je test, ki meri, kako se pričakovanja primerjajo z dejanskimi opaženimi podatki.
- Obstajata dve glavni vrsti kvadratnih preizkušenj chi: test neodvisnosti podatkov in preizkus ustreznosti modela.
- S temi testi se lahko ugotovi, ali je mogoče določeno ničelno hipotezo pri testiranju hipotez zavrniti.
Primer testa za kvadraturo Chi
Predstavljajte si, da je bila naključna anketa izvedena med 2000 različnimi volivci, moškimi in ženskami. Ljudje, ki so se odzvali, so bili razvrščeni po spolu in glede na to, ali so republikanski, demokratični ali neodvisni. Predstavljajte si mrežo s stolpci z oznako republikanski, demokratični in neodvisni ter dvema vrsticama z moškimi in ženskami. Predpostavimo, da so podatki 2.000 vprašanih:
Republikanski | Demokrata | Neodvisna | Skupaj | |
Moški | 400 | 300 | 100 | 800 |
Ženska | 500 | 600 | 100 | 1200 |
Skupaj | 900 | 900 | 200 | 2000 |
Prvi korak za izračun statistike chi kvadrata je iskanje pričakovanih frekvenc. Te se izračunajo za vsako "celico" v mreži. Ker obstajata dve kategoriji spola in tri kategorije političnega pogleda, je skupno šest pričakovanih pogostnosti. Formula pričakovane frekvence je:
E (r, c) = n (r) × c (r) nikjer: r = vrstica v vprašanju = stolpec v vprašanju = ustrezen skupek \ začetek {poravnano} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {kjer:} \\ & r = \ besedilo {zadevna vrstica} \\ & c = \ besedilo {zadeva v stolpcu} \\ & n = \ besedilo {ustrezno skupno } \\ \ konec {poravnano} E (r, c) = nn (r) × c (r), kjer: r = vrstica v vprašanju = stolpec v vprašanju = ustrezen skupni znesek
V tem primeru so pričakovane frekvence:
- E (1, 1) = (900 x 800) / 2, 000 = 360
- E (1, 2) = (900 x 800) / 2, 000 = 360
- E (1, 3) = (200 x 800) / 2, 000 = 80
- E (2, 1) = (900 x 1200) / 2, 000 = 540
- E (2, 2) = (900 x 1200) / 2000 = 540
- E (2, 3) = (200 x 1200) / 2 000 = 120
Nato so te vrednosti uporabljene za izračun statistike chi kvadrata po naslednji formuli:
Chi-kvadrat = ∑ [O (r, c) −E (r, c)] 2E (r, c) kjer: O (r, c) = opaženi podatki za dano vrstico in stolpec \ začni {poravnano} & \ besedilo {Chi-kvadrat} = \ vsota \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kjer:} \\ & O (r, c) = \ besedilo {opazovani podatki za dano vrstico in stolpec} \\ \ konec {poravnano} Chi-kvadrat = ∑E (r, c) [O (r, c) -E (r, c)] 2, kjer: O (r, c) = opaženi podatki za dano vrstico in stolpec
V tem primeru je izraz za vsako opaženo vrednost:
- O (1, 1) = (400 - 360) 2/360 = 4, 44
- O (1, 2) = (300 - 360) 2/360 = 10
- O (1, 3) = (100 - 80) 2/80 = 5
- O (2, 1) = (500 - 540) 2/540 = 2, 96
- O (2, 2) = (600 - 540) 2/540 = 6, 67
- 0 (2, 3) = (100 - 120) 2/120 = 3, 33
Statistična statistika chi je potem enaka vsoti teh vrednosti ali 32, 41. Nato lahko pogledamo tabelo s statističnimi podatki či, da glede na stopnje svobode v naši postavi vidimo, ali je rezultat statistično pomemben ali ne.
Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.