T-test

Kaj je T-test?

T-test je vrsta inferencialne statistike, ki se uporablja za ugotavljanje, ali obstaja pomembna razlika med sredstvi dveh skupin, ki sta lahko v določenih značilnostih povezani. Večinoma se uporablja, če bi nabor podatkov, kot je niz podatkov, ki je bil zapisan kot rezultat prevrnitve kovanca 100-krat, sledil običajni distribuciji in ima lahko neznane razlike. T-test se uporablja kot orodje za testiranje hipotez, ki omogoča testiranje domneve, ki velja za populacijo.

T-test pregleda t-statistiko, vrednosti porazdelitve t in stopnje svobode, da ugotovi verjetnost razlike med dvema nizoma podatkov. Za izvedbo testa s tremi ali več spremenljivkami je treba uporabiti analizo variance.

1:38

T-test

Pojasni T-test

T-test v bistvu nam omogoča, da primerjamo povprečne vrednosti obeh podatkovnih nizov in ugotovimo, ali sta prišla iz iste populacije. V zgornjih primerih, če bi vzeli vzorec učencev iz razreda A in drugega vzorca učencev iz razreda B, ne bi pričakovali, da bodo imeli povsem enak povprečni in standardni odklon. Podobno bi morali imeti vzorci, odvzeti iz kontrolne skupine s placebom, in vzorci iz skupine, predpisanih z zdravili, nekoliko drugačno srednjo in standardno deviacijo.

Matematično t-test vzame vzorec iz vsakega od obeh sklopov in vzpostavi trditev problema s predpostavko o ničelni hipotezi, da sta obe srednji enaki. Na podlagi veljavnih formul se določene vrednosti izračunajo in primerjajo s standardnimi vrednostmi in domnevna ničelna hipoteza se ustrezno sprejme ali zavrne.

Če je ničelna hipoteza mogoče zavrniti, to pomeni, da so odčitki podatkov močni in niso naključni. T-test je le eden izmed številnih testov, ki se uporabljajo v ta namen. Za pregled več spremenljivk in testov z večjo velikostjo vzorca morajo statistiki poleg uporabe t-testa uporabiti tudi druge teste. Za veliko velikost vzorca statistiki uporabljajo z-test. Druge možnosti testiranja vključujejo test chi-kvadrat in f-test.

Obstajajo tri vrste t-testov, ki so razvrščeni kot odvisni in neodvisni t-testi.

Ključni odvzemi

T-test je vrsta inferencialne statistike, ki se uporablja za ugotavljanje, ali obstaja pomembna razlika med sredstvi dveh skupin, ki sta lahko v določenih značilnostih povezani.
T-test je eden izmed številnih testov, ki se uporabljajo za preskušanje hipotez v statistiki.
Izračun t-testa zahteva tri ključne vrednosti podatkov. Vključujejo razliko med srednjimi vrednostmi iz vsakega niza podatkov (imenovanimi srednja razlika), standardnim odklonom vsake skupine in številom vrednosti podatkov vsake skupine.
Glede na podatke in vrsto potrebne analize se lahko izvede več različnih vrst t-testa.

Dvoumni rezultati testov

Upoštevajte, da želi proizvajalec zdravil preizkusiti novo izumljeno zdravilo. Sledi standardnemu postopku preizkušanja zdravila pri eni skupini bolnikov in dajanju placeba drugi skupini, imenovanem kontrolna skupina. Placebo, dodeljeno kontrolni skupini, je snov brez predvidene terapevtske vrednosti in služi kot merilo za merjenje, kako se druga skupina, ki ji je dano dejansko zdravilo, odziva.

Po preskušanju z zdravili so člani kontrolne skupine s placebom poročali o povečanju povprečne življenjske dobe za tri leta, medtem ko člani skupine, ki ji predpišejo novo zdravilo, poročajo o povečanju povprečne življenjske dobe za štiri leta. Takojšnje opazovanje lahko kaže, da zdravilo res deluje, saj so rezultati boljši za skupino, ki je uživala drogo. Možno pa je tudi, da je opazovanje morda posledica naključnega dogodka, predvsem presenetljivega kosa sreče. T-test je koristen za zaključek, ali so rezultati resnični in uporabni za celotno populacijo.

V šoli je 100 učencev v razredu A v povprečju doseglo 85% s standardnim odklonom 3%. Še 100 učencev, ki pripadajo razredu B, je doseglo povprečno 87% s povprečnim odstopanjem 4%. Medtem ko je povprečje razreda B boljše kot v razredu A, morda ni pravilno, če bi prišli do zaključka, da je skupna uspešnost učencev v razredu B boljša od uspeha učencev v razredu A. To je zato, ker skupaj z pomeni, da je standardni odklon razreda B tudi višji kot pri razredu A. Kaže, da so bili njihovi skrajni odstotki na nižjih in višjih straneh precej bolj razporejeni v primerjavi z razredom A. T-test lahko pomaga določiti kateri razred je bil boljši.

Predpostavke T-testa

Prva predpostavka glede t-testov se nanaša na merilno lestvico. Predpostavka za t-test je, da merilna lestvica, uporabljena za zbrane podatke, sledi neprekinjeni ali redni lestvici, kot so ocene za IQ test.
Druga domneva je preprost naključni vzorec, da se podatki zbirajo iz reprezentativnega, naključno izbranega dela celotne populacije.
Tretja predpostavka je, da podatki, ko so narisani, vodijo do normalne porazdelitvene krivulje porazdelitve v obliki zvona.
Uporabljena je četrta predpostavka, da je primerna velikost vzorca. Večja velikost vzorca pomeni, da bi se porazdelitev rezultatov morala približati običajni zvončasti krivulji.
Končna predpostavka je homogenost variacije. Homogena ali enaka varianta obstaja, kadar so standardna odstopanja vzorcev približno enaka.

Izračun T-testov

Izračun t-testa zahteva tri ključne vrednosti podatkov. Vključujejo razliko med srednjimi vrednostmi iz vsakega niza podatkov (imenovanimi srednja razlika), standardnim odklonom vsake skupine in številom vrednosti podatkov vsake skupine.

Rezultat t-testa ustvari vrednost t. Ta izračunana t-vrednost se nato primerja z vrednostjo, dobljeno iz tabele kritičnih vrednosti (imenovane tabela porazdelitve T). Ta primerjava pomaga ugotoviti, kako verjetno se je razlika med sredstvi zgodila po naključju ali ali imajo nabor podatkov res notranje razlike. T-test dvomi, ali razlika med skupinama predstavlja resnično razliko v študiji ali je verjetno nesmiselna statistična razlika.

T-razdelitvene tabele

Tabela porazdelitve T je na voljo v oblikah z enim repom in z dvema repom. Prva se uporablja za oceno primerov, ki imajo določeno vrednost ali razpon z jasno smerjo (pozitivno ali negativno). Na primer, kolikšna je verjetnost, da bo vrednost izhoda ostala pod -3, ali ko bo valjala par kock, več kot sedem? Slednji se uporablja za analizo, omejeno z obsegom, na primer spraševanje, če koordinate padejo med -2 in +2.

Izračuni se lahko izvajajo s standardnimi programskimi programi, ki podpirajo potrebne statistične funkcije, kot so tiste, ki jih najdemo v MS Excel.

T-vrednosti in stopnje svobode

T-test ima kot izhod dve vrednosti: t-vrednost in stopnjo svobode. Vrednost t je razmerje razlike med srednjo vrednostjo dveh vzorčnih nizov in razlike, ki obstaja znotraj vzorčnih nizov. Medtem ko je številska vrednost (razlika med srednjo vrednosti dveh vzorčnih nizov) enostavna za izračun, lahko imenovalec (razlika, ki obstaja znotraj vzorčnih nizov) postane nekoliko zapleten, odvisno od vrste vrednosti podatkov. Imenovalec razmerja je merjenje disperzije ali spremenljivosti. Višje vrednosti t-vrednosti, imenovane tudi t-ocena, kažejo, da obstaja velika razlika med dvema vzorčenima nizoma. Manjša kot je t-vrednost, večja je podobnost med obema vzorčenima nizoma.

Velika ocena t kaže, da so skupine različne.
Majhna ocena t kaže, da sta si skupini podobni.

Stopnje svobode se nanašajo na vrednote v študiji, ki se lahko spreminjajo in so bistvene za oceno pomena in veljavnosti ničelne hipoteze. Izračun teh vrednosti je običajno odvisen od števila zapisov podatkov, ki so na voljo v vzorčnem naboru.

Povezani (ali seznanjeni) T-test

Povezani t-test se opravi, kadar vzorci običajno sestojijo iz ujemajočih se parov podobnih enot ali kadar obstajajo primeri ponavljajočih se ukrepov. Na primer, lahko obstajajo primeri, da se isti bolniki večkrat testirajo - pred in po določenem zdravljenju. V takih primerih se vsak bolnik uporablja kot kontrolni vzorec proti sebi.

Ta metoda se uporablja tudi za primere, ko so vzorci na nek način povezani ali imajo enake lastnosti, kot primerjalna analiza otrok, staršev ali sorojencev. Povezani ali seznanjeni t-testi so odvisni, saj gre za primere, ko sta dva niza vzorcev povezana.

Formula za izračun t-vrednosti in stopenj svobode za seznanjeni t-test je:

Srednja vrednost 1 in srednja vrednost2 sta povprečni vrednosti vsakega nabora vzorcev, medtem ko var1 in var2 predstavljata varianco vsakega nabora vzorcev.

Preostali dve vrsti pripadata neodvisnim t-testom. Vzorci teh vrst so izbrani neodvisno drug od drugega - to je, da se zbirke podatkov v obeh skupinah ne nanašajo na iste vrednosti. Vključujejo primere, kot je skupina 100 bolnikov, ki so razdeljeni v dva sklopa po 50 bolnikov. Ena od skupin postane kontrolna skupina in ji dodeli placebo, druga skupina pa predpiše zdravljenje. To pomeni dve neodvisni vzorčni skupini, ki sta med seboj neprimerni.

T-test z enako varianco (ali združeni)

T-test enake variance se uporablja, kadar je število vzorcev v vsaki skupini enako ali je varianca obeh nizov podatkov podobna. Naslednja formula se uporablja za izračun t-vrednosti in stopenj svobode za t-test enake variance:

T-vrednost = srednja vrednost 1-srednja vrednost2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 povsod: srednja vrednost1 in srednja vrednost = povprečne vrednosti za vzorčne sestavevar1 in var2 = odstopanje vsakega od vzorec setn1 in n2 = Število zapisov v vsakem vzorčnem nizu \ začni {poravnano} & \ besedilo {T-vrednost} = \ frac {povprečje1 - povprečje}} {\ sqrt {\ frac {(n1 - 1) \ krat var1 ^ 2 + (n2 - 1) \ krat var2 ^ 2} {n1 + n2 - 2}} \ krat \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { kjer:} \\ & mean1 \ besedilo {in} povprečje2 = \ besedilo {povprečne vrednosti vsakega} \\ & \ besedila {vzorčnih nizov} \\ & var1 \ text {in} var2 = \ text {Odstopanje vsakega od vzorčni nizi} \\ & n1 \ besedilo {in} n2 = \ besedilo {Število zapisov v vsakem vzorčnem nizu} \\ \ konec {poravnano} T-vrednost = n1 + n2-2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 srednja1 - srednja2, pri čemer: srednja vrednost1 in srednja vrednost = povprečne vrednosti vzorčnih serijvar1 in var2 = odstopanje vseh vzorčnih nizovn1 in n2 = število zapisov v vsakem vzorcu nabor

in,

Stopnje svobode = n1 + n2−2 povsod: n1 in n2 = Število zapisov v vsakem vzorčnem nizu \ začni {poravnano} & \ text {Stopnje svobode} = n1 + n2 - 2 \\ & \ textbf {kjer:} \\ & n1 \ text {in} n2 = \ text {Število zapisov v vsakem vzorčnem nizu} \\ \ konec {poravnano} Stopnje svobode = n1 + n2−2 povsod: n1 in n2 = Število zapisov v vsakem vzorčnem nizu Нямецкімі мовамі

T-test neenake variacije

T-test neenakomerne variacije se uporablja, kadar je število vzorcev v vsaki skupini različno in je varianca obeh naborov podatkov. Ta test se imenuje tudi Welchov t-test. Naslednja formula se uporablja za izračun t-vrednosti in stopenj svobode za t-test neenake variance:

T-vrednost = srednja vrednost1-srednja vrednost212121 + var22n2 kjerkoli: povprečna vrednost1 in srednja vrednost = povprečne vrednosti vzorčnih nizovvar1 in var2 = odstopanje vseh vzorčnih nizovn1 in n2 = število zapisov v vsakem vzorčnem nizu \ začni {poravnano} & \ besedilo {T-vrednost} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {kjer:} \ \ & mean1 \ text {in} mean2 = \ text {Povprečne vrednosti vsakega} \\ & \ besedila {vzorčnih naborov} \\ & var1 \ text {in} var2 = \ text {Odstopanje vseh vzorčnih nizov} \ \ & n1 \ besedilo {in} n2 = \ besedilo {Število zapisov v vsakem vzorčnem nizu} \\ \ konec {poravnano} T-vrednost = n1var12 + n2var22 srednja1-srednja vrednost2, kjer: srednja vrednost1 in srednja vrednost = povprečne vrednosti od vseh vzorčnih nizovvar1 in var2 = nihanje vsakega niza vzorcevn1 in n2 = število zapisov v vsakem vzorčnem nizu

in,

Stopnje svobode = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2 -1 } & \ text {Stopnje svobode} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ desno) ^ 2} {\ frac {\ levo ( \ frac {var1 ^ 2} {n1} \ desno) ^ 2} {n1 - 1} + \ frac {\ levo (\ frac {var2 ^ 2} {n2} \ desno) ^ 2} {n2 - 1}} \\ & \ textbf {kjer:} \\ & var1 \ besedilo {in} var2 = \ besedilo {Odstopanje vseh vzorčnih nizov} \\ & n1 \ besedilo {in} n2 = \ besedilo {Število zapisov v vsakem vzorčnem nizu } \\ \ konec {poravnano} Stopnje svobode = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2, kjer: var1 in var2 = varianta vsakega vzorčnih nizovn1 in n2 = Število zapisov v vsakem vzorčnem nizu

Določitev pravilnega T-testa za uporabo

Za določitev t-testa na podlagi značilnosti vzorčnih serij se lahko uporabi spodnja shema poteka. Ključne postavke, ki jih je treba upoštevati, vključujejo, ali so vzorčni zapisi podobni, število zapisov podatkov v vsakem vzorčnem nizu in odstopanje vsakega nabora vzorcev.

Primer T-test neenake variacije

Predpostavimo, da izvajamo diagonalno meritev slik, prejetih v umetniški galeriji. Ena skupina vzorcev vključuje 10 slik, druga pa 20 slik. Nabori podatkov z ustreznimi srednjimi in vrednostmi variance so naslednji:

	1. sklop	2. sklop
	19.7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23.3
	18.5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19.5	20.6
	21, 95	13.7
		23.2
		17.5
		20.6
		18
		23.9
		21.6
		24.3
		20.4
		23.9
		13.3
Pomeni	19.4	21.6
Varianta	1.4	17.1

Čeprav je srednja vrednost kompleta 2 višja od povprečja v kompletu 1, ne moremo sklepati, da imajo vse slike povprečno dolžino okoli 21, 6 enot, saj je varianca kompleta 2 bistveno večja od kompleta 1. Ali je to slučajno ali resnično obstajajo razlike v celotni populaciji vseh slik, prejetih v umetniški galeriji

Ker je število podatkovnih zapisov različno (n1 = 10 in n2 = 20) in je tudi varianca različna, se za zgornji niz podatkov izračunata t-vrednost in stopnja svobode z uporabo formule, omenjene v T-testu neenakosti variance. odsek.

Vrednost t je -2.24787. Ker lahko znak minus zanemarimo, če primerjamo dve vrednosti t, izračunana vrednost znaša 2, 24787.

Stopnja vrednosti svobode znaša 24, 38 in se zaradi definicije formule zmanjša na 24, zato zahteva zaokrožitev vrednosti na najmanjšo možno celo število.

Kadar se domneva normalna porazdelitev, lahko določimo raven verjetnosti (alfa raven, stopnja pomembnosti, p ) kot merilo za sprejemljivost. V večini primerov je mogoče predvideti 5-odstotno vrednost.

Če uporabimo stopnjo vrednosti svobode kot 24 in 5-odstotno stopnjo pomembnosti, pogled na tabelo porazdelitve vrednosti t daje vrednost 2, 064. Primerjava te vrednosti z izračunano vrednostjo 2, 224 kaže, da je izračunana vrednost t večja od tabele pri stopnji pomembnosti 5%. Zato je ničelna hipoteza varno zavrniti, da med sredstvi ni razlike. Število prebivalstva ima notranje razlike in niso slučajno.

Primerjajte investicijske račune Ime ponudnika Opis Razkritje oglaševalcev × Ponudbe, ki se pojavijo v tej tabeli, so partnerstva, od katerih Investopedia prejema nadomestilo.

Sorodni pogoji

Kako deluje analiza variacije (ANOVA) Analiza variance (ANOVA) je orodje za statistično analizo, ki loči skupno spremenljivost, ki jo najdemo v podatkovnem nizu, na dve komponenti: naključne in sistematične dejavnike. več Razumevanje T Porazdelitev AT porazdelitev je vrsta verjetnostne funkcije, ki je primerna za oceno populacijskih parametrov za majhne velikosti vzorca ali neznane variacije. več Stopnje svobode Opredelitev Stopnje svobode se nanaša na največje število logično neodvisnih vrednosti, ki so v vzorcu podatkov vrednosti, ki se lahko spreminjajo. več Kako deluje preostalo standardno odstopanje Preostali standardni odklon je statistični izraz, ki se uporablja za opis razlike v standardnih odstopanjih opazovanih vrednosti v primerjavi s predvidenimi vrednostmi, ki jih kažejo točke v regresijski analizi. več Kako deluje statistika Chi Square Statistični podatki či kvadrat (χ2) je test, ki meri, kako se pričakovanja primerjajo z dejanskimi opaženimi podatki (ali rezultati modela). Podatki, uporabljeni pri izračunu statistike o kvadratnih hihih, morajo biti naključni, surovi, medsebojno izključujoči, sestavljeni iz neodvisnih spremenljivk in dobljeni iz dovolj velikega vzorca. več Kako se uporablja Wilcoxon test Wilcoxon test, ki se nanaša na test Rank Sum ali test s podpisanim Rankom, je neparametrični test, ki primerja dve seznanjeni skupini. več partnerskih povezav

← 4 Zaloge, ki lahko dobijo trgovinsko vojno ZDA in Kitajske

Definicija BDW obrazca SEC →

Priporočena

Pustite Komentar