Tástáil Hipitéis

Ceacht teagaisc simplí agus gairid ar thástáil hipitéise ag úsáid Python

Íomhá ó: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Sa bhlag seo, tabharfaidh mé rang teagaisc gairid ar Thástáil Hipitéis ag úsáid modhanna Staidrimh i Python. Tá Tástáil Hipitéis mar chuid den Modh Eolaíochta a bhfuil cur amach againn uile air, rud is dócha a d’fhoghlaim muid inár mblianta luatha oideachais. Mar sin féin, i staitisticí, déantar go leor turgnaimh ar shampla de dhaonra.

“Chun a chinneadh cad a insíonn tacar samplach breathnóireachtaí dúinn faoi mhíniú beartaithe, go ginearálta, ní mór dúinn tátal a bhaint as, nó mar a thugaimid staitisteoirí air, ar Cúis le Éiginnteacht. Is é réasúnaíocht leis an éiginnteacht croílár an tátail staidrimh agus is gnách go ndéantar é trí mhodh ar a dtugtar Tástáil Suntasachta Hipitéis Neamhní. " -Onna.

Mar shampla don bhlag seo, úsáidfidh mé tacar Sonraí Sacair Eorpach atá le fáil ar Kaggle, agus déanfaidh mé tástáil hipitéise. Is féidir an tacar sonraí a fháil anseo.

Céim 1

Déan breathnóireacht

Is é an chéad chéim ná feiniméin a urramú. Sa chás seo, beidh sé: An bhfuil tionchar ag ionsaí cosanta ar mheánspriocanna ceadaithe?

Céim 2

Scrúdaigh an taighde

Meon maith le dul ar aghaidh ná an obair níos cliste ní níos deacra. Rud maith amháin atá le déanamh ná a fheiceáil an bhfuil taighde ann cheana a bhaineann le do bhreathnóireacht. Más ea, b’fhéidir go gcabhróidh sé lenár gceist a fhreagairt. Cuideoidh a bheith ar an eolas faoi thaighde nó turgnaimh atá ann cheana linn ár dturgnamh a struchtúrú níos fearr, nó b’fhéidir fiú ár gceist a fhreagairt agus gan a bheith in ann an turgnamh a dhéanamh sa chéad áit.

Céim 3

Déan Hipitéis Neamhní agus Hipitéis Malartach a fhoirmiú

Is é hipitéis mhalartach an buille faoi thuairim atá againn agus is é hipitéis nialasach a mhalairt. Má deir an hipitéis mhalartach go bhfuil gaol suntasach idir dhá athróg, deir an hipitéis null nach bhfuil aon ghaol suntasach ann.

Is é a bheidh inár Hipitéis Neamhní: Níl aon difríocht staitistiúil sna spriocanna a cheadaítear le foirne a bhfuil rátáil ionsaitheachta cosanta acu atá níos mó ná nó cothrom le 65 i gcoinne foirne faoi bhun 65.

Hipitéis Malartach: Tá difríocht staitistiúil sna spriocanna a cheadaítear le foirne a bhfuil rátáil ionsaitheachta cosanta acu atá níos mó ná nó cothrom le 65 i gcoinne foirne faoi bhun 65.

Céim 4

Faigh amach an tástáil aon-tailed nó tástáil dhá earball atá inár hipitéis.

Tástáil Aon-Thailed

“Má tá leibhéal suntasachta 0.05 á úsáid agat, tugann tástáil aon-tailed deis do do alfa go léir an tábhacht staitistiúil a thástáil sa treo spéise amháin." Sampla de thástáil aon-tailed is ea “Ligeann foirne sacair a bhfuil rátáil ionsaitheachta níos ísle ná 65 acu spriocanna atá i bhfad níos staitistiúla ná foirne a bhfuil rátáil níos ísle ná 65.”

Tástáil Dhá Thaire

“Má tá leibhéal suntasachta 0.05 á úsáid agat, tugann tástáil dhá earball deis do leath de do alfa an tábhacht staitistiúil a thástáil i dtreo amháin agus i leath de do alfa tábhacht staitistiúil a thástáil sa treo eile. Ciallaíonn sé seo go bhfuil 0.025 i ngach eireaball de dháileadh do staitistic tástála. "

Le tástáil dhá earball, tá an tábhacht staitistiúil á thástáil agat sa dá threo. Inár gcás féin, táimid ag tástáil an tábhacht staitistiúil sa dá threo.

Céim 5

Socraigh leibhéal suntasachta tairsí (alfa)

(luach alfa): An tairseach imeallach a bhfuilimid ceart go leor leis an hipitéis null a dhiúltú. Is féidir luach alfa a bheith ar aon luach a shocraímid idir 0 agus 1. Mar sin féin, is é 0.05 an luach alfa is coitianta san eolaíocht. Ciallaíonn alfa atá leagtha síos go 0.05 go bhfuilimid ceart go leor an hipitéis null a dhiúltú cé go bhfuil seans 5% nó níos lú ann go bhfuil na torthaí mar gheall ar randamacht.

P-luach: An dóchúlacht ríofa go sroichfear na sonraí seo go randamach.

Má ríomhtar luach-p agus má thagann sé amach go 0.03, is féidir linn é seo a léirmhíniú mar a rá “Tá seans 3% ann go bhfuil na torthaí a fheicim i ndáiríre mar gheall ar randamacht nó ádh íon”.

Íomhá ó Learn.co

Is é ár gcuspóir an luach-p a ríomh agus é a chur i gcomparáid lenár n-alfa. Dá ísle an alfa is ea is déine an tástáil.

Céim 6

Déan Sampláil

Anseo tá ár tacar sonraí ar a dtugtar sacar. Le haghaidh ár dtástála, níl de dhíth orainn ach dhá cholún inár tacar sonraí: team_def_aggr_rating agus spriocanna_allowed. Déanfaimid é a scagadh go dtí an dá cholún seo agus ansin cruthaímid dhá fho-thacar d’fhoirne a bhfuil rátáil ionsaitheachta cosanta acu ar mó iad ná 65 nó cothrom leo agus foirne a bhfuil rátáil ionsaitheachta cosanta acu faoi bhun 65.

Níl le déanamh ach dul siar ar ár dtástáil hipitéise:

Tionchar ionsaitheachta cosanta ar mheánspriocanna ceadaithe. Hipitéis Neamhní: Níl aon difríocht staitistiúil sna spriocanna a cheadaítear le foirne a bhfuil rátáil ionsaitheachta cosanta acu atá níos mó ná nó cothrom le 65 i gcoinne foirne faoi bhun 65. Hipitéis Malartach: Tá difríocht staitistiúil sna spriocanna a cheadaítear le foirne a bhfuil rátáil ionsaitheachta cosanta níos mó acu ná nó cothrom le 65 in aghaidh foirne faoi bhun 65. Tástáil Alfa dhá-eireaball: 0.05

Anois tá dhá liosta samplaí againn ar féidir linn tástálacha staitistiúla a reáchtáil orthu. Roimh an gcéim sin, ceapfaidh mé an dá dháileadh chun amhairc a fháil.

Céim 7

Déan T-Tástáil Dhá Shampla

Úsáidtear an tástáil-t dhá shampla chun a fháil amach an bhfuil dhá acmhainn daonra cothrom. Chuige seo, úsáidfimid an modúl Python ar a dtugtar statsmodels. Ní rachaidh mé isteach an iomarca sonraí faoi statsmodels ach is féidir leat an cháipéisíocht a fheiceáil anseo.

Céim 8

Meastóireacht agus Críochnaigh

Thabhairt chun cuimhne gur = 0.05 an alfa a leagamar. Mar a fheicimid ónár dtorthaí tástála go bhfuil an luach-p níos lú ná ár n-alfa. Is féidir linn ár hipitéis null a dhiúltú agus le muinín 95% glacadh lenár hipitéis mhalartach.

Go raibh maith agat as léamh! Le haghaidh níos doimhne ar thástáil hipitéise, is féidir leat an tionscadal grúpa seo a sheiceáil ar GitHub a raibh baint agam leis ar thástáil hipitéise anseo.

Acmhainní:

Oighinn, Matha. “Staitisticí agus an“ Modh Eolaíoch ”Aisghafa ó YourStatsGuru. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Réamhrá le SAS. UCLA: Grúpa Comhairleach Staidrimh. ó https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (rochtain Bealtaine 16, 2019).

Lámhleabhar Staitisticí Innealtóireachta. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm