Hypothese Testen

En einfachen a kuerzen Tutorial op der Hypothesen Test mat Python

Bild vun: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

An dësem Blog ginn ech e kuerzen Tutorial vun der Hypothese Testing mat statistesche Methoden am Python. Hypothese Testen ass Deel vun der wëssenschaftlecher Method, déi mir all vertraut hunn, eppes wat mir méiglecherweis an eise fréie pädagogesche Joeren geléiert hunn. Wéi och ëmmer, an der Statistik, gi vill Experimenter op enger Probe vun enger Populatioun gemaach.

"Bestëmme wat e Probleemer Set vun Observatioune eis iwwer eng proposéiert Erklärung seet, allgemeng, erfuerdert eis eng Inferenz ze maachen, oder wéi mir d'Statistiker et nennen, mat Onversécherung. D'Ursaache mat Onsécherheet ass de Kär vun der statistescher Inferenz an gëtt normalerweis mat enger Method genannt "Null Hypothese Bedeitung Tester gemaach." -Oven.

Als Beispill fir dëse Blog wäert ech en europäesche Soccer Data Set benotzen deen op Kaggle fonnt gëtt, a wäert Hypothesen Tester maachen. Den Datebank fannt Dir hei.

Schrëtt 1

Maacht eng Observatioun

Den éischte Schrëtt ass Phänomener ze beobachten. An dësem Fall wäert et sinn: Gëtt et en Impakt vun der Verteidegungsagressioun op duerchschnëttlech erlaabt Ziler?

Schrëtt 2

Ënnersicht d'Fuerschung

E gudde Gedanken fir laanscht ze goen ass Aarbecht méi schlau an net méi haart. Eng gutt Saach ze maachen ass ze gesinn ob Fuerschung op Är Observatioun scho existéiert. Wa jo, kann et hëllefen eis Fro ze beäntweren. Bewosst iwwer scho existent Fuerschung oder Experimenter hëlleft eis eisen Experiment besser ze strukturéieren, oder vläicht souguer eis Fro ze beäntweren an net den Experiment un éischter Plaz ze féieren.

Schrëtt 3

Form eng Null Hypothese an eng Alternativ Hypothese

Eng alternativ Hypothese ass eis gebilt Rotschléi an eng Nullhypothese ass einfach de Géigendeel. Wann déi alternativ Hypothese seet datt et eng bedeitend Bezéiung tëscht zwou Variabelen ass, seet d'Null Hypothese datt et keng bedeitend Bezéiung ass.

Eis Null Hypothese wäert sinn: Et gëtt keen statisteschen Ënnerscheed an Ziler erlaabt mat Équipen mat engem Verteidegungsagressiounsgrad méi wéi oder gläich wéi 65 géint Equipen ënner 65.

Alternativ Hypothese: Et gëtt e statisteschen Ënnerscheed an Ziler erlaabt mat Équipen mat engem Verteidegungsagressiounsgrad méi oder méi wéi 65 géint Équipen ënner 65.

Schrëtt 4

Bestëmmen ob eis Hypothese en een-tailed Test oder en zwee-tailed Test ass.

Een-Tail Test

"Wann Dir e Bedeitungsniveau vun 0,05 benotzt, erlaabt engem een-tailed Test all Är Alpha d'statistesch Bedeitung an enger Richtung vun Interesse ze testen." E Beispill vun engem Test mat engem eenzegen Test wier "Futtballséquipen mat enger Agressiounswäerter manner wéi 65 erlaben statistesch méi däitlech méi Ziler wéi Équipen mat engem Rating niddereg wéi 65."

Zwee-Tailed Test

„Wann Dir e Bedeitungsniveau vun 0,05 benotzt, erlaabt en zweestëllegen Test d'Halschent vun Ärem Alpha fir d'statistesch Bedeitung an eng Richtung ze testen an d'Halschent vun Ärem Alpha fir statistesch Bedeitung an déi aner Richtung ze testen. Dëst bedeit datt 0,025 an all Schwanz vun der Verdeelung vun Ärer Teststatistik ass. "

Mat engem zweestaarwen Test sidd Dir d'Statistesch Bedeitung a béid Richtunge getest. An eisem Fall testen mir déi statistesch Bedeitung a béid Richtungen.

Schrëtt 5

Setzt e Schwellbedeitungsniveau (Alpha)

(alpha-Wäert): De marginalen Dréimoment bei deem mer an der Rei sinn mat der Ofleenung vun der Nullhypothese. En alpha-Wäert kann all Wäert sinn, dee mir tëscht 0 an 1. setzen. Wéi och ëmmer, de gemeinsame Alpha-Wäert an der Wëssenschaft ass 0,05. En Alpha op 0,05 heescht datt mir an der Rei sinn d'Nullhypothese ze refuséieren, och wann et eng 5% oder manner Chance ass datt d'Resultater duerch randomismus sinn.

P-Wäert: Déi berechent Probabilitéit fir dës Donnéeën zoufälleg z'erreechen.

Wann mir e p-Wäert ausrechnen an et op 0,03 erauskënnt, da kënne mir dëst interpretéiere wéi gesot "Et gëtt eng 3% Chance datt d'Resultater déi ech gesinn tatsächlech wéinst Zoufällegkeet oder reng Gléck sinn".

Bild vum Learn.co

Eist Zil ass de p-Wäert ze berechnen an et mat eiser Alpha ze vergläichen. Wat méi déif d'Alpha méi streng ass den Test.

Schrëtt 6

Maacht Sampling

Hei hu mir eis Datume genannt Fussball. Fir eisen Test brauche mir nëmmen zwou Kolonnen an eisem Dateset: team_def_aggr_rating an goals_allowed. Mir filteren et op dës zwou Sailen eraus a kreéieren dann zwee Sousets fir Équipen mat engem defensiven Agressiounsgrad méi oder méi wéi 65 an Équipë mat engem defensiven Agressiouns Rating ënner 65.

Nëmme fir eis Hypothese Test z'erkennen:

Impakt vun der Verdeedegung Agressioun am Duerchschnëtt erlaabt Ziler. Null Hypothese: Et gëtt keen statisteschen Ënnerscheed an Ziler erlaabt mat Équipen mat engem Verteidegungsagressiounsgrad méi wéi oder gläich wéi 65 géint Équipen ënner 65. Alternativ Hypothese: Et gëtt e statisteschen Ënnerscheed an Ziler erlaabt mat Équipen mat enger Verteidegungsagressioun Bewäertung méi grouss wéi oder gläich 65 géint Équipë ënner 65. Zwee-tailed Test Alpha: 0,05

Elo hu mir zwou Lëschte vun Proben déi mir statistesch Tester ausféiere kënnen. Virun dësem Schrëtt planzéieren ech déi zwou Distributiounen fir e Visual ze kréien.

Schrëtt 7

Maacht zwee-Probe T-Test

Den Zwee-Probe-T-Test gëtt benotzt fir ze bestëmmen ob zwee Populatiounsmëttel gläich sinn. Fir dëst benotze mir de Python Modul genannt statsmodels. Ech wäert net ze vill Detail iwwer Statistikmodeller ginn awer Dir kënnt d'Dokumentatioun hei gesinn.

Schrëtt 8

Bewäert a Schluss

Denkt drun datt d'Alpha déi mir gesat hunn e = 0,05 war. Wéi mir aus eisen Testresultater gesinn, datt de p-Wäert manner ass wéi eis Alpha. Mir kënnen eis Null Hypothese refuséieren a mat 95% Vertrauen eis alternativ Hypothese akzeptéieren.

Merci fir liesen! Fir méi am-Déift iwwer Hypothesen Testen, kënnt Dir dëse Gruppeprojet iwwerpréiwen op GitHub, an deem ech un Hypothesen Testen hei involvéiert war.

Ressourcen:

Uewen, Matthew. “Statistiken an déi„ Wëssenschaftlech Method “Vun YourStatsGuru erofgeholl. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Aféierung fir SAS. UCLA: Statistical Consulting Group. vun https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (accessed May 16, 2019).

Engineering Statistik Handbuch. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm