Какво, Как и Защо [+ 5 Learning Resources]

Тестването на хипотези е метод, използван от много анализатори в частния и правителствения сектор за правене на вероятни твърдения или предположения относно данните за населението.

Ако сте се занимавали или сте изучавали данни за населението, трябва да сте попадали на този жизненоважен инструмент за тестване на хипотези.

Могат да се използват много методи, за да се направят предположения, но не всички осигуряват по-висока точност.

И ако не сте сигурни за вашите данни, но все пак искате да ги използвате, това може да бъде рисковано за вашата организация.

Тестването на хипотези е добра стратегия за постигане на по-високо ниво на точност. Той е полезен при анализа на населението.

В тази статия ще обсъдя какво представлява тестването на хипотези, как работи, предимствата и случаите на употреба.

И така, без повече приказки, да започваме!

Какво е тестване на хипотези?

Тестването на хипотези е метод за статистически изводи, който анализаторите използват, за да проверят дали наличните данни за населението подкрепят достатъчно дадена хипотеза и да направят предположения от нея.

Чрез този метод анализаторите могат лесно да оценят дадена хипотеза и да определят колко точно е предположението въз основа на наличните данни.

С прости думи, това е процес на тестване, базиран на инференциална статистика, който ви позволява да стигнете до присъда относно данните за населението въз основа на събрани примерни данни.

Като цяло за анализаторите е почти невъзможно да намерят свойства или някакъв конкретен параметър на цялата популация. Но чрез тестване на хипотези можете да направите информирана прогноза и решение въз основа на примерните данни и тяхната точност.

Видове проверка на хипотези

Различните видове проверка на хипотези са:

  • Нулева хипотеза: Статистиката показва, че примерните данни са внезапни и няма корелация между двете променливи в дадените примерни данни.
  • Алтернативна хипотеза: Демонстрира основната теза и се противопоставя на нулевата хипотеза. Това е основната движеща сила в процеса на тестване, защото показва корелация между две променливи в примерните данни.
  • Ненасочена хипотеза: Този тип тестване на хипотези служи като двустранна хипотеза. Той изобразява, че няма посока между две променливи в примерните данни и че истинската стойност не е същата като прогнозираната стойност.
  • Насочена хипотеза: Насочената хипотеза изобразява някаква връзка между две променливи. Тук една променлива в примерни данни може да повлияе на другите променливи.
  • Статистическа хипотеза: Помага на анализаторите да преценят дали данните и стойността отговарят на определена хипотеза. Той е много полезен при правенето на изявления и предположения относно резултата от параметъра на извадката от съвкупността.

След това нека обсъдим методите за тестване на хипотези.

Методи за проверка на хипотези

За да прецените дали дадена хипотеза е вярна или не, като анализатор ще ви трябват много правдоподобни доказателства, за да направите заключение. В този процес на тестване се създава нулева и алтернативна хипотеза преди започване на оценката.

  9 популярни скриптови езика, които трябва да знаете като програмист или системен администратор

Тестването на хипотези не включва само един метод, а много за оценка дали примерните данни са благоприятни. Като анализатор трябва да вземете предвид данните и размера на извадката и да изберете кой метод за тестване на хипотези ви подхожда.

Тестване за нормалност

Това е стандартен метод за тестване на хипотези за анализиране на редовно разпределение в извадкови данни. По време на процеса на тестване се проверява дали групираните точки от данни около средната стойност са под или над средната стойност.

При това статистическо тестване вероятността точките да надхвърлят или под средната стойност са еднакво вероятни. Образува се камбановидна крива и тя е равномерно разпределена от двете страни на средната стойност.

Z-тест тестване

Това е друг вид тестване на хипотези, използвано, когато данните за населението са нормално разпределени. Той тества дали средната стойност на два отделни параметъра на популацията е различна, когато дисперсията на данните ви е известна.

По време на анализирането на данните за населението е много вероятно да използвате този тип, когато размерът на извадката от данни е повече от тридесет. Освен това теоремата за централната граница е друга причина, която прави Z-теста подходящ, тъй като теоремата гласи, че когато размерът на извадката се увеличи, извадките се разпределят нормално.

T-тест Тестване

Тестването на хипотези с T-Test ще се използва от вас, когато размерът на извадката е ограничен и обикновено е разпределен. Като цяло, когато размерът на извадката е под 30 и стандартното отклонение на параметъра е неизвестно за вас, той се прилага главно.

Когато правите T-тест, вие го правите, за да изчислите доверителните интервали на конкретни данни за населението.

Хи-квадрат тест

Тестът хи-квадрат е популярен процес за тестване на хипотези, който често се използва за оценка на годността и целостта на разпределение на данни.

Източник: wikipedia.org

Основната причина обаче да използвате този тип хипотеза е, когато искате да тествате дисперсията на съвкупността спрямо дисперсия на съвкупността с предполагаема или известна стойност. Провеждат се различни тестове Хи-квадрат, но най-често срещаният тип е тестът Хи-квадрат за дисперсия и независимост.

ANOVA тестване

Съкратено като Анализ на дисперсията, това е статистически метод за тестване, който помага да се сравнят наборите от данни на две проби. Въпреки това ви позволява да сравнявате повече от две средства наведнъж.

Той също така обяснява зависима променлива и независима променлива от примерни данни. Използването на ANOVA е доста подобно на използването на Z-тест и T-тест, но последните два са ограничени само до две средства.

Как работи тестването на хипотези?

Всеки анализатор, който използва тестване на хипотези, използва произволни извадки от данни за анализ и измерване. По време на тестването данните от произволна извадка се използват за тестване на нулевата хипотеза и алтернативната хипотеза.

Както обсъдихме по-рано, нулевата хипотеза и алтернативната хипотеза са напълно взаимно изключващи се и по време на резултата от тестването само една може да бъде вярна.

Въпреки това, има някои случаи, когато нулевата хипотеза се отхвърля; алтернативната хипотеза не винаги е вярна.

Източник: Analytics Steps

p-стойност: Докато процесът на тестване започва, се включва p-стойността или стойността на вероятността и тя показва дали резултатът е значим или не. Не само това, но p-стойността също така показва вероятността от поява на грешка при отхвърляне или неотхвърляне на нулева хипотеза по време на тестването. Получената p-стойност е 0 или 1, която след това се сравнява с нивото на значимост или алфа нивото.

  Обяснени видове съединители за видеокарти

Нивото на значимост тук определя приемливия риск при отхвърляне на нулева хипотеза по време на тестването. Важно е да запомните, че резултатът от проверката на хипотезата може да доведе до два вида грешки:

  • Грешка от тип 1 възниква, когато резултатът от теста отхвърля нулевата хипотеза, въпреки че е вярна.
  • Грешка тип 2 се появява, когато нулевата хипотеза се приеме от резултата от пробата, въпреки че е невярна.

Всички стойности, които причиняват отхвърляне на нулевата хипотеза, се съхраняват в критичната област. И това е критичната стойност, която разделя критичните региони от другите.

Стъпки за извършване на тестване на хипотези

Източник: Среден

Тестването на хипотези основно включва четири стъпки:

  • Дефинирайте хипотези: В първата стъпка вашата работа като анализатор е да дефинирате двете хипотези, така че само едната да е вярна. Нулевата хипотеза ще покаже, че няма разлика в средния ИТМ, докато алтернативната хипотеза ще посочи, че има значителна разлика в средния ИТМ.
  • План: В следващата стъпка ще трябва да проектирате план за анализ на това как можете да анализирате примерните данни. От жизненоважно значение е да направите извадка и да съберете примерните данни, за да се уверите, че са предназначени да тестват вашата хипотеза.
  • Анализирайте примерни данни: След като решите как ще оцените данните, е време да започнете процеса. Ще трябва да анализирате примерните данни физически, така че да няма излишък. Докато анализирате данните, трябва да проверите дали извадките са независими една от друга и че и двата размера на извадката са достатъчно големи.
  • Изчислете статистиката на теста: На този етап ще трябва да изчислите статистиката на теста и да намерите p-стойността. P-стойността ще бъде определена като се приеме, че нулевата хипотеза е вярна.
  • Оценете резултата: В последната стъпка ще трябва да оцените резултата от теста на хипотезата. Тук ще решите дали да отхвърлите нулевата хипотеза или да декларирате нейната правдоподобност въз основа на примерните данни.

Сега ще проучим ползите от тестването на хипотези.

Ползи от проверката на хипотези

Ползите от тестването на хипотези са:

  • Помага ви да анализирате силата на вашето твърдение за решение за данни.
  • Като анализатор ви позволява да създадете надеждна среда за вземане на решения относно примерни данни.
  • Той ви позволява да определите дали примерните данни, включени в тестването на хипотези, са статистически значими.
  • Той е полезен за оценка на надеждността и валидността на резултатите от теста във всеки систематичен процес на тестване.

Помага ви при екстраполиране на данните от етап на извадка към по-голяма съвкупност в зависимост от изискването.

Използване на случаи на тестване на хипотези

Тестването на хипотези се използва в различни сектори, за да се отгатне по подходящ начин точността на примерните данни. Някои примери от реалния свят за тестване на хипотези са:

#1. Клинични изпитвания

Тестването на хипотези се използва широко по време на клиничните изпитвания, тъй като помага на медицинските специалисти да решат дали ново лекарство, лечение или процедура ще бъдат ефективни или не въз основа на данни от извадки.

Лекарят може да мисли, че лечението може да понижи нивата на калий при някои пациенти. Лекарят може да измери нивото на калий на група пациенти преди да започне лечението и да провери нивото отново.

След това лекарят извършва тестване на хипотези, където H0: Uслед = Uпреди и това означава, че нивото на калий е същото като преди след прилагане на лечението. Друга хипотеза показва Ha: Uслед < Uпреди, което означава, че нивото на калий е намаляло след прилагане на лечението.

  GeoGuessr Съвети: Как да печелите постоянно

Така че, ако p-стойността е по-малка от нивото на значимост, тогава лекарят може да заключи, че лечението може да понижи нивото на калий.

#2. производство

Тестването на хипотези се използва в производствените предприятия, за да помогне на надзорните органи да решат дали новият метод или техника е ефективен или не.

Например, някои производствени единици могат да използват тестване на хипотези, за да установят дали новият метод им помага да намалят броя на дефектните продукти на партида. Да предположим, че броят на дефектните продукти е 300 на партида.

Производителят трябва да определи средната стойност за общия брой дефектни продукти, произведени преди и след използването на метода. Те могат да извършват тестване на хипотези и да използват хипотези H0: Uafter = Ubefore, където средната стойност на дефектните продукти, произведени след прилагане на нов метод, е същата като преди.

Друга хипотеза показва, че HA: Uafter не е равно на Ubefore, което означава, че общият брой дефектни продукти, произведени след прилагането на новия метод, не е същият.

След теста, когато p-стойността е по-малка от нивото на значимост, тогава производствената единица може да заключи, че броят на произведените дефектни продукти се е променил.

#3. селско стопанство

Тестването на хипотези често се използва, за да се установи дали торът или пестицидът причиняват растеж и имунитет на растенията. Биолозите могат да използват тестовете, за да докажат, че определено растение може да порасне повече от 15 инча след прилагане на новия тор.

Биологът може да прилага тора в продължение на един месец, за да събере примерни данни. Когато биологът извършва тест, една хипотеза е H0 U=15 инча, което показва, че торът не предизвиква подобрение на средния растеж на растението.

Друга хипотеза показва HA: U> 15 инча, което означава, че торовете предизвикват подобряване на средния растеж на растението. След тестване, когато p-стойността е по-малка от нивото на значимост, биологът вече може да докаже, че торовете предизвикват повече растеж от преди.

Ресурси за обучение

#1. Статистика: Въведение стъпка по стъпка от Udemy

Udemy предлага курс по статистика, в който ще научите стъпка по стъпка въведение в статистиката, обхващащо тестване на хипотези. Този курс съдържа примери и уроци от бивш учен по данни на Google, за да ви помогне да овладеете доверителните интервали, тестовете за хипотези и др.

#2. Основни статистики за анализ на данни от Udemy

Този курс на Udemy за основни статистики за анализ на данни ще ви помогне да научите статистика с проекти от реалния свят, забавни дейности, тестове на хипотези, вероятностни разпределения, регресионен анализ и др.

#3. Статистика за наука за данни и бизнес анализ

Този курс по статистика за наука за данни и бизнес анализ се предлага от Udemy, който ще ви помогне да научите тестване на хипотези. Той обхваща различни статистически теми, като дава възможност на специалистите по данни и бизнес анализаторите да ги научат и овладеят. Той обхваща инференциални и описателни статистики заедно с регресионен анализ.

#4. Тестване на хипотези от Джим Фрост

Тази книга е достъпна в Amazon и е интуитивно ръководство, което помага на анализаторите да вземат решения, основани на данни.

Той обхваща работата с тестове на хипотези, защо имате нужда от тях, как ефективно да използвате доверителни интервали, p-стойности, нива на значимост и много други теми.

#5. Тестване на хипотези от Скот Хартсхорн

Тази книга е уникална със своите визуални примери и е най-подходяща за начинаещи, които търсят бързо ръководство за тестване на хипотези.

Ще ви запознае със значението на статистиките, видовете и тяхната работа. Не е необходимо да имате предишни задълбочени познания по статистика, но обяснява всичко интуитивно.

Последна дума

Тестването на хипотези помага да се провери дадено предположение и след това да се разработят статистически данни въз основа на оценката. Използва се в много сектори, от производството и селското стопанство до клиничните изпитвания и ИТ. Този метод е не само точен, но и ви помага да вземате решения, базирани на данни, за вашата организация.

След това разгледайте учебните ресурси, за да станете бизнес анализатор.