ANOVA (анализ на вариацията)

ANOVA означава Анализ на вариацията. ANOVA е основана от Роналд Фишър през 1918 г. Името Analysis Of Variance е получено въз основа на подхода, при който методът използва дисперсията, за да определи средствата дали са различни или равни.

Това е статистически метод, използван за тестване на разликите между две или повече средства. Използва се за тестване на общи разлики, а не на специфични различия между средствата. Той оценява значимостта на един или повече фактори, като сравнява променливите средства за отговор на различни факторни нива.

Нулева хипотеза гласи, че всички средства за населението са равни. Алтернативната хипотеза доказва, че поне една средна популация е различна

Той предоставя начин за тестване на различни нулеви хипотези едновременно.

Обща цел на ANOVA

Причината за извършването на ANOVA е да се види дали има разлика между групите на някаква променлива. Днес изследователите използват ANOVA по много начини. Използването на ANOVA изцяло зависи от дизайна на изследването.

Можете да използвате t-тест, за да сравните средствата на две проби, но когато има повече от две проби, които трябва да се сравнят, ANOVA е най-добрият метод за използване.

Предположения на ANOVA

Има четири основни предположения

  • Очакваните стойности на грешките са нула
  • Различията на всички грешки са равни една на друга
  • Грешките са независими
  • Обикновено се разпределят

Видове ANOVA

  1. Един път между групите

Еднопосочен ANOVA се използва за проверка дали има някаква значителна разлика между средствата на три или повече несвързани групи. Той главно тества нулевата хипотеза.

H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ

Където µ означава средна група, а x означава брой групи. Един начин ANOVA дава значителен резултат. Един от начините ANOVA е статистически тест за многофункционален тест и няма да ви уведоми кои конкретни групи са били различни една от друга. За да знаете конкретната група или групи, които се различават от другите, тогава трябва да направите post hoc тест.

Пример за еднопосочна ANOVA

20 души са избрани да тестват ефекта от пет различни упражнения. 20 души са разделени в 4 групи с по 5 члена. Теглото им се записва след няколко дни. Ефектът от упражненията върху 5-та група мъже се сравнява. Тук теглото е единственият фактор.

Предположения

Зависимата променлива обикновено се разпределя във всяка група

Има хомогенност на вариациите

Независимост от наблюденията

  1. Един път ANOVA повтаряше мерки

Многократни мерки ANOVA е повече или по-малко равна на еднопосочна ANOVA, но се използва за сложни групировки. Многократните мерки изследват 1. промените в средните оценки за три или повече времеви точки

2. разлики в средните резултати при различни условия.

Пример за многократни мерки

Може да проучите ефекта на 6-месечна тренировъчна програма върху намаляването на теглото при някои хора. Изчислявате теглото в три различни моменти от време на тренировъчния период, за да разработите времеви курс за всеки ефект на упражненията.

Можете да се отдадете на един и същ индивид да яде различен тип храна за намаляване на теглото и да ги оцените според вкуса.

В този пример един и същ набор от хора се измерват повече от веднъж на една и съща зависима променлива.

  1. Двупосочен между групите

Двупосочният ANOVA сравнява средната разлика между групите, които са разделени на два фактора. Основната цел на двупосочния ANOVA е да установи дали има взаимодействие между двете независими променливи върху зависимите променливи. Също така ви позволява да знаете дали ефектът на една от вашите независими променливи върху зависимата променлива е еднакъв за всички стойности на вашата друга независима променлива.

пример

Изследването на ефекта на торовете върху добива на ориза. Прилагате пет тора с различно качество върху пет парцела земя, всеки от които обработва ориз. Добивът от всеки парцел се записва и се наблюдава разликата между всеки парцел. Тук може да се изучи и ефектът от плодородието на парцелите. По този начин има два фактора - Тор и плодородие.

Предположения

Преди да започнете с вашата двупосочна ANOVA, вашите данни трябва да преминат през шест предположения, за да сте сигурни, че данните, които имате, са достатъчни за извършване на двупосочна ANOVA. По-долу са изброени шестте предположения

  • Вашата зависима променлива трябва да се измерва на непрекъснато ниво
  • Вашите две независими променливи трябва да съдържат две или повече категорични независими групи за всяка
  • Трябва да имате независимост от наблюденията
  • Избягвайте всякакви остатъци
  • Вашата зависима променлива трябва да бъде обикновено разпределена за всяка комбинация от групите на двете независими променливи
  • Хомогенност на дисперсиите
  1. Двупосочни повтарящи се мерки

Двупосочно повтарящо се измерва средните разлики между групите, които са разделени на две в независимите променливи. Двупосочна повтаряща се мярка често се използва в изследвания, при които зависима променлива се измерва повече от два пъти при две или повече условия.

пример

Здравен изследовател иска да намери най-добрия начин да намали хроничната болка в ставите, претърпяна от хората. Изследователят избира два различни вида лечение, за да намали нивото на болката. Двата вида лечение са известни като „състояния“. Лечение А е масажна програма, а Лечението Б е програма за акупунктура. И двете лечения се прилагат на всички пациенти в продължение на 8 седмици.

Пациентите се тестват в три моменти - в началото на програмата, в средата на програмата и в края на програмата.

Изследователят избира 30 пациенти, които ще участват в изследването. Но когато първите 15 пациенти преминават лечение A, останалите 15 пациенти преминават на лечение B и обратно.

В края на 8 седмици изследователят използва двупосочни повтарящи се мерки ANOVA, за да установи дали има промяна в болката в резултат на взаимодействието между вида на лечението и в кой момент от време.

Предположения

Вашите данни трябва да преминат пет предположения, необходими за двупосочни повтарящи се мерки ANOVA, за да се даде точен резултат.

  • Вашата зависима променлива трябва да се измерва на непрекъснато ниво
  • Вашите два в рамките на предметните фактори трябва да се състоят от поне две категорично свързани групи
  • Не трябва да има външни хора
  • Зависимата променлива трябва да бъде обикновено разпределена между всяка комбинация от свързани групи
  • Различията в разликите между всички комбинации от свързани групи трябва да са равни

Параметричен и непараметричен ANOVA тест

Ако информацията за популацията е напълно известна чрез нейните параметри, тогава извършеният статистически тест се нарича Параметричен тест.

Ако информацията за популацията или параметрите не е известна, но все пак се изисква да се тества хипотезата, тогава тя се нарича непараметричен тест.

Когато имате категорични данни, тогава не можете да използвате метода ANOVA, трябва да използвате тест на Chi квадрат, който се занимава с ANOVA взаимодействие.

Процедура за тестване на хипотези - Един начин ANOVA

  1. Проверете всяко необходимо предположение и напишете нулева и алтернативна хипотеза

За да се изпълни по един начин ANOVA определени предположения трябва да има. Предположенията са следните

  • Всяка проба е независима случайна извадка
  • Разпределението на променливата за отговор следва нормално разпределение
  • Отклоненията в популацията са равни при отговорите за нивата на групата. Това може да се установи чрез разделяне на най-голямото стандартно отклонение на извадката на най-малкия стандарт на извадката и не е по-голямо от две, след което се приеме, че отклоненията в популацията са равни.
  1. Изчислете подходяща тестова статистика

Един от начините ANOVA използва F тестова статистика. Ръчните изчисления изискват много стъпки за изчисляване на съотношението F, но статистически софтуер като SPSS ще изчисли съотношението F за вас и ще произведе таблицата на източника на ANOVA.

Таблицата ANOVA ще ви даде информация за променливостта между групите и в рамките на групите. Таблицата ще ви даде цялата формула. По-долу е примерът на еднопосочна таблица ANOVA

източникSSDFГ-ЦАF
лечениеSSTк-1SST / (к-1)MST / MSE
грешкаSSENkSSE / (NK)
Общо (поправено)SSN-1

SST означава Сума от квадратчета обработки, SSE означава Сума от квадратчета грешки

DFT, което е k-1, означава степени на свобода за лечение, DFE, което е Nk, означава Степени на свобода за грешки.

  1. Определете стойност на ap, свързана със статистическата информация за теста
  2. Определете между нулевата и алтернативната хипотеза

Ако нулевата хипотеза е невярна, MST трябва да бъде по-голям от MSE

  1. Дайте заключение

Въз основа на резултата напишете заключение според вашия въпрос за проучване на anova.

Множество тестове за сравнение

Ако установите, че има значителна разлика между групите, която не е свързана с грешка в извадката, тогава е необходимо да се извършат няколко t тестове, за да се тестват средствата между групите. Извършват се няколко теста за контрол на степента на грешка тип 1.

  • Тест на Шеф
  • Модифициран тест на Bonferroni
  • Тест на Дънет
  • Тест на Туки

Изчисленията

ANOVA изчисленията могат да бъдат направени по три начина - ръчни изчисления, Excel лист и софтуер SPSS. Нека научим за всички изчисления подробно по-долу

  1. Ръчни изчисления на ANOVA

  • Етап 1

Изчислете CM

CM = (Общо всички наблюдения) 2 / N Общо

  • Стъпка 2

Изчислете общия SS

Общ SS = сбор от квадрати от всички наблюдения - CM

  • Стъпка 3

Изчислете SST (сбор от квадрати за лечение)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Стъпка 4

Изчислете SSE (сбор от квадрати за грешки)

SSE = SS (общо) - SST

  • Стъпка 5

Изчислете MST, MSE и тяхното съотношение F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA с помощта на Excel

За да изпълните един фактор ANOVA в excel, следвайте тези прости стъпки

  • Отидете в раздела Данни
  • Кликнете върху Анализ на данните
  • Изберете Anova: Single factor и щракнете върху OK (има и други опции като Anova: два фактора с репликация и Anova: два фактора без репликация)
  • Щракнете върху полето Диапазон на въвеждане и изберете диапазона
  • Щракнете върху полето Изходящ диапазон и изберете диапазона на изхода и щракнете върху Ок
  • Ще получите резултата, показан в листа на excel
  • Ако F е по-голям от F крит, нулевата хипотеза се отхвърля
  1. ANOVA с помощта на SPSS

Първо изтеглете софтуера SPSS, за да изпълните ANOVA. Тук можем да видим как да извършим еднопосочен ANOVA с помощта на SPSS

SPSS винаги приема, че независимата променлива е представена числово. В набора от примерни данни MAJOR е низ. Така че първо преобразувайте променливата на низовете в числова променлива. След като преобразуването ви приключи, вие сте готови да направите ANOVA

  • Отворете софтуера SPSS
  • Щракнете върху Анализ à Сравнение на средствата с един път ANOVA
  • Един начин за диалогов прозорец ANOVA се появява на екрана
  • В лявата част на диалоговия прозорец ще видите списък на всички зависими променливи, измерени от вас. Преместете го в списъка на зависимите от дясната страна с помощта на горния бутон на стрелката
  • По същия начин преместете независимата променлива в списъка от лявата страна до полето Фактор от дясната страна.
  • Щракнете върху бутона Post Hoc, за да изберете вида на множественото сравнение, което искате да направите.
  • Изберете всеки post hoc тест, който отговаря на вашите изследвания, като щракнете върху квадратчето до теста
  • Щракнете върху Продължи и ще ви отведе до диалоговия прозорец Еднопосочен ANOVA
  • Изберете всякаква статистика и щракнете върху квадратчетата вляво от опцията, за да я изберете
  • Кликнете върху График на средствата, за да получите графика на анова на средствата на условията
  • Щракнете върху Продължи и щракнете върху ОК

Ще се появи изходният прозорец на SPSS с шест основни секции

  • Описателен раздел
  • Тест за хомогенност на вариансите
  • ANOVA
  • Множество сравнения
  • Средна точка за оценка
  • диаграма

Неща, които трябва да се вземат предвид при изпълнение на ANOVA

Нивото на данните и предположенията играят решаваща роля в ANOVA.

Изследователят трябва да установи дали данните са кръстосани или вложени. Ако данните са пресечени, всички групи получават всички аспекти.

Ако данните са вложени, всяка група ще получи различен метод ANOVA.

По-важно е да се изчисли размерът на ефекта на анова. Размерът на ефекта може да ви каже степента, в която нулевата хипотеза е невярна. Средният размер на ефекта винаги е за предпочитане

Надявам се, че тази статия ви даде кратък преглед на ANOVA и интерпретиране на резултатите, като го използвате.

Свързани курсове: -

  1. ANOVA Използване на Minitab
  2. R Studio Anova Techniques курс

Категория: