Преглед на двупосочна ANOVA в R

Двупосочен ANOVA (анализ на вариацията) ни помага да разберем връзката между една непрекъсната зависима променлива и две категорични независими променливи. В тази тема ще научим за двупосочна ANOVA в Р.

По-долу са представени хипотезата за интерес при двупосочна ANOVA

  1. H₀: Наречете го основният ефект, който е първият фактор, който зависи от непрекъснатата променлива
  2. H₀: Основният ефект също е свързан с ефекта върху втората променлива върху зависимата непрекъсната променлива.
  3. H₀: Взаимодействието е комбинираният ефект на двете променливи от първия, втория фактор върху зависимата променлива

По-долу са описани нормите, на които трябва да отговаря двупосочната ANOVA.

  1. Наблюденията трябва да са независими
  2. Наблюденията трябва да бъдат нормално разпределени.
  3. Трябва да има еднаква разлика в наблюденията
  4. Без отстъпки в дизайна
  5. Грешките трябва да са независими.

Забележка

Трябва да трансформираме данните си, ако се наруши нормалността и равните вариации.

Пример за двупосочна ANOVA в R

Нека да извършим един начин ANOVA тест за набор от данни за нивата на рак, който съдържа 48 реда и 3 променливи данни:

Време, взето: Време за оцеляване на животно

Различни нива на рак 1 - 3

Лечение: лечения, използвани от 1-3

Преди да тестваме, имаме нужда от следните данни в ръка.

  • Импортиране на данните
  • Премахнете ненужната променлива
  • Конвертирайте променливи (нива на Рак) като подредено ниво.

По-долу е наборът от данни.

Наблюдения: 48

Променливи: 3

време за оцеляване 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

ракови нива 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Лечение A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Цели

  1. H₀: няма промяна в средното време за оцеляване между групата
  2. H₀: времето за оцеляване е различно за поне една група.

стъпки

  • Проверете нивата на рака. Можем да видим три знака, защото ги преобразуваме във фактори с мутирал глагол.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Изчислете както средното, така и стандартното отклонение

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

изход:

Тибло: 3 x 4

ракови нива count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • В стъпка трета можете да проверите графично дали има разлика между разпределенията. Обърнете внимание, че включвате изтърканата точка.
  • Изпълнете тест с команда AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Синтаксис:

y ~ X1 + X2 +… + Xn (X1 + X2 +… се отнася до независимите променливи)

y ~. Използвайте всички останали променливи като независими променливи

Уверете се, че запазите модела и отпечатате обобщението.

код

  • aov (време ~ ракови нива, данни = df): Изпълнете ANOVA теста със следната формула
  • резюме (anova_one_way): Печат на резюмето на теста

Df сума Sq средна стойност на Sq F Pr (> F)

Ракови нива 2 1.033 0.5165 11.79 7.66e-05 ***

Остатъчни 45 1.972 0.0438

-

Signif. кодове: 0 '***' 0, 001 '**' 0.01 '*' 0, 05 '.' 0, 1 '' 1

P-стойността е по-ниска от прага 0, 05. Статистическата разлика е обозначена с "*" в горния случай.

Еднопосочен тест към двупосочна Анова в R

Нека да видим как еднопосочният тест може да бъде разширен до двупосочен ANOVA. Тестът е подобен на еднопосочната ANOVA, но формулата се различава и добавя друга променлива на групата към формулата.

y = x1 + x2

  • H0 : Средствата са равни и за двете променливи (факторни променливи)
  • Н3 : Средствата са различни и за двете променливи

Вие добавяте променливи обработка към нашия модел. Тази променлива показва лечението на пациента. Интересувате се да видите дали има статистическа зависимост между нивата на рака и лечението на пациента.

Ние коригираме нашия код, като добавяме лакомство с другата независима променлива.

Df сума Sq средна стойност на Sq F Pr (> F)

Ракови нива 2 1.0330 0.5165 20.64 5.7e-07 ***

Лекувайте 3 0.9212 0.3071 12.27 6.7e-06 ***

Остатъци 42 1.0509 0.0250

Както нивата на рака, така и лечението са статистически различни от 0. По този начин можем да отхвърлим хипотезата на NULL. Също така потвърдете, че промяната на лечението или вида на рака влияе на времето за оцеляване.

Тест

Еднопосочна ANOVA: H3- Средната е различна за поне една група

Двупосочна ANOVA: H3- Средната е различна за двете групи.

Разлика между еднопосочен и двупосочен ANOVA

Разлики между Еднопосочна ANOVA и двупосочна ANOVA

Еднопосочна ANOVAДвупосочна ANOVA
Проектиран е да позволи тестване на равенството между 3 или повече средстваСъздаден за оценка на взаимовръзката на две независими променливи на зависима променлива.
Включва една независима променливаВключва две независими променливи
Анализирани в 3 или повече категорични групи.Сравнява множество групи от два фактора
Трябва да отговаря на два принципа - репликация и рандомизацияТрябва да отговаря на три принципа, които са репликация, рандомизация и локален контрол.

Предимства на двупосочната ANOVA

  • В горния пример възрастта и полът в нашия пример - помага да се намали отклонението от грешки, което прави дизайна по-ефективен.
  • Двупосочната ANOVA ни позволява да тестваме ефекта на два фактора едновременно.

Приложения на ANOVA

  1. Сравняване на пробега на различни превозни средства, гориво и пътища.
  2. Запознаване с влиянието на температурата, налягането или концентрацията на химикали върху някои химични реакции (силови реактори, химически инсталации и др.)
  3. Въздействие на различни катализатори върху скоростта на химичната реакция
  4. Разбиране на въздействието на рекламите и различния брой отговори на клиентите.
  5. Въздействие на производителността, качеството и скоростта на производство в биологията (процес въз основа на броя клетки, на които се разделят)

Препоръчителни статии

Това е ръководство за двупосочна ANOVA в R. Тук обсъждаме примерите, целите, стъпките и разликата между Еднопосочен и двупосочен ANOVA. Може да разгледате и следните статии, за да научите повече -

  1. АНОВА в R
  2. Как да интерпретираме резултатите, използвайки ANOVA тест
  3. Регресия срещу ANOVA
  4. GLM в R

Категория: