Формула на Outliers (Съдържание)

  • Формула за отличници
  • Примери за формула на Outliers (с шаблон на Excel)

Формула за отличници

В статистиката Outliers са двете крайни дистанцирани необичайни точки в дадените набори от данни. Изключително високата и изключително ниските стойности са по-външните стойности на набор от данни. Това е много полезно при намирането на възникнал някакъв недостатък или грешка. Просто както казва името, Outliers са стойности, които са излъгани от останалите стойности в набора от данни. Пример, помислете за студенти по инженерство и си представете, че са имали джуджета в класа си. Така че джуджетата са хората, които са с изключително нисък ръст в сравнение с други нормални хора на височина. Така че това е по-голямата стойност в този клас. Външните стойности могат да бъдат изчислени с помощта на метода Tukey.

Формулата за Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Примери за формула на Outliers (с шаблон на Excel)

Нека вземем пример, за да разберем по-добре изчислението на формулата на Outliers.

Можете да изтеглите този шаблон на Outliers тук - шаблон на Outliers

Формула за отличници - Пример №1

Помислете следния набор от данни и изчислете разходните данни за набора от данни.

Набор от данни = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Възходящ ред на набора от данни:

Медиана на набора от данни за възходяща поръчка се изчислява като:

В този набор от данни общият брой данни е 11. Значи n = 11. Медиана = 11 + 1/2 = 12/2 = 6. Следователно стойността, която е на 6 -та позиция в този набор от данни, е средната.

Значи средна стойност = 34.

Разделете набора от данни на 2 половини, използвайки медианата.

Медианата на набора от данни за долната половина и горната половина се изчислява като:

  • В долната половина 2, 5, 6, 7, 23, ако намерим средната като това, как намерихме в стъпка 2, средната стойност ще бъде 6. Значи Q1 = 6.
  • В горната половина 45, 56, 89, 98, 309, ако намерим средната като това, как намерихме в стъпка 2, средната стойност ще бъде 89. Значи Q3 = 89.

IQR се изчислява по формулата, дадена по-долу

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

По-нисък Outlier се изчислява по формулата, дадена по-долу

По-ниска стойност = Q1 - (1, 5 * IQR)

  • Долен външен елемент = 6 - (1, 5 * 83)
  • Долен външен = -118.5

По-висок Outlier се изчислява по формулата, дадена по-долу

По-висока стойност = Q3 + (1.5 * IQR)

  • По-високо ниво = 89 + (1, 5 * 83)
  • По-висока Outlier = 213.5

Сега извлечете тези стойности в набора от данни -118.5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Стойности, които попадат по-долу в долната странична стойност и по-горе в по-горната страна са външната стойност. За този набор от данни 309 е по-различен.

Формула за отличници - Пример №2

Помислете следния набор от данни и изчислете разходните данни за набора от данни.

Набор от данни = 45, 21, 34, 90, 109.

Възходящ ред на набора от данни:

Медиана на набора от данни за възходяща поръчка се изчислява като:

В този набор от данни общият брой данни е 5. Значи n = 5. Медиана = 5 + 1/2 = 6/2 = 3. Следователно стойността, която е на 3-та позиция в този набор от данни, е средната.

Значи средна стойност = 45.

Разделете набора от данни на 2 половини, използвайки медианата.

Медианата на набора от данни за долната половина и горната половина се изчислява като:

  • Q1 = 27.5
  • Q3 = 89

IQR се изчислява по формулата, дадена по-долу

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

По-нисък Outlier се изчислява по формулата, дадена по-долу

По-ниска стойност = Q1 - (1, 5 * IQR)

  • По-ниска външна стойност = 27, 5 - (1, 5 * 72)
  • Долен външен = -80.5

По-висок Outlier се изчислява по формулата, дадена по-долу

По-висока стойност = Q3 + (1.5 * IQR)

  • По-висока стойност = 99, 5 + (1, 5 * 72)
  • По-висока стойност = 207, 5

обяснение

Стъпка 1: Подредете всички стойности в дадения набор от данни във възходящ ред.

Стъпка 2: Намерете средната стойност за сортираните данни. Медианата може да се намери по следната формула. Следното изчисление просто ви дава позицията на средната стойност, която се намира в зададената дата.

Медиана = (n + 1) / 2

Където n е общият брой данни, налични в набора от данни.

Стъпка 3: Намерете долната квартилна стойност Q1 от набора от данни. За да намерите това, използвайки средната стойност, разделете набора от данни на две половини. От долната половина от стойности, намерете средната стойност за този долен набор, който е Q1 стойността.

Стъпка 4: Намерете горната квартилна стойност Q3 от набора от данни. Точно като горната стъпка. Вместо долната половина трябва да следваме същата процедура горната половина от стойности.

Стъпка 5: Намерете стойността на интелигентния диапазон на IQR. За да намерите стойността на Deduct Q1 от Q3.

IQR = Q3-Q1

Стъпка 6: Намерете стойността на Inner Extreme. Край, който попада извън долната страна, която също може да бъде наречена като незначителна външна страна. Умножете IQR стойността на 1, 5 и приспадайте тази стойност от Q1 ви дава вътрешната долна крайност.

По-ниска стойност = Q1 - (1, 5 * IQR)

Стъпка 7: Намерете стойността на външния екстрем. Край, който попада извън по-високата страна, която също може да се нарече главна външност. Умножете IQR стойността с 1, 5 и сумирайте тази стойност с Q3 ви дава външната по-висока крайност.

По-висока стойност = Q3 + (1.5 * IQR)

Стъпка 8: Стойности, които попадат извън тези вътрешни и външни крайности, са по-външните стойности за дадения набор от данни.

Уместност и ползване на Формула за отличници

Отличията са много важни при всеки проблем с анализа на данни. Outlier показва несъответствие във всеки набор от данни, тъй като е определен като необичайни далечни стойности в набора от един до друг. Това е много полезно при намирането на недостатъци, възникнали в набора от данни. Защото, когато поставите грешка в набора от данни, това се отразява на средната стойност и средната следователно може да получи големи отклонения в резултата, ако Outliers са в набора от данни. Ето защо е от съществено значение да откриете „Outliers“ от набора от данни, за да се избегнат сериозни проблеми в статистическия анализ.

Препоръчителни статии

Това е ръководство за формулата на Outliers. Тук обсъждаме как да изчислим Outliers заедно с практически примери и изтеглящ се шаблон на excel. Можете също да разгледате следните статии, за да научите повече -

  1. Ръководство за формула среден клас
  2. Примери за формула на заплатата
  3. Калкулатор за DPMO формула
  4. Как да изчислим разпределението на Т?
  5. Формула за квартилно отклонение | Примери