Полиномна регресия

Въведение в полиномната регресия

Регресията се определя като метод за намиране на връзката между независимите и зависимите променливи за прогнозиране на резултата. Първият полиномичен регресионен модел е използван през 1815 г. от Гергон. Използва се за намиране на най-подходящата линия, използвайки регресионната линия за прогнозиране на резултатите. Има много видове техники за регресия, полиномичната регресия е една от тях. Преди да разберете това, препоръчително е да имате правилни познания за линейна регресия, така че ще бъде лесно да се отбележат разликите между тях.

Защо полиномна регресия?

Това е една от регресионната техника, която се използва от професионалистите за прогнозиране на резултата. Тя се дефинира като връзката между независимите и зависимите променливи, когато зависимата променлива е свързана с независимата променлива с n-та степен. Не изисква връзката между зависимите и независимите променливи да е линейна, така че ако линията е крива, то може да има какъвто и да е полиномичен термин.
Основната разлика между линейна и полиномална регресия е, че линейната регресия изисква зависимите и независимите променливи да бъдат линейно свързани, докато това може по-добре да съответства на линията, ако включим по-висока степен към независимото число на променливата в уравнението. Уравнението на полиномалната регресия с n-та степен може да бъде записано като:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX п

Ако добавим по-високи градуси като квадратична, тогава тя превръща линията в крива, която по-добре пасва на данните. Обикновено се използва, когато точките от набора от данни са разпръснати и линейният модел не е в състояние да опише ясно резултата. Винаги трябва да следим за Overfitting и Underfitting, докато вземаме предвид тези степени към уравнението.
По-добре е да се вземе предвид степента, която преминава през всички точки на данни, но понякога с по-висока степен, като 10 или 20, може да премине през всички точки на данни и да намали грешката, но също така улавя шума на данните, който превишава модела и това може да бъде избегнато чрез добавяне на повече проби към набора от данни за тренировките. Така че, винаги е препоръчително да изберете оптимална степен, която да отговаря на модела.

Има две техники, които се използват при определяне на степента на уравнението:

Избор на напред: Това е методът за увеличаване на степента, докато не е достатъчно значим за определяне на модела.
Обратна селекция: Това е методът за намаляване на степента, докато не е достатъчно значим за определяне на модела.

Процедура за прилагане на полиномна регресия

Моля, намерете стъпките или процедурите по-долу, за да приложите полиномна регресия към всеки набор от данни:

Стъпка 1: Импортирайте съответния набор от данни във всяка платформа (R или Python) и инсталирайте необходимите пакети, необходими за прилагане на модела.

Стъпка 2: Разделете набора от данни на групи за обучение и тестване, така че да можем да приложим алгоритъма към набора от данни за обучение и да го тестваме с помощта на набор от данни за тестване.

Стъпка 3: Прилагайте методи за изследване на проучвателни данни, за да изучите фона на данните като средно, средно, режим, първи квантил, втори кватил и т.н.

Стъпка 4: Приложете алгоритъма на линейна регресия към набора от данни и проучете модела.

Стъпка 5: Приложете алгоритъма за полиномна регресия към набора от данни и проучете модела, за да сравните резултатите или RMSE, или R квадрат между линейна регресия и полиномна регресия.

Стъпка 6: Визуализирайте и прогнозирайте както резултатите от линейна, така и полиномична регресия и определете кой модел прогнозира набора от данни с по-добри резултати.

Той се използва в много експериментални процедури за получаване на резултата, използвайки това уравнение.
Той осигурява чудесна дефинирана връзка между независимите и зависимите променливи.
Използва се за изследване на изотопите на утайките.
Използва се за изследване на нарастването на различни заболявания в рамките на всяко население.
Използва се за изследване на генерирането на всякакъв синтез.

Характеристики на полиномната регресия

Това е вид нелинеен регресионен метод, който ни казва връзката между независимата и зависимата променлива, когато зависимата променлива е свързана с независимата променлива от n-та степен.
Линията на най-доброто прилягане се определя от степента на полиномното регресионно уравнение.
Моделът, получен от полиномалната регресия, се влияе от външните хора, така че винаги е по-добре да се лекуват остатъците, преди да се приложи алгоритъмът към набора от данни.
Функцията Polynomialfeature () се превръща в характеристика на матрицата в зависимост от степента на уравнението.
Характерът на кривата може да бъде проучен или визуализиран с помощта на обикновен диапазон на разсейване, който ще ви даде по-добра представа за линейната връзка между променливите и ще вземете решение за това.

заключение

Полиномната регресия се използва в много организации, когато идентифицират нелинейна връзка между независимите и зависимите променливи. Това е една от трудните регресионни техники в сравнение с други методи на регресия, така че задълбочените познания за подхода и алгоритъма ще ви помогнат да постигнете по-добри резултати.

Препоръчителни статии

Това е ръководство за полиномна регресия. Тук обсъждаме характеристиките и употребите на полиномната регресия. Можете също да прегледате и другите ни предложени статии, за да научите повече -

SVM алгоритъм
Методи на ядрото
LINEST Excel функция
Алгоритми за машинно обучение
Линейна регресия срещу логистична регресия | Топ разлики

Полиномна регресия - Употреби и характеристики на полиномната регресия

Съдържание:

Въведение в полиномната регресия

Защо полиномна регресия?

Процедура за прилагане на полиномна регресия