Въведение в полиномната регресия
Регресията се определя като метод за намиране на връзката между независимите и зависимите променливи за прогнозиране на резултата. Първият полиномичен регресионен модел е използван през 1815 г. от Гергон. Използва се за намиране на най-подходящата линия, използвайки регресионната линия за прогнозиране на резултатите. Има много видове техники за регресия, полиномичната регресия е една от тях. Преди да разберете това, препоръчително е да имате правилни познания за линейна регресия, така че ще бъде лесно да се отбележат разликите между тях.
Защо полиномна регресия?
- Това е една от регресионната техника, която се използва от професионалистите за прогнозиране на резултата. Тя се дефинира като връзката между независимите и зависимите променливи, когато зависимата променлива е свързана с независимата променлива с n-та степен. Не изисква връзката между зависимите и независимите променливи да е линейна, така че ако линията е крива, то може да има какъвто и да е полиномичен термин.
- Основната разлика между линейна и полиномална регресия е, че линейната регресия изисква зависимите и независимите променливи да бъдат линейно свързани, докато това може по-добре да съответства на линията, ако включим по-висока степен към независимото число на променливата в уравнението. Уравнението на полиномалната регресия с n-та степен може да бъде записано като:
Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX п
- Ако добавим по-високи градуси като квадратична, тогава тя превръща линията в крива, която по-добре пасва на данните. Обикновено се използва, когато точките от набора от данни са разпръснати и линейният модел не е в състояние да опише ясно резултата. Винаги трябва да следим за Overfitting и Underfitting, докато вземаме предвид тези степени към уравнението.
- По-добре е да се вземе предвид степента, която преминава през всички точки на данни, но понякога с по-висока степен, като 10 или 20, може да премине през всички точки на данни и да намали грешката, но също така улавя шума на данните, който превишава модела и това може да бъде избегнато чрез добавяне на повече проби към набора от данни за тренировките. Така че, винаги е препоръчително да изберете оптимална степен, която да отговаря на модела.
Има две техники, които се използват при определяне на степента на уравнението:
- Избор на напред: Това е методът за увеличаване на степента, докато не е достатъчно значим за определяне на модела.
- Обратна селекция: Това е методът за намаляване на степента, докато не е достатъчно значим за определяне на модела.
Процедура за прилагане на полиномна регресия
Моля, намерете стъпките или процедурите по-долу, за да приложите полиномна регресия към всеки набор от данни:
Стъпка 1: Импортирайте съответния набор от данни във всяка платформа (R или Python) и инсталирайте необходимите пакети, необходими за прилагане на модела.
Стъпка 2: Разделете набора от данни на групи за обучение и тестване, така че да можем да приложим алгоритъма към набора от данни за обучение и да го тестваме с помощта на набор от данни за тестване.
Стъпка 3: Прилагайте методи за изследване на проучвателни данни, за да изучите фона на данните като средно, средно, режим, първи квантил, втори кватил и т.н.
Стъпка 4: Приложете алгоритъма на линейна регресия към набора от данни и проучете модела.
Стъпка 5: Приложете алгоритъма за полиномна регресия към набора от данни и проучете модела, за да сравните резултатите или RMSE, или R квадрат между линейна регресия и полиномна регресия.
Стъпка 6: Визуализирайте и прогнозирайте както резултатите от линейна, така и полиномична регресия и определете кой модел прогнозира набора от данни с по-добри резултати.
Полиномна регресия
- Той се използва в много експериментални процедури за получаване на резултата, използвайки това уравнение.
- Той осигурява чудесна дефинирана връзка между независимите и зависимите променливи.
- Използва се за изследване на изотопите на утайките.
- Използва се за изследване на нарастването на различни заболявания в рамките на всяко население.
- Използва се за изследване на генерирането на всякакъв синтез.
Характеристики на полиномната регресия
- Това е вид нелинеен регресионен метод, който ни казва връзката между независимата и зависимата променлива, когато зависимата променлива е свързана с независимата променлива от n-та степен.
- Линията на най-доброто прилягане се определя от степента на полиномното регресионно уравнение.
- Моделът, получен от полиномалната регресия, се влияе от външните хора, така че винаги е по-добре да се лекуват остатъците, преди да се приложи алгоритъмът към набора от данни.
- Функцията Polynomialfeature () се превръща в характеристика на матрицата в зависимост от степента на уравнението.
- Характерът на кривата може да бъде проучен или визуализиран с помощта на обикновен диапазон на разсейване, който ще ви даде по-добра представа за линейната връзка между променливите и ще вземете решение за това.
заключение
Полиномната регресия се използва в много организации, когато идентифицират нелинейна връзка между независимите и зависимите променливи. Това е една от трудните регресионни техники в сравнение с други методи на регресия, така че задълбочените познания за подхода и алгоритъма ще ви помогнат да постигнете по-добри резултати.
Препоръчителни статии
Това е ръководство за полиномна регресия. Тук обсъждаме характеристиките и употребите на полиномната регресия. Можете също да прегледате и другите ни предложени статии, за да научите повече -
- SVM алгоритъм
- Методи на ядрото
- LINEST Excel функция
- Алгоритми за машинно обучение
- Линейна регресия срещу логистична регресия | Топ разлики