Въведение в методите на ядрото

Ядрата или методите на ядрото (наричани още функции на ядрото) са набори от различни видове алгоритми, които се използват за анализ на модели. Те се използват за решаване на нелинеен проблем чрез използване на линеен класификатор. Ядрените методи се използват в SVM (Support Vector Machines), които се използват при проблеми с класификацията и регресията. SVM използва това, което се нарича „трик на ядрото“, където данните се трансформират и се намира оптимална граница за възможните изходи.

Потребността от метод на ядрото и неговата работа

Преди да влезем в работата на методите на ядрото, е по-важно да разберем поддържащите векторни машини или SVM, защото ядрите се реализират в SVM модели. И така, Support Vector Machines са контролирани алгоритми за машинно обучение, които се използват при проблеми с класификацията и регресията, като класифициране на ябълка към клас плодове, докато класифициране на Лъв на животно от клас.

За да демонстрираме, по-долу е как изглеждат векторните машини за поддръжка:

Тук можем да видим хиперплан, който разделя зелените точки от сините. Хиперпланът е с едно измерение по-малко от околната равнина. Например на горната фигура имаме 2 измерения, които представляват заобикалящото пространство, но самотът, който разделя или класифицира пространството, е с едно измерение по-малко от обкръжаващото пространство и се нарича хиперплан.

Но какво ще стане, ако имаме такъв принос:

Много е трудно да се реши тази класификация, като се използва линеен класификатор, тъй като няма добра линейна линия, която трябва да може да класифицира червените и зелените точки, тъй като точките са разпределени на случаен принцип. Тук идва използването на функцията на ядрото, която отвежда точките към по-големи размери, решава проблема там и връща изхода. Помислете за това по този начин, можем да видим, че зелените точки са затворени в някаква периметрова зона, докато червената лежи извън нея, също може да има други сценарии, при които зелените точки могат да бъдат разпределени в зона с форма на трапец.

Така че това, което правим, е да преобразуваме двуизмерната равнина, която първо е класифицирана от едномерна хиперплоскост („или права линия“) в триизмерната област и тук нашият класификатор, т.е. хиперпланът няма да е права линия, а две -измерна равнина, която ще отреже района.

За да получим математическо разбиране на ядрото, нека разберем уравнението на ядрото на Лили Цзян, което е:

K (x, y) = където,
K е функцията на ядрото,
X и Y са входните размери,
f е картата от n-измерното към m-измерното пространство и,
е точков продукт.

Илюстрация с помощта на пример.

Нека кажем, че имаме две точки, x = (2, 3, 4) и y = (3, 4, 5)

Както видяхме, K (x, y) =.

Нека първо да изчислим

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
така,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) и
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
така точков продукт,
f (x). f (y) = f (2, 3, 4). е (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444
И,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Това, както установяваме, f (x) .f (y) и K (x, y) ни дават същия резултат, но предишният метод изискваше много изчисления (поради проектиране на 3 измерения в 9 измерения), докато използваме ядро, беше много по-лесно.

Видове ядро ​​и методи в SVM

Нека видим някои от функцията на ядрото или типовете, които се използват в SVM:

1. Liner Kernel - Нека кажем, че имаме два вектора с име x1 и Y1, тогава линейното ядро ​​се определя от точков произведение на тези два вектора:

K (x1, x2) = x1. x2

2. Полиномно ядро - Полиномното ядро ​​се определя от следното уравнение:

K (x1, x2) = (x1. X2 + 1) d,

Където,

d е степента на полинома и x1 и x2 са вектори

3. Гаусово ядро - Това ядро ​​е пример за ядро ​​на радиална основа. По-долу е уравнението за това:

Дадената сигма играе много важна роля в работата на гаусското ядро ​​и не трябва нито да се надценява и нито да се подценява, трябва да бъде внимателно настроена според проблема.

4. Експоненциално ядро - Това е в тясна връзка с предишното ядро, т.е. Гаусското ядро ​​с единствената разлика е - квадратът на нормата е премахнат.

Функцията на експоненциалната функция е:


Това е и функция на радиалната основа на ядрото.

5. Laplacian Kernel - Този тип ядро ​​е по-малко предразположен към промени и е напълно равен на предварително обсъжданото ядро ​​на експоненциалната функция, уравнението на Laplacian ядрото е дадено като:

6. Хиперболично или сигмоидно ядро - Това ядро ​​се използва в области на невронната мрежа на машинно обучение. Функцията за активиране на сигмоидното ядро ​​е биполярната сигмоидна функция. Уравнението за функцията на хиперболичното ядро ​​е:

Това ядро ​​е много използвано и популярно сред поддържащите векторни машини.

7. Ядро на Anova радиална основа - Известно е, че това ядро ​​се справя много добре при многомерни регресионни проблеми, точно както ядрите на Гаус и Лаплачия. Това също попада в категорията на радиално базисно ядро.

Уравнението за ядрото Anova е:

Има много повече видове метод на ядрото и сме обсъдили най-често използваните ядра. Това зависи изцяло от вида на проблема, който ще реши функцията на ядрото да бъде използвана.

заключение

В този раздел видяхме дефиницията на ядрото и как работи. Опитахме се да обясним с помощта на диаграми за работата на ядра. След това се опитахме да дадем проста илюстрация, използвайки математика за функцията на ядрото. В последната част видяхме различни видове функции на ядрото, които се използват широко днес.

Препоръчителни статии

Това е ръководство за методите на ядрото. Тук обсъждаме въведение, нужда, работа и видове методи на ядрото със съответното уравнение. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Алгоритми за извличане на данни
  2. K- означава алгоритъм за клъстериране
  3. Алгоритъм на грубата сила
  4. Алгоритъм на дървото за решение
  5. Методи на ядрото в машинното обучение
  6. Дърво на решения в машинното обучение

Категория: