Въведение в контролираното обучение

Надзорното обучение е област на машинното обучение, в която работим за прогнозиране на стойностите, използвайки обозначени набори от данни. Маркираните входни набори от данни се наричат ​​независима променлива, докато прогнозираните резултати се наричат ​​зависима променлива, тъй като те зависят от независимата променлива за техните резултати. Например, всички имаме папка със спам в нашия имейл (например Gmail) акаунт, който автоматично открива повечето от спам / измама имейли за вас с точност над 95%. Тя работи на базата на контролиран модел на обучение, където имаме набор от обучения с етикетирани данни, който в случая е, обозначен със спам имейл, маркиран от потребителите. Тези учебни набори се използват за обучение, което по-късно ще се използва за категоризиране на новите имейли като спам, ако отговаря на категорията.

Работа по контролирано машинно обучение

Нека разберем контролираното машинно обучение с помощта на пример. Да речем, че имаме кошница с плодове, която е пълна с различни видове плодове. Нашата работа е да категоризираме плодовете въз основа на тяхната категория.

В нашия случай сме разгледали четири вида плодове и това са ябълка, банан, грозде и портокали.

Сега ще се опитаме да споменем някои от уникалните характеристики на тези плодове, които ги правят уникални.

S No.

размер цвят форма

Първо име

1

малък зелен Кръгла до овална, Букетна форма Цилиндрична

Гроздов

2

голям червен Заоблена форма с депресия в горната част

ябълка

3

голям жълт Дълъг извиващ се цилиндър

банан

4 голям оранжев Заоблена форма

оранжев

Нека сега да кажем, че сте взели плод от кошницата с плодове, разгледали сте неговите характеристики, например неговата форма, размер и цвят, например, и след това заключите, че цветът на този плод е червен, големината, ако е голяма, формата е заоблена форма с депресия в горната част, следователно е ябълка.

  • По същия начин правите същото и за всички останали плодове.
  • Най-дясната колона („Име на плода“) е известна като променлива на отговора.
  • Ето как формулираме модел за обучение, който се контролира, сега ще бъде доста лесно за всеки нов (да кажем, робот или извънземен) с зададени свойства лесно да групира един и същ вид плодове заедно.

Видове алгоритъм за контролирано машинно обучение

Нека видим различни видове алгоритми за машинно обучение:

Регресия:

Регресията се използва за прогнозиране на единична стойност на изхода с помощта на набор от данни за обучение. Изходната стойност винаги се нарича като зависима променлива, докато входовете са известни като независима променлива. Имаме различни видове регресия в контролираното обучение, например,

  • Линейна регресия - тук имаме само една независима променлива, която се използва за прогнозиране на изхода, т.е. зависима променлива.
  • Множествена регресия - тук имаме повече от една независима променлива, която се използва за прогнозиране на изхода, т.е. зависимата променлива.
  • Полиномна регресия - тук графиката между зависимите и независимите променливи следва полиномиална функция. Например, например, в началото паметта се увеличава с възрастта, след това достига праг на определена възраст, а след това започва да намалява с напредване на възрастта.

Класификация:

Класификацията на контролираните алгоритми за обучение се използва за групиране на подобни обекти в уникални класове.

  • Бинарна класификация - Ако алгоритъмът се опитва да групира 2 отделни групи от класове, тогава той се нарича бинарна класификация.
  • Класификация с много класове - Ако алгоритъмът се опитва да групира обекти в повече от 2 групи, тогава той се нарича мултикласова класификация.
  • Сила - Алгоритмите за класификация обикновено се представят много добре.
  • Недостатъци - Склонни са към свръхфитнес и може да са неограничени. Например - имейл класификатор за спам
  • Логистична регресия / класификация - Когато променливата Y е двоична категорична (т.е. 0 или 1), използваме логистична регресия за прогнозиране. Например - Предсказване дали дадена транзакция с кредитна карта е измама или не.
  • Naive Bayes Classifiers - Класификаторът Naive Bayes се основава на Байесовата теорема. Този алгоритъм обикновено е най-подходящ, когато размерът на входовете е голям. Състои се от ациклични графики, които имат един родител и много детски възли. Детските възли са независими един от друг.
  • Дървета на решенията - дърво на решения е структура на дърво като структура, която се състои от вътрешен възел (тест за атрибут), клон, който обозначава резултата от теста и листните възли, който представлява разпределението на класовете. Коренният възел е най-горният възел. Това е много широко използвана техника, която се използва за класификация.
  • Машина за поддръжка на вектора - Поддържаща машина е или SVM върши работата по класифицирането, като намира хиперплана, който трябва да увеличи максимално полето между 2 класа. Тези SVM машини са свързани към функциите на ядрото. Полетата, където SVMs се използват широко, са биометрия, разпознаване на образи и т.н.

Предимства

По-долу са някои от предимствата на контролираните модели за машинно обучение:

  1. Производителността на моделите може да бъде оптимизирана от потребителските преживявания.
  2. Контролираното обучение дава резултати, използвайки предишен опит, а също така ви позволява да събирате данни.
  3. Надзорните алгоритми за машинно обучение могат да се използват за прилагане на редица проблеми в реалния свят.

Недостатъци

Недостатъците на контролираното обучение са следните:

  • Усилията за обучение на контролирани модели за машинно обучение могат да отнемат много време, ако наборът от данни е по-голям.
  • Класификацията на големите данни понякога представлява по-голямо предизвикателство.
  • Човек може да се наложи да се справи с проблемите на преоборудването.
  • Имаме нужда от много добри примери, ако искаме моделът да се представи добре, докато тренираме класификатора.

Добри практики при изграждане на учебни модели

Добра практика е да се създават модели за контролирани учебни машини: -

  1. Преди да изградите добър модел на машинно обучение, трябва да се извърши процесът на предварителна обработка на данни.
  2. Човек трябва да реши алгоритъма, който трябва да е най-подходящ за даден проблем.
  3. Трябва да решим какъв тип данни ще се използват за обучителния набор.
  4. Необходимо е да се вземе решение относно структурата на алгоритъма и функцията.

заключение

В нашата статия научихме какво е контролирано обучение и видяхме, че тук тренираме модела, използвайки етикетирани данни. След това влязохме в работата на моделите и техните различни видове. Най-накрая видяхме предимствата и недостатъците на тези контролирани алгоритми за машинно обучение.

Препоръчителни статии

Това е ръководство за това какво е контролирано обучение ?. Тук обсъждаме концепциите, как работи, видове, предимства и недостатъци на контролираното обучение. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Какво е дълбокото обучение
  2. Контролирано обучение срещу задълбочено обучение
  3. Какво е синхронизация в Java?
  4. Какво е уеб хостинг?
  5. Начини за създаване на дърво за решения с предимства
  6. Полиномна регресия | Употреби и функции

Категория: