Надзорно обучение срещу задълбочено обучение - 5 прости начина да научите

Съдържание:

Anonim

Разлики между контролирано обучение срещу задълбочено обучение

При контролирано обучение данните за обучение, които подавате към алгоритъма, включват желаните решения, наречени етикети. Типична контролирана учебна задача е класификацията. Спам филтърът е добър пример за това: той е обучен с много примерни имейли заедно с техния клас (спам или шунка) и трябва да се научи как да класифицира нови имейли.

Дълбокото обучение е опит за имитиране на активността в слоеве неврони в неокортекса, което е около 80% от мозъка, където се случва мисленето (В човешкия мозък има около 100 милиарда неврони и 100 ~ 1000 трилиона синапси). Нарича се дълбоко, защото има повече от един скрити слоеве неврони, които помагат да има множество състояния на нелинейна трансформация на характеристиките

Сравнение между главата на контролираното обучение срещу задълбоченото обучение (Инфографика)

По-долу е най-добрите 5 сравнения между контролирано обучение и задълбочено обучение

Ключови разлики между контролирано обучение срещу задълбочено обучение

И двете контролирано обучение срещу дълбокото обучение са популярни решения на пазара; нека да обсъдим някои от основните разлики между контролираното обучение срещу задълбоченото обучение:

● Основни модели -

Важни контролирани модели са -

k-Най-близки съседи - Използва се за класификация и регресия
Линейна регресия - за прогнозиране / регресия
Логистична регресия - за класификация
Поддържащи векторни машини (SVM) - Използва се за класификация и регресия
Es Дървета на решения и случайни гори - както задачи за класификация, така и регресия

Най-популярните дълбоки невронни мрежи:

Многослойни перцептрони (MLP) - Най-основен тип. Тази мрежа обикновено е началната фаза на изграждане на друга по-сложна дълбока мрежа и може да се използва за всякакви контролирани регресии или проблеми с класификацията

Autoencoders (AE) - Мрежата има непредвидени алгоритми за обучение за учене на функции, намаляване на размерите и откриване на външни размери

Convolution Neural Network (CNN) - особено подходящ за пространствени данни, разпознаване на обекти и анализ на изображения с помощта на многоизмерни невронови структури. Една от основните причини за популярността на задълбоченото обучение напоследък се дължи на тези на CNN.

Повтаряща се невронна мрежа (RNN) - RNN се използват за анализ на последователни данни, като например времеви серии, анализ на настроенията, NLP, езиков превод, разпознаване на реч, надпис на изображения. Един от най-разпространените видове RNN модел е мрежата за дългосрочна памет (LSTM).

Данни за обучение - Както беше споменато по-рано, контролираните модели се нуждаят от данни за обучение с етикети. Но задълбоченото обучение може да обработва данни със или без етикети. Някои невронни мрежови архитектури могат да бъдат без надзор, като например автоенкодери и ограничени Boltzmann машини

Избор на функции - Някои модели с надзор са способни да анализират функции и подмножество от функции, за да определят целта. Но през повечето време това трябва да се обработва във фаза на подготовка на данни. Но в Deep Neural Networks се появяват нови функции, а нежеланите функции се изхвърлят с напредък на обучението.

Представяне на данни - В класическите контролирани модели не се създава абстракция на входните характеристики на високо ниво. Краен модел, опитващ се да прогнозира продукцията чрез прилагане на математически преобразувания върху подмножество от входни характеристики.
Но в дълбоките невронни мрежи абстракциите на входните характеристики се формират вътрешно. Например, докато превежда текст, невронната мрежа първо преобразува входния текст във вътрешно кодиране, след което трансформира това абстрахирано представяне в целевия език.

Framework -Поддържаните ML модели се поддържат от много общи ML рамки на различни езици - Apache Mahout, Scikit Learn, Spark ML са някои от тях.
Основните рамки за дълбоко обучение осигуряват удобна за разработчиците абстракция, за да създават лесно мрежа, да се грижат за разпространението на изчисленията и да имат поддръжка за GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow са популярни рамки. Tensorflow от Google е широко използван сега с активна поддръжка на общността.

Таблица за наблюдение на контролирано обучение срещу задълбочено обучение

По-долу е дадено ключово сравнение между супервизираното обучение срещу задълбоченото обучение

Основата на сравнението между контролирано обучение срещу задълбочено обучение Контролирано обучение Дълбоко учене
Обучение по моделОсновни задачи в обучението -

  • Итерайте чрез тренировъчни случаи, най-вече като мини партиди, и актуализирайте теглата, приложени за функции.
  • Посока на актуализиране на теглото (нарастване или намаляване), определена от някои индикатори, като градиент на грешка, функция wrt тегло.
  • И накрая, целта се формулира като преобразуване на претеглена сума от подмножества.
Основни задачи в обучението -

  • Броят на тежестите, които трябва да се актуализират, е много голям, ако има няколко скрити слоя в повече.
  • Грешка в целевата стойност, изчислена първо и разпространена обратно към всеки слой
  • Намерете частичната производна на функцията за грешки wrt тегло и актуализирайте теглата, за да намалите грешката.
Потенциал на систематаИзползва се за решаване на сравнително прости задачи, при които връзката с входните функции и целта е откриваема от хората и инженерната функция е пряка. Например:

  • Биномиална или многокласова класификация като класифициране на клиентите въз основа на начина им на взаимодействие с уебсайт.
  • Прогнозирайте стойността на недвижимите имоти с помощта на подобни събрани данни.
Дълбокото обучение може да върши наистина интелигентни задачи като

  • Класификация на изображенията на ниво човек
  • Разпознаване на речта на ниво човек
  • Препис на почерк на ниво човек
  • Подобрен машинен превод
  • Дигитални асистенти като Google Now и Amazon Alexa
гъвкавостМоделите са по-гъвкави, което спомага за лесното настройване на ML модела. Има добре дефинирани методи като мрежово търсене с кръстосана валидация, за да намерите правилните хиперпараметриПо-малко гъвкави, тъй като има много хиперпараметри за настройване като брой слоеве, броя на невроните на слой, вида на функцията за активиране, която да се използва във всеки слой, логиката на инициализация на теглото и много други.
Представяне на функцииПолучени или абстрактни функции, които трябва да бъдат създадени изрично. Например полиномни характеристики като вход за линеен регресионен моделАбстрактно представяне на данни се генерира автоматично в скрити слоеве. Ето защо обучена невронна мрежа от CNN може да открие котка в изображение.
Генеративни моделиНе е възможно да се генерира нещо оригинално, тъй като автоматичното абстрактно представяне на данни не се случваВеднъж обучен, специфичен тип дълбока невронна мрежа може да генерира казват нови изображения, песни или текстове. Те се наричат ​​GNN (Генеративна невронна мрежа) или GAN (Generative Adversarial Networks)

Някои реализации на този тип мрежа се използват за създаване на дори нови модни дизайни

Заключение - Контролирано обучение срещу задълбочено обучение

Точността и способността на DNN (Deep Neural Network) s се увеличи значително през последните няколко години. Ето защо сега DNN са зона на активни изследвания и, ние вярваме, имат потенциал да развият Обща интелигентна система. В същото време е трудно да се разбере защо DNN дава конкретен изход, което прави фината настройка на мрежата наистина трудна. Така че, ако проблемът може да бъде решен с помощта на прости ML модели, силно се препоръчва да го използвате. Поради този факт, обикновената линейна регресия ще има значение, дори ако е разработена обща интелигентна система, използваща DNN.

Препоръчителен член

Това е ръководство за най-високите разлики между супервизираното обучение срещу задълбоченото обучение. Тук също така обсъждаме ключовите разлики между контролираното обучение срещу задълбоченото обучение с инфографиката и таблицата за сравнение. Може да разгледате и следните статии -

  1. Контролирано обучение срещу усилване
  2. Контролирано обучение срещу необучено обучение
  3. Невронни мрежи срещу дълбоко обучение
  4. Машинно обучение срещу прогнозна анализа
  5. TensorFlow срещу Caffe: Какви са разликите
  6. Какво е контролирано обучение?
  7. Какво е усилване на обучението?
  8. Топ 6 сравнения между CNN и RNN