Разлики между контролирано обучение срещу задълбочено обучение
При контролирано обучение данните за обучение, които подавате към алгоритъма, включват желаните решения, наречени етикети. Типична контролирана учебна задача е класификацията. Спам филтърът е добър пример за това: той е обучен с много примерни имейли заедно с техния клас (спам или шунка) и трябва да се научи как да класифицира нови имейли.
Дълбокото обучение е опит за имитиране на активността в слоеве неврони в неокортекса, което е около 80% от мозъка, където се случва мисленето (В човешкия мозък има около 100 милиарда неврони и 100 ~ 1000 трилиона синапси). Нарича се дълбоко, защото има повече от един скрити слоеве неврони, които помагат да има множество състояния на нелинейна трансформация на характеристиките
Сравнение между главата на контролираното обучение срещу задълбоченото обучение (Инфографика)
По-долу е най-добрите 5 сравнения между контролирано обучение и задълбочено обучение
Ключови разлики между контролирано обучение срещу задълбочено обучение
И двете контролирано обучение срещу дълбокото обучение са популярни решения на пазара; нека да обсъдим някои от основните разлики между контролираното обучение срещу задълбоченото обучение:
● Основни модели -
Важни контролирани модели са -
○ k-Най-близки съседи - Използва се за класификация и регресия
○ Линейна регресия - за прогнозиране / регресия
○ Логистична регресия - за класификация
○ Поддържащи векторни машини (SVM) - Използва се за класификация и регресия
Es Дървета на решения и случайни гори - както задачи за класификация, така и регресия
Най-популярните дълбоки невронни мрежи:
● Многослойни перцептрони (MLP) - Най-основен тип. Тази мрежа обикновено е началната фаза на изграждане на друга по-сложна дълбока мрежа и може да се използва за всякакви контролирани регресии или проблеми с класификацията
● Autoencoders (AE) - Мрежата има непредвидени алгоритми за обучение за учене на функции, намаляване на размерите и откриване на външни размери
● Convolution Neural Network (CNN) - особено подходящ за пространствени данни, разпознаване на обекти и анализ на изображения с помощта на многоизмерни невронови структури. Една от основните причини за популярността на задълбоченото обучение напоследък се дължи на тези на CNN.
● Повтаряща се невронна мрежа (RNN) - RNN се използват за анализ на последователни данни, като например времеви серии, анализ на настроенията, NLP, езиков превод, разпознаване на реч, надпис на изображения. Един от най-разпространените видове RNN модел е мрежата за дългосрочна памет (LSTM).
● Данни за обучение - Както беше споменато по-рано, контролираните модели се нуждаят от данни за обучение с етикети. Но задълбоченото обучение може да обработва данни със или без етикети. Някои невронни мрежови архитектури могат да бъдат без надзор, като например автоенкодери и ограничени Boltzmann машини
● Избор на функции - Някои модели с надзор са способни да анализират функции и подмножество от функции, за да определят целта. Но през повечето време това трябва да се обработва във фаза на подготовка на данни. Но в Deep Neural Networks се появяват нови функции, а нежеланите функции се изхвърлят с напредък на обучението.
● Представяне на данни - В класическите контролирани модели не се създава абстракция на входните характеристики на високо ниво. Краен модел, опитващ се да прогнозира продукцията чрез прилагане на математически преобразувания върху подмножество от входни характеристики.
Но в дълбоките невронни мрежи абстракциите на входните характеристики се формират вътрешно. Например, докато превежда текст, невронната мрежа първо преобразува входния текст във вътрешно кодиране, след което трансформира това абстрахирано представяне в целевия език.
● Framework -Поддържаните ML модели се поддържат от много общи ML рамки на различни езици - Apache Mahout, Scikit Learn, Spark ML са някои от тях.
Основните рамки за дълбоко обучение осигуряват удобна за разработчиците абстракция, за да създават лесно мрежа, да се грижат за разпространението на изчисленията и да имат поддръжка за GPUs.Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow са популярни рамки. Tensorflow от Google е широко използван сега с активна поддръжка на общността.
Таблица за наблюдение на контролирано обучение срещу задълбочено обучение
По-долу е дадено ключово сравнение между супервизираното обучение срещу задълбоченото обучение
Основата на сравнението между контролирано обучение срещу задълбочено обучение | Контролирано обучение | Дълбоко учене |
Обучение по модел | Основни задачи в обучението -
| Основни задачи в обучението -
|
Потенциал на системата | Използва се за решаване на сравнително прости задачи, при които връзката с входните функции и целта е откриваема от хората и инженерната функция е пряка. Например:
| Дълбокото обучение може да върши наистина интелигентни задачи като
|
гъвкавост | Моделите са по-гъвкави, което спомага за лесното настройване на ML модела. Има добре дефинирани методи като мрежово търсене с кръстосана валидация, за да намерите правилните хиперпараметри | По-малко гъвкави, тъй като има много хиперпараметри за настройване като брой слоеве, броя на невроните на слой, вида на функцията за активиране, която да се използва във всеки слой, логиката на инициализация на теглото и много други. |
Представяне на функции | Получени или абстрактни функции, които трябва да бъдат създадени изрично. Например полиномни характеристики като вход за линеен регресионен модел | Абстрактно представяне на данни се генерира автоматично в скрити слоеве. Ето защо обучена невронна мрежа от CNN може да открие котка в изображение. |
Генеративни модели | Не е възможно да се генерира нещо оригинално, тъй като автоматичното абстрактно представяне на данни не се случва | Веднъж обучен, специфичен тип дълбока невронна мрежа може да генерира казват нови изображения, песни или текстове. Те се наричат GNN (Генеративна невронна мрежа) или GAN (Generative Adversarial Networks)
Някои реализации на този тип мрежа се използват за създаване на дори нови модни дизайни |
Заключение - Контролирано обучение срещу задълбочено обучение
Точността и способността на DNN (Deep Neural Network) s се увеличи значително през последните няколко години. Ето защо сега DNN са зона на активни изследвания и, ние вярваме, имат потенциал да развият Обща интелигентна система. В същото време е трудно да се разбере защо DNN дава конкретен изход, което прави фината настройка на мрежата наистина трудна. Така че, ако проблемът може да бъде решен с помощта на прости ML модели, силно се препоръчва да го използвате. Поради този факт, обикновената линейна регресия ще има значение, дори ако е разработена обща интелигентна система, използваща DNN.
Препоръчителен член
Това е ръководство за най-високите разлики между супервизираното обучение срещу задълбоченото обучение. Тук също така обсъждаме ключовите разлики между контролираното обучение срещу задълбоченото обучение с инфографиката и таблицата за сравнение. Може да разгледате и следните статии -
- Контролирано обучение срещу усилване
- Контролирано обучение срещу необучено обучение
- Невронни мрежи срещу дълбоко обучение
- Машинно обучение срещу прогнозна анализа
- TensorFlow срещу Caffe: Какви са разликите
- Какво е контролирано обучение?
- Какво е усилване на обучението?
- Топ 6 сравнения между CNN и RNN