Въведение в безконтролното машинно обучение

Замисляли ли сте се как едно дете е в състояние да прави разлика между ябълки и портокали, когато не знае какви са всъщност, какъв вкус е, но въз основа на цвят и размер той може да ги раздели на 2 групи без предварителна информация? Можем ли да очакваме същата сегментация, която детето прави от машините, ако имаме информация за цвета и размера? Да видим как можем да направим това! В тази тема ще научим за Неуправляемото машинно обучение.

„Машинното обучение“, както терминът подсказва, че учим машини да изпълняват човешки задачи и как хората се учат, било от някого, или чрез наблюдение. Същото като хората, начинът, по който машината се учи.

Машинното обучение може да бъде разделено на 3 части: -

  1. Контролирано обучение
  2. Неуправляемо обучение
  3. Укрепване на обучението

Видове машинно обучение

Укрепването на обучението е базирано на агент агентство, което включва награда и наказание за действия, предприети от агент. Крайната цел е да се увеличи максимално възнаграждението в процеса на учене от околната среда.

Когато имате входно-изходни данни, накратко, етикетирани данни, например, дадена височина и тегло, за да определите дали човек е мъж или жена, може да се счита за контролирана учебна задача (от някой в ​​случая с хора).

Но в много сценарии от реалния живот тези етикетирани или пояснени данни не винаги са налични. Много пъти се сблъскваме с проблеми при сегментиране на обекти въз основа на техните свойства, които не са изрично споменати. Как да решим този проблем? Е, неподдържаното обучение е решението.

Уикипедия казва, че непредвиденото обучение е вид самоорганизирано обучение на хебианци, което помага да се намерят неизвестни досега модели в набора от данни без предварително съществуващи етикети. При неуправляемото обучение нямаме информация за етикети, но все пак искаме да добием представа от данните въз основа на различните му свойства.

Видове безконтролно машинно обучение

Неуправляемите учебни задачи могат да бъдат разделени до 3 категории:

  1. Асоциация правило за добив
  2. Групирането
  3. Система за препоръчване

1. Майнинг на правилата за асоцииране

Когато имаме данни за транзакциите за нещо, това може да е за продукти, продавани или всякакви данни за транзакциите за това, искам да знам, има ли някаква скрита връзка между купувача и продуктите или продукта към продукта, така че мога по някакъв начин да използвам тази информация за да увелича продажбите си. Извличането на тези взаимоотношения е ядрото на Асоциацията за управление на правила. Можем да използваме алгоритмите за растеж AIS, SETM, Apriori, FP за извличане на връзки.

2. Клъстеризиране

Клъстерирането може да бъде направено с всякакви данни, където нямаме информация за класа или етикета. Искаме да групираме данните така, че наблюденията с подобни свойства да принадлежат към един и същ клъстер / група, а разстоянието между клъстерите трябва да е максимално. Като има предвид, че вътрешно-клъстерното разстояние трябва да бъде минимално. Можем да обединим данните на избирателите, за да разберем мнението за правителството или клъстерните продукти въз основа на техните характеристики и използване. Населението на сегментите въз основа на характеристиките на доходите или използване на клъстеризацията в продажбите и маркетинга.

Можем да използваме K-средства, K-средства ++, K-Medoids, размити C-средства (FCM),

Очакване-максимизация (ЕМ), Агломеративно клъстериране, DBSCAN, видове йерархично клъстериране като единична връзка, цялостна връзка, средна връзка, алгоритми на метода на Уорд за клъстеризиране.

3. Система за препоръчване

Системата за препоръки е в основата на разширение на извличането на правила за асоцииране в смисъл, в ARM ние извличаме взаимоотношения, а в система за препоръки използваме тези взаимоотношения, за да препоръчаме нещо, което има по-големи шансове за приемане от крайния потребител. Системите за препоръки придобиха популярност, след като през 2009 г. Netflix обяви голяма награда от 1 000 000 щатски долара.

Препоръчителните системи работят върху транзакционните данни, било то финансова транзакция, електронна търговия или транзакция за хранителни стоки. В днешно време гигантските играчи в индустрията за електронна търговия примамват клиенти, като правят персонализирана препоръка за всеки потребител въз основа на тяхната минала история на покупките и подобни данни за поведение за покупки от други потребители.

Методите за разработване на системи за препоръчване могат да бъдат разделени до голяма степен на съвместно филтриране и филтриране въз основа на съдържанието. В съвместното филтриране отново имаме потребител-потребител Съвместно филтриране и Елемент-Елемент за съвместно филтриране, които са базирани на паметта подходи и Матрична факторизация и Сингулярно разлагане на стойност (SVD) са базирани на модела подходи.

Приложения на неуправляемото обучение

Тъй като данните в света се увеличават изключително много с всеки изминал ден, обучението без надзор има много приложения. Ние винаги създаваме данни, използвайки платформи за социални медии или някакво видео съдържание в YouTube и много пъти дори не правим умишлено. Всички тези данни са неструктурирани и етикетирането им за контролирани учебни задачи ще бъде уморително и скъпо.

Следват няколко готини приложения на безконтролно машинно обучение.

  1. Магазин за хранителни стоки или магазин / пазар за електронна търговия: Правила за асоцииране на извличане от данни за клиентите на транзакциите и препоръки за потребителите да купуват продукти.
  2. Платформа за социални медии: извличайте връзки с различни потребители, за да предлагате продукти или услуги. Препоръчайте на новите хора за социална връзка.
  3. Услуги: Препоръки за туристически услуги, препоръка на къщи за наемане или услуги по сватовство.
  4. Банково дело: Клъстерни клиенти въз основа на техните финансови транзакции. Клъстерна измамна сделка за откриване на измами.
  5. Политика: Мненията на избирателите на клъстери относно шансовете за победа за определена партия.
  6. Визуализация на данни: С клъстеризиране и t-разпределено стохастично съседско вграждане (t-SNE) можем да визуализираме данни с големи размери. Също така, това може да се използва за намаляване на размерите.
  7. Забавление: Препоръки за филми, музика, както правят Netflix и Amazon.
  8. Сегментиране на изображението: Части от изображения на клъстери въз основа на най-близките стойности на пиксела.
  9. Съдържание: персонализирани вестници, препоръки на уеб страници, приложения за електронно обучение и филтри за електронна поща.
  10. Структурно откритие: С клъстеризиране можем да открием всяка скрита структура в данните. Данни за туитър на клъстери за анализ на настроенията.

заключение

Ненадзорното машинно обучение не е твърде количествено измеримо, но може да реши много проблеми, при които контролираните алгоритми се провалят. Има много приложения за безконтролно обучение в много области, където имаме неструктурирани и необелязани данни. Можем да използваме неподдържани техники на обучение, за да научим нашите машини да вършат по-добра работа от нас. През последните години машините превъзхождаха хората по отношение на задачите, които се считат за решавани от векове. Надявам се с тази статия да разберете какво е и как неподдържаните техники за машинно обучение могат да се използват за решаване на проблеми в реалния свят.

Препоръчителни статии

Това е ръководство за Неуправляемото машинно обучение. Тук обсъждаме видовете машинно обучение и видовете безконтролно машинно обучение заедно с неговите приложения. Може да разгледате и следните статии, за да научите повече -

  1. Алгоритми за машинно обучение
  2. Какво е машинно обучение?
  3. Въведение в машинното обучение
  4. Инструменти за машинно обучение
  5. Клъстеризиране в машинно обучение
  6. Хиперпараметрово машинно обучение
  7. Йерархичен алгоритъм на клъстериране
  8. Йерархично клъстериране | Агломеративно и разделно клъстеризиране
  9. Топ 8 етапа на жизнения цикъл на машинното обучение

Категория: