Въведение в клъстеринга в машинното обучение

Първо ще разберем машинното обучение. Можем да видим, че данните нарастват бързо около нас. Данните се получават под различни форми като видео, аудио, снимки и т.н. Клъстерирането в машинно обучение използва тези данни, за да отговори на въпроса. Например (откриване на кожно заболяване) лекарят ще използва машинно обучение, за да разбере знака върху кожата и ще предвиди какъв вид заболяване е той. Клъстерирането не е нищо друго, освен групирането на необелязани набори от данни. Нека вземем пример за вашия филм (който искате да гледате). Може да харесате романтични филми, но сестра ви харесва комедийни филми. Може да харесате романтични филми на Боливуд или холивудски романтични филми. Но сестра ви харесва комедийните филми от Телегу, тук можете да видите, а сестра ви има различен избор на филми. И двамата сте открили информация за дълбочината на филмите. Тук сме групирали без етикети набор от данни (филми) за гледане на филма.

Как работи клъстерирането в машинно обучение?

В клъстеризирането групираме набор от без етикети, който е известен като обучение без надзор. Когато за първи път групираме незабелязани данни, трябва да намерим подобна група. Когато създаваме група, трябва да разберем характеристиките на наборите от данни, т.е. подобни неща. Ако създадем група по една или две характеристики, е лесно да се измери сходството.

  • Пример №1: Филми от режисьора. След като клъстерирането приключи, на всеки клъстер се присвоява номер на клъстер, който е известен като ClusterID. Система за машинно обучение като YouTube използва clusterID, за да представя най-лесно сложните данни.
  • Пример №2: YouTube използва историята на търсенията ни или гледаната история и предлага видеоклипове, които може да ни харесат. Набор от данни за функции за Facebook съдържа хора, които следваме, страници, които следваме, коментари, които въвеждаме, снимки или видеоклипове, които харесваме, снимки или снимки, на които маркираме. Клъстерирането на видео или снимка във Facebook ще замени набор от функции с единичен clusterID поради компресиране на данни.

Топ 4 метода за клъстеринг в машинно обучение

По-долу са методите на клъстеринг в машинно обучение:

1. Йерархична

Клъстерирането на име определя начин на работа, този метод формира клъстер по йерархичен начин. Новият клъстер се формира с помощта на предварително оформена структура. Трябва да разберем разликите между подхода Divisive vs Aglomerative. Агломерацията е подход отдолу нагоре, той започва с отделни точки в клъстер и комбинира някои произволни. Разделянето започва с един клъстер, всички точки в клъстер и го разделят на множество клъстери.

2. На базата на плътност

При този метод плътният регион се разглежда като клъстер, който има някои прилики. Тя е различна от долната плътна област на пространството на обекта. DBSCAN е известен като базирана на плътност пространствено групиране на приложения с шум. За ориентиране към обект на данни DBSCAN търси някакъв epsilon, ние задаваме някакъв радиус epsilon и минималния брой точки. В радиус, ако надминем някакъв минимален брой точки, тогава класираме клъстер с висока плътност. Така че по този начин можем да разгледаме данни с регион с висока плътност. DBSCAN се различава от центъра на метода на клъстеризиране, тъй като не е строг подход. Точките на шума са точки в области с ниска плътност, които са оставени без етикет или етикетирани като остатъци. Това е причината да не се нуждаем от конкретна K. Можем да определим минимални точки за регион с висока плътност и радиус, който искаме да бъде регион или клъстери.

3. Разделяне

Когато имаме набор от данни за N брой обекти. Този метод изгражда "K" като дял на данните. Този дял е клъстерът, т.е. конструкт K, дял (K <= N).

Изисквания, които трябва да бъдат изпълнени:

  • Всяка група или набор от данни трябва да съдържа поне един обект.
  • Всеки обект трябва да принадлежи само на една група.

Един от примерите за разделяне е групиране с K-средства.

4. Въз основа на решетка

Обектно пространство, ограничен брой клетки образува структура на решетката. Този метод осигурява бърза обработка на клъстери. Те са независими от пространството на обекта.

Приложения на клъстеринг в машинно обучение

По-долу са приложенията на клъстеринга в машинното обучение:

1. Медицински

Лекарят може да използва алгоритъм за групиране, за да открие откриването на болестта. Нека вземем пример за заболяване на щитовидната жлеза. Наборът от данни за заболяване на щитовидната жлеза може да бъде идентифициран с помощта на алгоритъм за клъстериране, когато прилагаме безконтролно обучение върху набор от данни, съдържащ набор от данни за щитовидната и не-щитовидната жлеза. Клъстерирането ще установи причината за заболяването и ще даде успешно търсене на резултат.

2. Социална мрежа

Ние сме поколението на ерата в интернет, можем да се срещнем с всеки човек или да се запознаем с всяка индивидуална идентичност чрез интернет. Сайтовете в социалните мрежи използват клъстеринг за разбиране на съдържанието, хората или мястото на потребителя. Когато непредвиденото обучение се използва в социалното, е полезно за превода на език. Например Instagram и Facebook предоставят функцията за превод на език.

3. Маркетинг

Можем да видим или наблюдаваме, че различна технология нараства до нас и хората привличат да използват тези технологии като облак, дигитален маркетинг. За да привлече по-голям брой клиенти, всяка компания разработва лесни за използване функции и технологии. За да разберем клиента, можем да използваме клъстеринг. Клъстерирането ще помогне на компанията да разбере потребителския сегмент и след това да категоризира всеки клиент. По този начин можем да разберем клиента и да намерим прилики между клиентите и да ги групираме.

4. Банково дело

Забелязахме, че измама с пари се случва около нас и компанията предупреждава клиентите за това. С помощта на клъстеринг застрахователните компании могат да намерят измама, да признаят клиентите за това и да разберат политиките, внесени от клиента.

5. Google

Google е една от търсещите хора, които хората използват. Да вземем пример, когато търсим някаква информация като зоомагазин в района, Google ще ни предостави различни опции. Това е резултат от клъстеризиране, групиране на подобен резултат, който ви се предоставя.

заключение

Научихме за клъстеринг и машинно обучение. Начин на групиране работи в машинното обучение. Информация за обучението без надзор. Използване в реално време на неуправляемо обучение. Методи за групиране и как работи всеки метод в машинното обучение.

Препоръчителен член

Това е ръководство за клъстеринг в машинно обучение. Тук обсъждаме топ 4 метода за групиране в машинното обучение заедно с приложенията. Можете да разгледате и другите ни предложени статии, за да научите повече -
  1. Рамки за машинно обучение Топ 10
  2. K- означава алгоритъм за клъстериране с предимства
  3. Въведение в техниките за машинно обучение
  4. Модели за машинно обучение | Топ 5 вида
  5. Машинно обучение C ++ библиотека

Категория: