Въведение в машинното обучение

Машинното обучение (ML) е изкуство за разработване на алгоритми без изрично програмиране. През последните две десетилетия бяха генерирани данни от излишъци и повечето от индустриите бяха изцяло цифровизирани. Тези съществуващи данни се използват от алгоритмите за машинно обучение (ML) за разработване на прогнозни модели и автоматизиране на няколко отнемащи време задачи.

Нека да видим как ML алгоритмите се различават от програмираните логически базирани алгоритми:

За алгоритъм, базиран на логика, потокът е добре дефиниран и известен предварително, но има няколко сценария в реалния живот (например класификация на изображенията), където логиката не може да бъде дефинирана. В такива случаи машинното обучение се оказа изключително полезно. Техниките за машинно обучение вземат входни параметри и очаквани референтни изходни данни и генерират логика, която след това се внедрява в производство.

Основни компоненти на въвеждането в машинното обучение:

Машинното обучение е разделено на следните категории:

1. Контролирано машинно обучение

Надзорният ML алгоритъм приема входни данни (функции), заедно с изходни данни, маркирани на входа. Те се използват най-вече за задачи за класификация и регресия.

Класификация:

  • Решение за допустимост на заем : Автоматизирайте процеса на одобрение на заем, използвайки минали данни с параметри като възраст, доходи, образование, град и т.н., за да решите дали заемът на кандидата може да бъде одобрен.

Регресия:

  • Прогнозиране на цената на къщата : Предвидете цената на къщата, като използвате функции като размер на къщата, възраст на къщата, брой стаи, населено място и т.н.

2. Ненадзорно машинно обучение

Техниките, които не се контролират от ML, не изискват никакви етикетирани данни и се използват за групиране на данни в различни сегменти въз основа на входните функции.

Пример: За да се раздели група от 100 души в 5 клъстера, функциите за въвеждане могат да включват интереси, хобита, социални връзки и т.н.

Приложения на машинно обучение

През изминалото десетилетие въвеждането в машинното обучение преобрази няколко индустрии, включително здравеопазване, социални медии, дигитален маркетинг, недвижими имоти, логистика, верига на доставки и производство. Ранните участници в тези индустрии вече са донесли значителни печалби. Нараства търсенето на квалифицирана работна сила с машинно обучение заедно с познанията в областта.

Следват няколко приложения, в които техниките на ML са изиграли съществена роля:

  • Класификация на спам:

За класифициране на пощата като спам / не спам, използвайки етикетирани отговори с използване на данни като съдържание на съобщения, използване на речник, използван в промоционални имейли, имейл адрес на изпращача, IP на изпращача, използване на хипервръзки, препинания на номера и др.

  • Раково откриване:

ML все по-често се използва в здравеопазването за диагностика и дори за откриване на рак, използвайки медицински данни за предишни пациенти. За откриване на рак на гърдата алгоритъмът за обучение взема като вход данни като размер на тумора, радиус, кривина и периметър. На изхода получаваме вероятността туморът да е злокачествен или не.

  • Прогнози за продажбите :

Все по-голям брой доставчици дигитализират своите записи, много от тях са започнали да използват инструменти за машинно обучение за прогнозиране на продажбите на конкретния артикул за дадена седмица, за да могат да запасят достатъчно количество инвентар. Въведение в техниките за машинно обучение биха взели принос от продажбите за предмети от миналата година и биха намерили модели за сезонни вариации и да дадат конкретни прогнози за продажбата на определени артикули. Можем също така да идентифицираме продукти с ниска ефективност по отношение на продажбите.

  • Разпознаване на лица:

Вероятно сте забелязали, докато качвате снимки във Facebook, че той маркира лицата на вашия приятел към имената им. В резервната машина / алгоритмите за дълбоко обучение вършат тази работа. Същото основно въведение в принципите на машинното обучение се използва и за разпознаване на лица, където входните изображения на лица се подават и невронните мрежи се обучават да класифицират тези изображения.

  • Класификация на текста:

С увеличаването на населението, идващо онлайн, стана задължително за уебсайтове / социални медийни компании като Twitter, Facebook, Quora да внедряват системи, базирани на текстова класификация. Twitter / Quora използва това за идентифициране на коментари / публикации на омраза. Някои новинарски компании също използват алгоритми за класифициране на текст, за да групират статии, които са подобни.

  • Аудио / гласова интерпретация:

Някога се чудите как устройства като Alexa, Siri, Google стават интелигентни всеки ден в разбирането на аудио данни на различни езици с различни акценти. Огромно количество данни се обучава в тези устройства за въвеждане в техниките за машинно обучение, което прави възможно.

  • Системи за откриване на измами:

Системите за откриване на измами на базата на ML са внедрени от няколко компании за електронна търговия, за да идентифицират клиенти, създаващи фалшиви поръчки, а също така да елиминират доставчици, продаващи фалшиви продукти в платформата. Банковите индустрии и други стартиращи финансови технологии в голяма степен разчитат на техниките на ML за откриване на сделки с измами

  • Препоръчителни двигатели

Netflix използва без надзор ML, за да препоръчва филми, докато Amazon го използва, за да препоръча продукти за закупуване.

Предимства

  • Автоматизиране на отнемащи време задачи:

ML-базирани приложения са автоматизирали няколко задачи като вземане на решения на ниско ниво, въвеждане на данни, телефонни обаждания, процедури за одобрение на заем.

  • Спестяване на разходи:

След като алгоритъмът бъде разработен и пуснат в производство, той може да доведе до значителна икономия на разходи, тъй като човешкият труд и вземането на решения са минимални.

  • Време за изпълнение:

За много приложения общото време е от първостепенно значение. ML е успял да намали времето в области като автострахователни претенции, при които потребителят качва снимки и застрахователната сума се изчислява. Той също така е помогнал на компаниите за електронна търговия в обработката на възвръщаемостта на продадения инвентар.

  • Вземане на решения, основано на данни:

Не само корпорациите, но и много правителства разчитат на МЛ, за да вземат решение при вземането на решения в кои проекти да инвестират и как да използват оптимално съществуващите ресурси.

Недостатъци

  • ML алгоритмите могат да бъдат предубедени:

Много пъти входните данни към алгоритъма на ML са пристрастни към конкретен пол, раса, държава, каст и т.н. Това води до ML алгоритми, разпространяващи нежелани пристрастия в процеса на вземане на решения. Това е наблюдавано в някои приложения, които разгръщат процес на приемане в училище / колеж, както и препоръки за социални медии.

  • Изисквайте големи данни, за да постигнете приемлива точност:

Въпреки че хората могат да се учат лесно за малки набори от данни, за някои приложения въвеждането в машинно обучение изисква огромни количества данни, за да се постигне достатъчна точност.

  • Манипулирайте потребителското решение:

Наскоро Cambridge Analytica, аналитична фирма използва алгоритми на ML в социалните медии, за да насочи и повлияе на решението на избирателите.

  • Понастоящем Въведение в алгоритъма за машинно обучение може да е подходящо за бъдещето:

Техниката на ML, обучени на текущия набор от данни, може да не е подходяща за бъдещето, тъй като разпределението на входа може да се промени значително с течение на времето. Едно от контрамерките за преодоляване на това е периодичното обучение на модела.

Препоръчителни статии

Това е ръководство за Въведение в машинното обучение. Тук сме обсъдили машинното обучение с основните точки и характеристики на въвеждането в машинното обучение. Можете също да разгледате следните статии:

  1. Техники за машинно обучение
  2. Машинно обучение срещу невронна мрежа
  3. Кариери в машинното обучение
  4. Разлика между големите данни срещу машинно обучение
  5. Хиперпараметрово машинно обучение

Категория: