Въведение във видовете алгоритми за машинно обучение

Видовете алгоритми за машинно обучение или изчисления на AI са програми (математика и обосновка), които се променят, за да се представят по-добре, тъй като са представени на повече информация. „Адаптирането“ на част от ИИ предполага, че тези проекти променят начина, по който обработват информация след известно време, както и хората променят начина, по който обработват информация, като учат. Така че машинното обучение или AI изчислението е програма с конкретен метод за промяна на собствените му параметри, предвид критиките на предишните му изложби, които правят очаквания за набор от данни.

Всички видове алгоритми за машинно обучение

Техните определени разновидности как да се характеризират видовете алгоритми за машинно обучение, но обикновено те могат да бъдат разделени на класове според мотивацията им, а основните класификации са придружаващи:

  1. Контролирано обучение
  2. Неуправляемо обучение
  3. Полу-контролирано обучение
  4. Укрепване на обучението

Какво е контролирано обучение

Контролираното обучение е мястото, където можете да считате, че обучението се ръководи от инструктор. Имаме набор от данни, който работи като преподавател и задачата му е да подготви модела или машината. Когато моделът се подготви, той може да започне да се примирява с очакване или избор, когато му бъде предоставена нова информация.

Пример за контролирано обучение:

  1. Получавате много фотографии с данни за това какво има върху тях и след това обучавате модел за възприемане на нови фотографии.
  2. Имате много данни за цените на жилищата въз основа на техния размер и местоположение и ги въвеждате в модела и го обучавате, тогава можете да прогнозирате цената на други къщи въз основа на данните, които храните.
  3. ако искате да предскажете, че вашето съобщение е спам или не се основава на по-старо съобщение, което имате, можете да предскажете, че ново съобщение е спам или не.

Управляваният алгоритъм за обучение е както следва:

1) Линейна регресия

линейна регресия е ценна за откриване на връзката между два устойчиви фактора. Единият е предиктор или автономна променлива, а другият е променлива реакция или отделение. Той търси измерима връзка, но не детерминирана връзка. Казва се, че връзката между два фактора е детерминистична при изключен шанс, че една променлива може да бъде предавана точно от другата. Например, използвайки температура в градус по Целзий, е възможно точно да се предвиди Фаренхайт. Фактическата връзка не е точна при определяне на връзка между два фактора. Например, връзка някъде в диапазона на височина и тегло. Централната мисъл е да се получи линия, която най-добре отговаря на информацията. Най-подходящата линия е тази, за която цялата грешка на прогнозата (всички информационни фокуси) са толкова малко, колкото може да се очаква при обстоятелствата. Грешката е разделянето между точката до линията на регресия.

2) Дървета на решения

Дърво на решения е приспособление за помощ при вземане на решения, което използва дървообразна диаграма или модел на решения и техните потенциални резултати, включително резултати от случайни събития, разходи за ресурси и полезност. Разгледайте изображението, за да получите настроение за това, което прилича.

3) Класификация на наивните Bayes

Naive Bayes класифицира група от основни вероятностни класификатори, зависещи от прилагането на теорията на Bayes със силно (неособено) самоуправление на характеристиките Naive Bayes. Тази класификация Някои от сертифицираните модели са:

За да подпечатате имейл като спам или не спам

Поръчайте новини за иновациите, правителствените проблеми или спорта

Проверете докосване на субстанция, предаваща положителни емоции или отрицателни настроения?

Използва се за програмиране на разпознаване на лица.

4) Логистична регресия

Логистичната регресия е основополагащ фактически метод за демонстриране на биномиален резултат с поне един информативен фактор. Той измерва количествено връзката между абсолютната променлива на отделението и поне един свободен коефициент чрез оценка на вероятностите, използващи логистичен капацитет, който е комбинираният логистичен присвояване.

Обикновено регресиите ще бъдат приложими в реалния живот като:

Кредитен рейтинг

Мярката на успеваемостта на пазара или компанията

За да прогнозирате приходите на която и да е фирма или всеки продукт

Има ли земетресение всеки ден?

5) Обикновена регресия на най-малките квадрати

Най-малко квадратчета е стратегия за извършване на директна регресия. директната регресия е предприемането на поставяне на линия чрез много фокуси. Има различни потенциални процедури за това и системата „най-обикновени най-малки квадратчета“ върви по този начин - можете да начертаете линия и след това за всички центрове за данни да измерите вертикалното откъсване между точката и линията и да ги включите нагоре; монтираната линия ще бъде мястото, където тази съвкупност от дялове е толкова бедна, колкото би могло да бъде нормално в светлината на настоящата ситуация.

Какво е необучение?

Моделът се учи чрез възприятие и открива структури в информацията. Когато моделът има набор от данни, той следователно открива примери и връзки в набора от данни, като прави групи в него. Това, което не може да направи, е да добави маркировки към снопа, подобно на него не може да се посочи това събиране на ябълки или манго, но това ще изолира всяка една ябълка от манго.

Да предположим, че сме показали на модела снимки на ябълки, банани и манго, така че това, което прави, в светлината на някои примери и връзки прави групи и дялове набора от данни в тези групи. В момента, ако друга информация е засилена към модела, тя я добавя към един от направените групи.

Пример за неуправляемо обучение

  1. Имате много снимки на 6 индивида, но без данни кой е на кой и трябва да изолирате този набор от данни в 6 купи, всяка със снимките на един човек.
  2. Имате частици, част от тях са лекарства, а част не са, но не осъзнавате кой ще бъде кой и се нуждаете от изчислението, за да намерите лекарствата.

Неподдържаният алгоритъм за обучение е както следва

Групирането

Клъстеризирането е важна идея по отношение на безпроблемното обучение. В по-голямата си част той успява да намери структура или пример при събиране на категоризирана информация. Изчисленията на клъстеринг ще обработят вашата информация и ще открият характерни клъстери (групи) в случай, че те съществуват в информацията. Можете също така да промените какъв брой снопове трябва да разграничите. Позволява ви да промените подробностите на тези събития.

Има различни видове клъстеринг, които можете да използвате

  1. Избирателен (разпределение)
  2. Модел: K-означава
  3. Agglomerative
  4. Модел: Йерархично групиране
  5. покритие
  6. Модел: Размити C-средства
  7. Вероятностни

Видове алгоритъм за клъстериране

  1. Йерархично групиране
  2. K-означава групиране
  3. K-NN (k най-близки съседи)
  4. Анализ на основните компоненти
  5. Разлагане на единична стойност
  6. Анализ на независимите компоненти
  7. Йерархична клъстеризация
Йерархична клъстеризация

Йерархичното клъстериране е изчисление, което изгражда кълващ ред на групите. Започва с всяка една информация, която се излъчва към тяхната собствена група. Ето, две близки групи ще бъдат в подобен куп. Това изчисление се затваря, когато е останала само една група.

К-означава клъстериране

K означава, че това е итеративно изчисляване на клъстерите, което ви насърчава да намерите най-забележителния стимул за всеки акцент. Отначало се избира идеалният брой групи. При тази техника на клъстеринг трябва да съберете информация, която е фокусирана върху k събития. По-голям k означава по-малко събирания с по-голяма гранулиране по подобен начин. По-ниско k означава по-големи събирания с по-малко гранули.

Доходността на изчислението е събиране на „имена“. Тя позволява информацията да насочва към една от k събиранията. При клъстеризиране на k означава, че всяко събиране се характеризира с извършване на центроид за всяко събиране. Центроидите са като сърцевината на купчината, която хваща фокусите, които са най-близо до тях и ги добавя към групата.

К-средното групиране допълнително характеризира две подгрупи

  1. Агломеративно групиране
  2. дендрограма
Агломеративно групиране

Този вид групиране с K-средства започва с фиксиран брой групи. Той обозначава цялата информация в точен брой групи. Тази стратегия за клъстериране не изисква броя на групите K като информация. Процедурата на агломерация започва с оформянето на всяка дата като единична група.

Тази стратегия използва някаква мярка за отделяне, намалява броя на групите (по един на всеки акцент) чрез комбиниране на процеса. В заключение имаме една основна група, която съдържа всяка една от статиите.

дендрограма

В техниката на клъстериране на Dendrogram всяко ниво ще говори с възможен куп. Височината на дендрограмата демонстрира степента на приличие между две групи за присъединяване. Колкото по-близо до основата на процедурата те са прогресивно сравними групи, което е находката от дендрограма, която не е характерна и в по-голямата си част абстрактна.

K-Най-близки съседи

K-най-близкият съсед е най-прямият от всички класификатори на AI. Той се различава от другите AI процедури по това, че не предоставя модел. Това е просто изчисление, което съхранява всеки един достъпен случай и характеризира нови примери, зависещи от мярка за подобие.

Работи много добре, когато има разделяне между моделите. Коефициентът на обучение е умерен, когато комплектът за подготовка е огромен, а разделението е нетривиално.

Анализ на основните компоненти

С изключение на вероятността да имате нужда от пространство с по-големи размери. Трябва да изберете причина за това пространство и само 200-те най-значителни резултати от тази предпоставка. Тази база е известна като основен компонент. Подмножеството, което изберете, е друго пространство, което е с малки размери, контрастирано с уникално пространство. Той запазва обаче голяма част от многостранния характер на информацията, както може да се очаква.

Какво е усилване на обучението?

Това е способността на специалист да си сътрудничи със земята и да открие кой е най-добрият резултат. Той преследва идеята за хит и предварителна техника. Операторът се възнаграждава или наказва с точка за правилен или неоснователен отговор и въз основа на положителните фокуси за награди, подбрани от самия модел. Също така, веднъж подготвен, той се подготвя да предвиди новата информация, въведена в него.

Пример за усилване на обучението

  1. Показване на реклами в съответствие с харесваните от потребителите оптимизации за дългосрочен период
  2. Знайте бюджета на рекламите, използван в реално време
  3. обратно усилване, научавайки се да познавате клиентите като не харесва по-добре

Какво е полу-контролирано обучение?

Полу-контролиран вид обучение, изчислението се подготвя въз основа на комбинация от имена и необелязана информация. Обикновено тази смес ще съдържа ограничено количество имена информация и много необелязана информация. Основният метод, който е включен, е, че първо, софтуерният инженер ще групира сравнима информация, използвайки изчисление без помощ, и след това ще използва текущата имена, за да назове остатъка от незабелязаната информация. Обичайните случаи на използване на такъв вид изчисление имат типично свойство сред тях - Получаването на незабелязана информация по принцип е скромно, докато именуването на споменатата информация е най-горе скъпо. Естествено, може да се представят трите вида изчисления на обучението като Супервизия и осъзнаване на случаите, в които студентът е под наблюдението на инструктор както в дома, така и в училище, Неподдържан осъзнаващ мястото, където студентът трябва да има смисъл от идеята сам, а Полуконтролираният осъзнава къде учителят показва няколко идеи в клас и дава запитвания като училищна работа, които зависят от съпоставими идеи.

Пример за полуконтролирано обучение

Изключително е, че повече информация = по-качествени модели на задълбочено обучение (до конкретна точка на задържане ясно, но по-често не разполагаме с толкова много информация.) Независимо от това, получаването на маркирана информация е скъпо. В случай, че трябва да подготвите модел за разграничаване на крилатите животни, можете да настроите много камери, които впоследствие да правят снимки на кокошки. Това като цяло е скромно. Договарящите се лица да отбележат тези снимки е скъпо. Помислете за възможността да имате огромен брой снимки на крилати животни, но просто договорете индивиди да отбележат малко подмножество от снимките. Както се оказа, вместо просто да тренирате моделите на маркираното подмножество, можете предварително да тренирате модела на целия тренировъчен набор, преди да го свържете с посочения подмножество и да покажете признаци за изпълнение на подобрения по тези линии. Това е полу-контролирано обучение. Тя заделя вашите пари.

заключение

Има много видове алгоритъм за машинно обучение, налични са и въз основа на различни и различни условия трябва да използваме алгоритъма с най-доброто съответствие за най-добър резултат. Има много алгоритми, които намират най-добрата точност на всеки тип алгоритми за машинно обучение и която е най-точната, която трябва да използваме. Можем да сведем до минимум грешката на всеки алгоритъм, като намалим шума в данните. Най-накрая ще кажа, че няма нито един алгоритъм за машинно обучение, който да ви даде 100 процента точност, дори човешкият мозък не може да го направи, така че да намерите най-добрия алгоритъм за ела за вашите данни.

Препоръчителни статии

Това е ръководство за Видовете алгоритми за машинно обучение. Тук обсъждаме Какво е алгоритъм за машинно обучение ?, а неговите видове включват контролирано обучение, неуправляемо обучение, полууправляемо обучение, усилване на обучението. Можете също да разгледате следните статии, за да научите повече -

  1. Методи за машинно обучение
  2. Машинно библиотечно обучение
  3. Модели за машинно обучение
  4. Рамки за машинно обучение
  5. Хиперпараметрово машинно обучение
  6. Йерархично клъстериране | Агломеративно и разделно клъстеризиране
  7. Създайте дърво на решения | Как да създадете | Предимства
  8. Жизнен цикъл на машинно обучение | Топ 8 етапа

Категория: