Конволюционни невронни мрежи - Топ 10 слоя в CNN

Съдържание:

Anonim

Въведение в конволюционните невронни мрежи

Конволюционните невронни мрежи, известни още като CNN или ConvNet, попадат в категорията на изкуствените невронни мрежи, използвани за обработка и визуализация на изображения. Изкуственият интелект използва задълбочено обучение за изпълнение на задачата. Невронните мрежи са или хардуер или софтуер, програмирани като неврони в човешкия мозък. Традиционната невронна мрежа приема само изображения с намалена разделителна способност като входове. CNN решава този проблем, като подрежда невроните си като челен лоб на човешкия мозък. Предварителната обработка на CNN е много по-малка в сравнение с други алгоритми. Свиване, линейна математическа операция се използва на CNN. Той използва свиване вместо общо матрично умножение в един от слоевете си.

Слоеве в конволюционни невронни мрежи

По-долу са слоевете на конволюционните невронни мрежи:

1. Слой за въвеждане на изображение

Входният слой дава входове (предимно изображения) и се извършва нормализация. Тук трябва да се отбележи размерът на въвеждането.

2. Конволюционен слой

В този слой се извършва конволюция и изображението се разделя на персептрони (алгоритъм), създават се локални полета, което води до компресия на персептрони, за да се представят карти като матрица с размер mx n.

3. Нелинейност слой

Тук характеристичните карти се приемат като входни и активиращи карти се дават като изход с помощта на функция за активиране. Функцията за активиране обикновено се осъществява като сигмоидни или хиперболични допирателни функции.

4. Ректификационен слой

Решаващият компонент на CNN, този слой тренира по-бързо, без да намалява точността. Извършва елементно-абсолютна операция с абсолютна стойност върху карти за активиране.

5. Ректифицирани линейни единици (ReLU)

ReLU комбинира нелинейни и коригиращи слоеве на CNN. Това прави праговата операция, при която отрицателните стойности се преобразуват в нула. ReLU обаче не променя размера на входа.

6. Слой за обединяване

Слоят за обединяване също се нарича слой за сваляне, тъй като това е отговорно за намаляването на размера на картите за активиране. Филтър и стъпка със същата дължина се прилагат към входния обем. По-малко значими данни се игнорират от този слой, поради което разпознаването на изображения се извършва в по-малко представяне. Този слой намалява препълването. Тъй като количеството параметри се намалява с помощта на обединяващия слой, се намалява и цената. Входът е разделен на правоъгълни групи за обединяване и се изчислява максимален или среден размер, който съответно връща максимален или среден. Макс пулът е популярен.

7. Слой за отпадане

Този слой произволно задава входния слой на нула с дадена вероятност. Повече резултати в различни елементи отпадат след тази операция. Този слой също помага да се намали препълването. Това прави мрежата излишна. В този слой не се случва обучение. Тази операция се извършва само по време на обучение.

8. Напълно свързан слой

Картите за активиране, които са изход от предишни слоеве, се превръщат в класово разпределение на вероятностите в този слой. FC слоят умножава входа чрез тегловна матрица и добавя вектора на отклонение.

9. Изходен слой

FC слой е последван от softmax и класификационни слоеве. Функцията softmax се прилага към входа. Класификационният слой изчислява функцията на кръстосана ентропия и загуба за проблеми с класификацията.

10. Регресионен слой

Половината средна квадратна грешка се изчислява в този слой. Този слой трябва да следва слоя FC.

Архитектура на конволюционната невронна мрежа

По-долу са архитектурата на конволюционните невронни мрежи:

1. LeNet

LeNet беше представен за оптично разпознаване и разпознаване на символи в Documents през 1998 г. Той е малък и перфектен за работа в процесора. LeNet е малък и лесен за разбиране. Това е изградено с три основни идеи: местните възприемчиви полета споделят тежести и пространствено подсимулиране. Мрежата показва най-доброто вътрешно представяне на сурови изображения. Той има три конволюционни слоя, два обединяващи слоя, един напълно свързан слой и един изходен слой. Един спирален слой веднага бе последван от обединяващия слой. Всички слоеве са обяснени по-горе.

2. AlexNet

AlexNet е разработен през 2012 г. Тази архитектура популяризира CNN в компютърното зрение. Той има пет конволюционни и три напълно свързани слоя, където ReLU се прилага след всеки слой. Той се възползва от предимствата на двата слоя, тъй като спираловидният слой има малко параметри и дълго изчисляване и е напълно обратното за напълно свързан слой. Превишаването беше много намалено от увеличаване на данните и отпадане. AlexNet беше по-дълбок, по-големите и спираловидни слоеве не са разделени от пултов слой в сравнение с LeNet.

3. ZF Net

ZF Net е разработен през 2013 г., който беше модифицирана версия на AlexNet. Размерът на средния спирален слой беше разширен и размерът на стъпалата и филтъра на първия спираловиден слой беше намален. Току-що разпозна недостатъците на AlexNet и разработи превъзходен. Всички слоеве са същите като AlexNet. ZF Net настройва параметрите на слоя като размер на филтъра или крачка на AlexNet, което го прави да намали процента на грешки.

4. GoogLeNet

Тази архитектура е разработена през 2014 г. Началният слой е основната концепция. Този слой покрива по-голямата площ, но отбелязва малка информация за изображението. За да се подобри производителността, в GoogLeNet се използват девет начални модула. Тъй като началният слой е предразположен към преоборудване, тук се използват повече нелинейности и по-малко параметри. Максималният пул слой се използва за свързване на изхода на предишния слой. Тази архитектура има 22 слоя, а параметрите са 12x по-малко. Това е по-точно от AlexNet, също по-бързо. Степента на грешка е сравнително по-ниска. Средният слой за обединяване се използва в края, вместо напълно свързан слой. Изчисленията се намаляват, увеличават се дълбочината и ширината. Много модули за създаване са свързани, за да отидат по-дълбоко в архитектурата. GoogLeNet превъзхожда всички останали архитектури, разработени до 2014 г. Има няколко последващи версии за тази архитектура.

5. VGG Net

Това беше подобрение спрямо ZFNet и впоследствие над AlexNet. Той има 16 слоя с 3 × 3 спираловидни слоя, 2 × 2 пулове за обединяване и напълно свързани слоеве. Тази архитектура приема най-простата мрежова структура, но има повечето от параметрите.

6. ResNet

Остатъчната мрежова архитектура е разработена през 2015 г. Тя използва пакетна нормализация и пропуска използването на FC слоеве. Тази архитектура използва 152 слоя и използва пропускащи връзки. ResNet се използва най-вече във всички алгоритми за задълбочено обучение.

заключение

Facebook използва CNN за маркиране на изображения, Amazon за препоръки на продукти и Google за търсене сред потребителски снимки. Всичко това се прави с по-голяма точност и ефективност. Напредъкът в задълбоченото обучение достигна етап, в който CNN е разработен и помага в много отношения. Тъй като сложната CNN става, тя помага за подобряване на ефективността.

Препоръчителен член

Това е ръководство за конволюционните невронни мрежи. Тук обсъждаме Въведение в конволюционните невронни мрежи и неговите слоеве, заедно с архитектурата. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Класификация на невронната мрежа
  2. Машинно обучение срещу невронна мрежа
  3. Преглед на алгоритмите на невронната мрежа
  4. Повтарящи се невронни мрежи (RNN)
  5. Внедряване на невронни мрежи
  6. Топ 6 сравнения между CNN и RNN