Въведение в машината с ограничен болтцман

Ограничената машина на Boltzmann е метод, който може автоматично да намери модели в данните, като реконструира нашия вход. Джеф Хинтън е основателят на задълбоченото обучение. RBM е повърхностна двуслойна мрежа, в която първият е видимият, а следващият е скритият слой. Всеки един възел във видимия слой се присъединява към всеки отделен възел в скрития слой. Машината с ограничен болтцман се счита за ограничена, тъй като два възела от един и същи слой не образуват връзка. RBM е числовият еквивалент на двупосочен преводач. В пътя напред RBM получава входа и го преобразува в набор от числа, който кодира входа. По обратния път, той приема това като резултат и обработва този набор от входове и ги превежда обратно, за да образува прибраните входове. Супер тренирана мрежа ще може да извърши този обратен преход с голяма достоверност. В две стъпки теглото и стойностите имат много важна роля. Те позволяват на RBM да декодира взаимовръзките между входовете и също така помагат на RBM да реши кои входни стойности са най-важни при откриване на правилните изходи.

Работа на ограничена машина Boltzmann

Всеки един видим възел получава стойност от ниско ниво от възел в набора от данни. На първия възел на невидимия слой X се образува от продукт на тежест и се добавя към отклонение. Резултатът от този процес се подава към активиране, което произвежда силата на дадения входен сигнал или изхода на възела.

В следващия процес няколко входа ще се присъединят към един скрит възел. Всеки X се комбинира с индивидуалната тежест, добавянето на продукта се прикрепя към стойности и резултатът отново се предава чрез активиране, за да се даде изходът на възела. На всеки невидим възел всеки вход X се комбинира с индивидуално тегло W. Входът X има три тегла тук, което прави дванадесет заедно. Теглото, образувано между слоя, се превръща в масив, където редовете са точни за въвеждане на възли и колоните са изпълнени за извеждане на възли.

Всеки невидим възел получава четири отговора, умножени по теглото им. Добавянето на този ефект отново се добавя към стойността. Това действа като катализатор за да се случи някакъв процес на активиране и резултатът отново се подава към алгоритъма на активиране, който произвежда всеки отделен изход за всеки един невидим вход.

Първият произведен тук модел е енергийно базиран модел. Този модел свързва скаларната енергия с всяка конфигурация на променливата. Този модел определя разпределението на вероятността чрез енергийна функция, както следва,

(1)

Тук Z е нормализиращият фактор. Това е функцията на дяла по отношение на физическите системи

В тази функция, базирана на енергия, следва логистична регресия, която първата стъпка ще дефинира log-. вероятност и следващият ще определи функцията на загубата като отрицателна вероятност.

използвайки стохастичния градиент, където са параметрите,

енергийно базиран модел със скрита единица се определя като "h"

Наблюдаваната част се обозначава като „x“

От уравнение (1) уравнението на свободната енергия F (x) се определя по следния начин

(2)

(3)

Отрицателният градиент има следната форма,

(4)

Горното уравнение има две форми, положителната и отрицателната форма. Понятието положително и отрицателно не се представя от знаци на уравненията. Те показват ефекта на плътността на вероятностите. Първата част показва вероятността за намаляване на съответната свободна енергия. Втората част показва намалява вероятността от генерирани проби. Тогава градиентът се определя както следва,

(5)

Тук N е отрицателни частици. В този модел, базиран на енергия, е трудно да се идентифицира градиентът аналитично, тъй като включва изчисляването на

Следователно в този модел на EBM имаме линейно наблюдение, което не е в състояние да изобрази точно данните. Така че в следващия модел Ограничена машина на Boltzmann, Скритият слой е по-добър, за да има висока точност и предотвратяване на загубата на данни. Енергийната функция на RBM се дефинира като,

(6)

Тук W е тегло, свързващо между видими и скрити слоеве. b е изместена от видимия слой.c е изместена от скрития слой. чрез превръщане в безплатна енергия,

В RBM единиците на видимия и скрит слой са напълно независими, което може да се запише по следния начин,

От уравнения 6 и 2, вероятностен вариант на функция за активиране на невроните,

(7)

(8)

Той е допълнително опростен в

(9)

Комбинирайки уравнения 5 и 9,

(10)

Вземане на проби в машина с ограничен болтцман

Gibbs вземане на проби от ставата на N случайни променливи се осъществява чрез последователност от N под-стъпки за формиране на формуляра където

съдържа другите случайни променливи в изключение.

В RBM S е набор от видими и скрити единици. Двете части са независими, които могат да извършват или блокират вземане на проби от Gibbs. Тук видимата единица извършва вземане на проби и дава фиксирана стойност на скритите единици, като едновременно скритите единици предоставят фиксирани стойности на видимата единица чрез вземане на проби

тук, е набор от всички скрити единици. Пример е избран на случаен принцип да е 1 (срещу 0) с вероятност, и подобно, е избран на случаен принцип да бъде 1 (срещу 0) с вероятност

Контрастираща дивергенция

Използва се като катализатор за ускоряване на процеса на вземане на проби
Тъй като ние очакваме да е истина, ние очакваме стойността на разпределение да е близка до P, така че да формира сближаване с окончателното разпределение на P

Но контрастивната дивергенция не чака веригата да се сближи. Пробата се получава само след процеса на Gibb, така че ние задаваме тук k = 1, където работи изненадващо добре.

Устойчива контрастивна дивергенция

Това е друг метод за формулировка за вземане на проби от приближение. Това е устойчиво състояние за всеки метод за вземане на проби, той извлича нови проби, като просто променя параметрите на К.

Слоеве на ограничена машина Boltzmann

Ограничената машина Boltzmann има два слоя, плитки невронни мрежи, които се комбинират и образуват блок от дълбоки вярващи мрежи. Първият слой е видимият слой, а другият - скритият. Всяка единица се отнася до кръг, подобен на неврон, наречен възел. Възлите от скрития слой са свързани с възли от видимия слой. Но два възела от един и същи слой не са свързани. Тук терминът Ограничен се отнася до вътреслоева комуникация. Всеки възел обработва входа и взема стохастично решение дали да предава входа или не.

Примери

Важната роля на RBM е разпределението на вероятностите. Езиците са уникални по своите букви и звуци. Разпределението на вероятността на писмото може да бъде голямо или ниско. В английския език буквите T, E и A са широко използвани. Но на исландски често срещаните букви са A и N. не можем да се опитаме да реконструираме исландски с тежест въз основа на английски. Това ще доведе до разминаване.

Следващият пример са изображения. Разпределението на вероятността на тяхната пикселна стойност се различава за всеки вид изображение. Можем да приемем, че има две изображения на слон и куче за входни възли, предният пропуск на RBM ще генерира въпрос като трябва ли да генерирам силен пикселен възел за слонов възел или кучешки възел ?. Тогава преминаването назад ще генерира въпроси като за слон, как да очаквам разпределение на пиксели? Тогава със съвместна вероятност и активиране, произведени от възли, те ще построят мрежа със съвместно съвместно възникване като големи уши, сива нелинейна тръба, флопи уши, бръчката е слонът. Следователно RBM е процесът на задълбочено обучение и визуализация, те формират две основни пристрастия и действат върху смисъла им за активиране и възстановяване.

Предимства на машината с ограничен болтцман

  • Ограничената машина на Болтцман е приложен алгоритъм, използван за класификация, регресия, моделиране на теми, съвместно филтриране и изучаване на функции.
  • Машината с ограничен болтцман се използва за невроизобразяване, редки реконструкции на изображения при планиране на мина, а също и за разпознаване на радарна цел
  • RBM е в състояние да разреши проблем с небалансирани данни чрез SMOTE процедура
  • RBM намират липсващи стойности чрез вземане на проби от Gibb, които се прилагат за покриване на неизвестните стойности
  • RBM преодолява проблема с шумните етикети чрез некоригирани данни на етикета и грешките му при възстановяване
  • Проблемните неструктурирани данни се отстраняват от екстрактор на функции, който трансформира суровите данни в скрити единици.

заключение

Дълбокото обучение е много мощно, което е изкуството за решаване на сложни проблеми, то все още е пространство за усъвършенстване и сложно за изпълнение. Безплатните променливи трябва да бъдат конфигурирани внимателно. Идеите зад невронната мрежа бяха трудни по-рано, но днес дълбокото обучение е стъпалото на машинното обучение и изкуствения интелект. Следователно RBM дава представа за огромните алгоритми за дълбоко обучение. Той се занимава с основната композиционна единица, която прогресивно прераства в много популярни архитектури и се използва широко в много големи индустрии.

Препоръчителен член

Това е ръководство за ограничената машина Boltzmann. Тук обсъждаме нейната работа, вземане на проби, предимства и слоеве на машината с ограничен болтцман. Можете също да прегледате и другите ни предложени статии, за да научите повече _

  1. Алгоритми за машинно обучение
  2. Архитектура на машинно обучение
  3. Видове машинно обучение
  4. Инструменти за машинно обучение
  5. Внедряване на невронни мрежи

Категория: