Общ преглед на алгоритъм на произволна гора

Алгоритмите са набор от стъпки, следвани за извършване на сложно изчисление за решаване на проблеми. Алгоритмите са създадени за решаване на проблеми с машинното обучение. Случайният горски алгоритъм е един такъв алгоритъм, използван за машинно обучение. Той се използва за обучение на данните въз основа на по-рано подадени данни и прогнозиране на възможния резултат за бъдещето. Това е много популярен и мощен алгоритъм за машинно обучение.

Разбиране на алгоритма на случайната гора

Алгоритъмът на случайните гори се основава на контролирано обучение. Може да се използва както за регресия, така и за проблеми с класификацията. Както подсказва името, Random Forest може да се разглежда като колекция от множество алгоритми на дървета с решения с произволно вземане на проби. Този алгоритъм е направен, за да премахне недостатъците на алгоритъма на дървото за решения.

Случайната гора е комбинация от идеята за „багаж“ на Брейман и произволен подбор на функции. Идеята е да направим прогнозата прецизна, като вземете среден или режим на изхода на множество дървета за решения. Колкото по-голям е броят на дърветата за решения, толкова по-прецизен ще бъде резултатът.

Работа на произволна гора:

За да разберем работата на Случайната гора, първо, трябва да разберем работата на дървото на решенията, тъй като Случайната гора се основава на дървета на решения.

Дърво на решението-

Това е прост, но популярен алгоритъм, който следва подхода отгоре надолу. Всеки възел в дървото на решенията представлява атрибут, а листът представлява резултата. Клоните, които свързват възлите с листата, са решенията или правилата за прогнозиране. Коренният възел е атрибутът, който най-добре описва учебния набор данни. Така цялостният процес е диаграмиран в дървовидна структура.

Ограничения на дървото на решенията: има тенденция да превишава набора от данни за обучение. Следователно, когато се използва с тест или различни резултати от данни могат да бъдат различни. Води до лоши решения. Дърветата могат да бъдат нестабилни, тъй като лека промяна в данните може да доведе до съвсем различно дърво.

Случайната гора използва метода за насипване, за да получи желания резултат. Концепцията е да се прилага алгоритъмът на дървото за решения върху набора от данни, но всеки път с различни извадки от данни за обучение. Резултатът от тези дървета на решения ще бъде различен и може да бъде предубеден въз основа на данните за обучение, подадени към алгоритъма. Така че, крайният изход може да се приеме като среден или режим на изхода на отделното дърво на решения. Следователно вариацията може да бъде намалена. Вземането на проби може да се извърши с подмяна. Резултатите от дърветата за решения се класират и този с най-висок ранг ще бъде крайният резултат на Random Forest. По този начин получената продукция ще бъде по-малко предубедена и по-стабилна.

Значение на случайния горски алгоритъм:

  • Случайният горски алгоритъм може да се използва както за регресионни, така и за класификационни модели на машинно обучение.
  • Той може също да обработва липсващи стойности в набора от данни.
  • За разлика от дървото на решенията, то няма да надвишава модела и може да се използва и за категорични променливи. Случайната гора добавя случайност към модела.
  • За разлика от дърветата за решения, вместо да търси единствената най-важна характеристика за изграждане на дърво за решения наоколо, той търси най-добрата функция, използвайки произволен подмножество от функции за дървета.
  • И след това генерирайте резултата въз основа на най-класирания изход от дървета на решения за подмножество.

Пример за реалния живот

Да предположим, че момиче на име Лиза иска да започне книга, така че тя отиде при един от приятелите си Дейвид и поиска неговото предложение. Той предложи на Лиза книга, базирана на писателя, който беше чела. По същия начин тя отиде при още няколко приятели за техните предложения и въз основа на жанра, автора и издателя им предложиха някои книги. Тя направи списък от това. Тогава тя закупи книга, която повечето й приятели предложиха.

Да предположим, че нейните приятели са дърво на решения и жанр, автор, издател и др. Са характеристики на данните. Следователно Лиза при различни приятели е представителство на различни дървета за решения. Следователно, изходът на алгоритъма е книгата, която получи повечето от гласовете.

Приложения на случаен горски алгоритъм:

  • Случайният горски алгоритъм се използва в много области като банкиране, електронна търговия, медицина, фондова борса и др.
  • В банковото дело се използва за определяне на лоялни клиенти и измами. Използва се за откриване кой клиент ще може да изплати заема. Защото в банкирането е много важно да се дават заеми само на тези клиенти, които ще могат да го изплащат навреме. Също така, случайна гора се използва за прогнозиране дали клиент е измамен или не. Ръстът на банката зависи от такъв тип прогнозиране.
  • В лечебното поле случайната гора се използва за диагностициране на заболяването въз основа на минали медицински данни на пациентите.
  • На фондовия пазар случайната гора се използва за идентифициране на пазара и поведението на акциите.
  • В областта на електронната търговия този алгоритъм се използва за прогнозиране на предпочитанията на клиента въз основа на поведението в миналото.

Предимство:

  • Както беше споменато по-горе, алгоритъмът на случайната гора може да се използва както за регресия, така и за класификационен тип проблем. Използва се лесно. Преизпълняването на набора от данни не е проблем в алгоритъма на случайните гори.
  • Може да се използва за идентифициране на най-важната характеристика сред наличните функции. С използването на хиперпараметър често се правят добри прогнози и е много лесно да се разбере.
  • Случайната гора има висока точност, гъвкавост и по-малко вариация.

Недостатък:

  • С увеличаването на броя на дърветата алгоритъмът става бавен и неефективен при работа със сценарии в реално време.
  • Случайната гора отнема повече време в сравнение с дървото на решенията.
  • Той също така изисква повече ресурси за изчисляване.

Примери: Компаниите използват алгоритми за машинно обучение, за да разберат по-добре клиентите си и да развият бизнеса си. Случайният горски алгоритъм може да се използва, за да се разбере предпочитанията на клиента. Може да се използва и за прогнозиране на вероятността човек да закупи определен продукт. Да предположим, като се имат предвид характеристики като тегло, височина, цвят, среден, разход на гориво и т.н. на превозно средство, компанията може да предвиди дали ще бъде успешен продукт на пазара или не. Може да се използва за идентифициране на фактори, отговорни за високите продажби.

Заключение:

Алгоритъмът с произволни гори е лесен за използване и ефективен алгоритъм. Той може да прогнозира с висока точност и затова е много популярен.

Препоръчителни статии

Това е ръководство за алгоритма на случайната гора. Тук обсъждаме работата, разбирането, важността, приложението, предимствата и недостатъците на алгоритъма на Случайната гора. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Какво е алгоритъм?
  2. Наивен алгоритъм на Байес
  3. Какво е алчен алгоритъм?
  4. Какво е езеро с данни?
  5. Най-използваните техники на ансамбълното обучение