Прогнозна аналитика срещу извличане на данни - кой е по-полезен

Съдържание:

Anonim

Разлика между прогнозната аналитика и обработката на данни

Прогнозната анализа е процесът на усъвършенстване на този ресурс от данни, като се използват бизнес знания за извличане на скрита стойност от тези новооткрити модели. Извличането на данни е откриването на скрити модели на данни чрез машинно обучение - а сложните алгоритми са инструментите за добив.

Извличане на данни + Знание на домейна => прогнозна анализа => Бизнес стойност

Сравнение между главата на предсказуемия Анализ и Извличането на данни

По-долу е 5-те сравнения между Predictive Analytics и Data Mining

Ключови разлики между прогнозирането на Google Анализ спрямо извличането на данни

По-долу е разликата между Predictive Analytics и Data Mining

Процес - Процесът на извличане на данни може да бъде обобщен в шест фази -

a.Business/Research Фаза за разбиране - ясно посочва целите и изискванията на проекта по отношение на бизнеса или изследователската единица като цяло
b.Data Understanding Phase - събирайте и използвайте проучвателен анализ на данни, за да се запознаете с данните и да откриете първоначална информация.
c.фаза на подготовка на данните - Почистете и приложете трансформация към сурови данни, така че да е готова за инструментите за моделиране
d.Modeling Phase - Изберете и приложите подходящи техники за моделиране и калибрирайте настройките на модела, за да оптимизирате резултатите.
напр. Фаза на оценка - Моделите трябва да бъдат оценени за качество и ефективност, преди да внедрим. Също така, определете дали моделът всъщност постига целите, поставени му за фаза 1.
f.Deployment Phase - Използвайте модели в производство. Може да бъде просто внедряване, като например генериране на отчет или сложен, като Реализиране на паралелен процес на извличане на данни в друг отдел.

Стъпки на високо ниво в областта на процесите на прогнозирането в Google Анализ

a.Определете бизнес цел - каква бизнес цел да бъде постигната и как се вписват данните. Например, бизнес целта е по-ефективни оферти за нови клиенти и необходими данни е сегментиране на клиенти с конкретни атрибути.
b.Изберете допълнителни данни - Необходими са допълнителни данни, може да са данни за потребителски профил от онлайн система или данни от инструменти на трети страни за по-добро разбиране на данните. Това помага да се намери причина зад модела. Понякога маркетинговите проучвания се провеждат за събиране на данни
c.Draft Predictive Model - Модел, създаден с току-що събрани данни и бизнес знания. Моделът може да бъде просто бизнес правило като „Има по-голям шанс да превърнем потребителите от възраст от A в b от Индия, ако дадем оферта като тази“ или сложен математически модел.

Бизнес стойност - самият Ming добавя стойности за бизнес като

a.Познайте задълбочено клиентските сегменти в различни измерения
b.Получавайте модел на ефективност, специфичен за KPIs (напр. увеличава ли се абонамента с броя на активните потребители?)
c.Идентифицирайте опитите за измама и я предотвратете.
d.Размери на производителността на системата (Например - Време за зареждане на различни устройства - някакъв модел?)

Прогнозната анализа дава възможност на организацията, като предоставя три предимства:

a.Vision - помага да се види какво е невидимо за другите. Политическите анализи могат да преминат през много минали клиентски данни, да го свържат с други данни и да сглобят всички части в правилния ред.
b.Решителност - Добре направеният модел за прогнозна анализа осигурява аналитични резултати без емоции и пристрастия. Той предоставя последователни и безпристрастни идеи в подкрепа на решенията.
c.Прецизност - помага да се използват автоматизирани инструменти, за да се свърши работата по отчитане за вас - спестяване на време и ресурси, намаляване на човешките грешки и подобряване на точността.

Мярка за ефективност - Процесът на представяне на данни се измерва от това доколко модела за намиране на модели в данните. По-голямата част от времето това ще бъде модел на регресия, класификация или клъстеринг и има добре дефинирана мярка за ефективност за всички тях.
Ефективността на прогнозната анализа се измерва върху въздействието върху бизнеса. Например - доколко добре е работила насочената рекламна кампания в сравнение с обща кампания ?. Без значение колко добре се намират модели за извличане на данни, за да се работи добре с прогнозните модели, бизнес погледът е задължителен.

Бъдеще - Полето за извличане на данни се развива много бързо. Опитайте се да намерите модели в данни с по-малко точки от данни с минимален брой функции с помощта на по-сложни модели като Deep Neural Networks. Много пионери в тази област като Google също се опитват да направят процеса прост и достъпен за всички. Един пример е Cloud AutoML от Google.
Прогнозната аналитика се разширява до голямо разнообразие от нови области като прогнозиране на задържане на служители, прогнозиране на престъпността (известна още като прогнозна полиция) и др. В същото време организациите се опитват да прогнозират по-точно чрез събиране на максимална информация от потребителите, като къде отиват, какъв вид гледане на видеоклипове и т.н.

Таблица за сравнение между Predictive Analytics и Mining Data

По-долу са списъците с точки, опишете сравненията между Predictive Analytics и Data Mining:

Основа за сравнениеИзвличане на данниПредсказуем анализ
дефиницияИзвличането на данни е процесът на откриване на полезни модели и тенденции в големите масиви от данни.Прогнозната анализа е процесът на извличане на информация от големи набори от данни, за да се правят прогнози и прогнози за бъдещи резултати.
важностПомогнете да разберете по-добре събраните данни. Например:

● По-добро разбиране на сегментите на клиентите

● модел на покупка в география или време

● Анализ на поведението чрез clickstream

● Анализ на графиката на цената на акциите.

● Анализ на GPS улични данни

Прогнозирайте отгоре на резултата от извличане на данни, като приложите знания за домейна -

● Какъв клиент ще купи след това?

● Каква ще бъде степента на отслабване на клиента?

● Колко нови абонамента ще бъдат стартирани, ако тази оферта бъде дадена?

● Какво е количеството на продукта, необходимо за следващия месец

ОбхватПрилагайте алгоритми за машинно обучение като регресия, класификация на събраните данни, за да намерите скрити моделиПриложете бизнес знания върху моделите на мина на данни с всички допълнителни данни, необходими, за да получите валидни прогнози за бизнеса
изходИзходът от извличане на данни ще бъде модел в данните под формата на различна дистрибуция или клъстери, различаващи се в времева линия. Но той няма да отговори защо се е появил този модел?Прогнозна анализа, опитваща се да намери отговори на модела с прилагането на бизнес знания и по този начин прави почти актуална информация.
Хора, които участватИзвършва се предимно от статистици и инженери за машинно обучение, които имат силен математически опит да участват в проектирането и да създават ML моделТук трябва да са специфични за бизнеса знания и ясна бизнес цел. Бизнес анализаторите и другите експерти в областта на домейните могат да анализират и интерпретират моделите, открити от машините, извеждайки полезен смисъл от моделите на данни и извличайки полезна информация

Заключение - Препоръчителен анализ на Google Анализ срещу извличане на данни

Както каза Рик Уайтинг в InformationWeek Какво следва, е какво следва. Политическият анализ е къде отива бизнес разузнаването.Data Mining помага на организациите по всякакъв начин и едно от най-важните в това е създаването на добра основа за прогнозна анализа

Препоръчителен член

Това е ръководство за разликата между прогнозната аналитика и обработката на данни, тяхното значение, сравнение между главата, ключови разлики, таблица за сравнение и заключение. Можете също да разгледате следните статии, за да научите повече -

  1. Прогнозна анализа спрямо науката за данни - Научете 8 полезно сравнение
  2. Анализ на данни срещу прогнозна аналитика - кой е полезен
  3. 7 най-полезна разлика между извличане на данни срещу уеб
  4. Складиране на данни VS Data Mining - 4 страхотни сравнения
  5. Въведение в архитектурата за обработка на данни