Разлика между прогнозната аналитика и обработката на данни
Прогнозната анализа е процесът на усъвършенстване на този ресурс от данни, като се използват бизнес знания за извличане на скрита стойност от тези новооткрити модели. Извличането на данни е откриването на скрити модели на данни чрез машинно обучение - а сложните алгоритми са инструментите за добив.
Извличане на данни + Знание на домейна => прогнозна анализа => Бизнес стойност
Сравнение между главата на предсказуемия Анализ и Извличането на данни
По-долу е 5-те сравнения между Predictive Analytics и Data Mining
Ключови разлики между прогнозирането на Google Анализ спрямо извличането на данни
По-долу е разликата между Predictive Analytics и Data Mining
● Процес - Процесът на извличане на данни може да бъде обобщен в шест фази -
a.Business/Research Фаза за разбиране - ясно посочва целите и изискванията на проекта по отношение на бизнеса или изследователската единица като цяло
b.Data Understanding Phase - събирайте и използвайте проучвателен анализ на данни, за да се запознаете с данните и да откриете първоначална информация.
c.фаза на подготовка на данните - Почистете и приложете трансформация към сурови данни, така че да е готова за инструментите за моделиране
d.Modeling Phase - Изберете и приложите подходящи техники за моделиране и калибрирайте настройките на модела, за да оптимизирате резултатите.
напр. Фаза на оценка - Моделите трябва да бъдат оценени за качество и ефективност, преди да внедрим. Също така, определете дали моделът всъщност постига целите, поставени му за фаза 1.
f.Deployment Phase - Използвайте модели в производство. Може да бъде просто внедряване, като например генериране на отчет или сложен, като Реализиране на паралелен процес на извличане на данни в друг отдел.
Стъпки на високо ниво в областта на процесите на прогнозирането в Google Анализ
a.Определете бизнес цел - каква бизнес цел да бъде постигната и как се вписват данните. Например, бизнес целта е по-ефективни оферти за нови клиенти и необходими данни е сегментиране на клиенти с конкретни атрибути.
b.Изберете допълнителни данни - Необходими са допълнителни данни, може да са данни за потребителски профил от онлайн система или данни от инструменти на трети страни за по-добро разбиране на данните. Това помага да се намери причина зад модела. Понякога маркетинговите проучвания се провеждат за събиране на данни
c.Draft Predictive Model - Модел, създаден с току-що събрани данни и бизнес знания. Моделът може да бъде просто бизнес правило като „Има по-голям шанс да превърнем потребителите от възраст от A в b от Индия, ако дадем оферта като тази“ или сложен математически модел.
● Бизнес стойност - самият Ming добавя стойности за бизнес като
a.Познайте задълбочено клиентските сегменти в различни измерения
b.Получавайте модел на ефективност, специфичен за KPIs (напр. увеличава ли се абонамента с броя на активните потребители?)
c.Идентифицирайте опитите за измама и я предотвратете.
d.Размери на производителността на системата (Например - Време за зареждане на различни устройства - някакъв модел?)
Прогнозната анализа дава възможност на организацията, като предоставя три предимства:
a.Vision - помага да се види какво е невидимо за другите. Политическите анализи могат да преминат през много минали клиентски данни, да го свържат с други данни и да сглобят всички части в правилния ред.
b.Решителност - Добре направеният модел за прогнозна анализа осигурява аналитични резултати без емоции и пристрастия. Той предоставя последователни и безпристрастни идеи в подкрепа на решенията.
c.Прецизност - помага да се използват автоматизирани инструменти, за да се свърши работата по отчитане за вас - спестяване на време и ресурси, намаляване на човешките грешки и подобряване на точността.
● Мярка за ефективност - Процесът на представяне на данни се измерва от това доколко модела за намиране на модели в данните. По-голямата част от времето това ще бъде модел на регресия, класификация или клъстеринг и има добре дефинирана мярка за ефективност за всички тях.
Ефективността на прогнозната анализа се измерва върху въздействието върху бизнеса. Например - доколко добре е работила насочената рекламна кампания в сравнение с обща кампания ?. Без значение колко добре се намират модели за извличане на данни, за да се работи добре с прогнозните модели, бизнес погледът е задължителен.
● Бъдеще - Полето за извличане на данни се развива много бързо. Опитайте се да намерите модели в данни с по-малко точки от данни с минимален брой функции с помощта на по-сложни модели като Deep Neural Networks. Много пионери в тази област като Google също се опитват да направят процеса прост и достъпен за всички. Един пример е Cloud AutoML от Google.
Прогнозната аналитика се разширява до голямо разнообразие от нови области като прогнозиране на задържане на служители, прогнозиране на престъпността (известна още като прогнозна полиция) и др. В същото време организациите се опитват да прогнозират по-точно чрез събиране на максимална информация от потребителите, като къде отиват, какъв вид гледане на видеоклипове и т.н.
Таблица за сравнение между Predictive Analytics и Mining Data
По-долу са списъците с точки, опишете сравненията между Predictive Analytics и Data Mining:
Основа за сравнение | Извличане на данни | Предсказуем анализ |
дефиниция | Извличането на данни е процесът на откриване на полезни модели и тенденции в големите масиви от данни. | Прогнозната анализа е процесът на извличане на информация от големи набори от данни, за да се правят прогнози и прогнози за бъдещи резултати. |
важност | Помогнете да разберете по-добре събраните данни. Например:
● По-добро разбиране на сегментите на клиентите ● модел на покупка в география или време ● Анализ на поведението чрез clickstream ● Анализ на графиката на цената на акциите. ● Анализ на GPS улични данни | Прогнозирайте отгоре на резултата от извличане на данни, като приложите знания за домейна -
● Какъв клиент ще купи след това? ● Каква ще бъде степента на отслабване на клиента? ● Колко нови абонамента ще бъдат стартирани, ако тази оферта бъде дадена? ● Какво е количеството на продукта, необходимо за следващия месец |
Обхват | Прилагайте алгоритми за машинно обучение като регресия, класификация на събраните данни, за да намерите скрити модели | Приложете бизнес знания върху моделите на мина на данни с всички допълнителни данни, необходими, за да получите валидни прогнози за бизнеса |
изход | Изходът от извличане на данни ще бъде модел в данните под формата на различна дистрибуция или клъстери, различаващи се в времева линия. Но той няма да отговори защо се е появил този модел? | Прогнозна анализа, опитваща се да намери отговори на модела с прилагането на бизнес знания и по този начин прави почти актуална информация. |
Хора, които участват | Извършва се предимно от статистици и инженери за машинно обучение, които имат силен математически опит да участват в проектирането и да създават ML модел | Тук трябва да са специфични за бизнеса знания и ясна бизнес цел. Бизнес анализаторите и другите експерти в областта на домейните могат да анализират и интерпретират моделите, открити от машините, извеждайки полезен смисъл от моделите на данни и извличайки полезна информация |
Заключение - Препоръчителен анализ на Google Анализ срещу извличане на данни
Както каза Рик Уайтинг в InformationWeek Какво следва, е какво следва. Политическият анализ е къде отива бизнес разузнаването.Data Mining помага на организациите по всякакъв начин и едно от най-важните в това е създаването на добра основа за прогнозна анализа
Препоръчителен член
Това е ръководство за разликата между прогнозната аналитика и обработката на данни, тяхното значение, сравнение между главата, ключови разлики, таблица за сравнение и заключение. Можете също да разгледате следните статии, за да научите повече -
- Прогнозна анализа спрямо науката за данни - Научете 8 полезно сравнение
- Анализ на данни срещу прогнозна аналитика - кой е полезен
- 7 най-полезна разлика между извличане на данни срещу уеб
- Складиране на данни VS Data Mining - 4 страхотни сравнения
- Въведение в архитектурата за обработка на данни