Разлика между Data Science и Data Mining
Data Mining е свързан с намирането на тенденциите в набор от данни. И използвайки тези тенденции за идентифициране на бъдещи модели. Това е важна стъпка в процеса на откриване на знанието. Често включва анализ на огромното количество исторически данни, които преди това бяха игнорирани. Data Science е поле за изследване, което включва всичко от Big Data Analytics, Data Mining, Predictive Modeling, Visualization of Data, Mathematics и Statistics. Data Science се споменава като четвъртата парадигма на Science. (останалите три са теоретични, емпирични и изчислителни). Academia често провежда изключителни изследвания в областта на Data Science.
Историческа перспектива
Преди да преминем към техническите описания, нека да разгледаме еволюцията на термините. Историческо разследване ще изясни как се използват термините в момента.
- Думата „Science Science“ е около 60-те години на миналия век, но тогава тя е използвана като алтернатива на „Computer Science“. В момента тя носи съвсем различно значение.
- През 2008 г. DJ Patil и Jeff Hammerbacher стават първите хора, които наричат себе си „Data Scientist“, за да опишат съответно ролята си в LinkedIn и Facebook.
- През 2012 г. статия в Harvard Business Review цитира Data Scientist като „най-сексапилна работа на 21- ви век“.
- Терминът Data Mining се развива паралелно. Той стана разпространен сред общността на базите данни през 90-те години.
- Data Mining дължи произхода си на KDD (Откриване на знания в бази данни). KDD е процес на намиране на знания от информация, присъстваща в базите данни. И Data Mining е основен подпроцес в KDD.
- Data Mining често се използва взаимозаменяемо заедно с KDD.
Въпреки че тези имена са се появили независимо, те често се допълват взаимно, тъй като в края на краищата те са тясно свързани с анализа на данните.
Сравнение между главата на Data Science Vs Data Mining (Инфографика)
По-долу е топ 9 на сравнението на Data Science Vs Data Mining
Пример за използване на случай
Обмислете сценарий, в който сте основен търговец на дребно в Индия. Имате 50 магазина, опериращи в 10 големи градове в Индия, и работите от 10 години.
Да речем, искате да проучите данните за последните 8 години, за да намерите броя на продажбите на сладкиши през празничните сезони на 3 града. Ако това е вашата цел, бих ви препоръчал да наемете човек с експертиза за обработка на данни. Data Miner вероятно ще премине през историческа информация, съхранявана в наследени системи и използва алгоритми за извличане на тенденции.
Помислете за друг случай, в който искате да знаете кои сладки са получили по-положителни отзиви. В този случай вашите източници на данни може да не се ограничават до бази данни, те могат да се разпространят до социални уебсайтове или съобщения за обратна връзка на клиентите. В този случай моето предложение към вас би било да наемете Data Scientist. Човек, нает като Data Scientist, е по-подходящ да прилага алгоритми и да провежда този социално-изчислителен анализ.
Основни разлики между Data Science Vs Data Mining
По-долу е разликата между науката за данни и извличането на данни, както следва
- Извличането на данни е дейност, която е част от по-широк процес на откриване на знания в базите данни (KDD), докато Science Science е поле за изучаване, точно като приложна математика или компютърни науки.
- Често Data Science се разглежда в широк смисъл, докато Data Mining се счита за ниша.
- Някои дейности в Data Mining, като статистически анализ, писане на потоци от данни и разпознаване на модели, могат да се пресичат с Data Science. Следователно, Data Mining се превръща в подмножество на Data Science.
- Машинно обучение в Data Mining се използва повече за разпознаване на модели, докато в Data Science има по-общо приложение.
Забележка
- Data Science и Data Mining не трябва да се бъркат с Big Data Analytics и може да има както миньори, така и учени, работещи върху големи набори от данни.
Data Science Vs Таблица за сравняване на извличане на данни
Основа за сравнение | Извличане на данни | Data Science |
Какво е? | Техника | Област |
фокус | Бизнес процес | Научно изследване |
Цел | Направете данните по-използваеми | Изграждане на продукти, ориентирани към данни за организация |
продукция | Модели | разнообразен |
Предназначение | Намиране на тенденции, които по-рано не са били известни | Социален анализ, изграждане на прогнозни модели, откриване на неизвестни факти и др |
Професионална перспектива | Някой с познания за навигация в данните и статистическото разбиране може да извърши извличане на данни | Човек трябва да разбере машинно обучение, програмиране, инфо-графични техники и да притежава знанията за домейна, за да стане учен |
Степен | Извличането на данни може да бъде подмножество на Data Science, тъй като дейностите по добив са част от тръбопровода Data Science | Мултидисциплинарен - науката за данни се състои от визуализации на данни, компютърни социални науки, статистика, извличане на данни, обработка на естествен език и др. |
Разбира се с (вида на данните) | Предимно структурирани | Всички форми на данни - структурирани, полуструктурирани и неструктурирани |
Други по-малко популярни имена | Археология на данните, събиране на информация, откриване на информация, извличане на знания | Наука, базирана на данни |
Заключение - Data Science Vs Data Mining
И така, ето! Сигурен съм, че сега сте по-наясно какви са основните разлики между тях и в какъв контекст двете трябва да бъдат използвани. Трябва да запомните, че няма официални и точни дефиниции на Data Science и Data Mining. Все още се водят дебати между академичните среди и индустрията за това какво представлява точно определение. Всички обаче са на една и съща страница по отношение на разликите на високо ниво и описанията на двата термина, които изследвахме в тази статия.
Препоръчителен член
Това е ръководство за Data Science Vs Data Mining, тяхното значение, сравнение между главата, ключови разлики, таблица на сравнението и заключение. Можете също да разгледате следните статии, за да научите повече -
- Науката за данните и нейното нарастващо значение
- 7 важни техники за извличане на данни за най-добри резултати
- Прогнозна анализа спрямо науката за данни - Научете 8 полезно сравнение
- 8 важни техники за извличане на данни за успешния бизнес