9 Страхотна разлика между Data Science Vs Data Mining

Съдържание:

Anonim

Разлика между Data Science и Data Mining

Data Mining е свързан с намирането на тенденциите в набор от данни. И използвайки тези тенденции за идентифициране на бъдещи модели. Това е важна стъпка в процеса на откриване на знанието. Често включва анализ на огромното количество исторически данни, които преди това бяха игнорирани. Data Science е поле за изследване, което включва всичко от Big Data Analytics, Data Mining, Predictive Modeling, Visualization of Data, Mathematics и Statistics. Data Science се споменава като четвъртата парадигма на Science. (останалите три са теоретични, емпирични и изчислителни). Academia често провежда изключителни изследвания в областта на Data Science.

Историческа перспектива

Преди да преминем към техническите описания, нека да разгледаме еволюцията на термините. Историческо разследване ще изясни как се използват термините в момента.

  • Думата „Science Science“ е около 60-те години на миналия век, но тогава тя е използвана като алтернатива на „Computer Science“. В момента тя носи съвсем различно значение.
  • През 2008 г. DJ Patil и Jeff Hammerbacher стават първите хора, които наричат ​​себе си „Data Scientist“, за да опишат съответно ролята си в LinkedIn и Facebook.
  • През 2012 г. статия в Harvard Business Review цитира Data Scientist като „най-сексапилна работа на 21- ви век“.
  • Терминът Data Mining се развива паралелно. Той стана разпространен сред общността на базите данни през 90-те години.
  • Data Mining дължи произхода си на KDD (Откриване на знания в бази данни). KDD е процес на намиране на знания от информация, присъстваща в базите данни. И Data Mining е основен подпроцес в KDD.
  • Data Mining често се използва взаимозаменяемо заедно с KDD.

Въпреки че тези имена са се появили независимо, те често се допълват взаимно, тъй като в края на краищата те са тясно свързани с анализа на данните.

Сравнение между главата на Data Science Vs Data Mining (Инфографика)

По-долу е топ 9 на сравнението на Data Science Vs Data Mining

Пример за използване на случай

Обмислете сценарий, в който сте основен търговец на дребно в Индия. Имате 50 магазина, опериращи в 10 големи градове в Индия, и работите от 10 години.

Да речем, искате да проучите данните за последните 8 години, за да намерите броя на продажбите на сладкиши през празничните сезони на 3 града. Ако това е вашата цел, бих ви препоръчал да наемете човек с експертиза за обработка на данни. Data Miner вероятно ще премине през историческа информация, съхранявана в наследени системи и използва алгоритми за извличане на тенденции.

Помислете за друг случай, в който искате да знаете кои сладки са получили по-положителни отзиви. В този случай вашите източници на данни може да не се ограничават до бази данни, те могат да се разпространят до социални уебсайтове или съобщения за обратна връзка на клиентите. В този случай моето предложение към вас би било да наемете Data Scientist. Човек, нает като Data Scientist, е по-подходящ да прилага алгоритми и да провежда този социално-изчислителен анализ.

Основни разлики между Data Science Vs Data Mining

По-долу е разликата между науката за данни и извличането на данни, както следва

  • Извличането на данни е дейност, която е част от по-широк процес на откриване на знания в базите данни (KDD), докато Science Science е поле за изучаване, точно като приложна математика или компютърни науки.
  • Често Data Science се разглежда в широк смисъл, докато Data Mining се счита за ниша.
  • Някои дейности в Data Mining, като статистически анализ, писане на потоци от данни и разпознаване на модели, могат да се пресичат с Data Science. Следователно, Data Mining се превръща в подмножество на Data Science.
  • Машинно обучение в Data Mining се използва повече за разпознаване на модели, докато в Data Science има по-общо приложение.

Забележка

  • Data Science и Data Mining не трябва да се бъркат с Big Data Analytics и може да има както миньори, така и учени, работещи върху големи набори от данни.

Data Science Vs Таблица за сравняване на извличане на данни

Основа за сравнениеИзвличане на данниData Science
Какво е?ТехникаОбласт
фокусБизнес процесНаучно изследване
ЦелНаправете данните по-използваемиИзграждане на продукти, ориентирани към данни за организация
продукцияМоделиразнообразен
ПредназначениеНамиране на тенденции, които по-рано не са били известниСоциален анализ, изграждане на прогнозни модели, откриване на неизвестни факти и др
Професионална перспективаНякой с познания за навигация в данните и статистическото разбиране може да извърши извличане на данниЧовек трябва да разбере машинно обучение, програмиране, инфо-графични техники и да притежава знанията за домейна, за да стане учен
СтепенИзвличането на данни може да бъде подмножество на Data Science, тъй като дейностите по добив са част от тръбопровода Data ScienceМултидисциплинарен - науката за данни се състои от визуализации на данни, компютърни социални науки, статистика, извличане на данни, обработка на естествен език и др.
Разбира се с (вида на данните)Предимно структурираниВсички форми на данни - структурирани, полуструктурирани и неструктурирани
Други по-малко популярни именаАрхеология на данните, събиране на информация, откриване на информация, извличане на знанияНаука, базирана на данни

Заключение - Data Science Vs Data Mining

И така, ето! Сигурен съм, че сега сте по-наясно какви са основните разлики между тях и в какъв контекст двете трябва да бъдат използвани. Трябва да запомните, че няма официални и точни дефиниции на Data Science и Data Mining. Все още се водят дебати между академичните среди и индустрията за това какво представлява точно определение. Всички обаче са на една и съща страница по отношение на разликите на високо ниво и описанията на двата термина, които изследвахме в тази статия.

Препоръчителен член

Това е ръководство за Data Science Vs Data Mining, тяхното значение, сравнение между главата, ключови разлики, таблица на сравнението и заключение. Можете също да разгледате следните статии, за да научите повече -

  1. Науката за данните и нейното нарастващо значение
  2. 7 важни техники за извличане на данни за най-добри резултати
  3. Прогнозна анализа спрямо науката за данни - Научете 8 полезно сравнение
  4. 8 важни техники за извличане на данни за успешния бизнес