Преглед на необходимите умения за Data Scientist

През 2012 г. в Harvard Business Review се посочва, че „Data Scientist е най-сексапилната работа на 21- ви век“. Предварително, за да знаем какви са уменията, необходими, за да бъде първо учен с данни, нека видим какво прави даден учен. Има много начини, по които даден учен може да се определи, но за да го опрости нека го кажем по този начин, Data Scientist е някой, който е в състояние да извлече смисъл и да получи ценна информация от данните. Работата на учен с данни включва предимно събиране, почистване и манипулиране на данни.

Технически и нетехнически умения

Сега нека се потопим в техническите и нетехническите умения, които са от съществено значение за да бъдете учен с данни.

Технически умения

По-долу са дадени техническите умения, необходими за учен с данни.

1. Способност за справяне с голямо количество данни

Количеството генерирани данни нараства експоненциално от последните няколко години и по-голямата част от тях се класифицират като неструктурирани данни. Неструктурирани данни обикновено се отнасят до данни, които не пребивават в традиционна база данни на колони с редове, която е точно противоположна на структурираните данни, малко от примерите за неструктурирани данни са видеоклипове, снимки, аудио съобщения. Тъй като основната роля на учен с данни е да извлича смисъл от данни, човек трябва да е удобен да работи с големи количества данни, независимо от природата, независимо дали са структурирани или неструктурирани.

2. Визуализация на данни

Данните, които се генерират във фирмите, трябва да бъдат преведени във формат, който е лесен за разбиране, за вземане на решения. Като учен с данни, човек трябва да може да визуализира данните с помощта на инструменти като Tableau, Plotly, Visual.ly, D3.js и Power BI. Важно е също така информатологът да е запознат с принципите, които визуално поставят данните. Това е една от важните роли за учен с данни, тъй като визуализацията на данни е единственият избор на действие за компаниите, които работят директно с данни.

3. Статистика

Ролята на статистиката в науката за данните е много важна. За учените по данни статистиката е математическата дисциплина, която дава необходимите инструменти и методи за намиране на модели и даване на представа от сложния набор от данни чрез извършване на математически изчисления върху тях. Тъй като ролята на учен с данни е да извлича смисъл чрез идентифициране на модели в данните, знанието в статистиката е ключово умение за учения с данни.

4. Умения за програмиране

С количеството данни, генерирани преди 20 години, Excel би бил достатъчен за справяне с него, но с количеството на структурирани и неструктурирани данни, които генерират тези данни, учените трябва да имат познания в инструменти за програмиране като Python, R, SQL като

  • Те дават повече възможности за обучение на набора от данни с много статистически техники
  • Те подобряват ефективността на процеса, докато правят анализ на данните

5. Манипулиране на данни

В повечето случаи данните, от които се нуждаем, ще бъдат объркани и ще бъде трудно за учените по данни да работят с такъв тип данни. И така, след получаване на данните от данните, първата стъпка е да се справим с тези несъвършенства. Някои несъвършенства включват липсващи стойности, неправилни струни като LA за Лос Анджелис, форматиране на дати като 10/09/2009 и 2009/09/10. Всички тези несъвършенства трябва да бъдат сортирани преди започване на обучението или анализа на данните.

6. Многопроменливо смятане и линейна алгебра

Разбирането на концепциите за матрици (линейна алгебра) и диференциация (смятане) е важно умение, което трябва да притежава учен с данни. В организация, където съществуващите данни за нея играят основна роля за извършване на бъдещи прогнози, малките подобрения в прогнозната ефективност или алгоритмичната оптимизация могат да направят голяма промяна за организацията. В началните етапи на учен с данни, когато използва предварително кодирани модели, не е необходимо да има задълбочено разбиране на матрици или смятане, но за да разбере какво се случва под капака на моделите или да изгради свои собствени реализации, определено е необходимо за да разберем тези понятия.

Нетехнически умения

По-долу са дадени нетехническите умения, необходими за ученият по данни.

1. Интелектуално любопитство

Докато анализирате данните на дадена организация в повечето случаи никой няма да може да види директни резултати или отговори. Увеличете броя на въпросите, които започвате да си задавате повече отговори, които ще разберете от данните. Като цяло любопитството се определя като силно желание да се разбере нещо. Това е причината интелектуалното любопитство да е много важна черта на учен с данни.

2. Силна бизнес проницателност

Без разбирането на данните на организацията или елементите в бизнес модела, всички технически умения, които притежава даден учен, няма да могат да получат необходимите резултати за организацията, тъй като той няма да може да разбере кои функции присъстват в набора от данни трябва да се даде предимство и което следва да се счита за последно. Така че за учен с данни, разбирането на бизнес модела и данните на организацията ще помогне за решаването на потенциалните предизвикателства пред нея за поддържане и разрастване на техния бизнес.

3. Силни комуникационни умения

Като учен с данни трябва да подготвите презентация за своите технически констатации и да я представите на нетехническите екипи като отделите за продажби в определен или друг момент от кариерата. Като учен с данни трябва да притежавате умения като разказване на истории (способност да разказвате истории от откритията), защото целият период от време и енергия, изразходвани за проучване на данни, прилагане на статистически техники, откриване на резултатите и всички други неща, ще отидат напразно ако ученият с данни не е в състояние да предаде съобщенията правилно на бизнес ръководителите. И в повечето случаи бизнес мениджърите няма да се интересуват да слушат всички стъпки, които сме следвали, за да стигнем до заключенията, те ще бъдат фокусирани главно върху резултатите и представените ценности. Така че винаги е най-добра практика историята да е ясна и актуална.

Заключение - Умения, необходими за Data Scientist

Това са някои от най-важните умения, които човек трябва да притежава, за да бъде учен по данни, тъй като основната им работа включва работа върху данните на организацията, анализирането им и представянето им на бизнес ръководители.

Препоръчителни статии

Това е ръководство за уменията, необходими за Data Scientist. Тук обсъждаме техническите и нетехническите умения, необходими, за да бъдем специалист по данни. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Кариера на научните данни
  2. Езици на науката за данни
  3. Заплата за големи анализи на данни
  4. Въпроси за интервю на анализатор на данни
  5. PHP Формат на датата на промяна

Категория: