Какво е визуализация на данни?

И защо вече не ни пука за диаграми за пай,

Визуализацията на данните не е просто превод на точки от данни в малки диаграми и линейни графики. Това е като гмуркане в океан, което крие съкровища на всяко ниво. В самото начало имаме директно очертаване на данните във фигурки от учебник, а именно. разпръснете парцели, линейни графики, диаграми на пай и графики. Линейните диаграми обикновено се използват за изобразяване на тенденция на данните във времето. В тази тема какво е визуализация на данни, ние изчистихме цялата концепция напред с дадените графики и диаграми на пай.

Кръгови диаграми

Една от най-повсеместните класации в употреба е диаграма на пицата или диаграма с пай.

Пропорция на газове в смес.

Източник : сюжетно

Често използвана по време на избори, за да покаже коя партия има лъвовете да споделят гласове, тази диаграма, макар и изключително популярна, има някои забележителни недостатъци. Статистици като Едуард Туфте, Леланд Уилкинсън и Джералд ван Бел изразиха несъгласието си към използването на диаграми за пай. Най-убедителното доказателство срещу диаграмите на пай вероятно е предоставено от Стивън Фау, основателят на Perceptual Edge. В своята статия „Запазете пая за десерта“, публикувана в бюлетина на Visual Business Intelligence, Стивън обяснява защо, за изненада на своите колеги и студенти, той смята, че диаграмите на пай са неефективно средство за визуализиране на данни.

Разгледайте диаграмата за пай по-долу.

В тази графика, изобразяваща съотношението на хранителните артикули, поръчани след 21 ч., Е лесно да се прецени процентът, принадлежащ на Сладолед - 25%. След леко изменение обаче вече не е възможно лесно да се установи процентът на поръчките за сладолед.

Въпреки че процентът на сладоледите все още е същия при 25%. Трудно е да се разбере от диаграмата по-горе. В предишната диаграма беше лесно да се отгатне процентът, тъй като сянката за сладолед започва от 6 o 'позиция на часовника и се простира до 9 o' позиция на часовника. Тъй като очите ни са обучени да виждаме часовниците на 12, 3, 6 и 9 - диаграма с пай също е по-лесна за интерпретация, ако регионите й се придържат към 4-те позиции на часовника. Един запален привърженик на пай диаграмата би излязъл и предполага, че този проблем може лесно да бъде избегнат чрез използване на етикети и маркиране на процента спрямо всеки регион.

Кругова диаграма с етикети на данни

Но отново, за да съпоставим стойността с елемента, очите ни трябва да продължат да изместват фокуса от легендата в долната част на графиката към етикетите на диаграмата. Решението за това би било да прикачите и името на елемента, заедно със стойностите - да получите нещо подобно на това:

Перфектно, бихте казали. Но тогава ви питам - Сега, когато прикачихме имената на елементите заедно със стойностите, как се различава диаграмата на пай по-горе от таблицата по-долу:

Изчистете таблицата с данни, сортирани по Процент на поръчката

Дали тази информация не изглежда много по-добре от етикетите и легендите, разпръснати по диаграмата на пай. В какво се използва тогава диаграмата за пай? Предполага се, че визуализациите ще добавят стойност, те са агенти на заключения, те трябва да накарат данните да разкрият своите тайни. Но в този случай диаграмата с пай не изпълнява обещанието си.

Въведете лентовата диаграма за визуализация на данни

По-тънката и много по-елегантна алтернатива на круговата диаграма е лентовата диаграма, която е в състояние да изрази всичко, което казва пайът и много повече, без да прави бъркотия от етикети и легенди.

Лентова диаграма, изобразяваща същото - лесно за сравняване, контраст и заключение

Това е същата информация, която сега се представя нежно на наблюдателя. Освен че показва отделните стойности, тази графика ни позволява бързо да сравняваме популярността на всеки хранителен продукт и дори да сравняваме относителната разлика в стойността между последователните артикули. Същите данни биха били налични и през таблицата, но мозъците ни са по-добри в обработката на изображения, отколкото в дешифрирането на текста. Ето защо използването на диаграма за пай с времето намалява. Макар и любим визуал в медийната индустрия, това е заменено от по-добри и по-сложни представи. Освен линейни графики, пайове и лентови диаграми има и безброй други диаграми, които са ви полезни. Една интересна графика, но не толкова популярна за непосветените е диаграмата на Sankey. Тази диаграма се използва за изразяване на разпределението и потока на материята. Въпросният въпрос може да бъде енергия, пари или дори вода.

Sankey Диаграма за енергийния поток и разпределение на типичен ИТ служител.

По-горе е фиктивна диаграма на Sankey, изразяваща как и къде се разпределя по-голямата част от енергията на ИТ служителя.

По-нови инструменти

С появата на социалните медии и различните платформи, където хората могат да изписват своите чувства, отзиви и мнение, един инструмент за визуализация на данни, който стана доста често срещан, е облачността на думите. Облачните думи ни помагат да разберем за какво говорят хората.

Много реално представяне на облачни думи на живо на потребителските ревюта на PUBG в Google Play Store

Ако погледнем думата облак тук, която е изградена от първите 80 рецензии на играта PUBG в Google Play Store, виждаме, че общият отговор на играта е „добър“, някои хора дори го наричат ​​„най-добрия“, Изглежда обаче, че има проблем с някои „актуализации“, които хората молят създателите на играта да се поправят. Всъщност, когато проверяваме отзивите в магазина за игра в този ден, виждаме отразено същото.

Проблемът с актуализациите. Също така вижте дали тук можете да намерите среща с думата „моля“

Бъдещето

Това е просто надраскване на върха на айсберга. Библиотеките като заговор и D3 приеха визуализацията на данните на различно ниво. Това се е случило, защото търсенето също се е променило. Как бихте визуализирали интелигентен град на табло? Гигантски екран, на който могат да бъдат показани жизнените точки на цял град. Трафикът, потреблението на енергия, здравословните условия на различните райони, качеството на въздуха и множество други параметри трябва да бъдат показани на една страница. Това изискване изисква различен подход към визуализацията на данните. Така че научихме, че какво е визуализацията на данни с помощта на тази концепция. Вече не можем да се придържаме с диаграми и графики. Нов подход е необходим, когато графиките отговарят на изкуството и въображението, създавайки обогатяващо визуално преживяване. Тази дискусия изисква съвсем друга статия. До следващия път.

Препоръчителни статии

Тази статия е полезно ръководство за това какво е визуализация на данни. Тук сме обсъдили основните понятия с диаграми и графики, така че лесно да разберете визуализацията на данните. Можете също да разгледате следната статия, за да научите повече -

  1. Кариера в администратор на база данни на Oracle
  2. 7 най-полезна разлика между извличане на данни срещу уеб
  3. Въпроси за интервю за анализ на данни
  4. Примери за големи анализи на данни

Категория: