Въведение във видовете визуализация на данни

В съвременната арена с големи данни, имайки над 2, 5 квинтилионни байта (1 квинтилион байт = 10 18 байта!) От данни, създадени всеки ден (Според socialmediatoday.com), умира необходимостта от съхраняване на данните. Излишно е да казвам, че тези данни са плътни и следователно не толкова четими от потребителя и непрекъснато не са фокусирани. За да изместите парадигмата за лесно разбиране на обхвата на данните и да извлечете полезни ползи в бизнеса, данните трябва да бъдат представени по-интуитивен начин и следователно биха изисквали подходящи диаграми, за да ги визуализират. Съществуват инструменти и методологии, създадени за ефективно изобразяване на данните, но ефективността зависи най-вече от вида на данните и изискването, необходимо да бъдат изрязани от данните.

Какво е визуализация на данни?

Визуализацията на данните е методология, чрез която данните се представят в необработен формат, за да се разкрие смисъла на това. С появата на големи данни стана наложително да се изгради смислен начин за показване на данните, така че количеството данни да не стане прекомерно. Частта от изобразяването на данните може да бъде използвана за различни цели, например за намиране на тенденции / общности / модели в данните, изграждане на модели за машинно обучение или може да се използва за проста операция като обобщаване.

Различни видове визуализация на данни

Визуализацията на данните е широко класифицирана в 6 различни типа. Въпреки че областта на визуализация на данни непрекъснато нараства, няма да е изненада, ако броят на категориите се увеличи.

Временни: Данните за тези видове визуализация трябва да отговарят на двете условия: представените данни трябва да са линейни и да са едноизмерни. Тези видове визуализация са представени чрез линии, които могат да се припокриват и също така да имат обща начална и крайна точка от данни.
Разсеяни парцелиИзползва точки за представяне на точка от данни. Най-разпространеният в днешния свят в машинното обучение по време на проучвателен анализ на данни.
Кръгова диаграмаТози тип визуализация включва кръгови графики, където дължината на дъгата означава величината.
Диаграма на полярната зонаПодобно на диаграмата на пая, диаграмата на Полярната област е кръгова графика, с изключение на секторните ъгли, равни по дължина, а разстоянието на удължаване от центъра означава величината.
Линейни графикиПодобно на диаграмата на разсейване, данните са представени с точки, с изключение на присъединени с линии за поддържане на приемственост.
СроковеПо този начин показваме списък на точките с данни в хронологичен ред от време.
Поредици от времеви серииВъв времеви серии ние представяме величината на данните в двумерна графика в хронологичен ред на времевата маркировка в данните.
Йерархична: Тези видове визуализации изобразяват подредени групи в по-голяма група. На прост език, основната интуиция зад тези визуализации са клъстерите, които могат да бъдат показани, ако потокът от клъстери започне от една точка.
Дървова диаграмаВ дървесна диаграма йерархичният поток е представен под формата на дърво, както подсказва името. Малко терминологии за това представяне са:

- Root Node: Начална точка.

- Детски възел: Има родител отгоре

- Лист възел: Няма повече дете възел.

Диаграми на звънене / Слънчева диаграмаПредставянето на дървото в диаграмата на дървото се преобразува в радиална основа. Този тип помага при представянето на дървото в сбит размер. Най-вътрешният кръг е коренният възел. А площта на детския възел означава% на данните.
дървовидна картаДървото е представено под формата на правоъгълници, плътно опаковани. Районът означава съдържащото се количество.
Кръгова опаковкаПодобно на дървесна карта, тя използва кръгова опаковка вместо правоъгълници.
Мрежа: Визуализацията на този тип свързва набори от данни към набори от данни. Тези визуализации изобразяват как тези набори от данни се свързват един с друг в рамките на мрежа.
Матрични графикиТози тип визуализация се използва широко за намиране на връзката между различни променливи в себе си. Например, корелационен сюжет
Алувиални диаграмиТова е тип диаграма на потока, в която промените в потока на мрежата са представени през интервали, както желае потребителят.

Word cloudОбикновено се използва за представяне на текстови данни. Думите са плътно опаковани, а размерът на текста означава честотата на думата.

Диаграми за връзка с възелТук възлите са представени като точки и връзката между възлите е представена.
Многоизмерна: За разлика от времевия тип визуализация, тези типове могат да имат множество измерения. В това можем да използваме 2 или повече функции, за да създадем 3-D визуализация чрез едновременни слоеве. Те ще позволят на потребителя да представи ключови поемания чрез разбиване на много неполезни данни.
Разсеяни парцелиВ многоизмерните данни избираме всякакви две характеристики и след това ги начертаваме в двумерно разпръскване. Правейки това бихме получили n C 2 = n (n-1) / 2 графики.
Подредени бар графикиСегментите за представяне се намират един върху друг. Тя може да бъде или 100% подредена бар графика, където сегрегацията е представена в%, или обикновена подредена бар графика, която обозначава действителната величина
Паралелен координатен сюжетВ това представяне се очертава фон и се начертават n успоредни линии (за n-мерни данни).
Геопространствена: Тези визуализации се отнасят до настоящото физическо местоположение в реалния живот, като го пресичат с карти (Може да е геопространствена или пространствена карта). Интуицията зад тези визуализации е да се създаде цялостен поглед върху изпълнението.
Карта на потокаДвижението на информация или обекти от едно място до друго е представено, където размерът на стрелката означава сумата.
Карта на ChoroplethГеопространствената карта е оцветена въз основа на определена променлива от данни.
картограмаТози тип представяне използва тематичната променлива за картографиране. Тези карти изкривяват реалността, за да представят информация. Това означава, че на определена променлива картите са преувеличени. Например, изображението вляво е пространствена карта, изкривена на структура на пчелен кошер.

Топлина картаТе са много подобни на Choropleth в геопространствения жанр, но могат да се използват и в области освен геопространствени.
Разни: Тези визуализации не могат да бъдат обобщени в особено голяма група. Така че вместо да формираме по-малки групи за отделния тип, ние го групираме в разни. Няколко примера са по-долу:
Отворена-висока-ниска-затворена диаграмаТози тип графики обикновено се използват за представяне на цените на акциите. Нарастващата тенденция се нарича бичи и намалява като мечешка.
Kagi-ChartОбикновено предлагането на търсенето на актив се представя с помощта на тази диаграма.

заключение

От горните видове визуализация виждаме, че като цяло има 6 вида групи. Списъкът по-горе не е изчерпателен списък, но малко от тях са широко използвани. В следващите моменти, когато и когато се добавят нови типове в списъка, групите могат да се увеличат. Това е за визуализацията. Ще продължим върху това какви параметри трябва да разгледаме по време на фиксиране на типа визуализация.

Препоръчителни статии

Това е ръководство за вида на визуализацията на данните. Тук обсъждаме Въведение и различни видове визуализация на данни. Можете също да прегледате и другите ни предложени статии, за да научите повече -

  1. Видове техники за анализ на данни
  2. Talend интеграция на данни
  3. Инструменти за анализ на данни
  4. Инструменти за научни данни
  5. Talend Tools
  6. Какво е интеграция на данни?
  7. Скатерни парцели в Матлаб
  8. Как се използва лентовата графика в Matlab (Примери)

Категория: