Въведение във видовете визуализация на данни
В съвременната арена с големи данни, имайки над 2, 5 квинтилионни байта (1 квинтилион байт = 10 18 байта!) От данни, създадени всеки ден (Според socialmediatoday.com), умира необходимостта от съхраняване на данните. Излишно е да казвам, че тези данни са плътни и следователно не толкова четими от потребителя и непрекъснато не са фокусирани. За да изместите парадигмата за лесно разбиране на обхвата на данните и да извлечете полезни ползи в бизнеса, данните трябва да бъдат представени по-интуитивен начин и следователно биха изисквали подходящи диаграми, за да ги визуализират. Съществуват инструменти и методологии, създадени за ефективно изобразяване на данните, но ефективността зависи най-вече от вида на данните и изискването, необходимо да бъдат изрязани от данните.
Какво е визуализация на данни?
Визуализацията на данните е методология, чрез която данните се представят в необработен формат, за да се разкрие смисъла на това. С появата на големи данни стана наложително да се изгради смислен начин за показване на данните, така че количеството данни да не стане прекомерно. Частта от изобразяването на данните може да бъде използвана за различни цели, например за намиране на тенденции / общности / модели в данните, изграждане на модели за машинно обучение или може да се използва за проста операция като обобщаване.
Различни видове визуализация на данни
Визуализацията на данните е широко класифицирана в 6 различни типа. Въпреки че областта на визуализация на данни непрекъснато нараства, няма да е изненада, ако броят на категориите се увеличи.
Временни: Данните за тези видове визуализация трябва да отговарят на двете условия: представените данни трябва да са линейни и да са едноизмерни. Тези видове визуализация са представени чрез линии, които могат да се припокриват и също така да имат обща начална и крайна точка от данни. | ||
Разсеяни парцели | Използва точки за представяне на точка от данни. Най-разпространеният в днешния свят в машинното обучение по време на проучвателен анализ на данни. | ![]() |
Кръгова диаграма | Този тип визуализация включва кръгови графики, където дължината на дъгата означава величината. | ![]() |
Диаграма на полярната зона | Подобно на диаграмата на пая, диаграмата на Полярната област е кръгова графика, с изключение на секторните ъгли, равни по дължина, а разстоянието на удължаване от центъра означава величината. | ![]() |
Линейни графики | Подобно на диаграмата на разсейване, данните са представени с точки, с изключение на присъединени с линии за поддържане на приемственост. | ![]() |
Срокове | По този начин показваме списък на точките с данни в хронологичен ред от време. | ![]() |
Поредици от времеви серии | Във времеви серии ние представяме величината на данните в двумерна графика в хронологичен ред на времевата маркировка в данните. | ![]() |
Йерархична: Тези видове визуализации изобразяват подредени групи в по-голяма група. На прост език, основната интуиция зад тези визуализации са клъстерите, които могат да бъдат показани, ако потокът от клъстери започне от една точка. | ||
Дървова диаграма | В дървесна диаграма йерархичният поток е представен под формата на дърво, както подсказва името. Малко терминологии за това представяне са:
- Root Node: Начална точка. - Детски възел: Има родител отгоре - Лист възел: Няма повече дете възел. | ![]() |
Диаграми на звънене / Слънчева диаграма | Представянето на дървото в диаграмата на дървото се преобразува в радиална основа. Този тип помага при представянето на дървото в сбит размер. Най-вътрешният кръг е коренният възел. А площта на детския възел означава% на данните. | ![]() |
дървовидна карта | Дървото е представено под формата на правоъгълници, плътно опаковани. Районът означава съдържащото се количество. | ![]() |
Кръгова опаковка | Подобно на дървесна карта, тя използва кръгова опаковка вместо правоъгълници. | ![]() |
Мрежа: Визуализацията на този тип свързва набори от данни към набори от данни. Тези визуализации изобразяват как тези набори от данни се свързват един с друг в рамките на мрежа. | ||
Матрични графики | Този тип визуализация се използва широко за намиране на връзката между различни променливи в себе си. Например, корелационен сюжет | ![]() |
Алувиални диаграми | Това е тип диаграма на потока, в която промените в потока на мрежата са представени през интервали, както желае потребителят. |
|
Word cloud | Обикновено се използва за представяне на текстови данни. Думите са плътно опаковани, а размерът на текста означава честотата на думата. |
|
Диаграми за връзка с възел | Тук възлите са представени като точки и връзката между възлите е представена. | ![]() |
Многоизмерна: За разлика от времевия тип визуализация, тези типове могат да имат множество измерения. В това можем да използваме 2 или повече функции, за да създадем 3-D визуализация чрез едновременни слоеве. Те ще позволят на потребителя да представи ключови поемания чрез разбиване на много неполезни данни. | ||
Разсеяни парцели | В многоизмерните данни избираме всякакви две характеристики и след това ги начертаваме в двумерно разпръскване. Правейки това бихме получили n C 2 = n (n-1) / 2 графики. | ![]() |
Подредени бар графики | Сегментите за представяне се намират един върху друг. Тя може да бъде или 100% подредена бар графика, където сегрегацията е представена в%, или обикновена подредена бар графика, която обозначава действителната величина | ![]() |
Паралелен координатен сюжет | В това представяне се очертава фон и се начертават n успоредни линии (за n-мерни данни). | ![]() |
Геопространствена: Тези визуализации се отнасят до настоящото физическо местоположение в реалния живот, като го пресичат с карти (Може да е геопространствена или пространствена карта). Интуицията зад тези визуализации е да се създаде цялостен поглед върху изпълнението. | ||
Карта на потока | Движението на информация или обекти от едно място до друго е представено, където размерът на стрелката означава сумата. | ![]() |
Карта на Choropleth | Геопространствената карта е оцветена въз основа на определена променлива от данни. | ![]() |
картограма | Този тип представяне използва тематичната променлива за картографиране. Тези карти изкривяват реалността, за да представят информация. Това означава, че на определена променлива картите са преувеличени. Например, изображението вляво е пространствена карта, изкривена на структура на пчелен кошер. | ![]() |
Топлина карта | Те са много подобни на Choropleth в геопространствения жанр, но могат да се използват и в области освен геопространствени. | ![]() |
Разни: Тези визуализации не могат да бъдат обобщени в особено голяма група. Така че вместо да формираме по-малки групи за отделния тип, ние го групираме в разни. Няколко примера са по-долу: | ||
Отворена-висока-ниска-затворена диаграма | Този тип графики обикновено се използват за представяне на цените на акциите. Нарастващата тенденция се нарича бичи и намалява като мечешка. | ![]() |
Kagi-Chart | Обикновено предлагането на търсенето на актив се представя с помощта на тази диаграма. | ![]() |
заключение
От горните видове визуализация виждаме, че като цяло има 6 вида групи. Списъкът по-горе не е изчерпателен списък, но малко от тях са широко използвани. В следващите моменти, когато и когато се добавят нови типове в списъка, групите могат да се увеличат. Това е за визуализацията. Ще продължим върху това какви параметри трябва да разгледаме по време на фиксиране на типа визуализация.
Препоръчителни статии
Това е ръководство за вида на визуализацията на данните. Тук обсъждаме Въведение и различни видове визуализация на данни. Можете също да прегледате и другите ни предложени статии, за да научите повече -
- Видове техники за анализ на данни
- Talend интеграция на данни
- Инструменти за анализ на данни
- Инструменти за научни данни
- Talend Tools
- Какво е интеграция на данни?
- Скатерни парцели в Матлаб
- Как се използва лентовата графика в Matlab (Примери)