Въведение в Scatterplot в R

  • R е език за програмиране с отворен код, използван за статистически данни и анализ на данни. С нарастващата популярност на науката за данни, R също придоби популярност. Използва се главно от статистици на данни и миньори на данни за извличане на ценна информация от данни. R е интерпретиран език и има интерфейс на командния ред, но има много графични потребителски интерфейси за улесняване на задачите на програмиста. R предлага голямо разнообразие от библиотеки за внедряване на статистика и графични техники. R предлага статична графика; тя позволява на потребителя да изгради многопластова графика. По този начин той произвежда графики за качество на публикациите и осигурява по-добро представяне на информацията.
  • R предлага огромен набор от библиотеки за графична реализация, но най-популярният е „ggplot2“. GGPlot2 е изпълнение на „Граматика на графиката“, което прави създаването на сложни графики опростено. Той предоставя програмен интерфейс за уточняване на променливи, тяхната позиция, цвят на графиката, видове графики и други свойства на визуализация. Тя ви позволява да изграждате графики стъпка по стъпка, което ви позволява да създавате слоеве за голяма гъвкавост и качество на публикациите.
  • Един такъв тип графика е Scatterplot в R. Scatterplot в R, наричана също диаграма на разсейване, която е вид графика, която показва връзката между две променливи. Показва точките с данни под формата на точки. Тя може да бъде изтеглена между непрекъсната независима променлива и друга променлива, която зависи от предишната променлива или две непрекъснати независими променливи. Корелацията може да бъде положителна, отрицателна или нулева. Ако наклонът на графиката е от долната лява до горната дясна част, корелацията е положителна. Ако наклонът е от горния ляв до долния десен, корелацията е отрицателна или с други думи увеличението на стойността на една променлива ще намалее стойността на друга променлива.

Синтаксис: Има много пакети в R за графики, следователно има много функции за създаване на Scatterplot в R. Най-основната и проста функция е

парцел (x, y)

където

x означава хоризонталната ос или независимата непрекъсната променлива.

y означава вертикалната ос или зависимата променлива.

Има много други параметри, които да начертаят функцията, за да се направи графиката лесна за разбиране.

По-долу са някои с определение:

  • main: добавя заглавие към графиката
  • xlab: добавете етикет към оста x
  • ylab: добавя етикет към y-оста
  • xlim: указва обхвата на оста x
  • ylim: указва обхвата на y-оста
  • pch: показва формата на точките в разпръснатия сюжет
  • cex: указва размера на точките
  • col: определя цвета на точките

Scatterplot в R може да се създаде и с помощта на пакета ggplot2. За целта първо трябва да инсталираме и заредим пакета ggplot2. След добавяне на пакета към текущата сесия по-долу командата може да се използва за създаване на Scatterplot в R.

ggplot (набор данни, aes (x, y, цвят, форма)) + geom_poin () + лаборатории (x, y, заглавие)

където

  • наборът от данни е наборът от данни, за който трябва да се създаде rasterplot.
  • aes () е естетическо картографиране в графика. Той описва как променливите са картографирани на графиката.
  • x е хоризонталната ос или независимата непрекъсната променлива.
  • y е вертикалната ос или зависимата променлива.
  • color е да добавите цвят към точките въз основа на променливата на групирането.
  • формата се използва за задаване на форма въз основа на променлива на групиране.
  • + знак означава, че командата продължава.
  • geom_point () е функция за разпръснат сюжет.
  • лаборатории (x, y, заглавие): добавете x етикет, y етикет и заглавие към графиката.

Създайте Scatterplot In R

За да създадем Scatterplot в R, първо трябва да заредим набора от данни. Тук използваме набор от данни (mtcars), предоставен от R. Първо заредете набора от данни в текущата сесия, като използвате командата по-долу

данни (ириса)

След като базата данни се зареди, прегледайте данните, за да получите основно разбиране за типа данни и колоните в него, като използвате командата по-долу.

Ирис

След получаване на основно разбиране на данните, нека да създадем обикновен разпръсквател, използвайки сюжетна функция

парцел (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Добавяне на етикети, за да може графиката да се чете

парцел (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = „Дължина на Sepal“, ylab = „Ширина на Sepal“, main = „Ширина срещу дължина ”)

Добавяне на още един параметър, за да направите графиката по-привлекателна

парцел (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = „Дължина на Sepal“, ylab = „Ширина на Sepal“, main = „Ширина срещу дължина ”, pch = 8, cex = 1, 5, col = 6)

Освен тези 2-D сюжети, матрични и 3-D графики могат да бъдат създадени и в R.

Матрици за скатерплот

Когато имаме повече от две променливи в набор от данни и искаме да намерим корелация на всяка променлива с всички останали променливи, тогава се използва матрицата на разсейване. Най-основната и проста команда за матрицата на разсейване е:

двойки (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = „Scatterplot Matrix“)

Горната графика показва връзката между тегло, mpg, dsp и цилиндър.

Scatterplot 3D

Понякога триизмерна графика дава по-добро разбиране на данните. За това R предоставя множество пакети, един от тях е "scatterplot3d". По-долу са командите за инсталиране на "scatterplot3d" в R работното пространство и да го заредите в текущата сесия

install.packages ( "scatterplot3d")

библиотека (scatterplot3d)

След зареждане на библиотеката изпълнението на командите по-долу ще създаде 3-D разсейвател.

отдават (ириса)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = “3D Scatterplot”)

Отделно от това, има много други начини за създаване на триизмерна. Потребителите могат също да добавят подробности като цвят, заглавия, за да подобрят графиката. Потребителят може също да създаде интерактивен 3D разпръсквач, като използва функцията „plot3D (x, y, z)“, предоставена от пакет „rgl“. Тази функция създава въртящ се 3D разпръсквач, който може да се завърти с помощта на мишка. По този начин, давайки пълен поглед върху корелацията между променливите.

заключение

R е един от най-известните езици за прилагане на графични техники, използвани от учените по данни. Той предоставя широка гама от пакети и библиотеки за графика и по-добро разбиране на данните. „Gglpot2“, „ggvis“, „rgl“, „plot3d“, „решетка“, „анимация“, „gganimate“, „cairo“ са част от пакетите, предоставени от R.

Графикът за разпръскване е най-простият начин за по-добро разбиране на данните. Използвайки тази визуализация, потребителят може да се запознае как променливите са свързани помежду си, как промяната на стойността на една променлива ще промени стойността на други променливи и т.н. Наклонът на диаграмата говори за положителната и отрицателната връзка между променливите.

Препоръчителни статии

Това е ръководство за Scatterplot в R. Тук обсъждаме въведение, матрици за разпръскване, 3D разпръскване, как да създадем растерна? заедно с подходящи примери. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Какво е GraphQL
  2. Scrum Framework
  3. R Въпроси за интервю
  4. Въведение в биномното разпределение в R

Категория: