Въведение в хистограмата в R

В тази статия ще започнем с основната хистограма при R внедряване и персонализиране. Хистограмата играе важна роля в анализите на данни за визуализиране на данните. R програмирането е специална среда за статистически изчисления и основи за науката за данни. В R програмирането наборите данни и функции са групирани под формата на пакети. Повечето от програмите за визуална анализа използват хистограмите и използват ширината на кошчето по подразбиране. Те позволяват бързо да се проучат данните, които са основна роля в науката за данните. Тук ще изградим хистограма, използвайки R команди.

Какво е хистограма?

Хистограмата представлява изобразяващо представяне на разпределение на база данни, с което лесно бихме могли да анализираме кой фактор има по-голям обем данни и най-малко данни. С други думи, хистограмата позволява да се правят кумулативни честотни диаграми в оста x и y. Всъщност хистограмите вземат както групирани, така и негрупирани данни. За групирани данни хистограмата се изгражда, като се вземат предвид границите на класа, докато негрупираните данни е необходимо да се формира групираното разпределение на честотата. Те помагат за ефективен анализ на обхвата и местоположението на данните. Прилага се някаква обща структура на хистограмите като нормална, изкривена, скала по време на разпространението на данни.

За разлика от лентата, хистограмата на диаграмата няма пропуски между баровете, а баровете тук са посочени като кошчета, с които данните са представени на равни интервали. Хистограма Взема непрекъсната променлива и се разделя на интервали е необходимо да изберете правилната ширина на кошчето. Основната разлика между лентовата диаграма и хистограмата е, че първите използват номинални набори от данни, за да начертаят, докато хистограмата очертава непрекъснатите набори от данни. R използва функция hist () за създаване на хистограми. Тази функция hist () използва вектор за стойности, за да начертае хистограмата. Хистограмата се състои от диапазон на непрекъснати стойности на ос, x-ос начертава честите стойности на данните в x-ос с барове с вариации на височината.

Синтаксис:

Синтаксисът за създаване на хистограма е

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Създаване на хистограма в R

За анализ целевата хистограма изисква някакъв вграден набор от данни, който да се импортира в R. R, а библиотеките й имат различни графични пакети и функции. Тук използваме набор от данни на швейцарски и въздушни пътници. За изчисляване на хистограма за дадена стойност на стойността на данните hist () се използва заедно със знак $ за избор на определена колона от данни от набора данни за създаване на хистограма.

Следващият пример изчислява хистограма на стойността на данните в колоната Изследване на набора данни, наречен Swiss.

Пример 1: Нека създадем проста хистограма

Код:

hist (swiss $Examination)

изход:

Hist е създаден за швейцарска база данни с изпит на колона. това просто очертава кошче с честота и х-ос.

Пример 2: Хистограма с повече аргументи

За да постигнем по-добро разбиране на хистограмите, трябва да добавим още аргументи към функцията hist, за да оптимизираме визуализацията на диаграмата. Промяната на x и y етикет в диапазон от стойности xlim и ylim аргументи се добавят към функцията.

Пример:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

изход:

По-горе код начертава хистограма за стойностите от набора от данни Air Passengers, дава заглавие като „Хистограма за повече аргументи“, етикетът x-ос като „Списък с имена“, със зелена рамка и жълт цвят до лентите, като ограничава стойност като 100 до 600, стойностите, отпечатани на оста y с 2, и ширината на кошчето да е 5.

Добавяне на два различни цвята към лентата

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

изход:

Добавяне на повече ленти към хистограмата

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

изход:

Пример 3: Хистограма в R Връща стойност

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

изход:

Пример 4: Използване на аргумент Break за промяна на ширината на кошчето

За да има повече точки на прекъсване между ширината, предпочита се да използвате стойността в c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

изход:

Горната графика приема ширината на лентата чрез стойности на последователност.

Пример 5: Изпълнение на кривата на нормално разпределение в хистограма

Ще използваме набора от данни „швейцар“ за стойностите на данните, за да нарисуваме графика. Тук функцията крива () се използва за показване на разпределителната линия.

Код:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

изход:

Пример 6: Разпределение на вероятностното разпределение

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Създаване на диаграми за плътност в хистограма в R

Разпределението на променлива се създава с помощта на функционална плътност (). По-долу е примерът с mtcars на базата данни. Парцелите за плътност помагат при разпределението на формата.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

изход:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Следващата хистограма в R показва височината като изследване на x-ос, а плътността е начертана на y-оста.

изход:

заключение

Това е всичко за хистограмата и именно хистограмата е най-лесният начин да разберете данните. Както видяхме с хистограма, бихме могли да нарисуваме единични, множество диаграми, използвайки ширина на кошчето, корекция на оста, промяна на цветовете и др. Хистограмата помага да се визуализират различните форми на данните. Накрая видяхме как хистограмата позволява да се анализират набори от данни, а средните точки се използват като етикети на класа. Хистограмата помага при промяна на интервалите за получаване на подобрено описание на данните и работи, особено с цифрови данни. хистограмите са по-предпочитани в анализа поради предимството им от показване на голям набор от данни. Въз основа на изхода можем да изкривим визуално данните и лесно да направим някои предположения.

Препоръчителни статии

Това е ръководство за Хистограма в Р. Тук сме обсъдили концепцията, синтаксиса и как да създадем хистограма в R с примери. Можете също да разгледате следните статии, за да научите повече -

  1. Примери за хистограма
  2. Кариера в R програмиране
  3. Грамота на Гант в Табау
  4. Кариера в компютърното програмиране
  5. Как да създадете линейна графика в R?

Категория: