Въведение в списъка на R пакетите

Пакет в езика за програмиране на R е единица, която осигурява необходимите функционалности, които могат да се използват, като се заредят в R средата. Списъкът с R пакети е подобен на библиотека в C, C ++ или Java. Така че, по същество, един пакет може да има множество функции като функции, константи и т.н., които ще позволим на потребителя да ги използва в контекста на определен проблем. В R, необходим пакет може да бъде зареден с помощта на библиотеката () функция. В случай, че пакет няма, тогава той може да бъде инсталиран с помощта на функцията install.packages (). Пакетите улесняват привидно трудните задачи чрез готовите му функционалности.

Какво представляват R пакетите?

В R има много пакети и изборът на пакет зависи от неговото приложение. Въпреки че има определени пакети, които се използват широко поради функционалностите, които предоставят, не е така, че другите пакети са по-малко важни. Различните пакети имат различни цели; някои са свързани със статистически техники, някои се отнасят до визуализации и т.н.

В следващия раздел ще разгледаме някои от важните пакети в R:

1. Кола

Този пакет е спътник към приложна регресия. Това е голям пакет, който предоставя различни функционалности за статистически анализ. Импортиране на този пакет в R среда импортира други свързани пакети като MASS, статистика, графика и др. Някои от функциите в пакета включват Anova, avPlots, Boxplot, carPalette, диаграми за плътност, infIndexPlot, линейна хипотеза, logit, външен тест, qqPlot, остатъчни графики, матрица на разсейване, матрица на разсейване и др. Обширните възможности на пакета могат да се преценят от броя на функциите, които предоставя.

2. Corrplot

Пакетът предоставя графичен дисплей на корелационна матрица и доверителен интервал. Пакетът също така предлага алгоритми за извършване на матрично пренареждане. Многобройните опции включват избор на необходимите цветове, текстови етикети, цветни етикети, оформление и др. Различни методи за визуализация или методи на параметри в пакета corrplot са „кръг“, „квадрат“, „елипса“, „число“, „сянка“, „цвят“, и "пай". Функцията corrplot, включваща различни опции, дава визуално привлекателно представяне на корелацията между различни променливи, които в противен случай при нормални обстоятелства, като числа, са трудни за интерпретиране. Положителните корелации се показват в синьо, а отрицателните - в червено. Интензитетът на цвета и големината на кръга са пропорционални на коефициентите на корелация.

3. DataExplorer

Този пакет се занимава с автоматизирано проучване и обработка на данни. Той осигурява автоматизиран процес на проучване на данни, предназначен за аналитични задачи и прогнозно моделиране. Това е от решаващо значение, тъй като дава възможност на потребителя да разбира данни и да извлича информация. Всяка променлива в анализа се сканира и анализира от пакета. Освен това пакетът предоставя функционалности за визуализация на тези променливи, използвайки типични графични техники. Той също така предоставя общи методи за обработка на данни за обработка и форматиране на данни.

4. Gmodels

Пакетът gmodels предоставя различни инструменти в R за изчертаване на данни. Той съдържа различни функции като glh.test, която се използва за тестване, отпечатване или обобщаване на обща линейна хипотеза за регресионен модел. Функцията прави. контрасти превръщат човешки четими контрасти във формата, която R изисква за изчисляване. Матрицата, върната от make.contrasts, може да се използва като аргумент на аргумента за контраст на функциите на модела. Функцията coefFrame приляга на модел към всяка подгрупа, дефинирана от , след това връща кадър с данни с един ред за всяко напасване и една колона за всеки параметър. Функционалният анализ изчислява и тества контрасти и други оценяващи се линейни функции на моделните коефициенти за lm, glm и др. Функцията fit.contrast изчислява и тества произволни контрасти за регресионни обекти.

5. Gplots

Този пакет предоставя функционалности за визуализация чрез многообразни инструменти за програмиране. Функциите в пакета работят върху концепцията за изчисляване и начертаване. Графичните възможности на пакета се демонстрират от различни функции като диаграма на лентата, boxplot2, col2hex, ci2d, hist2d, текстови графики, график на мивката, пилот на балон, plotCI, графични средства и т.н. Тези функции позволяват работа с настройки, свързани с цвета, текст и други сложни графични аспекти на визуализацията. Те също така се занимават със сложни елементи, участващи във визуализацията, базирана на статистически данни, например lmplot2, остатъчни функции, които позволяват на потребителя да управлява подробна регресивна диагностика чрез диагностични диаграми. Ако е необходимо да се начертаят множество данни в един и същ регион, но с отделни оси, тогава това е възможно, като се използва функцията over plot в пакета.

6. Ggplot2

Това е един от много известните пакети в R, който предоставя широки визуални възможности и представя резултатите дори на сложни статистически и математически техники. Многобройните функционалности, предоставени от пакета, позволяват на анализатора да извлече информация от данните по най-интерактивния начин. Описанието на R за функцията е „система за декларативно създаване на графика, която се основава на граматиката на граматиката“. Тази граматика на графика означава, че потребителят трябва да каже на „ggplot2“ за начина, по който променливите трябва да бъдат картографирани към естетиката, така че това по същество означава, че посочването на какви графични аспекти да се използва и ggplot2 ще работи съответно въз основа на детайлите.

7. Смазване

Този пакет R улеснява работата с дати и часове. Пакетът за смазване позволява лесна манипулация на данните за дата и час. Той анализира число и дава подходящо подреждане на данни, всъщност функциите за анализ на пакета обработват голямо разнообразие от формати и разделители, което опростява процеса на анализ. Една от забележителните характеристики е, че пакетът предлага функционалности за обработка на дати с различни часови зони.

8. Hmisc

На име Harrell Разни, пакетът Hmisc съдържа много функции, които могат да се използват за анализ на данни, графики на високо ниво и полезни операции. Той също така включва функции за изчисляване на размера и мощността на извадката, импортиране и анотиране на набори от данни, имитиране на липсващи стойности, предоставяне на разширени функционалности на таблицата, групиране на променливи, манипулиране на символния низ, преобразуване на R обекти в HTML код и т.н.

9. Решетка

Пакетът предлага система за визуализиране на данни на високо ниво, която беше вдъхновена от графиката на Trellis. Той акцентира върху многомерните данни. Мощните възможности за визуализация на пакета осигуряват необходимото графично решение. Някои от забележителните функции в пакета са B_07_cloud, което помага за създаването на 3d разпръснат парцел и повърхностен сюжет; D_level. цветове, функция за изчисляване на фалшиви цветове, представляващи числова или категорична променлива; B_06_levelplot, функция, която генерира диаграми на ниво и контурни диаграми; A_01_Lattice, функция, която осигурява графични възможности на решетката. B_09_tmd е функция, която генерира Tukey Mean - Difference Plot; B_11_oneway, функция, която отговаря на еднопосочния модел. По този начин пакетът предоставя широки функционалности за визуализации чрез различни функции.

10. MatrixModels

Този пакет позволява моделиране с оскъдни и плътни "Matrix" матрици. За да постигне това, използва модулно предсказване и отговор, модулни класове. Всички функции, предоставени от пакета, са еднакво важни, някои от които са lm.fit.sparse, което е функция за монтиране на оскъдни линейни модели, modelCoef, който решава коефициентите и нарастването на коефициентите, модел. Матрица, която изгражда евентуално оскъдни дизайнерски или моделни матрици, glm4, която пасва на обобщени линейни модели.

11. Мултикомплект

Пакетът позволява множество сравнения на k групи в обобщени линейни модели. Списък с девет стандартни процедури, а именно Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott и Tetrade, се предоставят на потребителя и потребителят избира сравненията въз основа на изискването. В допълнение към това, за контрастната матрица е осигурен и безплатен входен интерфейс, който позволява специални сравнения. Забележителната особеност е, че самите сравнения не се ограничават до конкретен дизайн, като например балансиран или прост, а програмите са проектирани по такъв начин, че да отговарят на множество сравнения в рамките на общия линеен модел, който дава възможност за коварианти, корелиращи средства, липсващи стойности и т.н.

12. OpenMx

Този пакет основно се занимава с моделиране на разширено структурно уравнение. Той осигурява функционалност за създаване на модели на структурни уравнения. Тези модели могат да бъдат манипулирани с помощта на програмиране. Моделите могат да бъдат зададени с матрици или пътища като LISREL или RAM. Някои от типовете модели включват множество групи, потвърждаващ фактор, разпределение на сместа, категоричен праг, диференциални функции Fit и т.н.

13. Plyr

Това е много важен пакет, който предоставя функционалности за манипулиране на данни. Той предоставя инструменти за разделяне, прилагане и комбиниране на данни. Той се предлага с набор от инструменти, които помагат за решаване на общ набор от проблеми. Например, понякога може да се наложи да разбием голяма задача на по-малки задачи, които са управляеми, след това работим върху всяко от парчетата и накрая, ние отново събираме всички части.

14. Qcc

Пакетът придобива значимост благодарение на различни функционалности за анализ на качеството, които предоставя. Той осигурява графики за контрол на качеството на Shewhart за непрекъснатост, атрибути и преброяване на данни. Сред другите важни диаграми са Cusum и EWMA диаграми и криви на експлоатационните характеристики. Той също така предлага функционалност за анализ на възможностите на процеса. Парето диаграма и диаграма за причинител и следствие и многовариантните контролни диаграми са полезни инструменти, които се предоставят от пакета.

15. RandomForest

Както подсказва името, този пакет се използва за изграждане на произволен горски алгоритъм. Пакетът реализира алгоритъма на случайните гори на Breiman, който се основава на оригиналния FORTRAN код на Beiman и Cutler. Алгоритъмът се използва за класификация и регресия. Пакетът може да се използва и в неподдържан режим за оценка на близостта между точките с данни.

16. Психика

Това е пакет, предназначен за специална цел. Пакетът предоставя процедура за психологически, психометрични и личностни изследвания. Функциите са предимно за многовариантния анализ, използвайки различни многовариантни статистически техники.

Заключение-Списък на R пакети

В R има множество пакети и прилагането на пакет зависи от изискванията. Списъкът на списъка с R пакети се разраства много бързо и всеки ден един пакет се добавя. Множество пакети могат да осигурят сходни функции, но изборът на пакет трябва да се основава на внимателното му проучване.

Препоръчителни статии

Това е ръководство за списък на R пакетите. Тук обсъждаме въвеждането на R пакети и някои важни пакети на R. Можете също да разгледате и другите ни предложени статии, за да научите повече -

  1. Java пакети
  2. Какво е JNDI в Java?
  3. JColorChooser
  4. R Програмиране срещу Python

Категория: