Въведение в R пакетите

Пакетът е набор от функции и набори от данни. Пакетите помагат да се подобри функционалността на език за програмиране. Ако искаме да съхраняваме и обработваме бази данни (т.е. SQL като функционалности, използващи рамки от данни), тогава можем да използваме пакет dplyr в R. Пакетите също предоставят документация за това как да използваме функциите и наборите от данни в даден пакет.

Къде можем да намерим пакети?

Пакетите са достъпни в интернет чрез различни източници. Има обаче определени надеждни хранилища, от които можем да изтеглим пакетите.

Ето двата важни хранилища, които са достъпни онлайн.

  • CRAN (Comprehensive R Archive Network): Това е официалната R общност с мрежа от FTP и уеб сървъри, която съдържа най-новия код и документация на R. Преди да публикувате вашите пакети онлайн, тя преминава през серия от тестове, които се придържат към политиката на CRAN,
  • GitHub: GitHub е друго известно хранилище, но не е специфично за R.The онлайн общността може да споделя своите пакети с други хора и се използва за контрол на версиите е добре. GitHub е с отворен код и няма никакъв процес на преглед.

Списък на полезни R пакети

В R има няколко пакета и могат да бъдат изтеглени от CRAN или GitHub. По-долу са пакетите, които могат да се използват за конкретни цели.

1. Зареждане на данните от външни източници

  • Хейвън: R чете и записва данни от SAS.
  • DBI: Да се установи комуникация между релационната база данни и R.
  • RSQlite: Използва се за четене на данни от релационни бази данни.

2. Манипулиране на данни

  • Dplyr: Използва се за манипулиране на данни като подмножество, осигурява преки пътища за достъп до данни и генерира sql заявки.
  • Tidyr - Използва се за преобразуване на данни в малки формати.
  • stringr - манипулиране на низови изрази и символни низове.
  • смазване- За работа с данни и време.

3. Визуализация на данни

  • Rgl: За работа върху 3D визуализации.
  • ggvis: За създаване и изграждане на граматика на графика.
  • googlevis: Използване на google инструменти за визуализация в R.

4. Уеб-базирани пакети

  1. XML: За да четете и пишете XML документи в R.
  2. Httpr: Работа с http връзки.
  3. Jsonlite: За да четете таблици с данни на json.

Получаване на R пакети

Можем да проверим наличните пакети, които присъстват в R, като използваме кода по-долу.

  • available.packages (): В CRAN мрежата има приблизително 5200 пакета.

CRAN има изгледи на задачи, които групират пакети по определена тема.

Инсталиране на R пакети

Можем да инсталираме пакети директно чрез IDE или чрез команди. За инсталиране на пакети използваме функцията по-долу и указваме името на пакета.

Синтаксис:

install.packages()

Код:

install.packages(“ggplot2”)

Горният код инсталира ggplot2 пакета и неговите зависими пакети, ако има такива.

Можем да инсталираме няколко пакета наведнъж, като посочим имената на пакета под векторния символ.

Синтаксис:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Код:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Инсталиране с помощта на R Studio

Предимството на използването на R studio е, че е GUI (графичен потребителски интерфейс). Можем да изберем пакетите за инсталиране и източника на него.

Можем да преминем към инструменти -> Инсталиране на пакети.

Зареждане на R пакети

След инсталирането на пакета R трябва да ги заредим в R, за да започнем да използваме инсталираните пакети.

Използваме функцията по-долу за зареждане на пакетите.

Синтаксис:

library(package name)

Забележка: Името на пакета не е необходимо да се посочва в кавички.

Код:

library(ggplot2)

Има определени пакети, които показват съобщения при зареждане. Някои от тях, не. Можем да видим детайлите на инсталираната библиотека с помощта на кода по-долу.

Код:

library(ggplot2)
search()

изход:

"Пакет: решетка" "пакет: ggplot2" "пакет: мазоли"

„Пакет: плетач“ „пакет: плъзгане“ „инструменти: rstudio“

Създаване на собствен пакет

Преди да създадем собствен пакет. Трябва да държим по-долу контролния списък в съзнанието си, преди да пристъпим към създаване на пакет.

  • Организирането на кода е едно от най-важните неща, докато пишете код в пакета. Губим половината от времето в търсене на местоположението на кода, вместо да подобрим кода. Поставете всички файлове в папка, която е лесно достъпна.
  • Документирането на кода ви помага да разберете целта на кода. Когато не преразглеждаме кода често, забравяме защо сме написали кода по определен начин. Освен това може да помогне на хората да разберат по-добре кода ви, когато се споделят с тях.
  • Споделянето на скриптове чрез имейл се превърна в архаично. Лесният начин е да качите кода си и да го разпространите в GitHub. Възможно е да получите обратна връзка, която може да ви помогне да подобрите кода.

За да създадем свой собствен пакет, трябва да инсталираме пакета devtools.

Код:

install.packages("devtools")

За да помогнем с документацията, можем да използваме пакета по-долу.

Код:

install.packages("roxygen2")

След инсталиране на пакета devtools. Можете да създадете свой собствен пакет.

Код:

devtools::create ("packagename")

На мястото на „име на пакета“ можете да дадете името, което желаете. Сега можете да добавите функциите си в този пакет.

Можете да създадете същото име на файл като името на вашата функция.

Синтаксис:

Devtools:create(“firstpackage”)

Разпространяващ пакет

Можете да разпространявате вашия пакет в github, като използвате пакета devtools.

Използваме кода по-долу, за да разпространяваме нашия пакет в github.

Код:

devtools::install_github("yourusername/firstpackage")

Можете да дадете потребителското име на github и името на пакета, което сте създали по-горе.

Ето необходимите файлове за пакет

  • Функции
  • документация
  • Данни

След като имаме всички горепосочени файлове, е добре да го публикуваме в хранилището.

Препоръчителни статии

Това е ръководство за R пакети. Тук обсъждаме списъка с полезни R пакети, инсталиране на пакети с помощта на R studio и създаване на собствен пакет и т.н. Можете също така да разгледате следните статии, за да научите повече -

  1. Какво е език за програмиране на R?
  2. Кариери в R програмиране
  3. R Програмиране срещу Python
  4. MySQL срещу SQLite
  5. Списък на R пакети

Категория: