Преглед на R Data Frame

Кадрите от данни са списък на вектори с еднаква дължина. Разликата между матрицата и кадрите от данни е, че кадрите с данни приемат различни видове данни. (Символ, цифра и др.) В тази тема ще научим за R Data Frame.

Предимства на използването на рамки от данни

  • Разпределено събиране на данни и организирано.
  • Той има по-добри оптимизации в сравнение с релационна база данни.
  • Съдържа различни данни, които са разнородни.

Създаване на рамка от данни в R

Ние създаваме data_frame. По-долу е примерът за деклариране на рамка от данни.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

В горния пример не сме дефинирали променливите. Нека сега видим как присвояваме стойности на променливи и ги съхраняваме в рамката с данни.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

изход:

Брой алфа булеи

1 2 x ИСТИНСКА

2 3 y ИСТИНСКИ

3 4 z FALSE

Структура на рамката от данни

Когато искаме да знаем структурата на определен кадър от данни. Можем да използваме функцията по-долу.

Звезда ()

str(Data_frame)

изход:

Номер: число 2 3 4

алфа: Фактор w / 3 нива „x“, „y“, „z“: 1 2 3

Булеви: логи ИСТИНСКИ ИСТИНСКИ ФАЛЗ

Извличане на конкретни данни от рамката от данни

1. Използване на името на колоната

Можем да извлечем определен набор от данни от рамката с данни.

От нашия пример по-горе, нека извлечем само първата колона от рамката с данни, която е Number.

Data_ frame <- data. Frame(Number)

изход:

номер

12

2 3

3 4

2. Използване на редовете

Можем да извлечем данните от редовете точно като примера по-долу.

Да предположим, че искаме да отпечатаме само два реда от колоната Число.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

изход:

Брой алфа булеи

1 2 x ИСТИНСКА

2 3 y ИСТИНСКИ

3 4 z FALSE

------------

Брой алфа булеи

1 2 x ИСТИНСКА

2 3 y ИСТИНСКИ

Можем да наблюдаваме разликата в първия и втория изход.

3. Печат на конкретни редове и колони

Можем също да отпечатваме конкретни редове и колони.

В примера по-долу отпечатваме 1- ви и 2- ри редове, колони

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

изход:

Брой алфа булеи

1 2 x ИСТИНСКА

2 3 y ИСТИНСКИ

3 4 z FALSE

-------------

Алфа номер

1 2 x

2 3 г.

4. Добавяне на друга колона към рамката с данни

Можем да добавим още една колона заедно със стойности към рамката с данни.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

изход:

Число алфа булеви клас

1 2 x ИСТИНСКА A

2 3 y ИСТИНСКИ B

3 4 z FALSE C

5. Добавяне на ред в рамката с данни

Използваме функцията rbind, за да добавим нов ред към съществуващия кадър с данни.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

изход:

Число алфа булеви клас

1 2 x ИСТИНСКА A

2 3 y ИСТИНСКИ B

3 4 z FALSE C

4 5 x FALSE D

6. Комбиниране на двата кадъра от данни

Можем също да комбинираме два кадъра с данни, за да произведем един изход.

За да комбинираме два кадъра с данни, трябва да имаме една и съща колона за кадрите с данни.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

изход:

Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
--------------
Брой алфа булеи
1 4 x ИСТИНСКА
2 5 y ИСТИНСКИ
3 6 z FALSE

--------------

Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
4 4 x ИСТИНСКА
5 5 y ИСТИНСКИ
6 6 z FALSE

Проверка на рамки за данни

По-долу са различните начини за инспектиране на рамка от данни и предоставя информация за рамка от данни, точно както горната функция на звездата.

1. Имена - предоставя имената на променливите в рамката от данни

Синтаксис : names(data frame name)

пример

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

изход : (1) "Число" "алфа" "Булеви"

2. Обобщение - Предоставя статистиката на рамката с данни.

Синтаксис: summary(data frame name)

пример

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

изход:

Брой алфа булеи
Мин. : 2.0 x: 1 Режим: логичен
1-ви Qu.:2.5 y: 1 FALSE: 1
Медиана: 3.0 z: 1 ИСТИНСКА: 2
Средно: 3.0 НС: 0
3-ти Qu.нат.5
Макс. : 4.0

3. Head - Предоставя данните за първите няколко реда.

Синтаксис: Head( name of the data frame)

пример

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

изход:

Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
4 5 ИСТИНСКА
5 6 b ЛЕЖНО
6 7 c ЛЕЖНО

4. Tail - Отпечатва последните няколко реда в рамката с данни.

Синтаксис: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

изход:

Брой алфа булеи
5 6 b ЛЕЖНО
6 7 c ЛЕЖНО
7 8 d ЛЕЖНО
8 9 f ЛЕЖНО
9 10 g ЛЕЖНО
10 11 j ЛЕЖНО

заключение

Кадрите от данни са важна концепция в R програмирането. Той е лесен, но мощен в създаването на набори от данни, които могат да бъдат променяни и достъпни лесно. Точно като матрицата, до наборите от данни може да се осъществява достъп чрез имена на редове и колони с лесно добавяне и премахване на данни.

Препоръчителни статии

Това е ръководство за R Data Frame. Тук обсъждаме Създаване на рамка от данни в R със структурата и извличане на конкретни данни от рамката от данни. Може да разгледате и следните статии, за да научите повече -

  1. Типове данни в С
  2. Кариера на научните данни
  3. Технологии за големи данни
  4. Платформа за научни данни
  5. Java Booleans

Категория: