Преглед на R Data Frame
Кадрите от данни са списък на вектори с еднаква дължина. Разликата между матрицата и кадрите от данни е, че кадрите с данни приемат различни видове данни. (Символ, цифра и др.) В тази тема ще научим за R Data Frame.
Предимства на използването на рамки от данни
- Разпределено събиране на данни и организирано.
- Той има по-добри оптимизации в сравнение с релационна база данни.
- Съдържа различни данни, които са разнородни.
Създаване на рамка от данни в R
Ние създаваме data_frame. По-долу е примерът за деклариране на рамка от данни.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
В горния пример не сме дефинирали променливите. Нека сега видим как присвояваме стойности на променливи и ги съхраняваме в рамката с данни.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
изход:
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
Структура на рамката от данни
Когато искаме да знаем структурата на определен кадър от данни. Можем да използваме функцията по-долу.
Звезда ()
str(Data_frame)
изход:
Номер: число 2 3 4
алфа: Фактор w / 3 нива „x“, „y“, „z“: 1 2 3
Булеви: логи ИСТИНСКИ ИСТИНСКИ ФАЛЗ
Извличане на конкретни данни от рамката от данни
1. Използване на името на колоната
Можем да извлечем определен набор от данни от рамката с данни.
От нашия пример по-горе, нека извлечем само първата колона от рамката с данни, която е Number.
Data_ frame <- data. Frame(Number)
изход:
номер
12
2 3
3 4
2. Използване на редовете
Можем да извлечем данните от редовете точно като примера по-долу.
Да предположим, че искаме да отпечатаме само два реда от колоната Число.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
изход:
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
------------
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
Можем да наблюдаваме разликата в първия и втория изход.
3. Печат на конкретни редове и колони
Можем също да отпечатваме конкретни редове и колони.
В примера по-долу отпечатваме 1- ви и 2- ри редове, колони
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
изход:
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
-------------
Алфа номер
1 2 x
2 3 г.
4. Добавяне на друга колона към рамката с данни
Можем да добавим още една колона заедно със стойности към рамката с данни.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
изход:
Число алфа булеви клас
1 2 x ИСТИНСКА A
2 3 y ИСТИНСКИ B
3 4 z FALSE C
5. Добавяне на ред в рамката с данни
Използваме функцията rbind, за да добавим нов ред към съществуващия кадър с данни.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
изход:
Число алфа булеви клас
1 2 x ИСТИНСКА A
2 3 y ИСТИНСКИ B
3 4 z FALSE C
4 5 x FALSE D
6. Комбиниране на двата кадъра от данни
Можем също да комбинираме два кадъра с данни, за да произведем един изход.
За да комбинираме два кадъра с данни, трябва да имаме една и съща колона за кадрите с данни.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
изход:
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
--------------
Брой алфа булеи
1 4 x ИСТИНСКА
2 5 y ИСТИНСКИ
3 6 z FALSE
--------------
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
4 4 x ИСТИНСКА
5 5 y ИСТИНСКИ
6 6 z FALSE
Проверка на рамки за данни
По-долу са различните начини за инспектиране на рамка от данни и предоставя информация за рамка от данни, точно както горната функция на звездата.
1. Имена - предоставя имената на променливите в рамката от данни
Синтаксис : names(data frame name)
пример
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
изход : (1) "Число" "алфа" "Булеви"
2. Обобщение - Предоставя статистиката на рамката с данни.
Синтаксис: summary(data frame name)
пример
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
изход:
Брой алфа булеи
Мин. : 2.0 x: 1 Режим: логичен
1-ви Qu.:2.5 y: 1 FALSE: 1
Медиана: 3.0 z: 1 ИСТИНСКА: 2
Средно: 3.0 НС: 0
3-ти Qu.нат.5
Макс. : 4.0
3. Head - Предоставя данните за първите няколко реда.
Синтаксис: Head( name of the data frame)
пример
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
изход:
Брой алфа булеи
1 2 x ИСТИНСКА
2 3 y ИСТИНСКИ
3 4 z FALSE
4 5 ИСТИНСКА
5 6 b ЛЕЖНО
6 7 c ЛЕЖНО
4. Tail - Отпечатва последните няколко реда в рамката с данни.
Синтаксис: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
изход:
Брой алфа булеи
5 6 b ЛЕЖНО
6 7 c ЛЕЖНО
7 8 d ЛЕЖНО
8 9 f ЛЕЖНО
9 10 g ЛЕЖНО
10 11 j ЛЕЖНО
заключение
Кадрите от данни са важна концепция в R програмирането. Той е лесен, но мощен в създаването на набори от данни, които могат да бъдат променяни и достъпни лесно. Точно като матрицата, до наборите от данни може да се осъществява достъп чрез имена на редове и колони с лесно добавяне и премахване на данни.
Препоръчителни статии
Това е ръководство за R Data Frame. Тук обсъждаме Създаване на рамка от данни в R със структурата и извличане на конкретни данни от рамката от данни. Може да разгледате и следните статии, за да научите повече -
- Типове данни в С
- Кариера на научните данни
- Технологии за големи данни
- Платформа за научни данни
- Java Booleans