Какво е кошер?

Преди да разберем първо типовете данни на кошера, ще проучим кошера. Hive е техника за съхранение на данни на Hadoop. Hadoop е сегментът за съхранение и обработка на данни на Big data платформа. Hive заема позицията си за техники за продължаване на обработката на данни. Подобно на други среди за продължаване, до кошера може да се стигне чрез следващи заявки. Основните предложения на кошера са анализ на данни, ad-hoc запитване и обобщение на съхранените данни от гледна точка на латентността, заявките получават по-голямо количество.

Видове данни на кошера

Типовете данни се класифицират в два вида:

  • Примитивни типове данни
  • Типове колективни данни

1. Примитивни типове данни

Примитивните средства са били древни и стари. всички типове данни, изброени като примитивни, са наследени. важните примитивни области от типове данни, изброени по-долу:

Тип Размер (байт) пример
TINYINT 1 20
SMALLINT 2 20
Int 4 20
BIGINT 8 20
Булева Булева вярна / невярна FALSE
двойно 8 10.2222
поплавък 4 10.2222
низ Последователност на знаците ABCD
клеймо Цяло число / плувка / низ 2/3/2012 12: 34: 56: 1234567
Дата Цяло число / плувка / низ 2.3.2019

Типовете данни на кошера се реализират с помощта на JAVA

Например: Java Int се използва за прилагане на типа данни Int тук.

  • Характеристичните масиви не се поддържат в HIVE.
  • Hive разчита на разделители, за да отдели полетата му, кошерът за координиране с Hadoop позволява да се увеличи производителността на запис и четенето.
  • Посочването на дължината на всяка колона не се очаква в базата данни на кошерите.
  • Струнните буквали могат да се артикулират в двойна кавичка („) единични кавички“.
  • В по-нова версия на кошера се въвеждат типове Varchar и те образуват спецификатор на обхват на (сред 1 и 65535), Така че за символен низ, това действа като най-голямата дължина на стойността, която може да побере. Когато се вмъкне стойност над тази дължина, тогава най-десните елементи на тези стойности са отрязани. Дължината на символа е разделителна способност с цифрата на кодовите точки, контролирани от символния низ.
  • Всички цялостни литерали (TINYINT, SMALLINT, BIGINT) се считат основно за типове данни INT и само дължината надвишава действителното ниво на int, което се преобразува в BIGINT или друг подходящ тип.
  • Десетичните буквали предоставят дефинирани стойности и превъзходно събиране за стойности с плаваща запетая в сравнение с типа DOUBLE. Тук числовите стойности се съхраняват в точната им форма, но в случай на двойни, те не се съхраняват точно като числови стойности.

Процес на леене на стойност на датата

Извършва се кастинг резултат
гласове (дата като дата) Същата стойност за дата
гласове (времева марка като дата) Локална часова зона се използва за оценка на стойностите за година / месец / дата тук и се отпечатва в изхода.
гласове (низ като дата) Съответната стойност на датата ще бъде подканена в резултат на това кастинг, но трябва да гарантираме, че низът е във формат „ГГГГ-ММ-DD“ Нула ще бъде върната, когато стойността на низа не успее да направи валидно съвпадение.
гласове (дата като времева марка) Съгласно текущия местен часови пояс, за този процес на кастинг ще бъде създадена стойност за времева марка
гласове (дата като низ) ГГГГ-ММ-DD се формира за стойността за година / месец / дата и изходът ще бъде в низ формат.

2. Типове данни за събиране

В кошера има четири типа данни за събиране, които също се наричат ​​сложни типове данни.

  • ARRAY
  • MAP
  • структура
  • UNIONTYPE

1. ARRAY: Поредица от елементи от общ тип, които могат да бъдат индексирани и стойността на индекса започва от нула.

Код:

array ('anand', 'balaa', 'praveeen');

2. КАРТА: Това са елементи, които се декларират и извличат с помощта на двойки ключ-стойност.

Код:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. СТРУКТУРА: Както в C, struct е тип данни, който натрупва набор от полета, които са етикетирани и могат да бъдат от всеки друг тип данни.

Код:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTYPE: Съюзът може да притежава всеки един от посочените типове данни.

Код:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

изход:

Различни разделители, използвани в сложни типове данни, са изброени по-долу,

разделител код описание
Записване или разделител на реда
A (Ctrl + A) \ 001 Разделител на полето
B (Ctrl + B) \ 002 СТРУКТУРИ И АРТИВИ
C (Ctrl + C) \ 003 MAP е

Пример за сложни типове данни

По-долу са примери за сложни типове данни:

1. СЪЗДАВАНЕ НА ТАБЛИЦА

Код:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. ДАННИ ЗА ОБРАЗЕЦ НА ТАБЛИЦАТА

Код:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. ЗАГАРАНЕ НА ДАННИТЕ

Код:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. РАЗГЛЕЖДАНЕ НА ДАННИТЕ

Код:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Заключение - Видове данни на кошера

Като релационна БД и все пак Sequel свързва HIVE предлага всички ключови свойства на обичайните SQL бази данни по много сложен начин, което го прави сред по-ефективните структурирани единици за обработка на данни в Hadoop.

Препоръчителни статии

Това е ръководство за типа данни на кошера. Тук обсъждаме два типа в типове данни на кошера с подходящи примери. Можете също да прегледате и другите ни свързани статии, за да научите повече -

  1. Какво е кошер?
  2. Алтернативи на кошера
  3. Функции за вграждане в кошер
  4. Въпроси за интервю на кошера
  5. Типове данни PL / SQL
  6. Примери за вградени функции на Python
  7. Различни видове SQL данни с примери

Категория: