Въведение в капковата маса на кошера

Ключовата дума „DROP“ се отнася до изтриването. За изтриването на данни се изисква данните да присъстват в кошера.

В Hadoop имаме две функционалности:

  1. Хранилище за данни
  2. Обработка на данни

За съхранение на данни HDFS (разпределена файлова система Hadoop) влиза в картината. Когато казваме, че имаме данни в таблицата на кошера, това означава две неща:

  1. Данните са в HDFS
  2. Имаме таблица на кошерите, създадена над този HDFS файл и зареждаме данните на този файл от HDFS в таблицата на кошера.

Така че основно, за да има таблицата за падане на кошера, файлът с данни е задължително условие. В тази статия ще видим как да пускаме таблици в кошера, какво се случва при падането на масата и всички неща, свързани с падащата маса в кошера.

Видове капкова маса в кошера

В кошера има два вида маси:

  1. Вътрешна или управлявана таблица
  2. Външна таблица или Неуправляема таблица

Управлявана таблица / вътрешна таблица:

  1. В кошера потребител / кошер / склад е директория по подразбиране. Вътрешните таблици се съхраняват в тази директория по подразбиране. Не е необходимо да предоставяме местоположението ръчно, докато създаваме таблицата.
  2. Командата „Drop table“ изтрива данните за постоянно.
  3. Hive управлява цялата сигурност за управлявани таблици.

Имам таблица, която вече е в директорията „потребител / кошер / склад“, наречена „кодове“.

За да проверим дали съществуващата таблица се управлява или не се управлява, можем да използваме командата по-долу:

Синтаксис на командите:

Опишете форматирано име на таблица;

изход:

Да видим, данните, представени в таблица „кодове“.

Първо, като използвате командния кошер -

Второ, използване на Hue (Hadoop User Experience a Web UI)

Команда за изтриване: Изтриване на таблицата име на таблица;

изход:

Сега, ако искам да избера данните от „кодове“, ще ми даде грешка, защото таблицата се изтрива.

Също така няма да можете да видите тази таблица в директорията по подразбиране, която е

"Потребител / кошер / склад"

Наблюдавайте тук,

Неуправляема таблица / Външна таблица:

  1. Външни таблици, от нас се изисква да предоставим пътя, където трябва да съхраним тази таблица, използвайки ключовата дума „location“ в командата create table.

Например:

СЪЗДАВАНЕ НА ВЪНШНА ТАБЛИЦА stg_s2_json.products

(продукт няма низ, низ за име на продукта, низ за описание, активен низ, създаден низ за дата, актуализиран низ за дата) полета с ограничен формат на реда, завършени с ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Hive изтрива само метаданните. Данните са постоянни.
  2. Тези таблици могат да бъдат използвани от всеки, който има достъп до HDFS, така че трябва да управляват сигурността на ниво папка.

За разбиране на отпадането на външната таблица ще използваме таблицата „продукти“.

Нека проверим дали таблицата е вътрешна или външна. Отново командата „опишете форматирано име на таблица“.

Спазвайте „ограничение 10“ в командата за избор. Таблица Продукти съдържа по-долу данни:

За да го проверите в Hue, изглежда така:

Нека видим какво се случва, когато пуснем тази таблица:

Синтаксис:

Drop table table_name;

изход:

Сега, ако се опитвате да извлечете данните от таблицата, тя хвърля грешка.

Първо, използвайки командата „select“ на терминала, ще ми хвърли грешка, което означава, че метаданните за външната таблица са изтрити.

Наблюдавайте грешката тук:

Второ, проверявайки състоянието на данните, файлът “products.json” все още присъства в HDFS, което означава, че данните са постоянни.

заключение

Ще го улесня и ще ви предоставя ключови точки и за двата вида таблици. Вие решавате кой тип ще отговаря на вашите изисквания.

Вътрешна маса

Външна таблица

Нарича се още „управлявана таблица“Нарича се още „Неуправляема таблица“
Няма нужда да посочвате местоположение, директория по подразбиране Hive управлява тези данниТрябва да посочите местоположение
Изтрива метаданните на таблицата, както и (Данните са временни)Hive ще остави данните недокоснати (Данните са постоянни)
Самият кошер контролира сигурността на масатаТрябва да управлявате сигурността на ниво папка

Препоръчителни статии

Това е ръководство за падащата маса на кошера. Тук обсъждаме въвеждането на Hive Drop Table, Видове капкова таблица в кошер по синтаксиса. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Какво е кошер?
  2. Архитектура на кошера
  3. Команди на кошера
  4. Какво представлява Oracle Database
  5. Поръчка на кошера от
  6. Инсталация на кошера

Категория: