Въведение в Hbase Интервю въпроси и отговори

HBase е популярна колоноориентирана система за управление на бази данни NoSQL, която работи върху Hadoop разпределената файлова система (HDFS). Той е подходящ за оскъдни набори от данни, които са често срещани в много случаи на използване на големи данни.

Ето топ 10 най-често задавани въпроси и отговори на HBase за 2019 г.: Значи най-накрая сте намерили мечтаната си работа в HBase, но се чудите как да пропуснете интервюто с Hbase и какво би могло да бъде вероятните въпроси за интервю за Hbase 2019. Всяко интервю е различно и обхватът на работата също е различен. Имайки това предвид, ние създадохме най-често срещаните въпроси за интервю за Hbase и отговори, за да ви помогнем да постигнете успех в интервюто си. Тези въпроси са разделени на две части, както следва:

Част 1 - Въпроси за интервю с HBase (основни)

Тази първа част обхваща основните въпроси и отговори на HBase за интервю.

1. Кога трябва да използвате HBase?

Отговор:
Hbase не е подходящ за всички случаи на използване. Най-подходящият сценарий може да бъде идентифициран със следните проверки -
i.Data обем: Трябва да има петабайти данни, които да се обработват в разпределена среда.
ii.Приложение: HBase не е подходящо за OLTP (онлайн транзакция обработка) системи, които изискват сложни транзакции с много изявления. Също така липсва сложна поддръжка на SQL, която е необходима за релационна анализация. Предпочита се, когато имате огромно количество данни с малко по-различна схема.
iii.Клъстер хардуер: HBase работи над HDFS. И HDFS работи ефективно с голям брой възли (минимум 5). Така HBase може да бъде добър избор само с добра хардуерна поддръжка.
iv.Not Traditional RDBMS: Hbase не може да поддържа случай на използване, който изисква традиционни функции като Присъединяване към множество таблици, сложни SQls с вложени функции или функции на прозореца и т.н.
v.Бърз случаен достъп до данни: Ако имате нужда от произволен достъп в реално време до данните си, то HBase е подходящ кандидат. Освен това е идеално подходящо за съхранение на големи таблици с многоструктурни данни.

2. Каква е разликата между Cassandra и HBase?

Отговор:
Както HBase, така и Cassandra са разпространили NoSQL база данни за големи данни от екосистемата Hadoop. И двете построени за различни случаи на използване.
HBase има своеобразна архитектура master-slave с няколко компонента като Zookeeper, Namenode, HBase Master (Hmaster) и Data Nodes и др. Cassandra третира всички възли като главни, което означава, че всички възли са равни и изпълняват всички функции.
HBase е оптимизиран за четене, писането се случва само на главния възел и има силна последователност за четене след запис. Касандра има отлични показатели за четене на един ред, ако е избрана евентуална последователност.
Hbase не поддържа първоначално вторични индекси, Cassandra поддържа вторични индекси за семейства на колони, където името на колоната е известно.
Първоначално Hbase е създадена в Google и те я кръстиха BigTable. Дори сега API на Bigtable и HBase е съвместим. Произходът на Касандра е от хартия за DynamoDB, която е NoSQL база данни от AWS.

Нека преминем към следващите въпроси за интервю на HBase.

3. Кои са основните компоненти на Hbase?

Отговор:
HBase a има три важни компонента - HMaster, Region Server и ZooKeeper.
i.HBase Master - HBase таблиците са разделени на региони. Докато стартиращият Master решава кой регион да присвои на регионален сървър (Регионалният сървър ще бъде възел в клъстер). Той също така обработва операции с метаданни на таблици като създаване или промяна на схемата. Този компонент също играе важна роля за възстановяването на провал
II. Регионален сървър - Както бе споменато по-горе, тук се случват действителните записи и четене на данни. Това са действителни клъстерни възли. Това ще има региони на много таблици, за което се решава чрез стартиране и завършване на ключове за редове Типичният регионален сървър може да обслужва до хиляда региона
iii.ZooKeeper - ZooKeeper е рамка за координация на клъстери, широко използвана в екосистемата Hadoop.Zookeeper проследява всички сървъри (главни и регионални сървъри), присъстващи в клъстер HMaster контакти ZooKeeper и известията се получават в случай на грешки.

4. Какво е HBase Bloom Filter?

Отговор:
Това са често срещаните въпроси за интервю на HBase, зададени в интервю. HBase Bloom Filter е ефективен механизъм за тестване дали даден файл в магазина (Когато нещо се запише на HBase, първо се записва в магазин в паметта, след като този мемориал достигне определен размер, той се прехвърля на диск в съхраняващ файл ) съдържа специфична клетка за ред или ред. Обикновено единственият начин да се реши дали ключът от редове присъства във файла на магазина е да се провери в блоковия индекс на файла, който има началния ключ на реда на всеки блок във файла на магазина. Bloom филтрите действат като структура на паметта в паметта, която помага да се намали четенето на диска само до файловете, които вероятно съдържат този ред - Не всички файлове в магазина. Така той действа като индекс на паметта, за да покаже вероятност за намиране на ред в определен файл на магазина.

5. Какво е уплътняване? Обяснете различни видове от него.

Отговор:
HBase съхранява всички получени операции в своята памет памет. Когато буферът на паметта е пълен, той се прехвърля на диск. Тъй като това може да създаде много малки файлове в HDFS, от време на време HBase може да избира файлове, които да бъдат уплътнени заедно в по-голям. Уплътняване се нарича Незначителна, когато HBase избира само част от HFi файловете, които трябва да бъдат уплътнени, но не всички. При голямо уплътняване всички файлове се избират за уплътняване заедно. Основното уплътняване работи като второстепенно, с изключение на това, че маркерите за изтриване могат да бъдат премахнати, след като бъдат приложени към всички свързани клетки и всички допълнителни версии на една и съща клетка също ще бъдат изпуснати.

Част 2 - Въпроси за интервю с HBase (разширено)

Нека сега да разгледаме разширените въпроси за интервю за HBase.

6.Как данни за версията на HBase?

Отговор:
Когато част от данните се вмъкне / актуализира / изтрие, HBase ще създаде нова версия за тази колона. Действителното изтриване се случва само докато се уплътнява. Ако определена клетка надхвърли редица разрешени версии, допълнителни версии ще бъдат отпаднали по време на уплътняването

7. Каква е разликата между получаване и сканиране?

Отговор:
Get ще върне само един ред от таблицата Hbase въз основа на дадения ключ на реда. Командата за сканиране връща набор от редове в зависимост от даденото състояние на търсене. Обикновено получаването е по-бързо от сканирането. Затова трябва да предпочетете да използвате това, ако е възможно.

Нека преминем към следващите въпроси за интервю на HBase.

8. Какво се случва при изтриване на ред?

Отговор:
По време на изтриването данните от командата не се изтриват физически от файловата система, вместо това се правят невидими чрез задаване на маркер. Физическото изтриване става по време на уплътняване
Маркерите за изтриване на колона, версия и фамилия са три различни типа маркери, които отбелязват изтриването съответно на колона, версия на колона и семейство на колони.

9. Обяснете разликата между HBase и Hive.

Отговор:
Това е разширеният въпрос за интервю на HBase, зададен в интервю. HBase и Hive са напълно различни технологии, базирани на Hadoop за обработка на данни. Hive е релационно подобна на SQL съвместима рамка за разпределено съхранение, докато HBase е магазин за стойности на ключови стойности на NoSQL. Hive действа като абстракционен слой отгоре на Hadoop със SQL поддръжка. Моделът за достъп до данни за HBase е много ограничен с две основни операции - получаване и сканиране. HBase е идеален за обработка на данни в реално време, където Hive е идеален избор за пакетна обработка на данни.

10. Какво представляват Hlog и HFile?

Отговор:
HLog е лог файлът за записване, известен също като WAL, а HFile е истинският файл за съхранение на данни. Данните първо се записват в лог-файла за предварително записване и също се записват в MemStore. След като MemStore е пълен, съдържанието на MemStore се прехвърля на диска в HFiles.

Препоръчителен член

Това е ръководство за списъка с въпроси за интервю за Hbase и отговорите, така че кандидатът да може лесно да разруши тези въпроси за интервю за Hbase. Можете също да разгледате следните статии, за да научите повече -

  1. Полезни въпроси за групово интервю
  2. Важни основни съвети за интервю
  3. Съществени стъпки за подготовка за интервю
  4. Въпроси за интервю, за да зададете кандидат за финансиране