HBase Архитектура - Концепция и компоненти - Характеристики и предимства

Съдържание:

Anonim

Въведение в архитектурата на HBase

HBase е система за съхранение на данни с отворен код, разпределена ключова стойност и база данни, ориентирана към колони, с висока производителност на запис и ниска латентност на произволно четене. Използвайки HBase, можем да извършваме онлайн анализи в реално време. HBase архитектурата има силна случайна четимост. В HBase данните се разделят физически на тези, които са известни като региони. Всеки регион е хостван от един регионален сървър и един или повече региони са отговорни за всеки регионален сървър. HBase архитектурата се състои от главно-подчинени сървъри. Клъстерът HBase има един главен възел, наречен HMaster и няколко регионални сървъра, наречени HRegion Server (HRegion Server). Има много региони - региони във всеки регионален сървър.

HDFS механизъм за съхранение

В HDFS данните се съхраняват в таблицата, както е показано по-горе.

Всеки ред има ключ.

Колона: Това е съвкупност от данни, които принадлежат към едно семейство колони и са включени вътре в реда.

Семейство колони: Всяко семейство от колони се състои от една или повече колони.

Всяка таблица съдържа колекция от семейства на колони. Тези колони не са част от схемата.

HBase има динамични колони. Различните клетки могат да имат различни колони, защото имената на колоните са кодирани вътре в клетките

Квалификатор на колоната: Името на колоната е известно като квалификатор на колоната.

Компоненти на архитектурата на HBase

В архитектурата на HBase има основни елементи: HMaster и Region Server. Регионално запазване на данни от HBase.

1. HMaster

Възелът HMaster е лек и се използва за присвояване на региона на сървърния регион.

Има няколко основни отговорности на Hmaster, които са:

  • Изпълнение на някои задачи за администриране, включително зареждане, балансиране, създаване на данни, актуализиране, изтриване и т.н.

Отговорен за промените в схемата или модификациите в META данни според указанията на клиентското приложение

  • Много DDL работа върху HBase таблици се обработва от HMaster.

Някои от методите, които HMaster Interface излага, са главно. Методи, ориентирани към данни от META.

  • Таблица (създаване, премахване, активиране, деактивиране, премахване на таблица)
  • ColumnFamily (добавяне на колона, промяна на колоната)
  • Регион (преместване, присвояване)

Клиентът общува както с HMaster, така и с ZooKeeper двупосочно. Той се свързва директно със сървърите на HRegion, за да чете и пише операции. HMaster присвоява регионите на сървърите в региона и от своя страна проверява здравословното състояние на регионалните сървъри.

2. Регион сървър

Можем да получим груба представа за регионалния сървър чрез диаграма, дадена по-долу.

Регионалните сървъри са работещи възли, които обработват заявките на клиентите за четене, писане, актуализиране и изтриване. Регионалният сървър е лек, той работи на всички възли в клъстера Hadoop. Основната задача на регионалния сървър е да съхранява данните в области и да изпълнява заявки на клиенти. Друга важна задача на сървъра на HBase регион е да използва метода Auto-Sharding за извършване на балансиране на натоварването чрез динамично разпределение на таблицата HBase, когато тя стане твърде голяма след вмъкване на данни.

HMaster може да се свърже с няколко HRegion сървъра и да изпълни следните функции:

  • Управление и хостинг на региони
  • Автоматично разделени региони
  • Обработка на заявки за четене и писане
  • Директна комуникация с клиенти

3. HDFS

HDFS означава Hadoop разпределена файлова система. Той съхранява всеки файл в няколко блока и репликира блокове в клъстер Hadoop, за да поддържа отказоустойчивост. HDFS осигурява висока толерантност и работи с евтини материали. Използването на евтин стоков хардуер за добавяне на възли към клъстера и обработването и запазването му ще даде на клиента по-добри резултати от съществуващия хардуер. HDFS контактува с компонентите на HBase и спестява много данни по разпределен начин.

4. Зоокеер

Zookeeper е проект с отворен код. HMaster и HRegionServers се регистрират в ZooKeeper.
Той предоставя различни услуги като поддържане на конфигурационна информация, именуване, предоставяне на разпределена синхронизация и др. Разпределената синхронизация е процесът на предоставяне на координационни услуги между възлите за достъп до работещи приложения. Той има ефемерни възли, които представляват регионални сървъри. Главните сървъри използват тези възли за търсене на налични сървъри.

Тези възли се използват и за проследяване на мрежови дялове и грешки на сървъра. Zookeeper е взаимодействащата среда между сървъра на региона на клиента. Ако клиентът иска да комуникира с регионалния сървър, тогава зоопаркът е комуникационният носител между тях.

Как се инициализира търсенето в HBase архитектура

Както знаете, местоположението на META таблицата се запазва от Zookeeper. Всеки път, когато клиент се обърне или пише заявки за HBase, процедурата е следната.

Клиентът открива от ZooKeeper как да ги постави META таблицата. След това клиентът изисква съответния клавишен ред от тях META таблицата за достъп до местоположението на регионалния сървър. С местоположението на META таблицата клиентът кешира тази информация. Клиентът не трябва да се позовава на тях по META таблица, докато и ако областта не бъде преместена или изместена. Тогава отново ще бъде заявен META сървърът и кешът ще бъде актуализиран. Както винаги клиентите не губят време да намират местоположението на Регионалния сървър на META Server, така че спестява време и ускорява процеса на търсене.

Характеристика

Лесно е да се интегрира от източника, както и от дестинацията с Hadoop.

Поддържа се разпределеното хранилище като HDFS.

Той има функция за случаен достъп чрез използване на вътрешна таблица за хеш за съхранение на данни за по-бързо търсене във HDFS файлове.

Предимства на HBase архитектурата

  • Те могат да съхраняват големи масиви от данни
  • Можем да споделим базата данни
  • Гигабайт до петабайти рентабилен
  • Висока наличност чрез репликация и отказ

Недостатъци на HBase архитектурата

  • SQL структура не поддържа
  • Не поддържа транзакция
  • Само с сортирани ключове
  • Проблеми с клъстерната памет

заключение

HBase е една от колоните, ориентирани към колони NonSql, в апаш. Докато сравнява с Hadoop или Hive, HBase се представя по-добре за извличане на по-малко записи. В тази статия обсъдихме архитектурата на HBase и нейните важни компоненти.

Препоръчителни статии

Това е ръководство за HBase архитектура. Тук обсъдихме концепцията, компонентите, характеристиките, предимствата и недостатъците. Можете да разгледате и другите ни предложени статии, за да научите повече -

  1. Какво е Big Data Technology?
  2. HDFS срещу HBase кой е по-добър
  3. Какво е език за сглобяване?
  4. Въведение в HTML