Какво е Data Mart? - Видове, функции и стъпки за внедряване на данни Mart

Съдържание:

Anonim

Въведение в данните Mart

Светът става все повече цифри и всяка организация генерира няколко петабайта данни. Data Mart е една такава класификация на данни от склад на данни, където концентрацията е върху един обект.

Можем да кажем, че това са данните относно един конкретен отдел или категория като продажби, финанси или маркетинг и т.н. По принцип това е подмножество от съхранение на данни. Тъй като има концентрация върху конкретни предмети или отдел, можем да кажем, че източникът на него е ограничен или зависи от много малко източници.

Data Mart vs Data Warehouse

Склад за данни е склад с колекция от данни от множество потоци на обекта. Частта за поддръжка и контрол като събирането на необработени данни и обработката им се обработва главно от ИТ групи за корпоративни информационни технологии, които предоставят различни услуги на родителските организации.

Складът за данни също се нарича централен или корпоративен склад за данни. Така източникът на склад за данни ще бъде множествен за разлика от марта на данните, който в някои случаи е подмножество на склад за данни.

Видове данни март

Обикновено има три типа данни. Те са:

1. Зависим склад за данни

Зависимият март на данни е чисто от хранилището на данни и всички групирани зависими ще формират хранилище на данни за предприятия. Това е чисто подмножество от хранилище на данни, тъй като е създадено от централната DW.

Тъй като чистите и обобщени данни вече присъстват в централния склад за данни ETT процес или Extract Transform and Transport се опростяват. Просто трябва да идентифицираме конкретния подмножество тук и да извършим ETT отгоре.

Тези данни са обикновено изградени, за да постигнат по-добра достъпност и много подобрена производителност с по-добър контрол и ефективност.

2. Независими данни март

Това не е създадено от централния склад на данни и източникът на това може да бъде различен. Тъй като данните са от различен от централния DW ETT процес е малко по-различен.

Повечето от независимите данни се използват от по-малка група организации и източникът на това също е ограничен. Независимият март на данни обикновено се създава, когато трябва да получим решение в сравнително по-кратки срокове.

3. Хибриден март на данните

Хибридният март на данните ще ви позволи да групирате данните от всички други източници, различни от централния хранилище на данни DW. Когато се занимаваме с ad hoc интеграция, това ще бъде от голяма полза за върховната работа по всички продукти, които се добавят към организациите отвън.

Характеристики на Data Mart

По-долу са някои от характеристиките на март на данните:

  • Тъй като източникът на данните е концентриран, за да бъде обект, времето за реакция на потребителя се подобрява чрез използването му.
  • За често изисквани данни използването на данни ще бъде от полза, тъй като е подмножество на централната DW и следователно размерът на данните ще бъде по-малък.
  • Освен това, тъй като обемът на данните е ограничен, времето за обработка ще бъде доста намалено в сравнение с централните Dws.
  • Те по принцип са гъвкави и могат да приспособяват промените в модела доста бързо и ефективно в сравнение със склада за данни.
  • Datamart изисква един експерт-предмет, който да обработва, за разлика от данните от склада, експертните знания, от които се нуждаем в множество предметни складове. Поради това казваме, че мартът на данните е по-гъвкав.
  • Можем да разделим категориите за достъп до ниско ниво с разделени данни и с данни, много е лесно.
  • Зависимостта от инфраструктурата е доста ограничена и данните могат да се съхраняват в различни хардуерни платформи при сегментиране.

Стъпки за внедряване на данни Mart

По-долу са стъпките, които са необходими за прилагането му.

1. Проектиране

Това ще бъде първата стъпка в прилагането, при която всички необходими задачи и източници са идентифицирани за събиране на техническа и бизнес информация. По-късно логическият план се реализира и при преглед това ще бъде преобразувано във физически план. Също така, тук се решава логическата и физическата структура на данните, например как да разделите данните и полето на дяла като дата или всеки друг файл.

2. Строителство

Това е втората фаза на внедряване, при която с помощта на RDBMS са генерирани физически бази данни, която беше определена като част от процеса на проектиране и логически структури. Всички обекти като схема, индекси, таблици, изгледи и т.н. са създадени.

3. Население

Това е третата фаза и тук данните се попълват при получаване на данните. Всички необходими трансформации се осъществяват преди попълването на данните върху него.

4. Достъп

Това е следващата стъпка на внедряване, при която ще използваме попълнените данни за запитване при създаване на отчети. Крайният потребител използва тази стъпка, за да разбере данните чрез заявки.

5. Управление

Това е последният етап от внедряването на марта на данните и тук се грижат различни задачи като управление на достъпа, оптимизация на системата и настройка, управление и добавяне на нови данни към марта на данните и планиране на сценарии за възстановяване за справяне с всякакви случаи на отказ.

Предимства на Data Mart

Следват някои от предимствата на използването му.

  • Това е една от най-добрите рентабилни алтернативи на склад за данни, където трябва да работите само в малък сегмент от данни.
  • Разделянето на данни от източници ще направи ефективността на данните, тъй като конкретна група от хора може да работи с данните от конкретен източник, вместо да използва всички хранилища на данни.
  • По-бързият достъп до данните е възможен чрез използване на март на данните, ако знаем по кой подмножество трябва да имаме достъп.
  • Datamart е много по-лесен за използване, така че крайните потребители могат лесно да направят заявка отгоре си.
  • Към времето за реализация мартът на данните изисква по-малко време в сравнение със склада на данни, тъй като данните са разделени в групи.
  • Исторически данни от конкретна тема могат да бъдат използвани за лесен анализ на тенденциите.

заключение

Тъй като е концентриран върху една функционална област, има много предимства както за реализатора на процеса, така и за крайния потребител. Следователно е необходимо ефективно прилагане на мартове, заедно със склад за данни в организацията.

Препоръчителни статии

Това е ръководство за Какво е Data Mart. Тук обсъждаме въвеждането, функциите и топ 3 вида, заедно с неговите характеристики и стъпки. Можете също да разгледате следните статии, за да научите повече -

  1. Складиране на данни на Oracle
  2. R Типове данни
  3. Типове данни на Python
  4. Касандра моделиране на данни
  5. Пълно ръководство за модела на данни в Касандра