Въведение в дизайна на хранилища на данни

Склад в обща дума означава да съхранявате нещо на едно място и подобни случаи в индустриите, за да съхранявате сложното количество данни на едно място. Business Intelligence (BI) ви позволява да изискате данни от източниците на данни, а доверието може да бъде направено само когато има добър дизайн на склад за данни.

Складът за данни интегрира множество източници на данни и ще осигури добра подкрепа за анализ и аналитично отчитане. Ако имате лош дизайн на склад за данни, това ще повлияе на растежа на вашата организация, като има неточни данни за заявки.

Вземете пример за популярност на уеб магазина на Amazon, като поръчате артикула и той може да бъде доставен на прага ни. Когато клиентът влезе в сайта за електронна търговия и търси наличния продукт в магазина. След това избрахме и поръчахме артикул, веднага щом доставчикът приеме и веднага изпрати. Тук можем да си спестим времето за закупуване на необходимия артикул.

Подобен случай на този склад за данни също, данните могат да се съхраняват и закупуват от транзакционната система. Складът за данни като две основни концепции

  • OLAP - Онлайн аналитична обработка
  • OLTP - Онлайн транзакционна обработка

И двете са системи за онлайн обработка, но имат някои разлики. OLTP управлява транзакционното приложение като ATM, OLAP използва за аналитична обработка като отчитане, прогнозиране и т.н.,

Събиране на изискване

  • Събирането на изискванията е една фаза в дизайна на склад за данни. Необходимо е да се определят критериите и да се прилага успешно. Ще се използват две стратегии, използвани за проектиране на склад за данни, едната се нарича бизнес, а друга се нарича техническа.
  • Бизнес стратегията се фокусира върху дългосрочния бизнес изглед и спомага за увеличаване на печалбата за растеж. Изискването за техническа стратегия се основава на отчитане от потребители, анализ, подбор на хардуер, метод за разработка, техника на тестване, среда за внедряване и обучение на потребителите.
  • Когато определихме бизнес и техническата стратегия, ние също трябва да създадем план BCP (Recovery Recovery). Когато се стигне до бедствие по човешки или природни причини, трябва да имаме план за бързо възстановяване на данните и да гарантираме, че няма загуба на данни. Разработването на плана за възстановяване при бедствия е едно от предизвикателствата и прави доверие за организацията.

Настройка на околната среда

  • След като събрахме данните за дизайна на склад за данни, трябва да направим правилна настройка на средата за развитие, тестване и производство. За предпочитане трябва да има отделна система за приложение, база данни и отделно за отчитане / ETL.
  • Когато изграждаме отделна среда за всеки, гарантира, че всички промени могат да бъдат разработени / тествани и след това да преминете към производство.
  • Ако имаме единна среда, предназначена за всички тези дейности, това може да завърши с издаване и загуба на данни. Например, когато има инцидент в системата, не успяхме да се ориентираме и да открием начина за поправяне и това го прави по-сложен.

Моделиране на данни

  • След като събирането на изискванията и околната среда са създадени, следващото е да се проектира как да се свърже източникът на данни, обработването и съхраняването им в хранилището на данни. Тази техника се нарича като моделиране на данни. Тя може да бъде анализ на обекта и връзката между останалите.
  • Когато проектираха склада за данни, инженерите проектираха как и къде трябва да се съхраняват данните. По същия повод трябва да определим и възможния начин за извличане на данните от склада на данни. След като източникът бъде идентифициран, екипът може да изгради логиката и да създаде структурен изглед на структурата.

Видове модел на данни

Има три вида

  • Идеен
  • логичен
  • физически

Трите вида модел на данни са споменати по-долу:

1. Концептуален: Той казва КАКВО съдържа системата и е проектиран от бизнес архитектите, за да определи обхвата на бизнес стратегията.

2. Логично: Това определя КАК логиката може да бъде създадена в СУБД, тя ще бъде проектирана от Business Analyst и Data Architect за създаване на набор от правила за съхраняване / извличане на данните

3. Физически: Това определя КАК системата може да бъде внедрена.

Използване на дизайна на хранилището на данни

Като добър дизайн на хранилище за данни може да отнеме много време при извличането на данните. Всяка стъпка трябва да следва ефективно, за да направи системата добра. Това ще помогне на организацията да борави със сложните видове данни и да подобри производителността въз основа на анализа на тенденциите. Така че всяка стъпка в DWH архитектурния дизайн е важна и по-осъзната в метода за подбор. Организацията стъпва във всеки поток впоследствие и води до успешно внедряване на хранилището на данни.

Има няколко важни приложения за приложения на хранилището на данни

1. Банкова индустрия: Повечето банки използват хранилището с данни за съхранение на голям обем данни за транзакциите и възможността да изтеглят данните от заявките много по-бързо. Може да се управлява като данни за клиентите, тенденции на пазара, отчети, анализ и т.н.,

2. Финансова индустрия: Подобно е на банковото, но единственият фокус е да се подобрят финансовите промени чрез анализ на клиентските данни

3. Правителство: Днес правителството управлява много данни онлайн и съхранява в релационната база данни. Всяка информация има връзка помежду си като Aadhaar, PAN е свързан с много източници.

4. Здравеопазване: Мениджърите в здравеопазването и услугите толкова много информация. Той поддържа клиничните подробности, клиентските записи и им помага да прогнозират резултатите, да анализират обратната връзка и да генерират отчетите.

5. Застраховане: Застрахователната компания, използвана предимно за модели на данни, тенденция на клиентите и поддържане на записи.

6. Производствена и дистрибуторска промишленост: Тя се използва най-широко във всички индустрии за съхраняване на информация за артикулите и им помага да предвидят позицията на търсенето за производство и продажби. Анализиране на продадения артикул, което дава по-добри техники за вземане на решения.

7. Услуги на търговци на дребно: Търговците на дребно са посредникът между производителя и клиента. Складът за данни им помага за промоции и тенденции за закупуване на артикули.

8. Телефонна индустрия: Телефонните индустрии управляват много исторически данни, които помагат за създаване на тенденция за клиентските данни и целта им да бъдат тласкащи рекламни кампании.

Предимства на Data Warehouse

  • Предоставя подобрена бизнес интелигентност
  • Гарантира качеството и последователността на данните
  • Спестява време и пари
  • Проследява исторически интелигентни данни
  • Генерира висока ROI

Dis-предимство на Data Warehouse

  • Допълнителна работа с доклади
  • Гъвкавост и хомогенизация на данните
  • Притеснения за собственост
  • Изискване за големи количества ресурси
  • Скритите проблеми изискват време

Препоръчителни статии

Това е ръководство за Дизайн на хранилища на данни. Тук обсъждаме техниката за проектиране на хранилището на данни, събиране на изисквания, настройка на средата, приложения, предимство / Dis-предимство. Можете също да разгледате следната статия, за да научите повече -

  1. Предимства на хранилището на данни
  2. Изпълнение на склада за данни
  3. Моделиране на хранилища на данни
  4. Инструменти за съхранение на данни
  5. Топ 4 различни типа модели данни

Категория: