Какво представлява моделът на данните?
Интерпретацията и документацията на съществуващите софтуерни проекти и процедури за разработка и транзакции се наричат информационно моделиране. Методите и инструментите на информационното моделиране опростяват сложните системи на дизайна, за да улеснят преинженеринга за работа с информация. Използва се за проектиране на информационен склад логически и физически. В тази тема ще научим за моделирането на хранилища на данни.
Нужда от моделиране на хранилища на данни
- Събиране на бизнес изисквания
- Подобряване на работата на базата данни
- Предоставя документация на източника и целевата система
1. Събиране на бизнес изисквания
Складът за данни обикновено е предназначен да определи субектите, необходими за склада и данните, които трябва да бъдат записани с архитектите на данни и бизнес потребителите. Този първи дизайн има много итерации, преди окончателният модел да бъде решен.
В този момент трябва да преодолеем преобладаващите недостатъци във фазата на проектиране. Тъй като съществуваща система реализира склад за данни, архитектите понякога влагат голяма част от старата система в новия дизайн, спестявайки време или разкриване.
Логическият модел ефективно улавя нуждите на компанията и служи като основа за физическия модел.
2. Подобряване на производителността на базата данни
Проверката на ефективността е съществена характеристика на хранилището на данни. В хранилището с данни се включва огромна информация, така че е много важно да се използва продукт от модел за данни за метаданни и управление на данни, използвани от BI потребители.
Физическият модел добавя индексиране, за да оптимизира ефективността на базата данни. Схемите също понякога се променят. Например, ако една звездна схема обещава по-бързо възстановяване на данни, тя може да се промени към схема на снежинка
3. Осигурява документация на източника и целевата система
При разработването на ETL система е много важно да се проверят физическите и логическите модели на източника и целевите системи.
Тази документация се предлага чрез информационно моделиране като ориентир за бъдещето.
Модел на концептуални данни
Най-високата връзка между отделните единици се определя от концептуален модел на данни.
Това е първата стъпка към създаването на модел от данни отгоре надолу, който представлява прецизното представяне на бизнес организацията.
Проектира общата структура на базата данни и изброява предметните области
Състои видовете и взаимодействията на образуванията. Символните обозначения (IDEF1X или IE) представляват връзката между тематичните полета. В информационен модел кардиналността показва отношенията един към един или много
Модел на данните за отношенията
Използва се моделиране на относителна информация в ориентирани към транзакции OLTP схеми. Релационният модел на данните има значителни характеристики:
- Използване на ключ
- Редуциране на данни
- Връзка между данните
Използване на ключ
Основният ключ в таблицата е ключът. Използва се като единична идентификация. Ненулева колона е първичен ключ. За главния ключ се използва чуждият ключ. Те свързват информацията от една таблица към друга таблица и се свързват.
Редуциране на данни
Информационният модел на взаимоотношенията прилага закони за целостта на информацията
Съкращаването на данните се елиминира. Част от информацията не се събира многократно. Това гарантира съгласуваност на данните и ограничено съхранение на данни
Връзка между данните
Всички данни се съхраняват в таблици и всяка връзка има колони и редове.
Заглавка и тяло трябва да са на масата. Заглавката е списъка с таблици на колони, а таблицата се състои от редовете. Кортежът е единичната стойност, която се произвежда от пресичане на колони и редове.
Многоизмерен модел на данни
Организация, която отразява значимите субекти на една компания и връзката между тях, е логична перспектива на многоизмерен модел на данни. Базите данни и таблиците не се ограничават до естествена база данни. ER диаграмите не са изобразени.
- Атрибути
- Факти
- Измерение
а. Измерение
- Аспект е събирането на данни, състоящо се от отделни информационни компоненти, които не се припокриват
- Можете да зададете, групирате и филтрирате информация за целите на гледане и сърфиране от крайните потребители.
б. Факти
- Таблица от колони, използвана за отговор на въпроси на компанията по числови причини.
- Мерките са адитивни, полуадитивни и неадитивни
° С. Атрибути
- Абстрактните условия са предназначени да улеснят обобщението на информацията в изследване
- Те могат също да бъдат описани като колони, които не са включени в изчислението на отчета.
Предимства на размерния модел
- Стандартизацията на размерите улеснява отчитането в бизнес области.
- Размерен и за съхранение на данни за по-лесно получаване на данни от тях, когато данните се съхраняват в базата данни.
- Компанията е много разбираема за размерния модел. Този модел се основава на фирмени условия, така че компанията да разбира значенията на всяка реалност, аспект или функция.
- За бързо запитване на информация, демерзираните модели и оптимизирането на мерните модели. Много платформи за бази данни за взаимоотношения потвърждават този модел и оптимизират плановете за изпълнение на заявките.
- Размерните модели могат да приемат промяната удобно. Таблиците с размери могат да включват допълнителни колони, без да влияят на използването на тези таблици от настоящите приложения за разузнаване на компанията.
Най-добри практики Моделиране на данни
Преди да започнете модела на данните, трябва да се извърши пълен анализ на нуждите на фирмата-клиент. Трябва да бъде изключително важно да се срещнат клиентите, за да обсъдят нуждите и техниките на информационното моделиране и незабавно специалистите по темата на компанията да го потвърдят.
Компанията трябва да разбира модела на данни, независимо дали е в графичен / метаданни формат или като бизнес правила за текстове.
Препоръчителни статии
Това е ръководство за моделиране на хранилища на данни. Тук обсъждаме Модела на данните, защо е необходим в складирането на данни, заедно с неговите предимства, както и типове модели. Можете също да разгледате следната статия, за да научите повече -
- Инструменти за съхранение на данни
- Видове хранилище на данни
- Инструменти за анализ на данни
- Инструменти за научни данни
- Складиране на данни на Oracle