Какво е моделиране на данни
Казано по-просто, Data Modeling се отнася до изграждането на модел на данни, който може да се съхранява в някаква база данни. Моделът на данните е концептуално представяне на асоциация между различни обекти на данни.
Разбиране на моделиране на данни / обхват
Появява се на три различни слоя:
- Физически модел: Това е схема, която казва как данните се съхраняват физически в базата данни
- Концептуален модел: Това е потребителският изглед на данните, т.е. високото ниво, което потребителят вижда.
- Логически модел: Той се намира между физическия модел и концептуалния модел и представя данните логично, отделно от физическите му складове.
Йерархично моделиране на данни: Тези модели се използват за замяна на файлови системи. Данните се съхраняваха в дърво като едно твърде много подреждане.
Релационно моделиране на данни: Вярно е, че йерархичният модел ни помогна да преминем от базирани на файлове системи, които намалиха сложността, но все пак човек знаеше конкретното използвано физическо съхранение на данни. Релационната база данни следва релационния модел, където данните се съхраняват в таблици, за разлика от йерархичната база данни, където се съхраняват в дървовидна структура. Накратко, тя намалява сложността повече в сравнение с йерархичния модел.
Как моделирането на данни прави работата толкова лесна / защо трябва да я използваме?
Той ни помага във визуалното представяне на данни и налага бизнес логиката, разпоредбите, политиките и т.н. по отношение на данните. Това е ръководство, което се използва от учени и анализатори при проектирането и внедряването на база данни. Така че без моделиране на данни работата на анализатори и учени да изпълняват бизнес изискванията към базата данни става трудно.
Защо се нуждаем от моделиране на данни? / Какво можете да направите с него?
Основната цел на използването му е:
- За да гарантираме, че всички обекти на данни са представени правилно, сякаш не е направено правилно, бихме получили неправилни резултати.
- Помага, както бе посочено по-рано, за проектиране на база данни на концептуални, физически и логически нива.
- Той помага за проектирането на релационни таблици, първични ключове, чужди ключове и т.н.
- Разработчиците на бази данни могат да създадат по-добра физическа база данни с добър модел, тъй като тя се превръща в ръководство за тях.
- Той помага да се идентифицират липсващи и излишни данни.
- Помага ни да имаме по-добра ИТ инфраструктура и да имаме лесна и евтина поддръжка, когато се изисква в дългосрочен план, въпреки че първоначално е отнемащо време.
Работа с моделиране на данни
Сега нека създадем примерен модел на данни, за да разберем как да работим с модел. За целта трябва да следваме определени стъпки:
- Първо трябва да разберем изискванията, В този случай ще създадем модел за онлайн магазин. Така че, имайки това предвид, имаме нужда от две таблици а) клиенти б) продукти
- Следващата стъпка е да получите атрибутите на таблиците или субектите
а. клиентската таблица може да има атрибути като:
- Документ за самоличност
- име
- електронна поща
- адрес
б. Таблицата с продукти може да има атрибути като:
- Документ за самоличност
- име
В клиентската таблица можем да имаме Id като първичен ключ и по подобен начин идентификационният номер на продукта в таблицата с продукта ще бъде първичен ключ, както е показано на диаграмите по-долу.
Сега ще проектираме връзката между тези две таблици. Така че за да свържем таблицата на клиента и продукта, ще създадем таблица, наречена покупка, която ще бъде като таблица с поръчки (т.е. кой клиент поръча кой продукт).
Ако погледнете фигурата по-горе справка за покупка на клиенти е ОК, тъй като всяка покупка има един клиент и един клиент има много покупки. Така че, тази справка е добре. Още едно нещо, което сме приели user_account_id като чужд ключ (препратката към идентификационния номер в клиентския ключ). По същия начин product_id. Все още има проблем с референцията за покупка на продукт, тъй като няколко продукта могат да бъдат закупени в една покупка, както и няколко покупки могат да включват един и същ продукт.
За да преодолеем това, ние ще създадем посредническа таблица, известна като покупка_item, която ще бъде свързана с покупка и продукт. На фигурата по-долу можем да видим проблема разрешен.
Предимства
Има различни предимства, както следва:
- Той помага на бизнеса да комуникира, да планира цялата организация.
- Той помага да се разпознае правилния източник на данни, който може да се използва за попълване на модела.
- Това може да се използва за определяне на връзки между различни таблици като първичен ключ, чужд ключ и т.н.
Коя е подходящата аудитория за изучаване на тази технология?
Това е много важно. Правилната аудитория за изучаване на техники за моделиране са личности, които са архитекти на данни и анализатори на данни. Повечето хора започват като анализатори на данни и след това се придвижват нагоре по стълбата.
Как тази технология ще ви помогне в кариерния растеж?
Според Glassdoor средната заплата на пазара за моделиери се предвижда да печелят средно около 78 601 долара. Така че можете да видите, че това е добре платена работа. Повечето големи компании инвестират в моделисти, тъй като те са много важни за запазване целостта на данните.
заключение
В заключение можем да кажем, че моделът, създаден от моделистите, гарантира последователност в именуването на конвенции, целостта и сигурността на данните. защото добрите данни ще дадат възможност на бизнеса за правилното ефективно използване на техните данни.
Препоръчителни статии
Това е ръководство за Какво е моделиране на данни. Тук обсъдихме дефиницията, кариерния растеж, уменията, предимствата и работата на моделирането на данни с помощта на примери. Можете да разгледате и другите ни предложени статии, за да научите повече -
- Какво е Agile Project Management?
- Въпроси за интервю за съхранение на данни
- Какво е SAS?
- Какво е Big Data Technology?
- Ръководство за модел на данни в Касандра