Запознайте се с основната схема: звезда срещу снежинка

Многомерната схема е предназначена за изграждане на модел на системи за съхранение на данни.

Основната цел на тези схеми е да отговорят на нуждите на по-големи бази данни, създадени за аналитични цели (OLAP).

Този метод се използва за подреждане на данни в базата данни с добро подреждане на съдържанието в база данни. Схемата позволява на клиентите да задават въпроси, свързани с бизнес или пазарни тенденции.

Освен това многомерната схема представя данните под формата на кубове с данни, които позволяват преглед и моделиране на данни от различни гледни точки и измерения.

Има три вида, но мнозина бъркат между звезда и снежинка. Следователно за тях става трудно да изберат предпочитания модел.

Ако сте един от тях, нека обсъдим разликите между схемата на звезда и снежинка, като започнем с определението и разберем техните предимства, предизвикателства, диаграма и характеристики.

Какво е многомерна схема?

Схемата се отнася до логическото описание на пълна база данни и витрини с данни. Той включва имената на записите и техните описания, включително агрегати и свързани елементи с данни.

Базата данни обикновено използва релационен модел за описание, докато системата за съхранение на данни използва модел на схема.

Многомерната схема може да бъде дефинирана с езика за заявки за извличане на данни (DMQL).

За да дефинира витрините с данни и хранилищата на данни, той използва два примитиви – дефиниране на измерение и дефиниране на куб.

Многомерната схема използва различни типове модели на схема. Те са:

  • Звездна схема
  • Схема на снежинка
  • Схема на галактика

Нека обсъдим какво представляват схемите звезда и снежинка.

Звезда срещу снежинка: какви са те?

Какво е звездна схема?

Звездовидната схема е архитектурен модел за съхранение на данни и бизнес разузнаване, изискващ една таблица с факти за съхраняване на измерени и транзакционни данни. Той също така използва различни таблици с по-малки измерения за съхраняване на атрибути за бизнес данни.

Наименува се според структурата си. Подобно на звезда, таблицата с фактите заема мястото си в центъра на диаграмата, а таблиците с малки размери стоят като клони към централната маса, за да образуват подобна на звезда структура.

Всяка звездна схема се състои от една таблица с факти, но множество таблици с малки измерения. Фактическите таблици включват специфични, измерими данни, които трябва да бъдат анализирани, като регистрирана производителност, финансови данни или записи за продажби. Това може да бъде моментна снимка на исторически данни в даден момент или транзакция.

Освен това схемата Star е най-простата и най-фундаменталната сред схемите за складове на данни и витрини за данни. Той е ефективен при обработка на основни заявки. Звездовидната схема обикновено поддържа бизнес разузнаване, ad hoc заявки, аналитично приложение и кубове за онлайн аналитична обработка.

Звездовидната схема също поддържа брой, средна стойност, сума и други агрегирания на много записи. Потребителите могат лесно да филтрират и групират агрегатите по измерения. Например потребителите генерират заявки като „намерете всички записи за продажби през юни“ или „анализирайте общите приходи от офиса на XYZ през 2022 г.“.

  30 най-добри модификации на Fallout 3 за подобрен геймплей

Какво е схема на снежинка?

Схемата на снежинка е многоизмерен модел на данни, който може да бъде известен също като разширение на звездната схема. Това е така, защото таблиците с размери в схемата на снежинка се разделят на подизмерения.

Схемата е снежинка, ако една или повече таблици с измерения не се свързват директно с таблицата на фактите, а по-скоро се свързват чрез други таблици с измерения.

Снежинките са явление, което нормализира таблиците с размери в звездна схема. Когато нормализирате всички таблици с размери, получената структура прилича на снежинка, съдържаща таблица с факти в средата на структурата.

С прости думи, схемата на снежинката се състои от една таблица с факти в средата на модела, която е свързана с таблици с размери, които отново са свързани с други таблици с размери. Тази схема се използва за подобряване на производителността на заявките.

Моделът е създаден за бързи и гъвкави заявки в сложни връзки и измерения. Полезно е за връзките „един към много“ и „много към много“ между различни нива на измерения.

Благодарение на по-стриктното спазване на повече стандарти за нормализиране, ще получите по-голяма ефективност при съхранение. Но излишъкът на данни е незначителен и производителността е ниска в сравнение с денормализирани модели на данни като звездна схема.

Звезда срещу снежинка: как работят?

Как работи звездната схема?

Фактическата таблица в средата на звездния модел съхранява два вида информация – числови стойности и стойности на атрибути на измерения. Нека ги разберем с пример за база данни за продажби.

  • Числовите стойности са уникални за всеки ред и точка от данни. Това не корелира или не е свързано с данните, съхранени в друг ред. Това са факти за дадена транзакция, като обща сума, количество на поръчката, точно време, нетна печалба, ID на поръчката и др.
  • Стойностите на размерните атрибути не съхраняват никакви данни директно, а съхраняват стойности на външен ключ за реда в таблица с размери. Различни редове в централната таблица ще се позовават на тази информация, като стойност на данните, ID на служител по продажбите, ID на клон, ID на продукт и т.н.

Таблиците с размери винаги съхраняват поддържаща информация от таблицата с факти. Всяка размерна таблица е свързана с колоната на таблица с факти заедно с размерна стойност и съхранява допълнителни данни за тази стойност.

Пример: Таблицата с размери на служител използва ИД на служител като ключова стойност и също така съдържа информация, като име, пол, адрес и телефонен номер. По същия начин таблицата с размери на продукта съхранява информация, включително име на продукта, цвят, първа дата на пазара, производствени разходи и т.н.

Как работи схемата на снежинка?

Помислете за дизайн на снежинка с централна кутия и различни връзки през тази кутия към различни точки. За поддържане на витрини за данни и складове за данни, дизайнът на схемата на снежинка идва на пазара.

Подобна е на звездната схема, но с малки промени. За разлика от схемата звезда, схемата снежинка разширява своите таблици с подизмерения, които са свързани с таблици с размери.

Основната цел на този модел е да нормализира денормализираната информация на звездния модел. По този начин може да реши често срещани проблеми, свързани със звездна схема.

В основата на схемата ще намерите таблица с факти, която се свързва с информацията, съдържаща се в таблиците с измерения. Тези таблици отново се излъчват навън към таблици с подизмерения, които имат подробна информация, описваща информацията от таблицата с измерения.

  Как да персонализирате работния плот MATE

Пример: Схемата на снежинката съдържа таблица с факти за продажбите и таблици с размери на местоположението на магазина, линията, семейството, продукта и времето. Пазарните измерения се състоят от две таблици с размери, като магазинът е основна таблица с размери и местоположението на магазина като таблица с подизмерения. Измерението на продукта има три таблици с подизмерения, в които се споменава таблица с подизмерения на продукт, линия и семейство.

Звезда срещу снежинка: Характеристики

Характеристики на звездната схема

  • Звездовидната схема може да филтрира данни от нормализирани данни, за да отговори на нуждите от съхранение на данни. Уникалният ключ се генерира от свързаната информация за всяка таблица с факти, за да идентифицира всеки ред.
  • Той осигурява бързи изчисления и агрегирания, като приходите от получените приходи и общия брой продадени артикули в края на всеки месец. Тези подробности могат да бъдат филтрирани според нуждите чрез рамкиране на подходящи заявки.
  • Това е измерването на събития, което включва крайни числови стойности, състоящи се от външния ключ. Тези ключове са свързани с таблиците с размери. Има различни видове таблици с факти, които са рамкирани със стойности на атомно ниво.
  • Таблицата с фактите на транзакцията съдържа данни за конкретни събития, като разпродажби и празници.
  • Фактите за запис включват дадени периоди като информация за акаунта в края на годината или всяко тримесечие.
  • Таблицата с размерите дава подробни данни за атрибути или записи, намерени в централната таблица.
  • Потребителят може сам да проектира маса според нуждите си.
  • Можете да използвате звездна схема за натрупване на таблици за моментни снимки.

Характеристики на схемата на снежинка

  • Схемата на снежинка се нуждае от малко дисково пространство.
  • Този модел е лесен за изпълнение благодарение на отделните и основните размерни таблици.
  • Таблиците с размери съдържат поне два атрибута за дефиниране на информация в множество зърна.
  • Поради множеството таблици производителността е ниска в сравнение със схемата със звезда.
  • Схемата на снежинката има най-високо ниво на интегритет на данните и ниски излишъци поради нормализирането.

Звезда срещу снежинка: предимства

Предимства на Star Schema

  • Схемата звезда е най-простият начин сред схемите на витрини за данни.
  • Има проста логика за отчитане. Тази логика се подразбира динамично.
  • Той е проектиран с помощта на захранващи кубове, приложени чрез процеса на онлайн транзакция, за да накара кубовете да работят ефективно и ефективно.
  • Звездовидната схема се формира с проста логика и заявки, които лесно се извличат от транзакционния процес.
  • Той предлага подобрена производителност за приложения за отчитане.
  • Той е внедрен, за да контролира бързото възстановяване на данни.
  • Филтрираната и избрана информация може лесно да се приложи в различни случаи.

Предимства на схемата Snowflake

  • Схемата звезда се използва за разработване на производителност на заявките поради по-малко изисквания за съхранение на диск.
  • Той предлага по-голяма мащабируемост във връзките между компонентите и нивата на размерите.
  • По-лесно се поддържа.
  • Звездовидната схема предлага бързо извличане на данни.
  • Това е обща и проста схема на данни за съхранение на данни.
  • Помага за подобряване на качеството на данните.
  • Структурираните данни намаляват проблема с целостта на данните.

Звезда срещу снежинка: Ограничения

Ограничения на Star Schema

Има високо денормализирано и цялостно състояние. Целият процес ще се срине, ако потребителят не успее да актуализира данните. Сигурността и защитите също са ограничени. Освен това звездната схема не е толкова гъвкава, колкото аналитичния модел. Не предлага ефективна подкрепа за различни взаимоотношения.

  Как да намерите и инсталирате преки пътища на трети страни на iPhone и iPad

Ограничения на схемата на снежинка

Основното ограничение, което ще намерите при Snowflake, са допълнителните усилия за поддръжка поради нарастващия брой таблици с малки размери. Много сложни заявки правят намирането на необходимите данни предизвикателство. Освен това времето за изпълнение на въпроса е високо поради по-високите таблици. Този модел също е твърд и изисква по-високи разходи за поддръжка.

Звезда срещу снежинка: Разлики

Звездата и снежинката са типове многоизмерна схема, но имат различни структури и свойства. Първият е като звезда, а вторият прилича на снежинка, определяйки имената им.

В звездообразната схема само едно съединение изгражда връзка между централната таблица с факти и таблиците с странични измерения. От друга страна, в схемата на снежинка са необходими множество съединения, за да се свържат с таблици с размери.

Схемата звезда обикновено се използва, когато имате по-малък брой редове в таблицата с размери, докато схемата снежинка се използва, когато таблицата с размери е относително голяма.

Диаграмата по-долу разграничава двата модела и как таблиците с измерения и таблицата на фактите са свързани в различни схеми.

Параметри Star SchemaSnowflake SchemaDisk spaceStar схема използва повече дисково пространство. Snowflake схема използва по-малко дисково пространство. Излишък на данни. Има голямо излишък на данни. Има нисък излишък на данни. Нормализация. Таблиците с размери са денормализирани, което означава повтаряне на една и съща стойност в таблицата. напълно нормализирана. Изпълнение на заявката. Отнема минимално време за изпълнение на заявките, което води до по-добра производителност. Отнема повече време от звездната схема за изпълнение на заявката, което я прави по-малко производителна от звездната схема. Сложност на заявката. Сложността на заявката е ниска. Сложността на заявката е по-висока от звездната схема.ПоддръжкаПоради големия излишък на данни, поддържането на звездна схема е малко трудно.Поради ниското излишък на данни е лесно да се поддържа и променя схемата снежинка.Целостта на данните Целостта на данните е висока, защото данните се съхраняват излишно, когато множество съществуват копия в таблиците с размери. Целостта на данните е ниска, тъй като напълно нормализира таблиците с размери. Йерархии Йерархиите за таблиците с размери в звездната схема се съхраняват в таблицата с размери. Йерархиите са разделени на отделни таблици с размери. Дизайн на DB Има прост дизайн на DB. Има много сложен дизайн на DB. Таблица с факти. Таблици с множество измерения обграждат таблица с факти. Фактическата таблица е заобиколена от таблици с размери, които също са заобиколени от таблици с подизмерения. Схемата Set upStar е лесна за проектиране и настройване, както ги представят директните връзки. От друга страна, схемата на снежинка е малко сложна за настройка. Обработка на куб Обработката на куб е по-бърза. Поради сложното свързване, обработката на куб е малко бавна. Чужди ключове. Има минимален брой външни ключове. Има максимален брой външни ключове.

Заключение

И двете схеми със звезда и снежинка са полезни в различни сектори. Така че решаването кой е по-добрият от тях се основава на техните изисквания.

Схемата снежинка е разширение на звездната схема, където нормализира размерните таблици в звездната схема.

Звездовидната схема е проста по дизайн, изпълнява заявки по-бързо и настройката е лесна. От друга страна, схемата на снежинка е по-лесна за поддръжка, заема по-малко дисково пространство и е по-малко склонна към проблеми с целостта на данните.

Така че схема със звезда може да бъде по-добрият вариант, ако имате нужда от прост дизайн, по-малко външни ключове и по-бърза обработка на куба. Но ако имате нужда от по-малко дисково пространство, ниска цялост на данните и ниска поддръжка, схемата на снежинка може да бъде по-подходяща.

Можете също така да разгледате някои от най-добрите решения за база данни с графики.