Un schéma définit la structure d'une base de données. La conception d'un schéma est importante , elle affecte à la fois la performance et la facilité avec laquelle les utilisateurs recherchent des informations dans une base de données . Un schéma en étoile , nommé parce que son schéma ressemble à une étoile , est une stratégie de conception utilisé pour les entrepôts de données relationnelles , il est l'un des styles de conception simple . Schémas en étoile sont composés de tables de faits et de dimension. Les tables de faits contiennent des mesures visant les données . Les faits sont quantitatives ou données factuelles et typiquement numérique. Les tables de dimension stocker des données ou des attributs descriptifs et sont généralement plus petits que les tables de faits . Pour clarifier un exemple , un entrepôt de données pour un magasin de détail peut contenir des données de ventes dans les tables de faits et les vendeurs dans une table de dimension . Plusieurs techniques sont disponibles pour définir un schéma en étoile . Instructions
1
définir le processus d' affaires exact que l'entrepôt de données prendra en charge. Définir le processus d' entreprise est essentielle car elle fournit des informations pour identifier les attributs et les mesures de l'entrepôt de données contiendra spécifiques. De plus, certains processus d'affaires ont établi des modèles de l'industrie qui sont utiles pour accélérer le processus de conception.
2
Définir la granularité des données qui seront disponibles dans l'entrepôt de données . Les informations contenues dans un entrepôt de données peut être de bas niveau , détaillé, les transactions individuelles ou une agrégation. En utilisant l'exemple de détail , des données détaillées pourraient inclure le nombre de produits d'un type spécifique d' un ordre individuel sur une journée . Une rangée d'échantillons pourrait être le 01/10/2010 , pour 3023 contenait trois robes rouges , deux chemises bleu et un chandail vert . Une vue agrégée des mêmes données pourrait omettre l'identification d'une commande individuelle , et au lieu de stocker le nombre de robes rouges commandés le 01/10/2010 .
3
Identifier les dimensions . Dimensions définissent comment les utilisateurs seront en mesure de trancher les données. Par exemple , les utilisateurs souhaitent souvent presque à afficher les données par le temps ou la géographie.
4
identifier les faits ou les mesures qui seront stockées dans l'entrepôt de données . Les mesures sont numériques et additif à travers les dimensions . Par exemple , les ventes sont numériques et les utilisateurs peuvent regarder les ventes totales pour un produit et par n'importe quel temps. Les chiffres de ventes sont valables peu importe comment les données sont segmentées .
5
Test du modèle proposé contre le processus d'affaires. Pour s'assurer que le modèle est adéquat, définir une liste d'exemples de questions qui pourraient être posées par les utilisateurs pour effectuer le processus d'affaires. Assurez-vous que le modèle contient les dimensions nécessaires (attributs) et des faits ( données quantitatives) pour répondre à chaque question.