Introduction : Récapitulatifs dans Data Prep Studio
Cliquez sur l’onglet Analyser de la barre d’outils de Data Prep Studio pour ouvrir un panneau déroulant qui vous permet de créer et gérer les récapitulatifs. Un récapitulatif organise l’information de champs sélectionnés sous forme de tableau et affiche le résultat dans une matrice à une ou deux dimensions, ce qui vous permet d’analyser vos données de façon plus approfondie. Supposez par exemple que vous avez une table répertoriant les détails des achats effectués par divers clients dans un magasin de disques pendant une période de trois mois. Vous pouvez trier cette table et voir qui a acheté combien d’exemplaires de quoi quel jour, mais vous ne pouvez pas savoir combien de ventes totales chaque client a généré pour le trimestre ou quel pourcentage des ventes totales représentaient ses achats.
Figure 1. Extrait d’une table ordinaire dans DPS.
Le récapitulatif ci-dessous résout ces problèmes.
Figure 2. Récapitulatif des totaux des ventes par client.
Avec un autre récapitulatif, vous pouvez même savoir quel type de support se vend le mieux.
Figure 3. Récapitulatif des totaux des ventes par type de support.
Ces récapitulatifs présentent les informations relatives à un seul champ-clé (ligne). Dans le premier récapitulatif, ce champ-clé est Client, et dans le deuxième, Support. Tout champ tabulé (ou totalisé) est une mesure. Dans les récapitulatifs illustrés ci-dessus, le champ Montant sert de mesure.
Remarque : Un récapitulatif doit comprendre au moins un champ-clé. Un récapitulatif comprend généralement au moins une mesure, mais cette mesure n'est pas toujours requise.
Les champs-clés servent à définir la matrice récapitulative. A la figure 3, par exemple, le champ-clé est Support. Monarch Data Prep Studio examine le champ et dresse la liste de toutes ses valeurs uniques (BLU, CD, LP, SACD et DVD), sur la base de laquelle il crée ensuite la matrice récapitulative.
Les mesures sont des champs numériques tabulés pour chaque ensemble de valeurs unique identifié dans les champs-clés. Ainsi, à la figure 3, le champ Montant est réparti en plusieurs totaux distincts pour chaque type de support d’enregistrement.
Bien qu’un seul champ-clé et une seule mesure soient nécessaires, les récapitulatifs peuvent être très complexes et comprendre des champs-clés, colonnes ou éléments et mesures multiples. Chaque mesure peut servir à calculer la somme, la moyenne, le pourcentage du total, la valeur minimale ou maximale, l’écart type ou la variance de chaque clé. Monarch Data Prep Studio peut aussi être utilisée comme mesure. Plutôt que d’opérer un calcul sur une mesure sélectionnée, la fonction dénombre les enregistrements de chaque clé.
Le récapitulatif illustré à la figure 4 repose sur les champs Client et Support comme champs-clés, la fonction Décompte et le champ Montant comme mesure.
Figure 4. Ventes, par client et par type de support. La colonne Décompte affiche le nombre de transactions et la colonne Montant, le montant total des ventes pour chaque clé.
Un récapitulatif peut aussi inclure des champs d’article, qui permettent l’affichage de transactions individuelles. Ces champs offrent un avantage par rapport à l'affichage de ces transactions dans la fenêtre du tableau en ce que le récapitulatif permet aussi l'affichage de sous-totaux et de totaux.
Le récapitulatif illustré à la figure 5 repose sur les champs Client, Support, Quantité et Description comme champs-clés et le champ Montant comme mesure. Le récapitulatif affiche les transactions individuelles pour chaque type de support, par client. Les sous-totaux sont calculés au niveau Support et Client.
Figure 5. Un récapitulatif affichant des transactions individuelles.
Tous les récapitulatifs illustrés ci-dessus présentent les valeurs des champs-clés dans les colonnes de gauche. Dans un autre type de récapitulatif, parfois appelé « récapitulatif croisé », les informations récapitulées des deux champs-clés sont présentées sous forme de matrice bidimensionnelle. Les valeurs du premier s’affichent de haut en bas, dans la colonne de gauche, et celles du second, de gauche à droite, sur la première ligne, sous la forme de colonnes. Cette organisation bidimensionnelle n’affiche qu’une mesure à la fois.
Un exemple de ce type de récapitulatif est illustré à la figure 6. Les champs-clés sont Client et Support, et les valeurs du champ Support sont disposées le long de la première ligne du tableau (colonnes). Le champ Montant est décomposé en sous-totaux pour chaque type de support d’enregistrement. Les totaux de chaque boutique sont affichés dans la colonne de droite, et les totaux de chaque type de support, le long de la dernière ligne. La cellule inférieure droite affiche le total global de tous les types de support vendus dans tous les magasins.
Figure 6. Récapitulatif bidimensionnel (croisé) affichant les ventes par client et par type de support.
Notez que les formats de colonne dans les récapitulatifs adoptent les formats de colonne du tableau à partir duquel ils ont été créés. Si vous changez les formats de colonne dans la fenêtre Préparer après la création d’un récapitulatif, les formats de colonne de ce récapitulatif ne changent pas.
Les article suivants pourraient vous être utiles si vous travaillez avec les récapitulatifs dans Data Prep Studio :
© 2024 Altair Engineering Inc. All Rights Reserved.