Spécification de valeurs de clé de correspondance pour un récapitulatif dans Data Prep Studio

Dans Monarch Data Prep Studio, la création d’un récapitulatif implique la génération d’une liste de toutes les valeurs uniques identifiées dans chaque champ-clé. Toutes les listes sont ensuite combinées pour former la matrice du récapitulatif. Chaque ligne de cette matrice représente un ensemble de valeurs de clé uniques. Par exemple, les champs Client et Support sont utilisés dans le récapitulatif illustré ci-dessous. Le champ Client contient 20 valeurs uniques (une par client compris dans l'état). Le champ Support en contient 5 (une par type de support). Combinés, ces deux champs peuvent créer une matrice récapitulative de 100 lignes (20 clients * 5 types de support). Dans la pratique, le récapitulatif comprendrait vraisemblablement moins de lignes, car tous les types de support ne sont pas nécessairement présents pour chaque client (voir l'illustration ci-dessous).

Matrice récapitulative de 20 clients et cinq types de support.
 

Il se peut qu'un sous-ensemble seulement des valeurs d'un champ-clé vous intéresse. Vous pouvez dans ce cas créer un filtre pour limiter les enregistrements disponibles au calcul du récapitulatif. Bien que puissants, les filtres en soi ne procurent pas toutes les capacités nécessaires aux analyses les plus sophistiquées.

Pour accroître les capacités d’un filtre, le moteur de récapitulatif Monarch Data Prep Studio offre différentes options de spécification des valeurs de clé ou de colonne à utiliser. Ces options se trouvent dans le sous-onglet Correspondance de la boîte de dialogue Propriétés du champ des champs Clé et Colonne.

Spécification de valeurs de clé de correspondance pour un récapitulatif :

  1. Vérifiez que le récapitulatif est sélectionné et ouvrez la boîte de dialogue d’édition du récapitulatif.

  2. Dans la boîte de dialogue d’édition du récapitulatif, cliquez sur l’icône Édition d’un champ Clé pour afficher ses onglets et ses propriétés.

     

  3. Accédez à l’onglet Correspondance.

  4. Sélectionnez l'option de correspondance appropriée.

  5. Entrez un libellé pour toutes les autres valeurs (facultatif).

    Si vous sélectionnez N premières valeurs, Valeurs du tableau ou Limite de mesure, vous avez également la possibilité de grouper toutes les autres valeurs sous un même libellé dans le récapitulatif. Cette fonctionnalité peut être utile en cas de sélection de valeurs de clé spécifiques à comparer à l'ensemble des données.

    Lors de la génération du récapitulatif, toutes les données associées aux valeurs ou plages-clés autres que celles spécifiées dans la zone Valeurs s’accumulent sous le libellé indiqué et s’affichent sur une ligne séparée du récapitulatif.

    Au besoin, modifiez le libellé Accumulateur (valeur par défaut : Tous autres) pour le rendre plus descriptif.

  6. Pour N premières valeurs, Valeurs du tableau et Limite de mesure, saisissez les valeurs à utiliser.

    Si vous avez sélectionné l’option Valeurs du tableau, cliquez sur le bouton Édition des valeurs pour afficher Valeurs du tableau :

     

    Vous pouvez :

    Sous l’option Valeurs supérieures, cliquez sur Nouvelle valeur pour ajouter chaque limite à appliquer à la liste des valeurs spécifiées ou supérieures, puis cliquez sur OK pour fermer la boîte de dialogue.

  7. Cliquez sur Accepter.

Monarch Data Prep Studio réaffiche le récapitulatif en fonction des valeurs spécifiées seulement.

 

n premières valeurs  

Cette option affiche les n premières valeurs disponibles au récapitulatif (n représente un chiffre que vous spécifiez). Le tri du récapitulatif peut changer les valeurs renvoyées. Par exemple, cette option peut être utilisée avec l'option de tri Mesure (voir Tri des champs-clés et champs d'article dans un récapitulatif) pour créer une analyse de type « n premiers » (voir l'illustration ci-dessous).

Utilisation des n premières valeurs pour une analyse des cinq meilleurs clients. Le champ Client est trié en ordre décroissant en fonction de la mesure Montant (des ventes).

 

Valeurs du tableau  

Grâce à cette option, vous pouvez créer une liste de valeurs spécifiques que Monarch Data Prep Studio utilisera pour chaque champ-clé, et spécifier le mappage des valeurs à cette liste.

Cette liste peut être aussi simple que « CD », « DVD » et « LP », ou être plus complexe et faire appel aux caractères génériques (? et *).

Remarque : Les caractères génériques ne sont pas admis pour les valeurs de date et numériques.

 

L’option Valeurs spécifiées permet aussi la définition d’un ordre de tri pour les valeurs de clé. Monarch Data Prep Studio admet le tri en fonction des champs-clés ou des mesures, mais l’ordre est croissant ou décroissant, alphabétique ou numérique, suivant le type de champ. Il est parfois utile de définir un ordre de tri exact : dans le cas des mois de l’année, par exemple.

Utilisation de valeurs spécifiées pour limiter l'affichage des informations relatives à deux clients seulement (Disques bleus et Harmonica).

 

Dans Valeurs du tableau, trois choix de mappage s’offrent à vous :

 

 

Limite de mesure  

Cette option ne renvoie que les valeurs de champ-clé pour lesquelles le sous-total d'une mesure sélectionnée est inférieur ou supérieur à une limite spécifiée. Cette option permet par exemple de limiter l’affichage aux clients dont les ventes s’élèvent à plus de 88 000 €.

image\sw_skv05.gif

Utilisation des limites de mesure pour une analyse des régions dans lesquelles les ventes dépassent un montant donné.

 

Intervalle de temps

Cette option n’est activée que lorsque le champ clé est de type Date/heure. Lorsque cette option est sélectionnée, la zone d'affichage en lecture seule, à droite, liste les intervalles couvrant la plage de valeurs de date/heure actuellement présentes pour le champ-clé, sous filtrage applicable du récapitulatif. Il s'agit précisément de la plage qui sera appliquée au moment du calcul effectif du récapitulatif.