Aperçu des données
L’aperçu des données est un aspect important de la préparation des données, car il vous permet de passer en revue vos données et d’en vérifier la qualité avant de les charger dans l’espace de travail de Monarch Data Prep Studio.
L’aperçu des données vous aide par exemple à déterminer rapidement si :
-
la table dispose d’assez de lignes pour travailler,
-
les valeurs dans les colonnes ont du sens,
-
votre table ne contient pas de valeurs nulles ou blanches.
Les changements apportés aux tables en mode Aperçu (par exemple, lorsque des colonnes sont supprimées ou filtrées) s’affichent sous la forme d’un groupe de changements dans l’historique des changements.
REMARQUE : Les tables qui nécessitent une mise à jour ou qui sont obsolètes (par exemple, celles dont les connecteurs ne sont plus pris en charge dans Monarch) ne s’affichent pas dans la liste des tables à prévisualiser.
-
Après avoir sélectionné une table à ajouter à votre session Monarch Data Prep Studio, allez à la fenêtre Aperçu. Une liste de toutes les tables ajoutées à votre espace de travail, leur type de source de données, le nom de la source et le chemin d’accès s’affiche.
Dans ce volet, vous pouvez trier les lignes dans n’importe quelle colonne affichée en cliquant sur l’icône Trier .
Vous pouvez également rechercher des éléments spécifiques en cliquant sur l’icône Filtre et en saisissant un mot-clé approprié dans le champ de filtre qui s’affiche.
- Choisissez une table dans la liste Table, puis cliquez sur Aperçu. Un ensemble de panneaux contenant des informations sur les colonnes de la table, y compris un aperçu de ses lignes, s’affiche :
Vous retrouverez la description de chacun des panneaux illustrés ci-dessus en cliquant ici.
Fixer des limites de lignes
Vous pouvez limiter le nombre de lignes à exploiter en cliquant sur l’icône Modifier en regard de Aucune limite de lignes sources configurée (applicable si aucune limite n’a été définie pour le nombre de lignes) ou Limite de lignes (applicable si une limite a été définie auparavant).
pour afficher la boîte de dialogue Modifier la limite de lignes sources.
Cliquez sur la liste déroulante Limite, sélectionnez Limite, saisissez la limite de lignes à appliquer et cliquez sur OK.
Affichage des informations et des statistiques de colonne :
Les colonnes composant une table en cours d’aperçu s’affichent dans le sous-panneau Informations sur les colonnes. Par défaut, toutes les colonnes sont sélectionnées et ouvertes dans la fenêtre de préparation. Si vous souhaitez supprimer une colonne d’une table avant de l’ouvrir, désélectionnez la case à cocher située à gauche de cette colonne.
Cliquez sur le nom d’une colonne spécifiée :
Affiche diverses statistiques sur les colonnes dans le sous-panneau Statistiques sur les colonnes .
Pour déterminer comment s’affichent les valeurs d’une colonne spécifiée, sélectionnez une option dans la liste Trier par du volet Statistiques de colonne.
Les statistiques affichées pour une colonne dépendent de son type de données.
STATISTIQUES
|
Texte |
Numérique |
Date/heure |
# Lignes # Null # Vide # Unique % manquant Longueur mini Longueur maxi Longueur moyenne Nombre de mots mini Nombre de mots maxi Nombre de mots moyen Valeur la moins fréquente Valeur la plus fréquente |
# Lignes # Null # Unique % manquant Mini Maxi Moyenne Somme Valeur la moins fréquente Valeur la plus fréquente |
# Lignes # Null # Unique % manquant Date mini Date maxi Valeur la moins fréquente Valeur la plus fréquente |
Filtrage des colonnes
Monarch Data Prep Studio permet de filtrer les données d’une table en mode aperçu. Cette fonctionnalité permet de retrouver rapidement les enregistrements qui correspondent à certains critères.
Filtrage des colonnes de texte
-
Sélectionnez l’icône de filtre en regard d’une colonne de texte pour afficher le volet Filtrer sur la droite du volet Statistiques de colonne.
-
Sélectionnez un opérateur de filtrage dans le menu déroulant à droite du champ Expression. Vous avez le choix entre les opérateurs suivants :
-
Contient – Cet opérateur de filtrage vous permet de filtrer les enregistrements avec des valeurs de champ qui contiennent une série de caractères spécifique.
-
Sélection multiple – Cet opérateur de filtrage vous permet de filtrer les enregistrements contenant une ou plusieurs chaînes uniques.
-
Est égal à – Cet opérateur de filtrage renvoie les enregistrements contenant une chaîne spécifique.
-
N’est pas égal à – Cet opérateur de filtrage renvoie tous les enregistrements sauf ceux qui contiennent la chaîne spécifiée.
-
Commence par – Cet opérateur de filtrage vous permet de sélectionner les enregistrements contenant les valeurs de colonne qui commencent par une série de caractères spécifique.
-
Se termine par – Cet opérateur de filtrage vous permet de sélectionner les enregistrements contenant les valeurs de colonne qui se terminent par une série de caractères spécifique.
-
Est nul – Cet opérateur de filtrage renvoie tous les enregistrements avec des valeurs nulles dans le champ sélectionné.
-
N’est pas nul – Cet opérateur de filtrage renvoie tous les enregistrements sans valeurs nulles dans le champ sélectionné.
-
-
Dans le champ à droite du champ Expression, saisissez vos critères de filtre.
REMARQUE : Lorsque l’option Sélection multiple est sélectionnée à l’étape 2, le sous-panneau Filtre affiche une liste de toutes les valeurs possibles pouvant être sélectionnées pour vos critères de filtrage.
Les valeurs sélectionnées dans le volet inférieur s’affichent dans le volet supérieur.
Si la liste des valeurs est longue, vous pouvez utiliser le champ intitulé Valeurs de recherche pour rechercher et sélectionner la valeur souhaitée à inclure dans votre filtre. En cliquant sur l’icône Supprimer à côté d’une valeur sélectionnée, cette valeur est supprimée des critères de filtrage et réintroduite dans la liste des valeurs possibles.
-
Cochez la case Ignorer la casse pour que Monarch Data Prep Studio ne prenne pas la casse en compte lors de la recherche d’enregistrements à renvoyer. Ce paramètre ne s’applique qu’aux opérations de filtrage Contient, Est égal, N’est pas égal, Commence par et Se termine par.
-
Utilisez le menu déroulant à droite du champ Action pour inclure ou exclure les critères de filtre que vous avez spécifiés à l’étape 3 dans la table de sortie. Ce paramètre ne s’applique qu’aux opérations de filtrage Contient, Commence par et Se termine par.
-
Vous pouvez créer plusieurs filtres pour affiner votre table. Répétez les étapes 1 à 2 afin de créer d’autres filtres textuels.
-
Cliquez sur Appliquer tous les filtres à l’aperçu pour mettre le filtre en œuvre.
L’exemple ci-dessous montre les modifications de la colonne consultée en aperçu quand le filtre indiqué est appliqué.
Filtrage des colonnes numériques
Dans la fenêtre Aperçu, les filtres pour les champs numériques sont créés de la même façon que les filtres pour les champs de texte.
Quand vous créez des filtres numériques, vous pouvez appliquer les opérateurs suivants :
-
Est égal à – Cet opérateur de filtrage renvoie les enregistrements contenant une valeur de champ spécifique.
-
N’est pas égal à – Cet opérateur de filtrage renvoie tous les enregistrements sauf ceux qui contiennent la valeur de champ spécifiée.
-
Sélection multiple – Cet opérateur de filtrage vous permet de filtrer les enregistrements contenant une ou plusieurs valeurs de champ uniques.
-
Inférieur à – Cet opérateur de filtrage vous permet de filtrer les enregistrements inférieurs à une valeur spécifiée.
-
Supérieur à – Cet opérateur de filtrage vous permet de filtrer les enregistrements supérieurs à une valeur spécifiée.
-
Inférieur ou égal à – Cet opérateur de filtrage vous permet de filtrer les enregistrements inférieurs ou égaux à une valeur spécifiée.
-
Supérieur ou égal à – Cet opérateur de filtrage vous permet de filtrer les enregistrements supérieurs ou égaux à une valeur spécifiée.
-
Entre – Cet opérateur de filtrage vous permet de définir des plages numériques. Quand il est sélectionné, vous devez aussi sélectionner un opérateur dans chacun de ces jeux d’opérateurs (c’est-à-dire supérieur à/supérieur à ou égal à et inférieur à/inférieur à ou égal à) pour identifier la plage à filtrer.
-
Est nul – Cet opérateur de filtrage renvoie tous les enregistrements avec des valeurs nulles dans le champ sélectionné.
-
N’est pas nul – Cet opérateur de filtrage renvoie tous les enregistrements sans valeurs nulles dans le champ sélectionné.
Filtrage des colonnes de date/heure
Vous pouvez filtrer les de date/heure et choisir de ne voir que les enregistrements contenant des valeurs de colonne qui se situent à l’intérieur d’une plage donnée, ou qui se situent avant ou après une date précise :
Quand vous créez des filtres de date/heure, vous pouvez appliquer les opérateurs suivants :
-
Est égal à – Cet opérateur de filtrage renvoie les enregistrements contenant une date/heure spécifique.
-
N’est pas égal à – Cet opérateur de filtrage renvoie tous les enregistrements sauf ceux qui contiennent la date/heure spécifiée.
-
Sélection multiple – Cet opérateur de filtrage vous permet de filtrer les enregistrements contenant une ou plusieurs dates/heures uniques.
-
Inférieur à – Cet opérateur de filtrage vous permet de filtrer les enregistrements antérieurs à une date/heure spécifiée.
-
Supérieur à – Cet opérateur de filtrage vous permet de filtrer les enregistrements postérieurs à une date/heure spécifiée.
-
Inférieur ou égal à – Cet opérateur de filtrage vous permet de filtrer les enregistrements antérieurs ou égaux à une date/heure spécifiée.
-
Supérieur ou égal à – Cet opérateur de filtrage vous permet de filtrer les enregistrements postérieurs ou égaux à une date/heure spécifiée.
-
Entre – Cet opérateur de filtrage vous permet de définir des plages date/heure. Quand il est sélectionné, vous devez aussi sélectionner un opérateur dans chacun de ces jeux d’opérateurs (c’est-à-dire supérieur ou égal à ou inférieur ou égal à) pour identifier la plage à filtrer.
-
Est nul – Cet opérateur de filtrage renvoie tous les enregistrements avec des valeurs nulles dans le champ sélectionné.
-
N’est pas nul – Cet opérateur de filtrage renvoie tous les enregistrements sans valeurs nulles dans le champ sélectionné.
Quand vous créez des filtres de date/heure, vous pouvez spécifier des valeurs de calendrier et/ou de format d’heure. Pour ce faire, cliquez sur les boutons de menu déroulant en regard des champs de date/heure dans la boîte de dialogue Filtre de (date/heure). Les commandes Calendrier et Horloge s’affichent pour vous aider à sélectionner la date et l’heure souhaitées, respectivement.
Suppression de filtres dans la fenêtre Aperçu
Lorsqu’un filtre a été défini pour une colonne, l’icône du filtre dans le sous-panneau Informations sur la colonne passe de vide () à partiellement rempli ().
REJET DE FILTRES INDIVIDUELS
Placez le pointeur de la souris sur l’icône de filtre à côté d’une colonne pour laquelle un filtre a été défini. Cliquez sur cette icône lorsque sa couleur change.
Vous pouvez également, dans le sous-panneau Filtres, sélectionner le filtre que vous souhaitez supprimer, puis cliquer sur Supprimer ce filtre .
REJET DE TOUS LES FILTRES
Pour supprimer tous les filtres définis à la fois, cliquez sur l’icône Effacer les filtres sur la droite du panneau Information de colonne.
Charger les tables prévisualisées dans l’espace de travail
Chargez les tables dans votre espace de travail en les sélectionnant puis en cliquant sur Ouvrir sélectionnées ou Ouvrir.
Liens associés
© 2024 Altair Engineering Inc. All Rights Reserved.