Vous pouvez utiliser les outils d’ingénierie des données pour nettoyer et préparer vos données. Un sous-ensemble d’outils de géotraitement est disponible dans la vue Data Engineering (Ingénierie des données) pour vous aider à préparer vos données avant de les utiliser dans une carte ou une analyse. Ces outils sont regroupés dans les catégories suivantes :
- Clean (Nettoyer) : permettent de nettoyer les données. Vous pouvez par exemple supprimer les lignes ou champs inutiles. Vous pouvez également modifier les champs ou remplir des valeurs manquantes.
- Construct (Construire) : permet de créer des champs qui découlent de champs existants ou des propriétés de la couche. Vous pouvez par exemple ajouter et calculer un nouveau champ, normaliser, transformer ou reclasser un champ existant et ajouter un champ en fonction de la géométrie de la couche en entrée.
- Integrate (Intégrer) : permet d’intégrer ou d’ajouter des données d’une autre source de données dans la classe d’entités ou table en entrée. Vous pouvez par exemple joindre des champs ou ajouter des champs en enrichissant les données.
- Format : permet de modifier le format des champs ou de réorganiser les champs dans la classe d’entités ou table. Vous pouvez par exemple convertir des champs temporels, coder des champs catégoriels ou réduire les dimensions des champs existants.
Remarque :
Certains outils de géotraitement dans la vue Data Engineering (Ingénierie des données) ne sont pas disponibles pour une couche non modifiable. Dans ce cas, créez une copie modifiable de la couche et ouvrez une nouvelle vue Data Engineering (Ingénierie des données).
Vous pouvez accéder à ces groupes et outils dans la vue Data Engineering (Ingénierie des données) en procédant de l’une des façons suivantes :
- Cliquez avec le bouton droit sur le menu contextuel d’un champ dans le volet des champs.
- Cliquez avec le bouton droit sur le menu contextuel d’un champ dans le volet des statistiques.
- Cliquez sur l’outil dans le ruban Data Engineering (Ingénierie des données).
Ruban Data Engineering (Ingénierie des données)
Lorsque la vue Data Engineering (Ingénierie des données) est active, un ruban contextuel apparaît en haut de l’application. Le ruban permet d’accéder aux commandes et outils utilisés pour explorer et préparer les données.
Le groupe Data (Données) du ruban permet d’accéder à la vue des champs et à la table attributaire de la couche associée à la vue Data Engineering (Ingénierie des données) active. Le groupe Tools (Outils) offre quatre bibliothèques d’outils : Clean (Nettoyer), Construct (Construire), Integrate (Intégrer) et Format. Chaque bibliothèque d’outils contient un sous-ensemble d’outils de géotraitement pour la tâche d’ingénierie des données respective. Par défaut, la couche associée à la vue Data Engineering (Ingénierie des données) permet de renseigner automatiquement le paramètre des entités en entrée de ces outils.
Outils Data Engineering (Ingénierie des données)
Les tables suivantes décrivent tous les outils du ruban Data Engineering (Ingénierie des données).
Remarque :
Certains des outils de géotraitement ne sont pas disponibles pour les données non spatiales, telles que les tables autonomes.
Nettoyer
Les outils suivants sont disponibles dans la catégorie Clean (Nettoyer) :
Outil | Description |
---|---|
Remplace les valeurs manquantes (nulles) par des valeurs estimées en fonction de voisins spatiaux, de voisins spatio-temporels ou de valeurs chronologiques. | |
Supprime un ou plusieurs champs d'une table, d'une classe d'entités, d'une couche d'entités ou d'un jeu de données raster. |
|
Identifie les points aberrants spatiaux dans les entités ponctuelles en calculant le facteur LOF de chaque entité. Les points aberrants spatiaux sont des entités dans des localisations anormalement isolées et le facteur LOF est une mesure qui décrit l’isolement d’une localisation par rapport à ses voisines locales. | |
Projette des données spatiales d'un système de coordonnées vers un autre. |
Construire
Les outils suivants sont disponibles dans la catégorie Construct (Construire) :
Outil | Description |
---|---|
Ajoute des informations aux champs attributaires d’une entité représentant les caractéristiques spatiales ou géométriques ainsi que l’emplacement de chaque entité, tels que la longueur ou la surface et les coordonnées x, y, z et m. | |
Calcule les valeurs d'un champ pour une classe d'entités, une couche d'entités ou un raster. |
|
Transforme des valeurs continues en un ou plusieurs champs en appliquant des fonctions mathématiques à chaque valeur et en modifiant la forme de la distribution. Les méthodes de transformation de l’outil sont les suivantes : logarithmique, racine carrée, Box-Cox, inverse multiplicatif, carré, exponentielle et Box-Cox inverse. | |
Standardise les valeurs des champs en les convertissant en valeurs conformes à une échelle spécifiée. Parmi les méthodes de standardisation figurent les suivantes : score z, minimum-maximum, maximum absolu et standardisation robuste. | |
Ajoute un nouveau champ à une table ou la table d’une classe d’entités, couche d’entités et/ou de rasters avec des tables attributaires. | |
Réduit le nombre de dimensions d’un ensemble de variables continues en agrégeant le maximum de variance possible dans moins de composantes via la méthode Analyse des composantes principales (ACP) ou Analyse discriminante linéaire à rang réduit (ADL). | |
Lisse les données des séries chronologiques, ce qui permet de tenir compte des fluctuations à court terme pour exposer les cycles et tendances à long terme. L’outil peut utiliser la variable numérique d’une ou de plusieurs séries chronologiques à l’aide de moyennes de déplacement centré, avant ou arrière, ainsi que d’une méthode adaptative basée sur une régression linéaire locale. |
Intégrer
Les outils suivants sont disponibles dans la catégorie Integrate (Intégrer) :
Outil | Description |
---|---|
Joint le contenu d'une table à une autre table en fonction d'un champ attributaire commun. La table en entrée est mise à jour pour contenir les champs de la table de jointure. Vous pouvez sélectionner quels champs de la table de jointure seront ajoutés à la table en entrée. | |
Enrichit les données en ajoutant des faits démographiques et paysagers sur les personnes et lieux qui entourent ou qui sont à l’intérieur des emplacements de données. La sortie est un doublon de votre entrée avec des champs attributaires supplémentaires. Cet outil requiert un compte d’organisation ArcGIS Online ou un jeu de données Business Analyst installé localement. |
|
Calcule la distance et d'autres informations de proximité entre les entités en entrée et l'entité la plus proche dans une autre couche ou classe d'entités. | |
Joint des attributs d'une entité vers une autre en fonction des relations spatiales. Les entités cible et les attributs joints des entités jointes sont écrits dans la classe d'entités en sortie. | |
Superpose une couche surfacique avec une autre couche en vue de synthétiser le nombre de points, la longueur des lignes ou la surface des polygones au sein de chaque polygone, ainsi que de calculer des statistiques des champs attributaires sur ces entités au sein des polygones. | |
Crée une table ou une classe d’entités ponctuelles indiquant les valeurs de cellule d’un raster ou d’un jeu de rasters, pour des emplacements définis. Les emplacements sont définis par des cellules raster, des points, des polylignes ou des polygones. | |
Identifie les entités qui se trouvent à une certaine distance des entités dans la couche en entrée et calcule les statistiques des entités à proximité. | |
Synthétise les attributs d’une couche surfacique en entrée en fonction de la superposition spatiale d’une couche surfacique cible et affecte les attributs synthétisés aux polygones cibles. Les polygones cibles comportent la somme des attributs numériques qui découlent des polygones en entrée sur lequel chacun se superpose. |
Format
Les outils suivants sont disponibles dans la catégorie Format :
Outil | Description |
---|---|
Convertit des valeurs de catégorie (chaîne, entier ou date) en plusieurs champs numériques représentant chacun une catégorie. Les champs numériques encodés peuvent être utilisés dans la plupart des processus de science des données et statistiques, y compris les modèles de régression. | |
Convertit des valeurs temporelles stockées dans une chaîne ou un champ numérique en un champ date. L'outil permet également de convertir dans des formats personnalisés les valeurs de temps stockées dans des champs de type chaîne, numérique ou date, tels que le jour de la semaine et le mois de l'année. |
|
Fait basculer les données stockées dans des champs ou colonnes vers les lignes d'une nouvelle table ou classe d'entités. | |
Convertit des valeurs temporelles enregistrées dans un champ date d'un fuseau horaire vers un autre fuseau horaire. | |
Reclasse les valeurs d’un champ numérique ou de texte dans des classes en fonction de limites définies manuellement ou à l’aide d’une méthode de reclassification. | |
Crée une table à partir de la table en entrée en réduisant la redondance dans les enregistrements et en mettant à plat les relations un vers plusieurs. |
Remarque :
La plupart des opérations de géotraitement qui modifient les données en entrée ne peuvent pas être annulées.
Rubriques connexes
Vous avez un commentaire à formuler concernant cette rubrique ?