Préparer les données

Vous pouvez utiliser les outils d’ingénierie des données pour nettoyer et préparer vos données. Un sous-ensemble d’outils de géotraitement est disponible dans la vue Data Engineering (Ingénierie des données) pour vous aider à préparer vos données avant de les utiliser dans une carte ou une analyse. Ces outils sont regroupés dans les catégories suivantes :

  • Clean (Nettoyer) : permettent de nettoyer les données. Vous pouvez par exemple supprimer les lignes ou champs inutiles. Vous pouvez également modifier les champs ou remplir des valeurs manquantes.
  • Construct (Construire) : permet de créer des champs qui découlent de champs existants ou des propriétés de la couche. Vous pouvez par exemple ajouter et calculer un nouveau champ, normaliser, transformer ou reclasser un champ existant et ajouter un champ en fonction de la géométrie de la couche en entrée.
  • Integrate (Intégrer) : permet d’intégrer ou d’ajouter des données d’une autre source de données dans la classe d’entités ou table en entrée. Vous pouvez par exemple joindre des champs ou ajouter des champs en enrichissant les données.
  • Format : permet de modifier le format des champs ou de réorganiser les champs dans la classe d’entités ou table. Vous pouvez par exemple convertir des champs temporels, coder des champs catégoriels ou réduire les dimensions des champs existants.

Remarque :

Certains outils de géotraitement dans la vue Data Engineering (Ingénierie des données) ne sont pas disponibles pour une couche non modifiable. Dans ce cas, créez une copie modifiable de la couche et ouvrez une nouvelle vue Data Engineering (Ingénierie des données).

Vous pouvez accéder à ces groupes et outils dans la vue Data Engineering (Ingénierie des données) en procédant de l’une des façons suivantes :

Ruban Data Engineering (Ingénierie des données)

Lorsque la vue Data Engineering (Ingénierie des données) est active, un ruban contextuel apparaît en haut de l’application. Le ruban permet d’accéder aux commandes et outils utilisés pour explorer et préparer les données.

Ruban Data Engineering (Ingénierie des données)

Le groupe Data (Données) du ruban permet d’accéder à la vue des champs et à la table attributaire de la couche associée à la vue Data Engineering (Ingénierie des données) active. Le groupe Tools (Outils) offre quatre bibliothèques d’outils : Clean (Nettoyer), Construct (Construire), Integrate (Intégrer) et Format. Chaque bibliothèque d’outils contient un sous-ensemble d’outils de géotraitement pour la tâche d’ingénierie des données respective. Par défaut, la couche associée à la vue Data Engineering (Ingénierie des données) permet de renseigner automatiquement le paramètre des entités en entrée de ces outils.

Outils Data Engineering (Ingénierie des données)

Les tables suivantes décrivent tous les outils du ruban Data Engineering (Ingénierie des données).

Remarque :

Certains des outils de géotraitement ne sont pas disponibles pour les données non spatiales, telles que les tables autonomes.

Nettoyer

Les outils suivants sont disponibles dans la catégorie Clean (Nettoyer) :

OutilDescription

Remplacer les valeurs manquantes

Remplace les valeurs manquantes (nulles) par des valeurs estimées en fonction de voisins spatiaux, de voisins spatio-temporels ou de valeurs chronologiques.

Supprimer un champ

Supprime un ou plusieurs champs d'une table, d'une classe d'entités, d'une couche d'entités ou d'un jeu de données raster.

Détection de points spatiaux aberrants

Identifie les points aberrants spatiaux dans les entités ponctuelles en calculant le facteur LOF de chaque entité. Les points aberrants spatiaux sont des entités dans des localisations anormalement isolées et le facteur LOF est une mesure qui décrit l’isolement d’une localisation par rapport à ses voisines locales.

Projeter

Projette des données spatiales d'un système de coordonnées vers un autre.

Construire

Les outils suivants sont disponibles dans la catégorie Construct (Construire) :

OutilDescription

Calculer des attributs géométriques

Ajoute des informations aux champs attributaires d’une entité représentant les caractéristiques spatiales ou géométriques ainsi que l’emplacement de chaque entité, tels que la longueur ou la surface et les coordonnées x, y, z et m.

Calculer un champ

Calcule les valeurs d'un champ pour une classe d'entités, une couche d'entités ou un raster.

Transformer un champ

Transforme des valeurs continues en un ou plusieurs champs en appliquant des fonctions mathématiques à chaque valeur et en modifiant la forme de la distribution. Les méthodes de transformation de l’outil sont les suivantes : logarithmique, racine carrée, Box-Cox, inverse multiplicatif, carré, exponentielle et Box-Cox inverse.

Standardiser un champ

Standardise les valeurs des champs en les convertissant en valeurs conformes à une échelle spécifiée. Parmi les méthodes de standardisation figurent les suivantes : score z, minimum-maximum, maximum absolu et standardisation robuste.

Ajouter un champ

Ajoute un nouveau champ à une table ou la table d’une classe d’entités, couche d’entités et/ou de rasters avec des tables attributaires.

Réduction de dimension

Réduit le nombre de dimensions d’un ensemble de variables continues en agrégeant le maximum de variance possible dans moins de composantes via la méthode Analyse des composantes principales (ACP) ou Analyse discriminante linéaire à rang réduit (ADL).

Lissage chronologique

Lisse les données des séries chronologiques, ce qui permet de tenir compte des fluctuations à court terme pour exposer les cycles et tendances à long terme. L’outil peut utiliser la variable numérique d’une ou de plusieurs séries chronologiques à l’aide de moyennes de déplacement centré, avant ou arrière, ainsi que d’une méthode adaptative basée sur une régression linéaire locale.

Intégrer

Les outils suivants sont disponibles dans la catégorie Integrate (Intégrer) :

OutilDescription

Joindre un champ

Joint le contenu d'une table à une autre table en fonction d'un champ attributaire commun. La table en entrée est mise à jour pour contenir les champs de la table de jointure. Vous pouvez sélectionner quels champs de la table de jointure seront ajoutés à la table en entrée.

Ajouter des données

Enrichit les données en ajoutant des faits démographiques et paysagers sur les personnes et lieux qui entourent ou qui sont à l’intérieur des emplacements de données. La sortie est un doublon de votre entrée avec des champs attributaires supplémentaires. Cet outil requiert un compte d’organisation ArcGIS Online ou un jeu de données Business Analyst installé localement.

Proche

Calcule la distance et d'autres informations de proximité entre les entités en entrée et l'entité la plus proche dans une autre couche ou classe d'entités.

Jointure spatiale

Joint des attributs d'une entité vers une autre en fonction des relations spatiales. Les entités cible et les attributs joints des entités jointes sont écrits dans la classe d'entités en sortie.

Synthétiser - A l'intérieur

Superpose une couche surfacique avec une autre couche en vue de synthétiser le nombre de points, la longueur des lignes ou la surface des polygones au sein de chaque polygone, ainsi que de calculer des statistiques des champs attributaires sur ces entités au sein des polygones.

Echantillon

Crée une table ou une classe d’entités ponctuelles indiquant les valeurs de cellule d’un raster ou d’un jeu de rasters, pour des emplacements définis. Les emplacements sont définis par des cellules raster, des points, des polylignes ou des polygones.

Synthétiser - A proximité

Identifie les entités qui se trouvent à une certaine distance des entités dans la couche en entrée et calcule les statistiques des entités à proximité.

Répartir le polygone

Synthétise les attributs d’une couche surfacique en entrée en fonction de la superposition spatiale d’une couche surfacique cible et affecte les attributs synthétisés aux polygones cibles. Les polygones cibles comportent la somme des attributs numériques qui découlent des polygones en entrée sur lequel chacun se superpose.

Format

Les outils suivants sont disponibles dans la catégorie Format :

OutilDescription

Encoder un champ

Convertit des valeurs de catégorie (chaîne, entier ou date) en plusieurs champs numériques représentant chacun une catégorie. Les champs numériques encodés peuvent être utilisés dans la plupart des processus de science des données et statistiques, y compris les modèles de régression.

Convertir un champ temporel

Convertit des valeurs temporelles stockées dans une chaîne ou un champ numérique en un champ date. L'outil permet également de convertir dans des formats personnalisés les valeurs de temps stockées dans des champs de type chaîne, numérique ou date, tels que le jour de la semaine et le mois de l'année.

Transposer des champs

Fait basculer les données stockées dans des champs ou colonnes vers les lignes d'une nouvelle table ou classe d'entités.

Changer de fuseau horaire

Convertit des valeurs temporelles enregistrées dans un champ date d'un fuseau horaire vers un autre fuseau horaire.

Reclasser un champ

Reclasse les valeurs d’un champ numérique ou de texte dans des classes en fonction de limites définies manuellement ou à l’aide d’une méthode de reclassification.

Table croisée

Crée une table à partir de la table en entrée en réduisant la redondance dans les enregistrements et en mettant à plat les relations un vers plusieurs.

Remarque :

La plupart des opérations de géotraitement qui modifient les données en entrée ne peuvent pas être annulées.

Rubriques connexes