Préparer les données

Vous pouvez utiliser les outils d’ingénierie des données pour nettoyer et préparer vos données. Un sous-ensemble d’outils de géotraitement est disponible dans la vue Data Engineering (Ingénierie des données) pour vous aider à préparer vos données avant de les utiliser dans une carte ou une analyse. Ces outils sont regroupés dans les catégories suivantes :

  • Clean (Nettoyer) : permettent de nettoyer les données. Vous pouvez supprimer les champs inutiles, par exemple. Vous pouvez également modifier les champs ou remplir des valeurs manquantes.
  • Construct (Construire) : permet de créer des champs qui découlent de champs existants ou des propriétés de la couche. Vous pouvez par exemple ajouter et calculer un nouveau champ, normaliser, transformer ou reclasser un champ existant et ajouter un champ en fonction de la géométrie de la couche en entrée.
  • Integrate (Intégrer) : permet d’intégrer ou d’ajouter des données d’une autre source de données dans la classe d’entités ou table en entrée. Vous pouvez par exemple joindre des champs ou ajouter des champs en enrichissant les données.
  • Format : permet de modifier le format des champs ou de réorganiser les champs dans la classe d’entités ou table. Vous pouvez par exemple convertir des champs temporels, coder des champs catégoriels ou réduire les dimensions des champs existants.

Remarque :

Certains outils de géotraitement dans la vue Data Engineering (Ingénierie des données) ne sont pas disponibles pour une couche non modifiable. Dans ce cas, créez une copie modifiable de la couche et ouvrez une nouvelle vue Data Engineering (Ingénierie des données).

Vous pouvez accéder à ces groupes et outils dans la vue Data Engineering (Ingénierie des données) en procédant de l’une des façons suivantes :

Ruban Data Engineering (Ingénierie des données)

Lorsque la vue Data Engineering (Ingénierie des données) est active, un ruban contextuel apparaît en haut de l’application. Le ruban permet d’accéder aux commandes et outils utilisés pour explorer et préparer les données.

Ruban Data Engineering (Ingénierie des données)

Le groupe Data (Données) du ruban permet d’accéder à la vue des champs et à la table attributaire de la couche associée à la vue Data Engineering (Ingénierie des données) active. Le groupe Tools (Outils) offre quatre bibliothèques d’outils : Clean (Nettoyer), Construct (Construire), Integrate (Intégrer) et Format. Chaque bibliothèque d’outils contient un sous-ensemble d’outils de géotraitement pour la tâche d’ingénierie des données respective. Par défaut, la couche associée à la vue Data Engineering (Ingénierie des données) permet de renseigner automatiquement le paramètre des entités en entrée de ces outils. Dans le groupe Spatial, Display XY Data (Afficher des données XY) et Geocode Table (Géocoder la table) convertissez vos tables autonomes non spatiales en données spatiales.

Outils Data Engineering (Ingénierie des données)

Les tables suivantes décrivent tous les outils du ruban Data Engineering (Ingénierie des données).

Remarque :

Certains des outils de géotraitement ne sont pas disponibles pour les données non spatiales, telles que les tables autonomes.

Nettoyer

Les outils suivants sont disponibles dans la catégorie Clean (Nettoyer) :

OutilDescription

Supprimer un champ

Supprime un ou plusieurs champs d'une table, d'une classe d'entités, d'une couche d'entités ou d'un jeu de données raster.

Modifier le champ

Renomme les champs et alias de champ ou modifie les propriétés de champ.

Projet

Projette des données spatiales d'un système de coordonnées vers un autre.

Supprimer des enregistrements

Supprime tous les enregistrements ou le sous-ensemble sélectionné de la saisie.

Remplacer les valeurs manquantes

Remplace les valeurs manquantes (nulles) par des valeurs estimées en fonction de voisins spatiaux, de voisins spatio-temporels, de valeurs chronologiques ou de valeurs statistiques globales.

Détection de points spatiaux aberrants

Identifie les points aberrants spatiaux globaux ou locaux dans des entités ponctuelles.

Construire

Les outils suivants sont disponibles dans la catégorie Construct (Construire) :

OutilDescription

Calculer un champ

Calcule les valeurs d'un champ pour une classe d'entités, une couche d'entités ou un raster.

Ajouter un champ

Ajoute un nouveau champ à une table ou la table d’une classe d’entités, couche d’entités et/ou de rasters avec des tables attributaires.

Calculer des taux

Calculer des taux bruts ou lissés. La méthode globale du taux de Bayes empirique lisse les taux pour les rapprocher d’un taux de référence global. Les méthodes de taux de Bayes empirique local, de moyenne pondérée localement et de médiane pondérée localement utilisent les voisins locaux pour effectuer un lissage spatial du taux.

Calculer des attributs géométriques

Ajoute des informations aux champs attributaires d’une entité représentant les caractéristiques spatiales ou géométriques ainsi que la localisation de chaque entité, telles que la longueur ou la surface, ainsi que les coordonnées x, y, z et les valeurs m.

Transformer un champ

Transforme des valeurs continues en un ou plusieurs champs en appliquant des fonctions mathématiques à chaque valeur et en modifiant la forme de la distribution. Les méthodes de transformation de l’outil sont les suivantes : logarithmique, racine carrée, Box-Cox, inverse multiplicatif, carré, exponentielle et Box-Cox inverse.

Standardiser un champ

Standardise les valeurs des champs en les convertissant en valeurs conformes à une échelle spécifiée. Parmi les méthodes de standardisation figurent les suivantes : score z, minimum-maximum, maximum absolu et standardisation robuste.

Réduction de dimension

Réduit le nombre de dimensions d’un ensemble de variables continues en agrégeant le maximum de variance possible dans moins de composantes via la méthode Analyse des composantes principales (ACP) ou Analyse discriminante linéaire à rang réduit (ADL).

Lissage chronologique

Lisse les données des séries chronologiques, ce qui permet de tenir compte des fluctuations à court terme pour exposer les cycles et tendances à long terme. L’outil peut utiliser la variable numérique d’une ou de plusieurs séries chronologiques à l’aide de moyennes de déplacement centré, avant ou arrière, ainsi que d’une méthode adaptative basée sur une régression linéaire locale.

Intégrer

Les outils suivants sont disponibles dans la catégorie Integrate (Intégrer) :

OutilDescription

Ajouter

Ajoute plusieurs jeux de données en entrée à un jeu de données cible existant, ou le met à jour le cas échéant. Les jeux de données en entrée peuvent être des classes d’entités, des tables, des shapefiles, des rasters, des classes d’entités annotations ou cotations.

Jointure spatiale

Joint des attributs d’une entité vers une autre en fonction des relations spatiales. Les entités cible et les attributs joints des entités jointes sont écrits dans la classe d’entités en sortie.

Joindre un champ

Joint le contenu d'une table à une autre table en fonction d'un champ attributaire commun. La table en entrée est mise à jour pour contenir les champs de la table de jointure. Vous pouvez sélectionner quels champs de la table de jointure seront ajoutés à la table en entrée.

Proche

Calcule la distance et d’autres informations de proximité entre les entités en entrée et l’entité la plus proche dans une autre couche ou classe d’entités.

Synthétiser - À l’intérieur

Superpose une couche surfacique avec une autre couche en vue de synthétiser le nombre de points, la longueur des lignes ou la surface des polygones dans chaque polygone, et calcule des statistiques des champs attributaires sur les entités dans les polygones.

Synthétiser - A proximité

Identifie les entités qui se trouvent à une certaine distance des entités dans la couche en entrée et calcule les statistiques des entités à proximité.

Échantillonner à partir du raster

Crée une table ou une classe d’entités ponctuelles indiquant les valeurs des cellules d’un raster ou d’un jeu de rasters, pour des localisations définies. Les localisations sont définies par cellules de raster, points, polylignes ou polygones.

Ajouter des données

Enrichit les données en ajoutant des faits démographiques et paysagers sur les personnes et lieux qui entourent ou qui sont à l’intérieur des emplacements de données. La sortie est un doublon de votre entrée avec des champs attributaires supplémentaires. Cet outil requiert un compte d’organisation ArcGIS Online ou un jeu de données Business Analyst installé localement.

Répartir le polygone

Synthétise les attributs d’une couche surfacique en entrée en fonction de la superposition spatiale d’une couche surfacique cible et affecte les attributs synthétisés aux polygones cibles. Les polygones cibles comportent la somme des attributs numériques qui découlent des polygones en entrée sur lequel chacun se superpose.

Format

Les outils suivants sont disponibles dans la catégorie Format :

OutilDescription

Convertir un champ temporel

Transfère les valeurs temporelles stockées dans un champ dans un autre champ. L’outil permet la conversion entre des types de champ (texte, numérique ou date/heure) ou la conversion de valeurs dans un autre format, par exemple jj/MM/aa HH:mm:ss en aaaa-MM-jj.

Changer de fuseau horaire

Convertit des valeurs temporelles enregistrées dans un champ date d'un fuseau horaire vers un autre fuseau horaire.

Table croisée

Crée une table à partir de la table en entrée en réduisant la redondance dans les enregistrements et en mettant à plat les relations un vers plusieurs.

Transposer des champs

Fait basculer les données stockées dans des champs ou colonnes vers les lignes d'une nouvelle table ou classe d'entités.

Reclasser un champ

Reclasse les valeurs d’un champ numérique ou de texte dans des classes en fonction de limites définies manuellement ou à l’aide d’une méthode de reclassification.

Encoder un champ

Convertit des valeurs de catégorie (chaîne, entier ou date) en plusieurs champs numériques représentant chacun une catégorie. Les champs numériques encodés peuvent être utilisés dans la plupart des processus de science des données et statistiques, y compris les modèles de régression.

Remarque :

La plupart des opérations de géotraitement qui modifient les données en entrée ne peuvent pas être annulées.

Rubriques connexes