Supprimer les doublons (Gestion des données)

Synthèse

Supprime les enregistrements d’une table ou d’une classe d’entités qui ont des valeurs identiques dans un ensemble de champs. Si le champ de géométrie est sélectionné, les géométries de l’entité sont comparées.

L’outil Rechercher les doublons permet de signaler les enregistrements considérés comme identiques sans pour autant les supprimer.

Utilisation

    Attention :

    Cet outil modifie les données en entrée. Pour plus d’informations et connaître les stratégies permettant d’empêcher les modifications de données indésirables, reportez-vous à la rubrique Outils qui modifient ou mettent à jour les données en entrée.

  • Pour chaque ensemble d’enregistrements identiques, l’outil supprime tous les enregistrements identiques sauf le premier. L’ordre des enregistrements identiques sera le même que celui renvoyé par l’outil Rechercher les doublons.

  • Les valeurs provenant de plusieurs champs dans le jeu de données en entrée seront comparées. Si plusieurs champs sont indiqués, les enregistrements seront mis en correspondance en fonction des valeurs du premier champ, puis des valeurs du deuxième champ, et ainsi de suite.

  • Avec une classe d’entités ou une couche d’entités en entrée, utilisez le champ de géométrie du paramètre Champs pour comparer les géométries d’entités et rechercher les entités identiques par emplacement. Les paramètres Tolérance XY et Tolérance Z ne sont valides que si le champ de géométrie est sélectionné en tant que champ en entrée.

  • La valeur Table d’appariement des ID en double en sortie comprendra les champs suivants :

    • IN_FID— L’ID d’objet d’un enregistrement en entrée pour lequel il existe un doublon
    • REPR_FID— L’ID d’objet d’un enregistrement représentatif qui a été conservé

Paramètres

ÉtiquetteExplicationType de données
Jeu de données en entrée

La table ou classe d’entités dont les enregistrements identiques seront supprimés.

Table View
Champs

Champ(s) dont les valeurs sont comparées pour rechercher des enregistrements identiques.

Field
Tolérance XY
(Facultatif)

Tolérance x,y qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Linear Unit
Tolérance Z
(Facultatif)

Tolérance z qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Double
Table d’appariement des ID en double en sortie
(Facultatif)

Une table en sortie facultative qui comprendra les valeurs d’ID d’objet de tous les enregistrements de l’entrée qui ont un doublon, mis en correspondance avec les valeurs d’ID d’objet de l’enregistrement représentatif qui a été conservé.

Table View

Sortie obtenue

ÉtiquetteExplicationType de données
Jeu de données en entrée mis à jour

Jeu de données en entrée mis à jour.

Table View

arcpy.management.DeleteIdentical(in_dataset, fields, {xy_tolerance}, {z_tolerance}, {out_mapping_table})
NomExplicationType de données
in_dataset

La table ou classe d’entités dont les enregistrements identiques seront supprimés.

Table View
fields
[fields,...]

Champ(s) dont les valeurs sont comparées pour rechercher des enregistrements identiques.

Field
xy_tolerance
(Facultatif)

Tolérance x,y qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Linear Unit
z_tolerance
(Facultatif)

Tolérance z qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Double
out_mapping_table
(Facultatif)

Une table en sortie facultative qui comprendra les valeurs d’ID d’objet de tous les enregistrements de l’entrée qui ont un doublon, mis en correspondance avec les valeurs d’ID d’objet de l’enregistrement représentatif qui a été conservé.

Table View

Sortie obtenue

NomExplicationType de données
out_dataset

Jeu de données en entrée mis à jour.

Table View

Exemple de code

Exemple 1 d’utilisation de l’outil DeleteIdentical (fenêtre Python)

Le script de fenêtre Python ci-dessous montre comment utiliser la fonction DeleteIdentical en mode intermédiaire.

import arcpy
arcpy.management.DeleteIdentical("C:/data/fireincidents.shp", ["ZONE", "INTENSITY"])
Exemple 2 d'utilisation de l'outil DeleteIdentical (script autonome)

Le script autonome suivant montre comment utiliser la fonction DeleteIdentical pour identifier les enregistrements en double d’une table ou d’une classe d’entités.

# Name: DeleteIdentical_Example2.py
# Description: Delete identical features in a dataset based on Shape (geometry) and a TEXT field.

# Import system modules
import arcpy

# Set workspace environment
arcpy.env.workspace = "C:/data/sbfire.gdb"

# Set input feature class
in_dataset = "fireincidents"

# Set the field on which the identical records are found
fields = ["Shape", "INTENSITY"]

# Set the XY tolerance within which identical records will be deleted
xy_tol = "0.02 Miles"

# Set the Z tolerance to default
z_tol = ""

# Run Delete Identical 
arcpy.management.DeleteIdentical(in_dataset, fields, xy_tol, z_tol)

Informations de licence

  • Basic: Oui
  • Standard: Oui
  • Advanced: Oui

Rubriques connexes