Preparar datos

Puede utilizar herramientas de ingeniería de datos para limpiar y preparar sus datos. La vista de Ingeniería de datos incluye un subconjunto de herramientas de geoprocesamiento que le ayudarán a preparar los datos para utilizarlos en un mapa o un análisis. Estas herramientas se agrupan en las siguientes categorías:

  • Limpiar: limpiar los datos. Por ejemplo, puede eliminar campos innecesarios. También puede modificar los campos o rellenar los valores que falten.
  • Construir: crear campos derivados de campos o propiedades existentes en la capa. Por ejemplo, puede agregar y calcular un nuevo campo; estandarizar, transformar o reclasificar un campo existente; y agregar un campo basado en la geometría de la capa de entrada.
  • Integrar: integrar o agregar datos de otra fuente de datos a la tabla de entrada o clase de entidad. Por ejemplo, puede unir campos o agregar campos enriqueciendo los datos.
  • Formato: cambiar el formato de los campos o reorganizar los campos en la tabla o clase de entidad. Por ejemplo, puede convertir campos de tiempo, codificar campos de categorías o reducir las dimensiones de los campos existentes.

Nota:

Algunas herramientas de geoprocesamiento de la vista de Ingeniería de datos no están disponibles para una capa no editable. En este caso, haga una copia editable de la capa y abra una nueva vista de Ingeniería de datos.

Puede acceder a estos grupos y herramientas en la vista de Ingeniería de datos mediante una de las siguientes acciones:

Cinta de Ingeniería de datos

Cuando la vista de Ingeniería de datos está activa, aparece una cinta contextual en la parte superior de la aplicación. La cinta proporciona acceso a comandos y herramientas para explorar y preparar los datos.

Cinta de Ingeniería de datos

El grupo Datos de la cinta proporciona acceso a la vista de campos y a la tabla de atributos de la capa asociada a la vista de Ingeniería de datos activa. El grupo Herramientas ofrece cuatro galerías de herramientas: Limpiar, Construir, Integrar y Formato. Cada galería de herramientas contiene un subconjunto de herramientas de geoprocesamiento para la tarea de ingeniería de datos correspondiente. De forma predeterminada, la capa asociada a la vista de Ingeniería de datos activa se utiliza para rellenar automáticamente el parámetro de entidades de entrada de estas herramientas. En el grupo Espacial, Mostrar datos XY y Geocodificar tabla convierten sus tablas independientes no espaciales en datos espaciales.

Herramientas de Ingeniería de datos

Las siguientes tablas describen todas las herramientas de la cinta de Ingeniería de datos.

Nota:

Algunas de las herramientas de geoprocesamiento no están disponibles para los datos no espaciales, como las tablas independientes.

Limpiar

Las siguientes herramientas están disponibles en la categoría Limpiar:

HerramientaDescripción

Eliminar campo

Elimina uno o varios campos de una tabla, una clase de entidad, una capa de entidad o un dataset ráster.

Incorporar

Incorpora (u, opcionalmente, actualiza) un dataset de destino existente con varios datasets de entrada. Los datasets de entrada pueden ser clases de entidad, tablas, shapefiles, rásteres, clases de entidad de anotación o de dimensión.

Modificar campo

Cambia el nombre de campos y alias de campo o modifica las propiedades de los campos.

Proyecto

Proyecta datos espaciales de un sistema de coordenadas a otro.

Eliminar filas

Elimina todas o el subconjunto seleccionado de filas desde la entrada.

Rellenar los valores que faltan

Reemplaza valores que faltan (nulos) por valores estimados según los vecinos espaciales, los vecinos del espacio-tiempo, valores de serie temporal o valores de estadísticas globales.

Detección de valores atípicos espaciales

Identifica valores atípicos espaciales globales o locales en entidades de punto.

Construir

Las siguientes herramientas están disponibles en la categoría Construir:

HerramientaDescripción

Calcular campo

Calcula los valores de un campo para una clase de entidad, una capa de entidades o un ráster.

Agregar campo

Agrega un nuevo campo a una tabla o a la tabla de una clase de entidad o capa de entidades, así como a rásteres con tablas de atributos.

Calcular atributos de geometría

Agrega información a campos de atributos de una entidad que representan las características espaciales o geométricas y la ubicación de cada entidad, como la longitud o el área y las coordenadas x, y, z, y los valores m.

Transformar campo

Transforma valores continuos en uno o varios campos aplicando funciones matemáticas a cada valor y cambiando la forma de la distribución. Entre los métodos de transformación de la herramienta se encuentran logarítmica, raíz cuadrada, Box-Cox, inverso multiplicativo, cuadrado, exponencial y Box-Cox inversa.

Estandarizar campo

Estandariza los valores de los campos al convertirlos en valores que siguen una escala especificada. Entre los métodos de estandarización se encuentran puntuación z, mínimo-máximo, máximo absoluto y estandarización sólida.

Reducción de dimensión

Reduce el número de dimensiones de un conjunto de variables continuas agregando la mayor cantidad posible de varianza en menos componentes utilizando un Análisis de componentes principales (PCA) o un Análisis discriminante lineal (LDA) de rango reducido.

Suavizado de serie temporal

Suaviza los datos de la serie temporal, lo que ayuda a tener en cuenta las fluctuaciones a corto plazo para exponer las tendencias y los ciclos a largo plazo. La herramienta puede utilizar la variable numérica de una o varias series temporales mediante medias móviles centradas, hacia delante y hacia atrás, así como un método adaptativo basado en la regresión lineal local.

Integrar

Las siguientes herramientas están disponibles en la categoría Integrar:

HerramientaDescripción

Unión espacial

Une los atributos de una entidad con otra basada en la relación espacial. Las entidades de destino y los atributos unidos de las entidades de unión se escriben en la clase de entidad de salida.

Campo de unión

Une permanentemente el contenido de una tabla a otra tabla basándose en un campo de atributos común. La tabla de entrada se actualiza para contener los campos de la tabla a unir. Puede seleccionar qué campos de la tabla a unir se agregarán a la tabla de entrada.

Cerca

Calcula la distancia y la información de proximidad adicional entre entidades de entrada y la entidad más cercana en otras clases de entidad o capa.

Resumir dentro de

Superpone una capa de polígono con otra capa para resumir el número de puntos, la longitud de las líneas o el área de los polígonos dentro de cada polígono, así como para calcular estadísticas de campos de atributos sobre las entidades dentro de los polígonos.

Resumir cerca de

Permite buscar entidades que se encuentran a una determinada distancia de las entidades de la capa de entrada y calcular estadísticas para las entidades próximas.

Muestra del ráster

Crea una tabla o una clase de entidad de punto que muestrea los valores de las celdas de un ráster, o conjunto de rásteres, para detectar ubicaciones definidas. Las ubicaciones se definen por celdas ráster, puntos, polilíneas o polígonos.

Enriquecer

Enriquece datos al agregar datos demográficos y del paisaje sobre las personas y los lugares que rodean o se encuentran dentro de ubicaciones de datos. La salida es un duplicado de la entrada con campos de atributos adicionales. Esta herramienta requiere una cuenta de organización de ArcGIS Online o un dataset de Business Analyst instalado localmente.

Distribuir polígono

Resume los atributos de una capa de polígono de entrada basándose en la superposición espacial de una capa de polígono de destino y asigna los atributos resumidos a los polígonos de destino. Los polígonos de destino tienen atributos numéricos sumados que derivan de los polígonos de entrada a los que se superpone cada objetivo.

Formato

Las siguientes herramientas están disponibles en la categoría Formato:

HerramientaDescripción

Convertir campo de tiempo

Transfiere valores de fecha y hora almacenados en un campo a otro campo. La herramienta se puede usar para la conversión entre diferentes tipos de campos (campos de texto, numéricos o de fecha) o para convertir los valores a un formato diferente, como dd/MM/aa HH:mm:ss a aaaa-MM-dd.

Convertir zona de tiempo

Convierte valores de tiempo registrados en un campo de fecha de una zona horaria a otra zona horaria.

Tabla pivote

Crea una tabla a partir de la table de entrada al reducir la redundancia en los registros y al aplanar las relaciones de uno a muchos.

Transponer campos

Permite cambiar los datos almacenados en campos o columnas a filas de una tabla o clase de entidad nueva.

Reclasificar campo

Reclasifica valores de un campo numérico o de texto en clases en función de unos límites definidos manualmente o utilizando un método de reclasificación.

Codificar campo

Convierte valores de categorías (cadena de caracteres, entero o fecha) en varios campos numéricos, cada uno de los cuales representa una categoría. Los campos numéricos codificados se pueden utilizar en la mayoría de flujos de trabajo estadísticos y de ciencia de datos, incluidos los modelos de regresión.

Nota:

La mayoría de las operaciones de geoprocesamiento que modifican los datos de entrada no se pueden deshacer.

Temas relacionados