Puede utilizar herramientas de ingeniería de datos para limpiar y preparar sus datos. La vista de Ingeniería de datos incluye un subconjunto de herramientas de geoprocesamiento que le ayudarán a preparar los datos para utilizarlos en un mapa o un análisis. Estas herramientas se agrupan en las siguientes categorías:
- Limpiar: limpiar los datos. Por ejemplo, puede eliminar filas o campos innecesarios. También puede modificar los campos o rellenar los valores que falten.
- Construir: crear campos derivados de campos o propiedades existentes en la capa. Por ejemplo, puede agregar y calcular un nuevo campo; estandarizar, transformar o reclasificar un campo existente; y agregar un campo basado en la geometría de la capa de entrada.
- Integrar: integrar o agregar datos de otra fuente de datos a la tabla de entrada o clase de entidad. Por ejemplo, puede unir campos o agregar campos enriqueciendo los datos.
- Formato: cambiar el formato de los campos o reorganizar los campos en la tabla o clase de entidad. Por ejemplo, puede convertir campos de tiempo, codificar campos de categorías o reducir las dimensiones de los campos existentes.
Nota:
Algunas herramientas de geoprocesamiento de la vista de Ingeniería de datos no están disponibles para una capa no editable. En este caso, haga una copia editable de la capa y abra una nueva vista de Ingeniería de datos.
Puede acceder a estos grupos y herramientas en la vista de Ingeniería de datos mediante una de las siguientes acciones:
- Haga clic con el botón derecho del ratón en el menú contextual de un campo en el panel de campos.
- Haga clic con el botón derecho del ratón en el menú contextual de un campo en el panel de estadísticas.
- Haga clic en la herramienta en la cinta de Ingeniería de datos.
Cinta de Ingeniería de datos
Cuando la vista de Ingeniería de datos está activa, aparece una cinta contextual en la parte superior de la aplicación. La cinta proporciona acceso a comandos y herramientas para explorar y preparar los datos.
El grupo Datos de la cinta proporciona acceso a la vista de campos y a la tabla de atributos de la capa asociada a la vista de Ingeniería de datos activa. El grupo Herramientas ofrece cuatro galerías de herramientas: Limpiar, Construir, Integrar y Formato. Cada galería de herramientas contiene un subconjunto de herramientas de geoprocesamiento para la tarea de ingeniería de datos correspondiente. De forma predeterminada, la capa asociada a la vista de Ingeniería de datos activa se utiliza para rellenar automáticamente el parámetro de entidades de entrada de estas herramientas.
Herramientas de Ingeniería de datos
Las siguientes tablas describen todas las herramientas de la cinta de Ingeniería de datos.
Nota:
Algunas de las herramientas de geoprocesamiento no están disponibles para los datos no espaciales, como las tablas independientes.
Limpiar
Las siguientes herramientas están disponibles en la categoría Limpiar:
Herramienta | Descripción |
---|---|
Reemplaza valores que faltan (nulos) por valores estimados según los vecinos espaciales, los vecinos del espacio-tiempo o valores de serie temporal. | |
Elimina uno o varios campos de una tabla, una clase de entidad, una capa de entidad o un dataset ráster. |
|
Identifica valores atípicos espaciales en entidades de punto calculando el factor de valor atípico local (LOF) de cada entidad. Los valores atípicos espaciales son entidades en ubicaciones anormalmente aisladas, y el LOF es una medición que describe cómo de aislada está una ubicación de sus vecinos locales. | |
Proyecta datos espaciales de un sistema de coordenadas a otro. |
Construir
Las siguientes herramientas están disponibles en la categoría Construir:
Herramienta | Descripción |
---|---|
Agrega información a campos de atributos de una entidad que representan las características espaciales o geométricas y la ubicación de cada entidad, como la longitud o el área y las coordenadas x, y, z y m. | |
Calcula los valores de un campo para una clase de entidad, una capa de entidades o un ráster. |
|
Transforma valores continuos en uno o varios campos aplicando funciones matemáticas a cada valor y cambiando la forma de la distribución. Entre los métodos de transformación de la herramienta se encuentran logarítmica, raíz cuadrada, Box-Cox, inverso multiplicativo, cuadrado, exponencial y Box-Cox inversa. | |
Estandariza los valores de los campos al convertirlos en valores que siguen una escala especificada. Entre los métodos de estandarización se encuentran puntuación z, mínimo-máximo, máximo absoluto y estandarización sólida. | |
Agrega un nuevo campo a una tabla o a la tabla de una clase de entidad o capa de entidades, así como a rásteres con tablas de atributos. | |
Reduce el número de dimensiones de un conjunto de variables continuas agregando la mayor cantidad posible de varianza en menos componentes utilizando un Análisis de componentes principales (PCA) o un Análisis discriminante lineal (LDA) de rango reducido. | |
Suaviza los datos de la serie temporal, lo que ayuda a tener en cuenta las fluctuaciones a corto plazo para exponer las tendencias y los ciclos a largo plazo. La herramienta puede utilizar la variable numérica de una o varias series temporales mediante medias móviles centradas, hacia delante y hacia atrás, así como un método adaptativo basado en la regresión lineal local. |
Integrar
Las siguientes herramientas están disponibles en la categoría Integrar:
Herramienta | Descripción |
---|---|
Une permanentemente el contenido de una tabla a otra tabla basándose en un campo de atributos común. La tabla de entrada se actualiza para contener los campos de la tabla a unir. Puede seleccionar qué campos de la tabla a unir se agregarán a la tabla de entrada. | |
Enriquece datos al agregar datos demográficos y del paisaje sobre las personas y los lugares que rodean o se encuentran dentro de ubicaciones de datos. La salida es un duplicado de la entrada con campos de atributos adicionales. Esta herramienta requiere una cuenta de organización de ArcGIS Online o un dataset de Business Analyst instalado localmente. |
|
Calcula la distancia y la información de proximidad adicional entre entidades de entrada y la entidad más cercana en otras clases de entidad o capa. | |
Une los atributos de una entidad con otra basada en la relación espacial. Las entidades de destino y los atributos unidos de las entidades de unión se escriben en la clase de entidad de salida. | |
Superpone una capa de polígono con otra capa para resumir el número de puntos, la longitud de las líneas o el área de los polígonos dentro de cada polígono, así como para calcular estadísticas de campos de atributos sobre dichas entidades dentro de los polígonos. | |
Crea una tabla o una clase de entidad de punto que muestrea los valores de las celdas de un ráster, o conjunto de rásteres, para detectar ubicaciones definidas. Las ubicaciones se definen por celdas ráster, puntos, polilíneas o polígonos. | |
Permite buscar entidades que se encuentran a una determinada distancia de las entidades de la capa de entrada y calcular estadísticas para las entidades próximas. | |
Resume los atributos de una capa de polígono de entrada basándose en la superposición espacial de una capa de polígono de destino y asigna los atributos resumidos a los polígonos de destino. Los polígonos de destino tienen atributos numéricos sumados que derivan de los polígonos de entrada a los que se superpone cada objetivo. |
Formato
Las siguientes herramientas están disponibles en la categoría Formato:
Herramienta | Descripción |
---|---|
Convierte valores de categorías (cadena de caracteres, entero o fecha) en varios campos numéricos, cada uno de los cuales representa una categoría. Los campos numéricos codificados se pueden utilizar en la mayoría de flujos de trabajo estadísticos y de ciencia de datos, incluidos los modelos de regresión. | |
Convierte valores de tiempo almacenados en un campo numérico o de cadena a un campo de fecha. La herramienta también se puede utilizar para convertir valores de tiempo almacenados en campos de cadena de caracteres, numéricos o de fecha en formatos personalizados como, por ejemplo, el día de la semana y el mes del año. |
|
Permite cambiar los datos almacenados en campos o columnas a filas de una tabla o clase de entidad nueva. | |
Convierte valores de tiempo registrados en un campo de fecha de una zona horaria a otra zona horaria. | |
Reclasifica valores de un campo numérico o de texto en clases en función de unos límites definidos manualmente o utilizando un método de reclasificación. | |
Crea una tabla a partir de la table de entrada al reducir la redundancia en los registros y al aplanar las relaciones de uno a muchos. |
Nota:
La mayoría de las operaciones de geoprocesamiento que modifican los datos de entrada no se pueden deshacer.