Transformación de puntuación normal

Disponible con una licencia de Geostatistical Analyst.

Algunos métodos de interpolación y simulación requieren que los datos de entrada se distribuyan normalmente (consulte Examinar la distribución de sus datos para obtener una lista de estos métodos). La transformación de puntuación normal (NST) está diseñada para transformar su dataset de forma que se parezca estrechamente a una distribución normal estándar. Se hace clasificando los valores de su dataset de menor a mayor y haciendo coincidir estas clasificaciones con clasificaciones equivalentes generadas a partir de una distribución normal. Los pasos de la transformación son los siguientes: se ordena y clasifica su dataset, se encuentra una clasificación equivalente de una distribución normal estándar para cada clasificación de su dataset y los valores de distribución normales asociados a esas clasificaciones conforman el dataset transformado. El proceso de clasificación se puede realizar mediante la distribución de frecuencias o la distribución acumulada de los datasets.

A continuación, se muestran ejemplos de histogramas y distribuciones acumuladas antes y después de aplicar una transformación de puntuación normal:

Histogramas antes y después de una transformación de puntuación normal
Histogramas antes y después de una transformación de puntuación normal

Distribuciones acumuladas antes y después de una transformación de puntuación normal
Distribuciones acumuladas antes y después de una transformación de puntuación normal

Métodos de aproximación

En Geostatistical Analyst, existen cuatro métodos de aproximación: directo, lineal, kernels gaussianos y sesgo multiplicativo. El método directo utiliza la distribución acumulada observada, el método lineal ajusta las líneas entre cada paso de la distribución acumulada y el método de kernels gaussianos aproxima la distribución acumulada ajustando una combinación lineal de distribuciones normales acumuladas de componentes. El sesgo multiplicativo se aproxima a la distribución acumulada ajustando una distribución base (T de Student, lognormal, gamma, empírica y empírica logarítmica) que después está sesgada por una combinación lineal ajustada de distribuciones beta (el sesgo se realiza con la transformación integral de probabilidad inversa). Las distribuciones de base lognormal, gamma y empírica logarítmica solo se pueden utilizar para datos positivos, y se garantiza que las predicciones sean positivas. El Criterio de información de Akaike (AIC) se proporciona para evaluar la calidad del modelo ajustado.

Después de realizar predicciones en la escala transformada, el software transforma automáticamente las predicciones de nuevo a la escala original. La elección del método de aproximación depende de las suposiciones que tenga intención de hacer y de la suavidad de la aproximación. El método directo es el menos suavizado y tiene la menor cantidad de suposiciones y el método lineal es intermedio. Los métodos de kernels gaussianos y sesgo multiplicativo tienen transformaciones inversas suaves, pero suponen que la distribución de datos se puede aproximar mediante una combinación finita de distribuciones conocidas.

Temas relacionados