Fonctionnement de l’interpolation polynomiale locale

Disponible avec une licence Geostatistical Analyst.

Tandis que l’interpolation polynomiale globale ajuste un polynôme à la surface entière, l’interpolation polynomiale locale ajuste plusieurs polynômes, chacun dans des voisinages superposés spécifiés. Le voisinage de recherche peut se définir à l’aide de la taille et de la forme, du nombre de voisins et de la configuration de secteur. Vous pouvez également utiliser le paramètre Exploratory Trend Surface Analysis (Analyse exploratoire de surface de tendance) pour modifier simultanément les valeurs Bandwidth (Bande passante), Spatial Condition Number (Indice de conditionnement spatial) (si elle est activée) et Searching Neighborhood (Voisinage de recherche).

Un polynôme global de premier ordre ajuste un plan unique à travers les données. Un polynôme global de deuxième ordre ajuste une surface avec une courbe, ce qui permet aux surfaces de représenter des vallées. Un polynôme global de troisième ordre peut accueillir deux courbes, et ainsi de suite. Toutefois, lorsqu’une surface présente une forme variable (un paysage qui descend en pente, se stabilise en plateau et décrit une autre pente), un seul polynôme global ne s’ajustera pas correctement. Plusieurs plans polynomiaux pourront représenter la surface plus précisément, comme indiqué dans l’illustration suivante :

Interpolation polynomiale locale
Illustration de l’interpolation polynomiale locale

L’interpolation polynomiale globale, d’un autre côté, ajuste le polynôme d’ordre spécifié (zéro, premier, deuxième, troisième, etc.) en utilisant des points présents uniquement dans le voisinage défini. Les voisinages se superposent et la valeur utilisée pour chaque prévision est celle du polynôme ajusté au centre du voisinage.

L’image suivante illustre une coupe transversale de données d’élévation d’échantillon (un transect). Dans la première image, trois voisins (les points rouges) sont utilisés pour ajuster un polynôme de premier ordre et une ligne (la ligne rouge) afin de prévoir la valeur inconnue de la localisation identifiée par le point bleu. Dans la deuxième image, une deuxième localisation (le point jaune) est prévue par un autre polynôme de premier ordre. Elle est très proche de la première localisation et les mêmes points mesurés sont utilisés dans les prévisions, mais les pondérations seront un peu différentes. Par conséquent, l’ajustement polynomial (la ligne bleue) est légèrement différent.

Polynôme de premier ordre
Polynôme de premier ordre

Ce processus se poursuit, centrant sur les localisations de prévision suivantes et ajustant les polynômes locaux pour prévoir les valeurs. Les deux images ci-dessous montrent deux points arbitraires supplémentaires prévus pour créer la surface finale. Le point orange est prévu à partir du polynôme ajusté (la ligne verte) à l’aide des points d’échantillonnage mesurés verts et le point marron est prévu à partir du polynôme violet clair.

Polynôme local
Polynôme local

Dans les deux images ci-dessous, deux autres polynômes sont ajustés (les lignes jaune et grise) pour prévoir deux autres localisations (les points bleu-vert et verts).

Polynôme local
Polynôme local

Ce processus se poursuit pour chaque localisation. Vous pouvez voir comment la surface est créée (la ligne de surface violette) pour les points d’échantillonnage ci-dessous.

Polynôme local

Mesures de précision

L’interpolation polynomiale locale fournit les deux mesures de précision suivantes, qui ne sont pas disponibles pour les autres méthodes d’interpolation déterministes proposées dans ArcGIS Geostatistical Analyst :

  • Les erreurs standard de prévision indiquent l’incertitude associée à la valeur prévue pour chaque localisation.
  • L’indice de conditionnement spatial mesure le degré de stabilité ou d’instabilité de la solution des équations de prévision pour une localisation spécifique. Si l’indice de conditionnement est élevé, une faible variation des coefficients de matrice entraîne une modification importante du vecteur de solution (coefficients de régression). La surface de l’indice de conditionnement spatial montre la variation de la stabilité du modèle numérique et fournit des informations complémentaires sur l’incertitude de prévision, car la surface d’erreur standard de prévision est créée en supposant que le modèle est correct.

L’interpolation polynomiale locale est plus précise lorsque les données présentent les propriétés suivantes :

  • Les échantillons ont été collectés sur une grille (c’est-à-dire qu’ils sont équitablement espacés).
  • Les valeurs de données, à l’intérieur du voisinage de recherche, sont distribuées normalement.

En pratique, la plupart des jeux de données n’auront pas ces propriétés. Dans ce cas, les valeurs prévues seront affectées, mais pas autant que les erreurs standard de prévision. Pour vous aider à savoir si les résultats dans certaines zones sont fiables ou non, l’interpolation polynomiale locale (LPI) fournit une surface de l’indice de conditionnement spatial. Les valeurs générales sont indiquées dans la table suivante. Ces valeurs critiques sont rendues en jaune dans la surface de l’indice de conditionnement :

Ordre du polynômeValeur de seuil de l’indice de conditionnement spatial critique

1

10

2

100

3

1000

Supérieur à 3

Non recommandé dans la plupart des cas

Les valeurs inférieures aux seuils de l’indice de conditionnement spatial critique indiquent à quelles localisations les solutions sont fiables. Les valeurs proches ou égales aux valeurs critiques doivent faire l’objet d’un examen approfondi et les valeurs supérieures aux limites critiques ne sont pas fiables.

Les indices de conditionnement spatiaux sont générés en évaluant la sensibilité de la valeur prévue aux petites variations dans les coefficients des équations de prévision linéaires. Un petit indice de conditionnement spatial indique que la solution est stable, tandis qu’une valeur importante indique que la solution est instable. L’instabilité de la solution doit être une préoccupation si elle se produit dans des zones d’intérêt particulier, car de petites variations dans les données en entrée (notamment leurs valeurs, localisations et disposition spatiale) peuvent entraîner des variations plus importantes dans la valeur prévue. Cela signifie qu’une incertitude associée aux données en entrée (par exemple, des erreurs dans les mesures attributaires ou des imprécisions dans les coordonnées où la mesure a été réalisée) et particulièrement aux points aberrants de données, peuvent avoir un impact considérable sur les valeurs prévues. En outre, des variations dans le voisinage de recherche modifient le nombre de points de données (et les pondérations dans le cas d’un voisinage de recherche lisse) qui sont utilisés pour réaliser une prévision et peuvent affecter l’indice de conditionnement spatial pour cette localisation.

La surface de l’indice de conditionnement spatial est créée pour les polynômes de 1er, 2e et 3e ordre. L’erreur standard de prévision est estimée en supposant que le modèle LPI est correct (c’est-à-dire que la régression des moindres carrés pondérés locaux est un algorithme approprié et que les valeurs de l’indice de conditionnement spatial sont inférieures aux valeurs de seuil de l’indice de conditionnement spatial dans la table ci-dessus).

Vous pouvez exclure les zones où des indices de conditionnement élevés ont lieu dans les cartes d’erreur standard de prévision et de prévision en définissant Use Spatial Condition Number Threshold (Utiliser le seuil de l’indice de conditionnement spatial) sur True (Vrai) dans la boîte de dialogue LPI (Interpolation polynomiale locale). L’indice de conditionnement dépend uniquement des localisations des points en entrée, et non de leurs valeurs réelles. En d’autres termes, que les valeurs d’ozone ou d’élévation provenant du même jeu de données soient utilisées en entrée dans l’interpolation polynomiale locale, la surface de l’indice de conditionnement reste la même.

Dans le cas de données réparties régulièrement, les noyaux Constant, Epanechnikov et Quartique sont les plus adaptés d’un point de vue théorique pour les polynômes de 0, 1er et 2e ordre, respectivement. Dans le cas de données réparties irrégulièrement, la sélection du meilleur noyau doit reposer sur les diagnostics de validation et de validation croisée et les valeurs d’indice de conditionnement spatial.

L’interpolation par noyau avec interruptions est une variante de l’interpolation polynomiale locale (LPI). Les instabilités locales dans ces résultats sont corrigées à l’aide d’une technique proche de la régression de régularisation. Le compromis est que les valeurs prévues sont légèrement déformées et qu’en pratique dans la plupart des cas, la déformation n’est pas assez importante pour affecter les décisions que vous prenez en fonction des valeurs prévues.

Trous dans la surface

Si le paramètre Use Spatial Condition Number Threshold (Utiliser le seuil de l’indice de conditionnement spatial) est sélectionné, des « trous » peuvent apparaître dans la surface en sortie. Il s’agit de zones où le seuil de l’indice de conditionnement spatial est dépassé ou le voisinage de recherche est trop petit. Les paramètres de voisinage de recherche et le seuil de l’indice de conditionnement spatial peuvent être ajustés de façon à remplir ces zones. Toutefois, il est à noter que ces trous ont été créés là où une instabilité risque de figurer dans le calcul des valeurs de prévision.

Quand utiliser l’interpolation polynomiale locale

L’interpolation polynomiale globale est utile pour créer des surfaces lisses et identifier des tendances à long terme dans le jeu de données. Dans les sciences de la Terre toutefois, la variable d’intérêt présente généralement une variation à court terme en plus d’une tendance à long terme. Lorsque le jeu de données présente une variation à court terme, les cartes d’interpolation polynomiale locale peuvent capturer la variation à court terme.

L’interpolation polynomiale locale est sensible à la distance de voisinage et un voisinage de recherche restreint peut générer des zones vides dans la surface de prévision. C’est pour cela que vous pouvez prévisualiser la surface avant de produire la couche en sortie.

Rubriques connexes