Fonctionnement de l’outil Interpolation par noyaux avec interruptions

L’interpolation par noyaux est une variante d’une interpolation polynomiale locale de premier ordre, dans laquelle l’instabilité des calculs est empêchée avec une méthode similaire à celle utilisée dans la régression de régularisation pour estimer les coefficients de régression. Lorsque l’estimation n’est que légèrement biaisée et qu’elle est beaucoup plus précise qu’un estimateur non biaisé, elle peut être privilégiée. Vous pouvez consulter Hoerl and Kennard (1970), par exemple, pour en savoir plus sur la régression de régularisation.

L’erreur de prévision de l’interpolation polynomiale locale est estimée en supposant que le modèle est correct, c’est-à-dire que l’indice de conditionnement spatial est très petit partout. Il arrive souvent que cette hypothèse ne soit pas respectée et l’indice de conditionnement spatial met en évidence les zones où les prévisions et les erreurs standard de prévision sont instables. Dans le modèle de lissage des noyaux, le problème avec les erreurs standard de prévision trop importantes et les prévisions contestables est corrigé par le paramètre de régularisation en introduisant un très léger biais dans les équations. Cela rend superflu la carte de l’indice de conditionnement spatial. Par conséquent, l’interpolation par noyaux n’offre que le type de surface en sortie Prévision et Erreur standard de prévision. Dans la mesure où le paramètre de régularisation introduit un biais pour stabiliser les prévisions, il doit préserver la stabilité du modèle tout en étant le plus petit possible. Pour en savoir plus sur ce processus, consultez « Local Polynomials for Data Detrending and Interpolation in the Presence of Barriers », Gribov and Krivoruchko (2010).

Une autre différence entre les deux modèles est que le modèle Interpolation par noyaux utilise la distance la plus courte entre les points afin que les points qui se trouvent sur les côtés de l’interruption non transparente spécifiée (absolue) soient connectés par une série de lignes droites.

L’interpolation par noyaux utilise les noyaux symétriques radialement suivants : Exponentiel, Gaussien, Quartique, Epanechnikov, Polynôme de cinquième ordre et Constant. La bande passante du noyau est déterminée par un rectangle autour des observations.

Le noyau Epanechnikov produit généralement de meilleurs résultats que lorsque les polynômes de premier ordre sont utilisés. Cependant, selon les données, les diagnostics de validation croisée et de validation peuvent suggérer un autre noyau, Fan and Gijbels (1996).

Les prévisions de l’outil Interpolation par noyaux avec interruptions, avec des interruptions absolues (à gauche) et sans (à droite), sont comparées ci-dessous. Notez comme les isolignes changent brutalement au niveau des interruptions dans le graphique de gauche, mais comme elles dépassent de manière fluide les interruptions dans le graphique de droite.

Prévisions de l’outil Interpolation par noyaux avec des interruptions absolues
Prévisions de l’outil Interpolation par noyaux avec des interruptions absolues.
Prévisions de l’outil Interpolation par noyaux sans des interruptions absolues
Prévisions de l’outil Interpolation par noyaux sans des interruptions absolues.

Les modèles basés sur la distance la plus courte entre les points peut être préférable dans des applications hydrologiques et météorologiques.

Fonctions de noyaux

Fonctions de noyaux : pour toutes les formules ci-dessous, r est un rayon centré au point s et h est la bande passante.

  • Exponentiel :

    Fonction de noyau Exponentiel

  • Gaussien :

    Fonction de noyau Gaussien

  • Quartique :

    Fonction de noyau Quartique

  • Epanechnikov :

    Fonction de noyau Epanechnikov

  • Polynôme de cinquième ordre

    Fonction de noyau Polynôme de cinquième ordre

  • Constant :

    Fonction de noyau Constant

    I(expression) est une fonction d’indicatrices qui prend la valeur 1 si expression a la valeur True (Vrai) et la valeur 0 si expression a la valeur False (Faux).

Le paramètre de bande passante s’applique à toutes les fonctions de noyau à l’exception de Constant. Les fonctions de noyau Exponentiel, Gaussien et Constant prennent également en charge un voisinage de recherche lisse en vue de limiter la portée du noyau.

Références et lectures complémentaires

Fan, J. and Gijbels, I. (1996). Local Polynomial Modelling and Its Applications, Chapman & Hall. London.

Hoerl, A.E. and Kennard, R.W. (1970), Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67.

Yan, Xin. (2009) Linear regression analysis : theory and computing. Publié par World Scientific Publishing Co. Pte. Ltd. 5 Toh Tuck Link, Singapore 596224.

Rubriques connexes