含障碍的核插值法的工作原理

核插值是一阶局部多项式插值的一种变体,其中使用类似于岭回归中用于估计回归系数的方法来防止计算中的不稳定性。 当估值仅存在较小偏差并且比无偏差估值器精确得多时,它可能是首选估值器。 有关岭回归的详细信息,请参阅 Hoerl 和 Kennard (1970) 的著作。

局部多项式插值预测误差的估计基于以下假设:模型本身正确,即空间条件数在所有位置均极小。 此假设常常不成立,而空间条件数能够揭示预测结果及预测标准误差不稳定的区域。 在核平滑模型中,通过在方程中引入少量偏差,使用岭参数来解决预测标准误差过大以及预测结果不可靠的问题。 由此无需使用空间条件数地图。 因此,核插值仅为输出表面类型提供预测和预测标准误差。 由于岭参数将引入偏差以稳定预测,因此岭参数应尽可能小,同时仍保持模型稳定性。 有关此过程的详细信息,请参阅:Local Polynomials for Data Detrending and Interpolation in the Presence of Barriers, Gribov and Krivoruchko (2010)。

两种模型之间的另一区别在于:核插值模型将使用点之间的最短距离,因此会通过一系列直线来连接指定非透明(绝对)障碍两侧的点。

核插值采用以下径向对称核:指数核、高斯核、四次核、Epanechnikov 核、5 阶多项式核和常数核。 核的带宽由观测点周围的矩形决定。

当使用一阶多项式时,Epanechnikov 核通常会产生更好的结果。 但是,根据数据,交叉验证和验证诊断可能会建议使用另一种核:Fan and Gijbels (1996)。

以下比较了具有绝对障碍(第一幅图)以及不具有障碍(第二幅图)的含障碍核插值预测。 请注意,在第一幅图中,等值线在障碍物呈现突变,而在第二幅图中,等值线平滑跨越障碍物。

具有绝对障碍的核插值预测
无绝对障碍的核插值预测

在水文和气象应用领域中,基于点间最短距离的模型可能更具优势。

核函数

在以下所有公式的核函数中,r 是以点 s 为中心的半径,h 为带宽。

  • 指数:

    指数核函数

  • 高斯:

    高斯核函数

  • 四次式:

    四次核函数

  • Epanechnikov:

    Epanechnikov 核函数

  • PolynomialOrder5:

    PolynomialOrder5 核函数

  • 常量:

    常数核函数

    其中 I(表达式)是一个指示函数,如果表达式为 true,则其值为 1,如果表达式为 false,则其值为 0。

带宽参数适用于除了常数核函数之外的所有核函数。 指数核函数、高斯核函数和常数核函数也支持平滑搜索邻域以限制核的范围。

参考材料和更多阅读材料

Fan, J. and Gijbels, I. (1996). Local Polynomial Modelling and Its Applications, Chapman & Hall. London.

Hoerl, A.E. and Kennard, R.W. (1970), Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67.

Yan, Xin. (2009) Linear regression analysis : theory and computing. Published by World Scientific Publishing Co. Pte. Ltd. 5 Toh Tuck Link, Singapore 596224.

相关主题