カーネル内挿はローカル 1 次多項式内挿のバリアントであり、リッジ回帰での回帰係数の推定に使用されている方法とほぼ同じ方法を使用して計算不安定性が回避されます。 推定値にわずかな偏りしかなく、不偏推定量より精度が高い場合、その推定量が優先されます。 リッジ回帰については、Hoerl and Kennard (1970) などに詳しい説明があります。
ローカル多項式内挿の推定誤差の推定では、モデルが正確である、つまり空間条件数があらゆる場所において非常に小さいことを前提としています。 この前提が満たされず、推定値と推定標準誤差が不安定なエリアが空間条件数によって示されることがよくあります。 カーネル スムージング モデルでは、推定標準誤差が過度に大きく推定に疑問がある問題は、リッジ パラメーターによって方程式に少量のバイアスを追加することで補正されます。 これにより、空間条件数のマップは不要になります。 したがって、カーネル内挿では出力サーフェス タイプとして推定と推定標準誤差のみが提供されます。 リッジ パラメーターでは推定を安定化するためにバイアスが追加されるため、モデルの安定性を維持しながら、リッジ パラメーターをできるだけ小さい値にする必要があります。 このプロセスについては、『Local Polynomials for Data Detrending and Interpolation in the Presence of Barriers』 (Gribov and Krivoruchko (2010)) に詳しい説明があります。
この 2 つのモデルのもう 1 つの違いとして、カーネル内挿モデルではポイント間の最短距離が使用され、指定された不透過 (絶対) バリアのそれぞれの側でポイントが直線によって接続されます。
カーネル内挿では、放射対称性カーネルである指数カーネル、ガウス カーネル、4 次カーネル、Epanechnikov カーネル、5 次多項式カーネル、定数カーネルが使用されます。 カーネルのバンド幅は観測値を中心とした長方形によって決まります。
Epanechnikov カーネルでは、通常は 1 次多項式を使用した場合に良好な結果が得られます。 ただし、データによっては、交差検証診断と検証診断で別のカーネルを使用することを示唆されることがあります (Fan and Gijbels (1996))。
バリアを使用したカーネル内挿で絶対バリアを指定した場合の推定 (左側) と絶対バリアを指定していない場合の推定 (右側) を以下に示します。 左側の図ではバリアでコンターが急激に変化し、右側の図ではコンターがバリアを超えて滑らかに流れているのがわかります。
水文分野と気象分野ではポイント間の最短距離に基づいたモデルが推奨されます。
カーネル関数
カーネル関数: 以下のすべての式で、r はポイント s を中心とした半径、h はバンド幅です。
- 指数:
- ガウス:
- 4 次:
- Epanechnikov:
- 5 次多項式:
- 定数:
ここで、I(expression) は、expression が真の場合には値 1 をとり expression が偽の場合には値 0 をとる指標関数です。
バンド幅パラメーターは、定数カーネル関数を除くすべてのカーネル関数に適用されます。 指数カーネル関数、ガウス カーネル関数、定数カーネル関数は、カーネルの範囲を制限するため、スムージング検索近傍もサポートしています。
参考文献
Fan, J. and Gijbels, I. (1996). Local Polynomial Modelling and Its Applications, Chapman & Hall. London.
Hoerl, A.E. and Kennard, R.W. (1970), Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67.
Yan, Xin. (2009) Linear regression analysis : theory and computing. Published by World Scientific Publishing Co. Pte. Ltd. 5 Toh Tuck Link, Singapore 596224.