ローカル多項式内挿の仕組み

Geostatistical Analyst のライセンスで利用可能。

グローバル多項式内挿では 1 つの多項式がサーフェス全体に適合されるのに対し、ローカル多項式内挿では複数の多項式が、指定された重なり合う近傍内でそれぞれ適合されます。 検索近傍は、サイズと形状、近傍ポイント数、セクターの構成を使用して定義できます。 あるいは、[探索的トレンド サーフェス解析] パラメーターを使用して、[バンド幅][空間条件数] (有効な場合)、[検索近傍] の値を同時に変化させることができます。

グローバル 1 次多項式は 1 つの平面をデータに適合させるのに対し、グローバル 2 次多項式は 1 回曲げたサーフェスを適合させるため、サーフェスが谷を表すことができます。グローバル 3 次多項式では 2 回曲げることができ、以降も同様になります。 ただし、傾斜地と平坦地が混在する変化に富んだ地形の場合、グローバル多項式 1 つだけでは十分に適合しません。 その場合、以下の図に示すように、複数の多項式平面によってサーフェスをさらに正確に表すことができます。

ローカル多項式内挿
ローカル多項式内挿の図

これに対し、ローカル多項式内挿では、定義された近傍内のポイントのみを使用して指定された次数 (0 次、1 次、2 次、3 次など) の多項式が適合されます。 近傍同士が重なり合い、各推定に使用される値は、近傍の中心にある適合された多項式の値となります。

以下の図では、サンプル標高データの断面が示されています (横断面)。 1 つ目の図では、3 つの近傍ポイント (赤色のポイント) を使用して 1 次多項式と線 (赤色の線) を適合させ、青色のポイントが示す位置での未知値を推定しています。 2 つ目の図では、別の 1 次多項式によって 2 つ目の位置 (黄色のポイント) について推定しています。 この位置は 1 つ目の位置と非常に近く、どちらの推定でも同じ測定ポイントが使用されますが、加重が少し異なるため、多項式適合 (青色の線) は若干異なります。

1 次多項式
1 次多項式

この処理を繰り返し、推定位置を中心にしてローカル多項式を適合させることで、値が推定されます。 以下の 2 つの図では、さらに 2 つの任意のポイントについて推定して最終サーフェスを作成しています。 オレンジ色のポイントは緑色の測定済みサンプル ポイントを使用して適合された多項式 (緑色の線) から推定され、茶色のポイントは薄紫色の多項式から予想されています。

ローカル多項式
ローカル多項式

以下の 2 つの図では、さらに 2 つの多項式を適合することで (黄色の線と灰色の線) さらに 2 つの位置 (青緑色のポイントと緑色のポイント) について推定しています。

ローカル多項式
ローカル多項式

各位置についてこの処理が繰り返されます。 サンプル ポイントについて、以下に示すようなサーフェスが作成されました (紫色のサーフェス ライン)。

ローカル多項式

確度の尺度

ローカル多項式内挿では、ArcGIS Geostatistical Analyst のその他の決定論的内挿法にはない、次に示す 2 つの確度の尺度が提供されます。

  • 推定標準誤差は、各位置について推定された値の不確実性を示します。
  • 空間条件数は、各位置についての推定式の解の安定性の尺度です。 条件数が大きい場合、行列係数のわずかな変化によって解ベクトル (回帰係数) が大きく変化します。 空間条件数サーフェスは数値モデルの安定性のばらつきを示し、推定標準誤差サーフェスはそのモデルが正確であることを前提として作成されるため、推定の不確実性に関する追加の情報を提供します。

ローカル多項式内挿法は、データが次のような特性を持つ場合に最も確度が高くなります。

  • サンプルがグリッド上で取得された (つまり、サンプルが等間隔である)。
  • 検索近傍内のデータ値が正規分布している。

実際には、このような特性を持つデータセットはほとんどありません。 そのような場合、推定値も影響を受けますが、推定標準誤差ほどではありません。 特定のエリアにおける結果が信頼できるかどうかを容易に判断できるように、LPI では空間条件数サーフェスが提供されます。 以下の表に、おおよその目安となる値を示します。これらの臨界値は条件数サーフェスでは黄色で表示されます。

多項式次数空間条件数の臨界閾値

1

10

2

100

3

1000

3 より大きい

ほとんどの状況では推奨されません

空間条件数の臨界閾値を下回る値は、その位置における解が信頼できることを示しています。 臨界値に近いか等しい値はその位置における解の信頼性に疑問があることを示し (入念な調査が必要)、臨界閾値を上回る値は解が信頼できないことを示しています。

空間条件数は、推定値が推定 1 次方程式の係数のわずかな変化によってどの程度の影響を受けるかを評価することによって生成されます。 小さい空間条件数は解が安定していることを示すのに対し、大きな空間条件数は解が不安定であることを示します。 入力データ (値、位置、空間的配置など) のわずかな変動によって推定値に大きな変動が生じることになるため、対象地域における解の不安定さは懸念材料となります。 つまり、入力データの不確実性 (属性の測定値に誤差があったり、測定座標が不正確であるなど)、とりわけデータの外れ値は、推定値に非常に大きな影響を与える場合があります。 さらに、検索近傍が変化することで、推定に使用されるデータ ポイントの数 (およびスムージング検索近傍の場合は加重) が変わり、その位置の空間条件数に影響が生じることがあります。

空間条件数サーフェスは 1 次、2 次、および 3 次多項式で作成されます。 推定標準誤差は LPI モデルが正確である (つまり、ローカル加重最小二乗回帰が適切なアルゴリズムであり、空間条件数の値が上の表に示す空間条件数の閾値より小さい) ことを前提として推定されます。

LPI ダイアログ ボックスで [空間条件数の閾値を使用] を True に設定することによって、条件数の値が大きいエリアを推定マップと推定標準誤差マップから除外することができます。 条件数は、入力ポイントの実際の値ではなく、その位置だけに依存します。 つまり、LPI への入力として同じデータセット内のオゾンの数値と標高値のどちらを使用しても、条件数サーフェスは変わりません。

理論的観点からは、規則的に分布したデータの場合、0 次多項式、1 次多項式、2 次多項式にはそれぞれ、定数カーネル、Epanechnikov カーネル、4 次カーネルが最適となります。 不規則に分布したデータの場合、検証診断、交差検証診断、および空間条件数の値に基づいて最適なカーネルを選択する必要があります。

バリアを使用したカーネル内挿は LPI のバリアントの 1 つです。 これらの結果における局所的不安定性は、リッジ回帰と同様の手法によって補正されます。 トレードオフとして推定値に若干の偏りが生じますが、実用的には、推定値に基づいた意思決定に影響が生じるほど大きなものではありません。

サーフェスの穴

[空間条件数の閾値を使用] パラメーターがオンになっている場合、出力サーフェスに "穴" が現れる可能性があります。 この穴は、空間条件数の閾値を超えているか検索近傍が小さすぎるエリアです。 検索近傍パラメーターと空間条件数の閾値を調整することでこれらの穴を埋めることができますが、これらの穴は推定値の計算が不安定である場所に作成されたことに注意する必要があります。

ローカル多項式内挿を使用する状況

グローバル多項式内挿はスムージング サーフェスを作成し、データセット内の長距離トレンドを把握するのに役立ちますが、 地球科学の分野では、対象の変数に長距離トレンドだけでなく短距離変動が存在することがよくあります。 データセットが短距離変動を示している場合、ローカル多項式内挿法マップによって短距離変動を捕捉することができます。

ローカル多項式内挿は近傍距離の影響を受けやすいため、検索近傍が小さいと、推定サーフェス内に空のエリアが生じることがあります。 このため、出力レイヤーを生成する前にサーフェスをプレビューすることができます。

関連トピック