エリア内挿を使用したポリゴン間推定の実行—ArcGIS Pro

Geostatistical Analyst のライセンスで利用可能。

複雑度: 初級データ要件: 独自データの使用目的: この練習は、エリア内挿を使用してポリゴン間推定を実行する方法について学ぶことを目的としています。この練習では、データが欠損しているポリゴンの値を推定する方法についても学びます。

はじめに

この練習では、エリア内挿を使用して、あるポリゴンセット (ソースポリゴン) で収集されたデータから新しいポリゴンセット (ターゲットポリゴン) のデータ値を推定する方法について学びます。この練習では、ロサンゼルス地区の 5 年生児童の肥満率をデータとして使用します (プライバシーの観点から、元データに変更が加えられています)。各学区のすべての 5 年生児童がサンプル抽出され、肥満の児童と肥満でない児童の数が記録されました (14 の学区についてはこのデータが提供されていません)。この練習の目的は、学区単位で収集された肥満率から学区内の各国勢調査細分区グループの肥満率を推定することです。さらに、データが欠損している 14 の学区の肥満率を推定します。

以下の図では、ロサンゼルスの学区が 5 年生の肥満率によって色分けされています。肥満率が低い学区は青色 (22.5% 以下)、肥満率が高い学区は赤色 (44.7% 以上)、中間は緑色、黄色、オレンジ色で表示されています。黒色のポリゴンはデータが欠損している学区です。右側の図に示すロサンゼルス地区の各国勢調査細分区グループでの 5 年生の肥満率を推定します。

エリア内挿は 2 つのステップから成るプロセスです。最初に、ソースポリゴンから推定サーフェスを作成してから、その推定サーフェスをターゲットポリゴン内で平均します。

肥満率の推定サーフェスの作成

エリア内挿ワークフローの 1 つ目のステップとして、学区ごとに収集された肥満率から推定サーフェスを作成します。エリア内挿ではモデルを対話的に適合させる必要があるため、[地球統計ウィザード] で推定サーフェスを作成する必要があります。

地球統計ウィザードを開く

ArcGIS Pro を起動し、ArcGIS Geostatistical Analyst エクステンションの有効なライセンスを持っていることを確認します。
リボンの [解析] タブをクリックし、[地球統計ウィザード] アイコンをクリックします。

方法の選択と入力データの特定

[地球統計学的方法] で、[エリア内挿] をクリックします。
(たとえば人口ではなく) 肥満率を推定することが目的なので、[タイプ] で [レート] を選択します。
[ソースデータセット] で、学区の肥満率が含まれているポリゴンフィーチャクラスである [child_obesity] を選択します。
[カウントフィールド] で、[5th_obese] を選択します。
このフィールドには、肥満である 5 年生の児童の数が含まれています。
[母集団フィールド] で、[5th_total] を選択します。
このフィールドには、5 年生児童の総数が含まれています。
この練習ではセカンダリ変数は使用しないので、2 つ目のデータセットはデフォルトのままにします。
エリア内挿の地球統計ウィザードのウィンドウ 1
[次へ] をクリックしてエリア内挿モデルの作成を開始します。

バリオグラフィの調整

バリオグラフィページを表示しています。これはエリア内挿のワークフロー全体の中でも最も時間がかかり、正確な推定を得るために最も重要なステップです。右側のパラメーターの値を変えて、大部分の経験的共分散 (青色の十字) が信頼区間 (赤色の縦線) に収まるようにすることが目的です。モデルが正しく指定されている場合、約 90% の経験的共分散が信頼区間に収まることが予想されます。

以下の図では、デフォルトのモデルでは十分ではなく、大部分の経験的共分散が信頼区間に収まっていません。モデルを適合させるために調整を行う必要があります。

約 12,000 メートルの距離で経験的共分散が負になっています。これは、最初に [ラグサイズ] を 1000 に変更し、[ラグ数] は 12 のままにする必要があることを示しています (この 2 つのパラメーターの積が、経験的共分散が最初に負になる距離とほぼ等しくなるようにします)。
以下の図では共分散曲線が良くなったように見えますが、さらにこのモデルを改良することができます。 y 軸上の大きな経験的共分散値が問題です。
地球統計ウィザードのウィンドウ 2
この結果を改善するため、[モデル] でモデルタイプを [K-ベッセル] に変更します。
このモデルはデータに非常に良好に適合しているように見えます。経験的共分散の大部分が信頼区間に収まり、いくつかは信頼区間から少しだけ外れています。しかし、これが良好なモデルであることを確信するためには、交差検証の結果を確認する必要があります。
地球統計ウィザードのウィンドウ 2
[次へ] をクリックして [検索近傍] ウィンドウを開きます。

検索近傍の修正

[検索近傍] ウィンドウに、5 年生の肥満率のプレビューサーフェスが表示されます。プレビューサーフェス上のどこかをクリックすると、その地点での肥満率の推定値が表示されます。たとえば、以下の図で十字の位置の推定値は 0.333177 です。つまり、このモデルはその地点で生活する 5 年生児童は 33% の確率で肥満であると推定しています。

[次へ] をクリックして [交差検証] ウィンドウを開きます。

交差検証の統計情報の確認

[正規 QQ プロット] タブをクリックします。
地球統計ウィザードのウィンドウ 4
[標準化二乗平均平方根] の値は 1.1475 です。この数値は 1 に近いことが理想的なので、これでよいです。正規 QQ プロットでは、各ポイントが 1 対 1 の直線付近にあるため、標準誤差がほぼ正規分布していることもわかります。このモデルを推定に使用します。
[完了] をクリックし、[方法レポート] ダイアログボックスの [OK] をクリックします。
肥満率の推定サーフェスがマップに表示されます。分析によっては、肥満率サーフェスがあれば十分です。その場合、ワークフローは以上で終わりです。ここでは、国勢調査細分区グループレベルで 5 年生児童の肥満率を推定したいので、このエリア内挿ワークフローの後半に進みます。
ロサンゼルスの 5 年生児童の肥満率サーフェス
注意:
上の図のレイヤーは対象地域にクリップされ、5th grade obesity という名前に変更されています。

国勢調査細分区グループごとの肥満率の推定

エリア内挿によって適切な推定サーフェスが作成された後は、[エリア内挿レイヤー → ポリゴン (Areal Interpolation Layer To Polygons)] ジオプロセシングツールでこのサーフェスを使用してロサンゼルスの国勢調査細分区グループごとに 5 年生の肥満率を推定することができます。

[5th grade obesity] レイヤーを右クリックし、[レイヤーのエクスポート] メニューを展開し、[ポリゴンへ] を選択してエリア内挿レイヤー → ポリゴンツールのダイアログボックスを開きます。
注意:
[エリア内挿レイヤー → ポリゴン (Areal Interpolation Layer To Polygons)] ツールには [Geostatistical Analyst ツール] ツールボックスの [地球統計レイヤーを操作] ツールセットからアクセスすることもできます。
[入力エリア内挿地球統計レイヤー] が [5th grade obesity] に設定されていることを確認します。
[入力ポリゴンフィーチャ] ドロップダウン矢印をクリックし、ロサンゼルス国勢調査細分区グループのポリゴンフィーチャクラスである [LA_blocks] をクリックします。
[出力ポリゴンフィーチャクラス] 参照ボタンをクリックして出力の保存先を選択し、出力ポリゴンフィーチャクラスの名前として LA_blocks_obesity と入力します。
LA_blocks フィーチャクラスからすべてのフィールドを引き継ぎたいので、[入力フィーチャからすべてのフィールドを追加] がオンになっていることを確認します。
エリア内挿レイヤー → ポリゴンジオプロセシングツールのダイアログボックス
[OK] をクリックして、このツールを実行します。
ロサンゼルスの各国勢調査細分区グループの 5 年生の肥満率の推定が含まれているポリゴンフィーチャクラスがマップに追加されます。肥満率の推定値を含むフィールドには [Predicted] というラベルが付きます。さらに、この推定の標準誤差が [StdError] というラベルの付いたフィールドに保存されます。
ロサンゼルスの各国勢調査細分区グループの 5 年生児童の肥満率の推定
注意:
公平に比較するため、上の図の配色は学区の肥満率からインポートされています。
肥満率の推定値の標準誤差によって国勢調査細分区グループを色分けすることもできます。標準誤差は LA_blocks_obesity の StdError フィールドに保存されています。これにより、肥満率の推定に誤差マージンを設けることができます。
標準誤差が小さい地区は薄い赤色で表示されています。細分区グループが大きいほど標準誤差が小さい傾向にあります。これは、面積が大きいほど情報が増えて、推定の不確実性が下がるためです。
ロサンゼルスの各細分区グループの肥満率の標準誤差

学区ごとにサンプル抽出された比率からロサンゼルスの各国勢調査細分区グループの 5 年生の肥満率を推定するワークフローは以上で終わりです。

データが欠損している学区の肥満率の推定

データが欠損している学区の肥満率を推定するため、ここでも再び [エリア内挿レイヤー → ポリゴン (Areal Interpolation Layer To Polygons)] ジオプロセシングツールを使用します。

[5th grade obesity] レイヤーを右クリックし、[レイヤーのエクスポート] メニューを展開し、[ポリゴンへ] を選択してエリア内挿レイヤー → ポリゴンツールのダイアログボックスを開きます。
[入力エリア内挿地球統計レイヤー] が [5th grade obesity] に設定されていることを確認します。
[入力ポリゴンフィーチャ] ドロップダウン矢印をクリックし、データが欠損している学区のポリゴンフィーチャクラスである [Missing_zones] をクリックします。
[出力ポリゴンフィーチャクラス] 参照ボタンをクリックして出力の保存先を選択し、出力ポリゴンフィーチャクラスの名前として Missing_zones_obesity と入力します。
Missing_zones フィーチャクラスからすべてのフィールドを引き継ぎたいので、[入力フィーチャからすべてのフィールドを追加] がオンになっていることを確認します。
エリア内挿レイヤー → ポリゴンジオプロセシングツールのダイアログボックス
[OK] をクリックして、このツールを実行します。
データが欠損しているロサンゼルスの学区の 5 年生の肥満率の推定が含まれているポリゴンフィーチャクラスがマップに追加されます。肥満率の推定値を含むフィールドには Predicted というラベルが付きます。さらに、この推定の標準誤差が [StdError] というラベルの付いたフィールドに保存されます。
データが欠損している学区の 5 年生児童の肥満率の推定
注意:
この配色は学区の肥満率からインポートされています。

データが欠損しているロサンゼルスの学区での 5 年生の肥満率を推定するワークフローは以上で終わりです。

結果を保存せずに ArcGIS Pro を閉じることができます。

参考データ

Rosenshein, L. "The Local Nature of a National Epidemic: Childhood Overweight and the Accessibility of Healthy Food." M.S. dissertation, George Mason University, Department of Geography and GeoInformation Science, Fairfax, Virginia, USA, 2010.