地理空間加重回帰分析 (Geographically Weighted Regression) (GWR) (GeoAnalytics)

サマリー

空間的に変化する関係をモデリングするときに使用される局所形の線形回帰である、地理空間加重回帰分析 (GWR) を実行します。

注意:

このツールは、ArcGIS Pro 2.3 で実装された [地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールに追加された機能のサブセットです。

ツールのアルゴリズムについては、「地理空間加重分析 (GWR) の詳細」をご参照ください。 このトピックでは、空間統計ツールボックス (Spatial Statistics toolbox) ツールについて説明します。現在のところ、GeoAnalytics Server ツールボックス ツールにすべての機能が含まれているわけではありません。

使用法

  • このジオプロセシング ツールは ArcGIS Enterprise 10.8 1 以降で使用できます。

  • このツールは、空間的に変化する関係をモデリングするときに使用される局所形の線形回帰である、地理空間加重回帰分析 (GWR) を実行します。 GWR ツールは、データセット内のあらゆるフィーチャに回帰方程式をあてはめることで、理解または予測しようとしている変数またはプロセスのローカル モデルを作成します。 [地理空間加重回帰分析 (Geographically Weighted Regression) (GWR)] ツールでは、各ターゲット フィーチャの近傍内に存在するフィーチャの従属変数と説明変数を組み込んで、このような別々の方程式を作成します。 各近傍の形状と範囲は、[近傍タイプ] の入力と [近傍選択方法] の各パラメーターに基づいて解析されます。

  • 最善の結果となるよう、GWR は数百のフィーチャを持つデータセットに適用してください。 このツールは、小規模なデータセットには適していません。 このツールをマルチポイント データに使用することはできません。

  • [入力フィーチャ] パラメーターは、モデル化している現象 ([従属変数]) を表すフィールドと [説明変数] パラメーターの値を表す 1 つ以上のフィールドとともに使用します。 これらのフィールドは、数値で値の範囲を持つ必要があります。 従属変数または説明変数に欠落値を含むフィーチャは、解析から除外されます。 [フィールド演算 (Calculate Field)] ツールを使用して値を変更できます。 ArcGIS Pro でデータを使用できる場合は、欠損値の補完ツールを使用して不足している値をデータセットに追加してから [地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールを実行します。

  • また、[地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールは出力フィーチャを生成し、局所的な診断値を報告するフィールドを追加します。 [出力フィーチャクラス] パラメーターの値、および関連するチャートは、残余をモデリングできるよう、ホット/コールド レンダリング方式が適用された状態で、[コンテンツ] ウィンドウに自動的に追加されます。 各出力の詳細な説明については、「地理空間加重回帰分析の詳細」をご参照ください。

    注意:

    [地理空間加重回帰分析 (Geographically Weighted Regression) (GWR)] ツールでは、各種出力を生成できます。 GWR モデルの概要は、ツールの実行中に [ジオプロセシング] ウィンドウの下にメッセージとして表示されます。 このメッセージにアクセスするには、[ジオプロセシング] ウィンドウで進行状況バーにカーソルを合わせるか、ポップアップ ボタンをクリックするか、メッセージ セクションを展開します。 ジオプロセシング履歴を介して、以前に実行した [地理空間加重回帰分析 (Geographically Weighted Regression) (GWR)] ツールのメッセージにアクセスすることもできます。

  • 投影されたデータを使用する必要があります。

  • [地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールを使用しデータをローカルに調査する前に、一般化線形回帰ツールを使用してデータをグローバルに調査する方法が一般的です。

  • [従属変数] および [説明変数] パラメーターは、各種の値を含む数値フィールドの必要があります。 これらの値には、グローバルおよびローカルなばらつきがあります。 このため、GWR モデルでは、別の空間様式を表すダミーの説明変数を使用しないでください (都心外の国勢調査地区に 1 という値を割り当て、それ以外にはすべて 0 という値を割り当てるなど)。 [地理空間加重回帰分析 (Geographically Weighted Regression) (GWR)] ツールでは、説明変数の係数が異なっていてもよいため、このような空間様式の説明変数が不要です。これを含めてしまうと、局所的な多重共線性の問題が生じます。

  • [一般化線形回帰] のようなグローバル回帰モデルでは、複数の変数が多重共線性を示すと (複数の変数が冗長であるか、同じ「ストーリー」を語るとき)、結果は信頼できません。 [地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールは、データセット内のフィーチャごとにローカル回帰方程式を作成します。 特定の説明変数の値が空間的にクラスタリングしている場合は、ローカル多重共線性が問題となっている可能性が高いといえます。 局所的な多重共線性のために不安定な結果になっているかどうかは、出力フィーチャクラスの調整済み条件数フィールド (COND_ADJ) で確認できます。 一般的なルールとして、調整済み条件数が 30 を上回っている場合、NULL に等しい場合、またはシェープ ファイルの場合に -1.7976931348623158e+308 に等しい場合の結果には信頼性がありません。

  • GWR モデルに名義またはカテゴリ データを含める場合には、注意してください。 カテゴリが空間的にクラスタリングしているようなときには、ローカル多重共線性の問題が生じるリスクがあります。 局所的な共線性が問題となっているかどうかは、GWR 出力に含まれている調整済み条件数で判別できます (調整済み条件数が 0 未満、30 超、または NULL に設定されている場合)。 ローカル多重共線性が存在する場合の結果は安定していません。

  • 重要な説明変数が欠けていると、回帰モデルは誤って指定されます。 回帰残余の空間的自己相関が統計的に有意である場合や、1 つ以上の説明変数の係数に予期せぬ空間的なばらつきがある場合は、モデルが誤って指定されている可能性が考えられます。 欠けている重要な変数が何であるのかを特定し、これらをモデルに含められるよう、(GLR 残余分析や GWR 係数差異分析などを通じて) あらゆる努力を行ってください。

  • 常に、説明変数を非定常とすることが理にかなっているかを疑ってみてください。 たとえば、ASPECT をはじめとするいくつかの変数を関数として、特定の植物種の密度をモデリングしているとします。 ASPECT 変数の係数が分析範囲全体で変化する場合には、重要な説明変数 (優勢な競合する植物など) が欠けているという事実を示している可能性が高いといえます。 あらゆる努力を行って、回帰モデルにすべての重要な説明変数を含めてください。

  • 計算結果が無限または未定義の場合、シェープファイル以外の結果は NULL になります。

  • 深刻なモデル設計上の問題や、局所方程式に十分な近傍数が含まれていないことを示すエラーは、多くの場合、グローバルまたは局所的な多重共線性の問題があることを示しています。 どこに問題があるのかを判断するために [一般化線形回帰 (Generalized Linear Regression)] を使用してグローバル モデルを実行し、各説明変数について VIF 値を確認します。 大きな VIF 値がある場合 (たとえば 7.5 以上)、グローバル多重共線性によって GWR では解を導けなくなっています。 しかし、もっと可能性が高いのは、ローカル多重共線性の問題です。 各独立変数の主題図を作成してみてください。 主題図で同一値が空間的にクラスターを形成している場合は、モデルからそのような変数を除外するか、別の独立変数と組み合わせて値のばらつきを増やします。 たとえば、住宅の価値をモデル化していて、寝室と風呂に変数がある場合は、両方を組み合わせて値のばらつきを増やすか、それぞれを風呂と寝室の面積として表します。 GWR モデルの構築時には、空間様式のダミー変数、空間クラスターとなっているカテゴリや名義変数、可能性のある値が非常に限られている変数の使用を避けてください。

  • 地理空間加重回帰分析 (GWR) は、[一般化線形回帰 (Generalized Linear Regression)] と同じ要件の適用を受ける線形モデルです。 GWR モデルが適切に指定できていることを確認するには、「地理空間加重回帰分析の詳細」で説明されている診断を入念に確認してください。 ここで取り上げたすべての診断ツールが GeoAnalytics Desktop ツールボックスで使用できるわけではありません。 「回帰分析の基礎」の「回帰モデルがうまくいかない理由」にも、モデルが正確であることを確認するための情報が記載されています。

  • 次のヒントを 1 つ以上使用することで、[地理空間加重回帰分析 (Geographically Weighted Regression (GWR))] ツールのパフォーマンスを向上させることができます。

    • 対象データのみが解析されるように、範囲環境を設定します。
    • 計算の近傍数を減らします。
    • [近傍タイプ] パラメーターで [距離バンド] オプションの代わりに [近傍数] オプションを使用します (Python のneighborhood_type = "NUMBER OF NEIGHBORS")。
    • 可能であれば、説明変数の数を減らします。
    • 解析が実行されているロケーションに対してローカルなデータを使用します。

  • このジオプロセシング ツールは、ArcGIS GeoAnalytics Server を活用しています。 解析は GeoAnalytics Server で実行され、結果が ArcGIS Enterprise のコンテンツに保存されます。

  • GeoAnalytics Server ツールを実行する場合、解析は GeoAnalytics Server で実行されます。 最適なパフォーマンスを得るためには、ArcGIS Enterprise ポータルでホストされているフィーチャ レイヤーかビッグ データ ファイル共有を通じて、GeoAnalytics Server にデータを提供する必要があります。 GeoAnalytics Server のローカルにないデータは、解析が開始する前に GeoAnalytics Server に移動されます。 つまり、ツールを実行する時間が長くなり、場合によっては ArcGIS Pro から GeoAnalytics Server にデータを移動できないこともあります。 エラーの閾値はネットワークの速度や、データのサイズや複雑さに左右されます。 データを必ず共有するか、ビッグ データ ファイル共有を作成することをお勧めします。

    データをポータルで共有する方法の詳細

    ArcGIS Server Manager を使用してビッグ データ ファイル共有を作成する方法の詳細

  • 空間統計ツールボックスの [地理空間加重回帰分析 (Geographically Weighted Regression)] ツールを使用して、類似分析を実行することもできます。 次のワークフローを行うには、空間統計 (Spatial Statistics) ツールボックスのツールを使用します。

    • ArcGIS Pro コンピューターのローカル レイヤーを使用する (ファイル ジオデータベースのフィーチャクラスなど)。
    • 別のレイヤーに対する予測を行うか、ラスター係数レイヤーを作成する。
    • バイナリ (論理) 変数またはカウント (ポワソン値) 変数をモデル化する。
    • ゴールデン検索または手動間隔を使用して近傍検索を定義する。

パラメーター

ラベル説明データ タイプ
入力フィーチャ

従属変数と説明変数を格納したポイント フィーチャクラス。

Feature Set
従属変数

モデル化される観測値を含む数値フィールド。

Field
モデル タイプ

モデル化されるデータのタイプを指定します。

  • 連続 (ガウス)[従属変数] 値は連続敵です。 Gaussian モデルが使用され、ツールは最小二乗法 (Ordinary Least Squares) の回帰分析を実行します。
String
説明変数

回帰モデルの独立説明変数を表すフィールドのリスト。

Field
出力フィーチャ

出力フィーチャ サービスの名前。

String
近傍タイプ

使用される近傍を固定距離として構築するか、フィーチャの密度に応じて空間範囲の変化を許容するかを指定します。

  • 近傍数近傍サイズは、各フィーチャの計算に含まれる指定した近傍数の関数です。 フィーチャの密度が高い場合、近傍の空間範囲は小さくなります。フィーチャの密度が低い場合、近傍の空間範囲は大きくなります。
  • 距離バンド近傍サイズは、各フィーチャに対して定数または固定距離です。
String
近傍選択方法

近傍サイズの決定方法を指定します。

  • ユーザー定義近傍サイズは、[近傍数] または [距離バンド] パラメーターによって指定されます。
String
近傍数
(オプション)

各フィーチャについて考慮する近隣フィーチャの最も近い数 (最大 1000)。 この数は 2 ~ 1000 の整数の必要があります。

Long
距離バンド
(オプション)

近傍の空間範囲。

Linear Unit
ローカル加重方式
(オプション)

モデルの空間的な加重を提供するために使用されるカーネル タイプを指定します。 カーネルは、各フィーチャと近傍内にある他のフィーチャとの関連性を定義します。

  • バイスクエア指定された近傍の外部にあるフィーチャには、0 のウェイトが割り当てられます。 これがデフォルトです。
  • ガウスすべてのフィーチャがウェイトを受け取りますが、加重はターゲット フィーチャから遠いほど、指数的に小さくなります。
String
データストア
(オプション)

出力の保存先の ArcGIS Data Store を指定します。 デフォルトは、[ビッグ データ ストア] です。 ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。 リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • ビッグ データ ストア出力がビッグ データ ストアに格納されます。 これがデフォルトです。
  • リレーショナル データ ストア出力がリレーショナル データ ストアに格納されます。
String

派生した出力

ラベル説明データ タイプ
出力

出力フィーチャ。

レコード セット

arcpy.geoanalytics.GWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {number_of_neighbors}, {distance_band}, {local_weighting_scheme}, {data_store})
名前説明データ タイプ
in_features

従属変数と説明変数を格納したポイント フィーチャクラス。

Feature Set
dependent_variable

モデル化される観測値を含む数値フィールド。

Field
model_type

モデル化されるデータのタイプを指定します。

  • CONTINUOUSdependent_variable 値は連続的です。 Gaussian モデルが使用され、ツールは最小二乗法 (Ordinary Least Squares) の回帰分析を実行します。
String
explanatory_variables
[explanatory_variables,...]

回帰モデルの独立説明変数を表すフィールドのリスト。

Field
output_features

出力フィーチャ サービスの名前。

String
neighborhood_type

使用される近傍を固定距離として構築するか、フィーチャの密度に応じて空間範囲の変化を許容するかを指定します。

  • NUMBER_OF_NEIGHBORS近傍サイズは、各フィーチャの計算に含まれる指定した近傍数の関数です。 フィーチャの密度が高い場合、近傍の空間範囲は小さくなります。フィーチャの密度が低い場合、近傍の空間範囲は大きくなります。
  • DISTANCE_BAND近傍サイズは、各フィーチャに対して定数または固定距離です。
String
neighborhood_selection_method

近傍サイズの決定方法を指定します。

  • USER_DEFINED近傍サイズは、number_of_neighbors または distance_band パラメーターによって指定されます。
String
number_of_neighbors
(オプション)

各フィーチャについて考慮する近隣フィーチャの最も近い数 (最大 1000)。 この数は 2 ~ 1000 の整数の必要があります。

Long
distance_band
(オプション)

近傍の空間範囲。

Linear Unit
local_weighting_scheme
(オプション)

モデルの空間的な加重を提供するために使用されるカーネル タイプを指定します。 カーネルは、各フィーチャと近傍内にある他のフィーチャとの関連性を定義します。

  • BISQUARE指定された近傍の外部にあるフィーチャには、0 のウェイトが割り当てられます。 これがデフォルトです。
  • GAUSSIANすべてのフィーチャがウェイトを受け取りますが、加重はターゲット フィーチャから遠いほど、指数的に小さくなります。
String
data_store
(オプション)

出力の保存先の ArcGIS Data Store を指定します。 デフォルトは、SPATIOTEMPORAL_DATA_STORE です。 ビッグ データ ストアに格納されたすべての結果は、WGS84 で保存されます。 リレーショナル データ ストアに格納された結果は、それらの座標系を維持します。

  • SPATIOTEMPORAL_DATA_STORE出力がビッグ データ ストアに格納されます。 これがデフォルトです。
  • RELATIONAL_DATA_STORE出力がリレーショナル データ ストアに格納されます。
String

派生した出力

名前説明データ タイプ
output

出力フィーチャ。

レコード セット

コードのサンプル

GeographicallyWeightedRegression (地理空間加重回帰分析) の例 (スタンドアロン スクリプト)

次の Python ウィンドウ スクリプトは、GWR ツールの使用方法を示しています。

このスクリプトでは、森林火災の高い頻度に影響を及ぼす環境変数を判定するモデルを作成します。


# Name: GWR.py
# Description: Run GWR on forest fire occurrence report data to understand 
#              which variables explain reoccurring forest fires
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy

# Set local variables
inputFeatures = "https://analysis.org.com/server/rest/services/DataStoreCatalogs/bigDataFileShares_EcoData/BigDataCatalogServer/fireLocations"
outputLayerName = "GWR_ForestFireFrequency"
dependentVariable = "Fire_Frequency"
explanatoryVariables = "GroundCover, TreeCover, SoilMoisture, slope"
distanceValue = "5 Miles"

# Execute GWR
arcpy.geoanalytics.gwr(inputFeatures, dependentVariable, 
                                                    "CONTINUOUS", explanatoryVariables, 
                                                    outputLayerName, "DISTANCE_BAND", 
                                                    "USER_DEFINED", None, distanceValue, 
                                                    "GAUSSIAN", "SPATIOTEMPORAL_DATA_STORE"))

環境

特殊なケース

出力座標系

解析で使用される座標系。 このパラメーターで指定されない限り、入力の座標系で解析が行われます。 GeoAnalytics Tools の場合、最終結果は WGS84 のビッグ データ ストアに保存されます。

ライセンス情報

  • Basic: 次のものが必要 ArcGIS GeoAnalytics Server
  • Standard: 次のものが必要 ArcGIS GeoAnalytics Server
  • Advanced: 次のものが必要 ArcGIS GeoAnalytics Server

関連トピック