ホット スポット分析の比較の詳細

[ホット スポット分析の比較 (Hot Spot Analysis Comparison)] ツールは、2 つのホット スポット分析結果レイヤーを比較して、その類似性と関連性を算出します。 ホット スポット分析結果レイヤー間の類似性と関連性を求めるには、両方の入力レイヤーで対応するフィーチャ (およびその近傍) 間の有意水準カテゴリ (99% ホット、95% ホット、90% ホット、有意でない、90% コールド、95% コールド、99% コールド) を比較します。

2 つのホット スポット分析結果の比較

このツールを実行すると、ホット スポット結果間の全体の類似性と関連性を計測するためにグローバル相似値とグローバル Kappa 値が算出されます。 対応するフィーチャのペアごとにローカル バージョンの相似値と Kappa 値も算出されます。 これにより、比較をマッピングして、グローバル値よりも類似性または関連性が高いエリアを求めるか、グローバル値よりも類似性または関連性が低いエリアを求めることができます。 出力フィーチャには、ホット スポット結果が最も類似していないエリアをハイライト表示し、対応するすべてのフィーチャの有意水準ペアを集計するチャートとカスタム シンボルも含まれています。

入力ホット スポット結果レイヤーは必ず、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールまたは [最適化ホット スポット分析 (Optimized Hot Spot Analysis)] ツールの出力フィーチャになります。 各結果のすべてのフィーチャは、有意水準カテゴリを比較できるように、他の結果の対応する 1 つのフィーチャとペアにする必要があります。 2 つの入力ホット スポット結果のフィーチャが空間的に整列していない場合は (2 つのポリゴンの境界が同じでない場合など)、分析の前に 2 つのフィーチャ レイヤーが交差し、フィーチャの交差部分で比較が行われます。

類似性と関連性

ホット スポット結果の類似性は、両方のホット スポット結果のホット スポット、コールド スポット、有意でないエリアが空間的に整列している度合を示し、結果の関連性 (または依存性) は、基になるホット スポット分析変数間の統計的依存性の度合を示します。 この違いはわずかですが、重要です。この理由は、2 つのホット スポット結果に高い類似性が見られる (多数の対応するフィーチャの有意水準が同じである) が関連性と依存性がほとんどないことはよくあるためです。 このことは以下の図の 2 つのホット スポット結果レイヤーで示されています。

それぞれの結果の 25 個中 23 個のポリゴンはカテゴリが一致し、2 つの結果には高い類似性があります。 ただし、それぞれの結果の 25 個中 24 個のポリゴンはコールド スポットであり、基になるホット スポット結果に依存性と関連性がない場合でも 23 個のポリゴンは一致することが予想されます。 つまり、ほぼすべてのポリゴンのカテゴリが一致しているにもかかわらず、結果に統計的関連性があるという証拠はありません。 両方の変数はほぼ全体がコールド スポットで 1 つだけ孤立したホット スポットが存在しますが、これらの間の関係や関連性の根拠はありません。

結果に類似性はあるが関連性がない
2 つのホット スポット結果レイヤーの赤色のポリゴンはホット スポット、青色のポリゴンはコールド スポットです。

以下に示す 2 つのホット スポット結果でも、25 個中 23 個のポリゴンが一致しているため、類似性は 1 つ目の結果セットと同じです。 ただし、一致しているポリゴンのうち 22 個はコールド スポットで、1 つがホット スポットです。 各結果でホット スポットが 2 つしかないため、ホット スポットが偶然これほど近接して整列する可能性はありません。 これが結果間の基になる関係と関連性の根拠となります。 関係は必ずしも因果関係があることを意味するわけではありませんが、一方の結果の値を変更することによってもう一方の結果の値に影響を及ぼすことが可能である場合があります。 たとえば、一方のホット スポット結果が乳児死亡率のホット スポットとコールド スポットを表し、もう一方が汚染のホット スポットとコールド スポットを表している場合、変数間の強い関連性は、汚染度の低下によって乳児死亡率が減少する可能性があることを示唆しています。 もう 1 つの例として、2 つのホット スポット結果が歴年の汚染度を表している場合、関連性は北部と東部への汚染度の移動として解釈することができます。

類似性と関連性のある結果

ホット スポット結果間の類似性は、0 ~ 1 の相似値で計測されます。 両方の結果で対応する多数のフィーチャの有意水準が同じである場合は、値が 1 に近くなり、対応する多数のフィーチャの有意水準が同じでない場合は、値が 0 に近くなります。 関連性は Kappa 値で計測されます。関連性が強い結果の Kappa 値は 1 に近くなり、関連性がない (依存性がない) 結果の Kappa 値は 0 に近くなります (または、やや負の値になる)。 Kappa 値は、相似値がリスケールされた値であり、ホット スポット結果間の統計的関連性を特定するために、空間クラスタリングとカテゴリ頻度を考慮します。 参考のため、上記の 1 つ目のホット スポット結果セットの Kappa 値は 0 にほぼ等しく、2 つ目の結果セットの Kappa 値は 0.6 にほぼ等しくなります。

有意でないフィーチャを除外

上の例に示すように、ホット スポット結果が 1 つのカテゴリで占められている場合、そのカテゴリは有意でないことが最も一般的です。 ただし、有意でないフィーチャが調査対象でない場合、両方の結果に有意でないエリアが多数存在することを単に示すためだけの相似値と Kappa 値は不要です。 これを回避するため、どちらのホット スポット結果も統計的に有意でない場合は、[有意でないフィーチャを除外] パラメーターを使用して、対応するフィーチャのペアを比較の対象外にすることができます。 対象外にした場合は、統計的に有意なホット スポットとコールド スポットだけを比較する条件付きの相似値と Kappa 値が算出され、類似性と関連性が正確に反映されます。 有意水準カテゴリの数と全体的な割合は相似値と Kappa 値に影響を与えるため、多数の有意でないフィーチャを除外する前には結果を考慮してください。

ファジー類似性

対応する 2 つのフィーチャを比較した場合、その結果は、フィーチャの有意水準カテゴリが同じであるかどうかという単純な二項対立 (はい/いいえ) にとどまらないことがあります。 類似性と関連性の算出では、有意水準の類似性と空間近傍に基づいて対応するフィーチャ間の部分一致を許可するために、ファジー集合メンバーシップが使用されています。 たとえば、99% ホット スポットは、他の 99% ホット スポットと完全に一致すると見なされ、95% ホット スポットと部分的に一致すると見なされ、99% コールド スポットと完全に一致しないと見なされます。 また、対応する 2 つのフィーチャの有意水準が同じでなくても、近接フィーチャの有意水準が同じである場合、距離類似性に基づいて、これら 2 つのフィーチャは部分的に一致すると見なされます。 対応する 2 つのフィーチャ間の全体的な類似性は、カテゴリの類似性に距離類似性を乗算して求められます。 算出の詳細については、以下の「空間 Fuzzy Kappa」のセクションをご参照ください。

カテゴリ類似性

各ホット スポット結果には 7 つの有意水準カテゴリがあります。 各カテゴリには 99% ホットから 99% コールドまでの自然順があり、カテゴリ間の類似性はカテゴリによって異なります。 カテゴリ類似性加重により、異なる有意水準カテゴリ同士がどの程度類似していると見なすかを定義することができます。 結果の各組み合わせ (90% コールドと 95% ホットなど) には、類似性を示す 0 ~ 1 の範囲のカテゴリ加重を割り当てる必要があります。 加重が 1 に等しい組み合わせは完全一致と見なされ、加重が 0 に等しい組み合わせは完全に類似していないと見なされます。 0 から 1 までの間の値は、カテゴリ間の部分的な類似性の度合を示します。 加重は対称である必要があり、たとえば、99% ホットと 95% ホットの間の加重は 95% ホットと 99% ホットの間の加重と等しくなければなりません。

2 つのカテゴリの類似性加重が 1 に等しい場合、類似性と関連性の算出でこの 2 つは同じカテゴリと見なされるため、加重を使用して異なるカテゴリを組み合わせることができます。 たとえば、95% の信頼度で 2 つのホット スポット分析を実行するには、カテゴリのすべての組み合わせで 1 に等しい加重を使用して、90% コールド、有意でない、90% ホットの各カテゴリを組み合わせることができます。 相似値と Kappa 値は 90% コールド カテゴリと 90% ホット カテゴリを有意でないものと見なします。 さらに、有意でないフィーチャを除外した場合、有意でないカテゴリと組み合わされているカテゴリもすべて除外されます。

ホット スポットとコールド スポット間に大きな加重を割り当てることによって、ホットとコールドの関係を反転させることもできます。 関係の反転が推奨されるのは、収入の中央値のコールド スポットが糖尿病のホット スポットと整列しているなど、ホット スポット結果に負の関係がある場合です。

注意:

カテゴリ類似性加重は、相似値と Kappa 値の計算にのみ影響します。 類似性加重を使用して有意水準カテゴリを組み合わせた場合でも、これらのカテゴリは、メッセージ テーブル、出力レイヤー シンボル、チャートで別々のカテゴリとして扱われます。 詳細については、以下の「ツールの出力」のセクションをご参照ください。

カテゴリ類似性加重は [類似性加重方式] パラメーターを使用して指定します。 次のオプションを利用できます。

  • [ファジー加重] - 類似性加重はファジー (非バイナリ) になり、有意水準の近接性によって求められます。 すべてのホット スポットは、すべてのコールド スポットおよび有意でないフィーチャと完全に類似していないと見なされます。その逆も同様です。 90%、95%、および 99% ホット スポットとコールド スポットの間の加重は、正規分布の上片側棄却域の臨界値の比率によって求められます (例: 95% ホットと 99% ホットの間の加重は 1.645/2.33 = 0.71)。 各カテゴリ間のその他すべての加重については、以下の「加重マトリックス ポップアウト」のセクションの 1 つ目の図をご参照ください。 これがデフォルトです。
  • [有意水準の完全な一致] - フィーチャが類似していると見なされるには、有意水準が同じでなければなりません。 たとえば、99% ホット スポットは、95% および 90% ホット スポットと完全に類似していないと見なされます。
  • [90% 有意、95% 有意、99% 有意の組み合わせ] - 90%、95%、および 99% ホット スポットであるフィーチャは互いに完全に類似していると見なされ、90%、95%、および 99% コールド スポットであるすべてのフィーチャは互いに完全に類似していると見なされます。 このオプションでは、有意性が 90% 以上のすべてのフィーチャは同じである (統計的に有意である) と見なされ、信頼度が 90% 未満のすべてのフィーチャは同じである (有意でない) と見なされます。
  • [95% 有意と 99% 有意の組み合わせ] - 95% および 99% ホット スポットであるフィーチャは完全に類似していると見なされ、95% および 99% コールド スポットであるフィーチャは完全に類似していると見なされます。 たとえば、90% ホット スポットと 90% コールド スポットは、それより高い有意水準とは完全に類似していないと見なされます。 このオプションでは、有意性が 95% 以上のすべてのフィーチャは同じである (統計的に有意である) と見なされ、有意性が 95% 未満のすべてのフィーチャは同じである (有意でない) と見なされます。
  • [99% 有意のみ使用] - 99% ホット (またはコールド) スポットであるフィーチャに限り、互いに完全に類似していると見なされます。 このオプションでは、有意性が 99% 未満のすべてのフィーチャは有意でないと見なされます。
  • [ホットとコールドの関係を反転] - デフォルトのファジー加重が使用されますが、最初のホット スポット結果のホット スポットは、2 番目のホット スポット結果のコールド スポットに類似していると見なされます。 たとえば、1 つの結果の 99% ホット スポットは、もう 1 つの結果の 99% コールド スポットと完全に類似していると見なされ、もう 1 つの結果の 95% および 90% コールド スポットと部分的に類似していると見なされます。
  • [加重をテーブルから取得] - テーブル レイヤーの各フィールドで定義されている加重が使用されます。 このテーブルは [入力加重テーブル] パラメーターで指定し、CATEGORY1CATEGORY2WEIGHT の各フィールドが含まれている必要があります。 ペアの有意水準カテゴリ (入力レイヤーの Gi_Bin フィールドの値) をカテゴリ フィールドに指定し、これらのカテゴリ間の類似性加重を加重フィールドに指定します。 たとえば、[-3, -2, 0.6] という行は、類似性加重値 0.6 を 99% コールド対 95% コールドの組み合わせに割り当てます。 テーブル内に組み合わせが存在しない場合、加重は 0 と見なされます。 テーブルは加重マトリックス ポップアウトからエクスポートできます。
  • [カスタム加重] - [カテゴリ類似性加重] パラメーターで指定されたカスタム類似性加重値が使用されます。

加重マトリックス ポップアウト

[カテゴリ類似性加重] パラメーターでは、加重マトリックス ポップアウトを使用して加重を対話的に表示および編集することができます。 [類似性加重方式] パラメーターの別のオプションを選択すると表示されている加重が更新されるため、各オプションに関連付けられている加重を確認して編集を行うことができます。 ポップアウトを開くには、このパラメーターの横にある [カスタム] ボタンをクリックします。

カテゴリ類似性加重マトリックス ポップアウト

有意水準の組み合わせ間のカスタム加重を割り当てるには、関連セルをクリックして 0 ~ 1 の間の加重値を入力し、Enter キーを押します。 加重の対称性を維持するため、マトリックスの左下半分のセルだけを編集することができ、右上の同等のセルには加重がミラーリングされます。 以下の図に、ホットとコールドの関係が反転した、有意水準の完全な一致を使用するカスタム加重の例を示します (たとえば、95% ホットは 95% コールドと完全に類似し、その他すべての有意水準とは完全に類似していないと見なされます)。

ホットとコールドの関係が反転した、有意水準の完全な一致

加重を指定したら、[OK] をクリックするか、ポップアウトの外側をクリックして、加重を適用します。 加重が変更された場合、[類似性加重方式] パラメーターの値が [カスタム加重] に変わります。 [キャンセル] または [閉じる] ボタンをクリックすると、ポップアウトが閉じ、変更は適用されません。

[エクスポート] ボタンをクリックすると参照ダイアログ ボックスが開き、加重値をテーブルとして保存することで、[加重をテーブルから取得] オプションで後から再使用できるようになります。 後からカスタム加重を再使用するには、加重マトリックス ポップアウトを使用して加重ファイルを作成し、後から比較する際にその加重テーブルを使用することをお勧めします。

距離類似性

カテゴリ類似性に加え、距離類似性では、フィーチャに同じ有意水準がなくても、近傍の他のフィーチャに同じ有意水準がある場合は、部分一致が許可されます。 ホット スポット分析はローカル近傍を使用する空間分析手法であるため、各フィーチャの有意水準は、フィーチャだけでなく、フィーチャとそれに最も近い近傍フィーチャの値の特徴付けにもなります。 この意味で、近傍フィーチャが類似している場合は、近傍の類似性に少し影響します。

[近傍数] パラメーターには、比較で使用される追加の近傍フィーチャの数を指定し、近傍の順序に基づく距離加重を使用して部分的な類似性が導入されます。 フィーチャの距離加重は 1 に等しくなり、近傍が追加されるごとに次の式を使用して加重が減分します。

距離加重の式

この式におけるランクは近傍の順位であり、範囲は 0 (比較対象のフィーチャ) ~近傍数 (最も遠い近傍) となります。 たとえば、4 つの近傍が存在する場合 (比較対象のフィーチャを含めて 5 つ)、次の 5 つの距離加重が使用されます: 5/5 (1)、4/5 (0.8)、3/5 (0.6)、2/5 (0.4)、1/5 (0.2)。

注意:

ポリゴンとラインの場合、重心間のユークリッド距離を使用して最も近い近傍の順序が求められます。 出力空間参照が地理座標系である場合、重心間の弦距離が使用されます。 各近傍が比較対象のフィーチャから異なる距離にある場合でも、すべてのフィーチャで同じ予想相似値を維持するため、距離加重には (生の距離ではなく) 近傍の順序が使用されます。

ツールの出力

比較の結果は、ジオプロセシング メッセージ、出力フィーチャのグループ レイヤー、およびチャートで返されます。

ジオプロセシング メッセージ

これらのメッセージには、ホット スポット結果間のグローバルな比較に関する情報が表示されます。 これらのメッセージに表示される情報を次に示します。

  • [相似値] - ホット スポット結果レイヤー間の全体的な類似性を示す 0 ~ 1 の値。 この値は、対応するフィーチャの任意のペアの有意水準カテゴリが同じであるファジー確率として解釈できます。 この値はすべてのローカル相似値の平均に等しくなります。
  • [予想相似値] - 2 つのホット スポット結果レイヤーに関連性がない (依存性がない) という仮定の下で予想される相似値。 相似値が予想相似値より大きい場合、2 つのマップ間に基になる依存性があります。 この値は、ほとんどの場合が情報提供であり、Kappa 値の計算時に相似値をスケーリングする目的に使用されます。 この値はローカル予想相似値の平均に等しくなります。
  • [空間 Fuzzy Kappa] - 相似値をその予想値でスケーリングして求められたホット スポット分析変数間の関連性の計測値。 完全に関連性があるホット スポット結果の値は 1 になり、関連性がない (依存性がない) ホット スポット結果の値は 0 に近くなります。 負の値は、ホット スポット分析変数間に負の関係があることを意味します。 値の下限が設定されていない場合、実際に値が -3 より小さくなることはほとんどありません。 Kappa 値を解釈する際の厳密なルールはありませんが、0.8 より大きい値をほぼ完全な関連性、0.6 ~ 0.8 の値を強い関連性、0.4 ~ 0.6 の値を中程度の関連性、0.2 ~ 0.4 の値をある程度の関連性、0 ~ 0.2 の値をわずかな関連性、負の値を関連性なし (大きな負の値を負の関連性) として解釈することが通常は推奨されます。
  • [有意でないフィーチャの数] - どちらのフィーチャも統計的に有意でない、ホット スポット有意水準ペアの数です。
    注意:

    有意でないフィーチャが除外された場合、それらは相似値、予想相似値、空間 Fuzzy Kappa の計算に含まれません。 統計的に有意なフィーチャの条件付きの値であることを示すため、ラベルが [条件付き相似値][条件付き予想相似値][条件付き空間 Fuzzy Kappa]、および [有意でないフィーチャの除外数] に変わります。

  • カテゴリ ウェイト テーブル メッセージ テーブルに、ホット スポット有意水準の各ペア間のカテゴリ加重が表示されます。 たとえば、以下の図には、デフォルトのカテゴリ類似性加重方式によるカテゴリ ウェイト テーブルが表示されています。

    カテゴリ ウェイト テーブル メッセージ

  • ホット スポット有意水準ペア (個数) メッセージ テーブルには、各ホット スポット有意水準ペアの数が表示されます。 たとえば、以下の図で、第 1 行 2 列目の値 440 は、440 個のフィーチャ ペアが 1 つ目のホット スポット結果では 99% コールド、2 つ目の結果では 95% コールドであったことを意味しています。 余白にある行と列の合計は、各ホット スポット結果における各有意水準の総数を示しています。

    ホット スポット有意水準ペア (個数) メッセージ

  • ホット スポット有意水準ペア (%) メッセージ テーブルには、個数テーブルと同じ情報が表示されますが、個数は行合計の割合に変換されます。 たとえば、以下の図では、上の図で 440 と表示されていたセルには 5.57 (440/7904 = 0.0557) と表示されています。 このテーブルは、2 つのホット スポット結果が、異なるタイミングで計測された同じ変数を表している場合に特に便利です。 この場合には、ある計測から次の計測までの間にどのようにカテゴリが推移したかを確認できます。 たとえば、以下の図からは、1 つ目の結果で 99% コールド スポットであったフィーチャのうち、89.26% が 99% コールド スポットのままとなり、5.57% は 95% コールド スポットに変化したことなどがわかります。

    ホット スポット有意水準ペア (パーセンテージ) メッセージ

出力フィーチャとグループ レイヤー

出力フィーチャは入力ホット スポット結果レイヤーの交差であり、対応するフィーチャの各ペアのローカルな類似性と関連性を集計するフィールドが含まれます。 このフィーチャクラスには次のフィールドが含まれます。

  • [ホット スポット 1 入力値] (GI_BIN_1) - 1 つ目のホット スポット結果からのフィーチャの有意水準カテゴリを表す整数。 値の範囲は -3 (99% コールド) ~ 3 (99% ホット) です。 フィールド タイプは long です。
  • [ホット スポット 2 入力値] (GI_BIN_2) - 2 つ目のホット スポット結果からのフィーチャの有意水準カテゴリを表す整数。 フィールド タイプは long です。
  • [ホット スポット 1 有意水準] (GI_SIG_1) - 1 つ目のホット スポット結果からのフィーチャの有意水準カテゴリ。 可能な値: コールド 99%、コールド 95%、コールド 90%、有意でない、ホット 90%、ホット 95%、ホット 99%。 フィールド タイプは text です。
  • [ホット スポット 2 有意水準] (GI_SIG_2) - 2 つ目のホット スポット結果からのフィーチャの有意水準カテゴリ。 フィールド タイプは text です。
  • [相似値] (SIM_VALUE) - フィーチャ ペアのローカル相似値。 値の範囲は 0 ~ 1 です。 フィールド タイプは double です。
  • [予想相似値] (EXP_SIM) - フィーチャ ペアの予想相似値。 値の範囲は 0 ~ 1 です。 フィールド タイプは double です。
  • [空間 Fuzzy Kappa] (KAPPA) - フィーチャ ペアの空間 Fuzzy Kappa 値。 フィールド タイプは double です。
  • [有意水準の組み合わせ] (CAT_PAIR) - ホット スポット結果の有意水準カテゴリの組み合わせ。 このフィールドは以下の 2 つのチャートの基本として使用されています。 フィールド タイプは text です。

このツールをマップ内で実行すると、3 つのレイヤーがグループ レイヤーに追加され、類似性、関連性、および有意水準ペアを空間的に調査できるようになります。 最初のレイヤーには、5 つの等間隔に分類された 0 ~ 1 の相似値が表示され、最も類似していないエリアを強調するために、相似値が小さくなるにつれて色が濃くなります。 2 番目のレイヤーには、等間隔と 6 つのクラスでシンボル表示された空間 Fuzzy Kappa 値が表示されます。 3 番目のレイヤーには、1 つの入力ホット スポット結果が統計的に有意なホット スポットであり、もう 1 つの入力ホット スポット結果が統計的に有意なコールド スポットであるフィーチャを特定できるように、それぞれの有意水準の組み合わせがカスタム シンボルで表示されます (カスタム シンボルでは、組み合わせの数を少なくするために、90%、95%、および 99% の有意性は区別されない)。 デフォルトでは、1 つ目のレイヤーが有効、最後の 2 つのレイヤーが無効になっています。

比較結果のグループ レイヤー

チャート

最後のレイヤーには、結果間の有意水準の組み合わせをさらに詳しく調査できるように、2 つのチャートが表示されます。 これらのチャートには、メッセージ内のテーブルと同じ情報が表示されますが、わかりやすくするために、チャートが数と割合で色分けされています。 また、チャートとマップの間にある選択項目を使用して、たとえば、1 つの結果では 99% ホット スポットであるが、もう 1 つの結果では 99% コールド スポットであるフィーチャをすべて選択し、最大許容差を示すこともできます。

ホット スポット有意水準ペアの個数ヒート チャートには、各有意水準の組み合わせの個数が表示され、個数が多いほど濃い青色で示されます。 たとえば、下の図では、最大数のペアは 99% コールドから 99% コールド (左上)、有意でないから有意でない (真ん中)、99% ホットから 99% ホット (右下) です。

ホット スポット有意水準ペアの個数ヒート チャート

ホット スポット 1 水準カテゴリ内のホット スポット 2 水準の個数バー チャートでは、積み上げ水平バーによって、1 つ目の結果のカテゴリ内の 2 つ目のホット スポット結果の各有意水準カテゴリの個数が示されます。 たとえば、下の図では、99% のホットスポットとコールド スポットの大部分は、有意なホットスポットとコールド スポットでもあります (上下のバーがそれぞれほぼ青色と赤色になっている)。 ただし、最初の結果の有意でないフィーチャの中には、2 つ目の結果のコールド スポットよりも一致度の高いホット スポットが存在します (真ん中のバーは青色よりも赤色が多い)。 2 つのホット スポット結果のレイヤーが異なる時間に測定された温度を表している場合、これは測定時間の間の分析範囲全体の温度上昇を示すことになります。

ホット スポット 1 水準カテゴリ内のホット スポット 2 水準の個数バー チャート

空間 Fuzzy Kappa

ホット スポット結果のレイヤー間の関連性は Kappa 値によって測定されます。Kappa 値は、2 つの結果に依存性がない場合に予想される類似性の度合と比較して結果の類似性を定量化します。 特定のカテゴリの数が多いこととカテゴリの空間クラスタリングによって相似値が大きくなる可能性があります。 Kappa 値によってカテゴリ頻度と空間クラスタリングが補正され、ホット スポット結果レイヤー間の基になる関連性が正確に計測されます。

Kappa 値は、次の式に従って、相似値を予想相似値によってリスケールすることによって計算されます。

Kappa 式

ホット スポット結果レイヤー間に完全な類似性がある場合 (相似値が 1 に等しい)、Kappa 値も 1 に等しくなり、完全な関連性があることが示されます。 相似値が予想相似値と等しい場合、Kappa 値は 0 になり、結果は互いに関連性と依存性がないことが示されます。 相似値が予想相似値未満である場合、Kappa 値は負の値になり、ホット スポット結果間に負の関連性があることが示されます。

Kappa 統計量は当初、Likert スケール (Cohen 1960) を使用してラスターの一貫性と信頼性をテストするために開発されました。 最初のバージョンの Kappa 統計量はカテゴリの頻度を補正するものでしたが (一部の Likert レーティングは他よりも一般的)、各レーティングは依存性がないものと見なされていました。 2000 年代初頭に拡張され、カテゴリ ラスターを比較するためにカテゴリ類似性と距離類似性が採用されました (Hagen 2003, 235-249) (Hagen-Zanker, Straatman, and Uljee 2005, 769-785) (Hagen-Zanker 2009, 61-73) (Dou et. al. 2007, 726-734)。 ただし、これらの拡張は依然として、カテゴリは空間的にクラスター化しないことを前提としていましたが、このことはホット スポット分析結果やその他多くの空間カテゴリ変数には当てはまりません。 [ホット スポット分析の比較 (Hot Spot Analysis Comparison)] ツールは Kappa 統計量を、各ホット スポット結果内の有意水準カテゴリのクラスタリング (自己相関) を考慮した空間 Fuzzy Kappa 統計量に拡張しています。

相似値の計算

ホット スポット分析結果内の対応するフィーチャのペアごとにローカル相似値が算出されます。 グローバル相似値はすべてのローカル相似値の平均です。

対応するフィーチャそれぞれが同じ有意水準カテゴリ (または類似性加重によって組み合わされているカテゴリ) を持つ場合、フィーチャ ペアの相似値は 1 に等しくなります。 1 つ目の結果のすべての近傍の有意水準カテゴリが 2 つ目の結果のすべての近傍と完全に類似性がない場合 (たとえば、1 つ目の結果のすべてのホット スポットと 2 つ目の結果のすべてのコールド スポット)、相似値は 0 に等しくなります。 その他すべての状況では、相似値は 0 ~ 1 の範囲になります。

フィーチャの各ペアについて、2 つの方向性相似値を計算して 2 つのうちの小さい方が相似値になります。 1 つ目の方向性類似性は 1 つ目の結果から 2 つ目の結果への類似性であり、2 つ目の方向性類似性は 2 つ目の結果から 1 つ目の結果への類似性です。 個々の計算では、一方の結果のフィーチャのカテゴリを、もう一方の結果の対応するフィーチャおよびその各近傍と比較する必要があります。 対応するフィーチャと各近傍について、カテゴリ加重に距離加重が乗算され、最大の結果が方向性相似値となります。

たとえば、以下の図は 2 つのホット スポット結果 A および B を示しています。 A と B にはそれぞれ 3 つのフィーチャがあります: ホット スポット (赤色)、コールド スポット (青色)、有意でないフィーチャ (ライト グレー)。 最大ポリゴンは 1 つ目のフィーチャ ペア、最小ポリゴンは 2 つ目のフィーチャ ペア、中間ポリゴンは 3 つ目のフィーチャ ペアです。 ポリゴン間の近接性を容易に把握できるように、各ポリゴンの重心が示されています。1 つ目のポリゴンは 3 つ目のポリゴンよりも 2 つ目のポリゴンにやや近接しています。

類似性計算の例

この例では、対応するカテゴリ間 (ホット対ホット、コールド対コールド、有意でない対有意でない) のカテゴリ加重を 1、ホット スポットとコールド スポット間の加重を 0、有意でないフィーチャの加重はホット スポットとコールド スポットの両方で 1/2 であるものとします。

次の表に、結果 A から結果 B への方向性類似性のカテゴリ加重、距離加重、類似性を示します。 最後の列の相似値は、距離加重とカテゴリ加重を乗算することによって計算されています。

組み合わせ距離加重カテゴリ加重類似性

A1 から B1

1 (対応するフィーチャ)

0 (コールドからホット)

0

A1 から B2

2/3 (1 つ目の近傍)

1/2 (コールドから有意でない)

1/3 = 0.33

A1 から B3

1/3 (2 つ目の近傍)

1 (コールドからコールド)

1/3 = 0.33

結果 A から結果 B への最大の類似性は 0.33 であり、これは 2 つの近傍の組み合わせで生じます。 次の表に、結果 B から結果 A への方向性類似性を示します。

組み合わせ距離加重カテゴリ加重類似性

B1 から A1

1 (対応するフィーチャ)

0 (ホットからコールド)

0

B1 から A2

2/3 (1 つ目の近傍)

1 (ホットからホット)

2/3 = 0.67

B1 から A3

1/3 (2 つ目の近傍)

1/2 (ホットから有意でない)

1/6 = 0.17

結果 B から結果 A への最大の類似性は 0.67 です。

フィーチャ ペアのローカル相似値は 2 つの方向性類似性 (A から B と B から A) のうち小さい方の値であるため、1 つ目のフィーチャ ペアの相似値は 0.33 です。 同じ手順に従って 2 つ目と 3 つ目のフィーチャ ペアの相似値も計算し、この例ではどちらの相似値も 0.5 に等しくなります。 グローバル相似値はすべてのフィーチャ ペアの相似値の平均であり、この例では、グローバル相似値は 4/9 = 0.44 です。

有意でないフィーチャが除外された場合、その相似値は計算されず、それらはグローバル相似値の平均には含まれませんが、除外されないフィーチャの相似値を計算する際には引き続き近傍として使用されます。

注意:

この例では、組み合わせの数を減らすため、フィーチャ ペアと有意水準カテゴリがそれぞれ 3 つしかないホット スポット結果が使用されています。 ただし、このツールを使用するには少なくとも 20 個のフィーチャ ペアが必要であり、7 つすべての有意水準カテゴリ間にカテゴリ加重を割り当てる必要があります。

予想相似値の計算

各フィーチャについて、予想相似値の計算では相似値と同じ手順が使用されますが、1 つ目の結果のフィーチャは、対応するフィーチャではなく、2 つ目の結果のランダムなフィーチャとペアになります。

ランダムな近傍
1 つ目のホット スポット結果の各フィーチャが、2 つ目の結果の複数のフィーチャとランダムなペアになります。

ランダムな近傍と比較することで、予想値ではカテゴリの頻度 (より一般的なカテゴリがランダムに選択される可能性がより高くなる) と近傍内のカテゴリ クラスタリング (ランダムな近傍には有意水準カテゴリが類似するフィーチャのクラスターが含まれる可能性が高くなる) が考慮されます。 各ランダム ペアからの相似値は、2 つのホット スポット結果に依存性がないという仮定の下で推定される相似値です。 フィーチャの予想相似値を計算するには、1 つ目の結果の各フィーチャを多数のランダムな近傍とペアにし、ランダム相似値の平均を求めます。 [順列の数] パラメーターで、各フィーチャのランダム ペアの数を指定します。 順列の数が大きくなるにしたがい、ツールの実行時間が長くなり、予想相似値と Kappa 値の精度が高くなります。

グローバル予想相似値は、すべてのフィーチャ ペアの予想相似値の平均です。 有意でないフィーチャが除外された場合、除外されたフィーチャがランダムな近傍として選択されることはなくなり、その予想相似値は計算されませんが、ランダムに選択されたフィーチャの近傍として引き続き使用されます。

注意:

グローバル予想相似値は、2 つの結果の間に依存性がないという仮定の下で推定される、バイアスのない真のグローバル予想値です。 ただし、重複する近傍間の相関関係により、グローバル予想値の分散はグローバル相似値の分散と同じにはなりません。 つまり、グローバル相似値の従来のランクに基づいた順列 p 値はこの手順には有効ではありません。 有意性検定を支援するための手法の強化については、まだ盛んに研究が行われています。

ベスト プラクティスおよび制限

このツールを使用する場合、以下を考慮してください。

  • 比較を実行することで回答したい質問に基づいて、カテゴリ類似性加重を選択し、有意でないフィーチャを除外するかどうかを決定する必要があります。 ホット スポット結果間の類似性または関連性を最大化または最小化するためだけに値やオプションを選択してはなりません。 たとえば、カテゴリ類似性加重を使用して 99% ホット カテゴリと 90% コールド カテゴリを組み合わせることができますが、一方の結果の 99% ホット スポットがもう一方の結果の 90% コールド スポットと類似すると考えられる何らかの理由がない限り、比較によって質問への意味のある回答は得られません。 同様に、有意でないフィーチャを除外するかどうかは、有意でないエリアが調査対象のエリアであるかどうかによって判断する必要があります。
  • いずれかの入力ホット スポット結果レイヤーに重複するポリゴンが含まれている場合、重複するポリゴンの交差部分から新しいフィーチャが作成されます。 これにより、同一の有意水準カテゴリを持つ結果レイヤーでも類似性の値が 1 と等しくならないことがあります。 XY 許容値環境を使用して、ジオコーディング エラーなど、意図しない重複を取り除くことができます。 出力フィーチャのフィーチャ数を確認して、予想した数より多くの交差部分がないか調べることをお勧めします。
  • 2 つのホット スポット結果がサイズの異なるポリゴンである場合、交差部分で大きなポリゴンが多数の小さなポリゴンに分割されます。 これによって有意水準カテゴリの個数が変わり、類似性と関連性に影響が生じます。 このツールを使用するには、フィーチャの交差部分が 20 か所以上必要となります。
  • 入力ホット スポット結果の順序を変更しても、相似値は変化しませんが、順列のランダム性によって、予想される相似度と Kappa 値はわずかに変化します。 メッセージ テーブルとチャートの軸も逆になるため、場合によっては解釈しやすくなります。 メッセージとチャートには、1 つ目の結果のカテゴリ内の 2 つ目のホット スポット結果の有意水準カテゴリの個数が表示されるので、代わりに、入力レイヤーの順序を逆にして、2 つ目の結果のカテゴリ内の 1 つ目の結果のカテゴリを表示することもできます。

参考文献

Cohen, Jacob. 1960. "A coefficient of agreement for nominal scales." Educational and Psychological Measurement. 20:1, 37-46. https://doi.org/10.1177/001316446002000104.

Dou, Weibei, Yuan Ren, Qian Wu, Su Ruan, Yanping Chen, Daniel Bloyet, and Jean-Marc Constans. 2007. "Fuzzy kappa for the agreement measure of fuzzy classifications." Neurocomputing. 70, 726-734. https://dx.doi.org/10.1016/j.neucom.2006.10.007.

Hagen, Alex. 2003. "Fuzzy set approach to assessing similarity of categorical maps." International Journal of Geographical Information Science. 17:3, 235-249. https://doi.org/10.1080/13658810210157822.

Hagen-Zanker, Alex, Bas Straatman, and Inge Uljee. 2005. "Further developments of a fuzzy set map comparison approach." International Journal of Geographical Information Science. 19:7, 769-785. https://doi.org/10.1080/13658810500072137.

Hagen-Zanker, Alex. 2009 "An improved Fuzzy Kappa statistic that accounts for spatial autocorrelation." International Journal of Geographical Information Science. 23:1, 61-73. https://doi.org/10.1080/13658810802570317.

関連トピック