Moran の固有ベクトルの概要

空間統計ツールボックスの多くのツールでは、どのフィーチャが互いに隣接しているかを定義して、それぞれの近接フィーチャのペア間にウェイトを割り当てる近傍の定義 (空間リレーションシップのコンセプト) が必要です。 近接フィーチャと加重を使用して、すべてのフィーチャのペア間の空間リレーションシップを表す空間加重マトリックス (SWM) が定義されます。 N 個のフィーチャの場合、SWM は N 行と N 列 (正方行列) になります。行はペアの最初のフィーチャを表し、列はペアの 2 つ目のフィーチャを表し、行列内の対応する値はペア間の加重 (またはリレーションシップ) を表します。 たとえば、ポリゴン隣接の近傍を使用する場合、接続されている 2 つのポリゴンの対応するセルの値は 1 になり、接続されていない場合は値 0 になります。

任意の正方対称行列は、固有ベクトルと固有値に基づいて N 個の独立した (相関のない) コンポーネントに分解できます。各コンポーネントは、元の行列の独立した要素を表します (主成分分析が変数を相関のないコンポーネントに再構築する方法に似ています)。 これらのコンポーネントには元の行列のすべての情報が含まれていますが、再構築および分離されて個別に調査できるため、元の行列内に隠されているコア構造が明らかになることがよくあります。 行列が SWM の場合、これらの固有ベクトルは Moran の固有ベクトルと呼ばれ (空間コンポーネントとも呼ばれます)、フィーチャと SWM のコア空間パターンを表します。

それぞれの Moran の固有ベクトルは各フィーチャに数値を割り当て、通常は空間パターンを視覚化するためにマッピングおよびシンボル表示されるため、よく Moran 固有ベクトル マップ (MEM) とも呼ばれます。 最初のいくつかの MEM (固有値が最も大きく、パターンが最も強い) は通常、南北または東西のトレンドなどの広範囲にわたるグローバルな空間パターンに対応し、以降の MEM (固有値が小さく、パターンが弱い) は通常、よりローカルな空間パターンを表します。 たとえば、次の画像は、ポリゴン隣接を使用して SWM を定義した六角形のテッセレーションのさまざまな MEM を示しています。 上の行には、より広い空間パターンを表す最初の 4 つの MEM が表示され、下の行には、パターンがより局所的な後の 4 つの MEM が表示されています。

フィーチャと SWM が同じ 8 つの MEM

MEM の作成では、SWM とフィーチャの位置のみが使用され、フィーチャのフィールドや変数は使用されないことに注意してください。そのため、空間パターンは、その位置に存在する変数に対応しない場合があります。 代わりに、MEM は、組み合わせることで空間変数のさまざまな空間パターンを表すことができる潜在的な空間パターンを表します。 たとえば、フィーチャのフィールドに西から東への広いトレンドがあるが、低い値と高い値の小さなクラスターも含まれている場合、西から東へのトレンドを表す MEM とクラスターを表す MEM の 2 つを組み合わせることで、変数の空間パターンを表すことができます。 より複雑な空間変数の場合、その空間パターンを適切に表現するために、多くの異なる MEM が必要になる場合があります。

MEM は、空間変数の空間クラスタリング度 (自己相関) を計測する Moran's I 統計とも密接に関係しています。 最初の MEM は、Moran's I 値が最大 (空間的自己相関が最高) になるフィーチャの値セットです。 2 つ目の MEM は、値が最初の MEM の値と相関がない場合に、Moran's I 値が最大になる値セットです。 3 つ目の MEM は、最初の 2 つの MEM のそれぞれと相関がない場合に、Moran's I 値が最大になる値セットです。 N 個のフィーチャに対して最大 N 個の MEM を作成できますが、通常、有用な空間パターンを表すのは MEM の 25% 未満です。

最初の MEM の Moran's I 値は、フィーチャの任意のフィールドで最大の Moran's I 値を表します。 つまり、1 つのフィーチャで 1 つの値が変化した場合、Moran's I 値は減少し、変数のクラスタリング度は低下します。 これにより、実際のデータの Moran's I 値にコンテキストを与えることができます。 よくある誤解は、任意のデータセットおよび SWM で最大の Moran's I 値は 1 に等しいというものです。しかし、多くの場合、最大の Moran's I 値は、フィーチャと SWM に応じて、1 よりも大幅に小さくなります (多くの場合、0.6 程度に低くなります)。 最大の Moran's I が 1 より大きい場合もありますが、これは一般的ではありません。 たとえば、データのフィールドの Moran's I 値が 0.65 の場合、最大値が 1 と等しいと考えると、この値はそれほど高い値でないと思われますが、最初の MEM の Moran's I 値が 0.7 と等しい場合、そのフィールドの SWM の空間的自己相関がほぼ最高であることを意味します。 これは、一部の SWM が他よりも大幅に大きな Moran's I 値を持つ可能性があるため、解析に適切な SWM を選択する際にも役立ちます。

空間解析における MEM の使用

空間分析において MEM は多種多様な用途があり、空間コンポーネント ユーティリティ (Moran の固有ベクトル) ツールセットのツールは、さまざまな方法で MEM を作成および使用します。

  • [空間構造の分解 (Decompose Spatial Structure (Moran Eigenvectors))] - 入力フィーチャクラスと SWM に対して最高の Moran's I 値を持つ MEM のセットを作成します。 入力はフィーチャクラスであり、SWM は近傍パラメーターを通じて定義されます。 また、相対的な Moran's I の閾値と MEM の最大数を指定することで、作成される MEM の数を制御することもできます。 出力は、MEM がフィールドとして加えられた、入力と同じフィーチャを持つフィーチャクラスです。 ツールによって作成された MEM をマッピングして、SWM のさまざまな空間パターンを視覚化したり、SWM のフィーチャの任意のフィールドの最大 Moran I 値を評価したりできます。

  • [近隣のコンセプトを比較 (Compare Neighborhood Conceptualizations)] - フィーチャクラスの 1 つ以上のフィールドの空間パターンを最も正確に表現する近傍と加重方式を提示します。 入力はフィーチャクラスと 1 つ以上のフィールドで、出力は SWM ファイルです。このファイルは、カスタム SWM ファイルを使用して近傍と加重を定義できる空間統計ツールボックスの他のツール ([2 変数空間的関連性 (Bivariate Spatial Association (Lee'sL))][ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))][クラスター/外れ値分析 (Cluster and Outlier Analysis (Anselin Local Moran's I))] ツールなど) に使用できます。 このツールは、どの SWM が入力フィールドの空間パターンに最も近い MEM を作成するかを判定することで、推奨される SWM を決定します。

  • [空間コンポーネントの説明変数を作成 (Create Spatial Component Explanatory Variables)] - 入力フィーチャクラスの複数のフィールドの空間パターンを最もよく表現または説明する MEM のセットを作成して選択します。 これは、モデル (最小二乗回帰モデルなど) を作成し、変数の空間パターンを考慮する際に役立ちます。 ツールでフィーチャクラスとすべての変数 (説明変数と従属変数) を指定すると、入力フィールドの空間パターンの表現に役立つ MEM が作成されます。 これらの MEM を (元の説明変数に加えて) 説明変数として予測モデルに含めると、通常、モデルが改善され、元の説明変数の係数の推定値が近くなり、変数の空間パターンを考慮することで予測の精度が向上します。

  • [フィールドから空間的自己相関分析をフィルター (Filter Spatial Autocorrelation From Field)] - 入力フィールドから自己相関を適切に除去し、入力フィールドを空間的にフィルターしたバージョンを生成する MEM のセットを作成して選択します。 入力フィールドは、空間コンポーネント (MEM) と非空間コンポーネント (入力フィールドを空間的にフィルターしたバージョン) に分けられます。 フィルターされたフィールドは、トレンドやクラスターなどの空間的効果を取り除きながら、フィールドのコア統計的特性を維持します。 フィルターされたフィールドは、空間の影響が不要でフィールドの基の信号にノイズを追加してしまう相関ワークフローや他の解析で使用できます。 たとえば、汚染と気管支喘息の割合の相関を、それらの変数に関連する空間的影響を取り除きながら推定して、2 つの変数間の直接相関やリレーションシップを分離することができます。 入力フィールドが予測モデルの残差フィールドである場合、選択した MEM を (元の説明変数に加えて) 予測モデルの説明変数として使用して、モデルの残差項から空間的自己相関を除去することができます。 これは、多くの予測モデルでは残差が空間的に自己相関していないと想定しているため便利です。

参考情報

MEM は、正の空間的自己相関がある場合にのみ作成または選択されます。つまり、パターンは、分散パターンではなく空間クラスターを表します。

作成される MEM の数は、入力フィーチャ数の 25% と等しく、最大で 100 です。 [空間コンポーネントの説明変数を作成 (Create Spatial Component Explanatory Variables)] および [フィールドから空間的自己相関分析をフィルター (Filter Spatial Autocorrelation From Field)] ツールはそれぞれ、最も効果的に説明変数を作成するため、および空間的自己相関をフィルターグするために、これらの MEM から選択します。

[空間構造の分解 (Decompose Spatial Structure (Moran Eigenvectors))] ツール (1 つの指定した近傍と加重方式を使用) を除き、ツールは 28 個の異なる SWM をテストし、ツールの目的に最も効果的な MEM を作成するものを使用します。 次の SWM がテストされます。

  • 5 つの距離バンド。それぞれに、加重なし、Gaussian、Bisquare カーネルがあります (合計 15)。 最短距離バンドは、各フィーチャに対して少なくとも 1 つの近傍フィーチャがある距離です。 最長距離バンドは、入力フィーチャの対角範囲の 20 パーセントです。 他の 3 つの距離バンドは、最短距離バンドと最長距離バンドの間で均等に増加することで作成されます。 ポリゴン フィーチャの場合、重心間の距離を使用して距離と近傍が求められます。
  • 4 つの異なる近傍数 (8、16、32、64)。それぞれに、加重なし、Gaussian、Bisquare カーネルがあります (合計 12)。 バンド幅は適応型で、K 個の近傍の場合、(K+1) 番目の近傍までの距離に等しくなります。 入力フィーチャの数が K 未満の場合は、それより多くい近傍はスキップされます。 たとえば、入力フィーチャが 50 個ある場合、64 個の近傍を使用する 3 つの SWM はスキップされます。 ポリゴン フィーチャの場合、重心間の距離を使用して距離と近傍が求められます。
  • ポイント フィーチャの場合、最終的な SWM はドロネー三角形分割の近傍です。 ポリゴン フィーチャの場合、最終的な SWM は隣接 (エッジおよびコーナー) 近傍です。

それぞれの近傍とカーネルの加重の詳細については、「近傍要約統計量 (Neighborhood Summary Statistics) の詳細」および「空間関係のモデリング」をご参照ください。 または、[入力空間加重マトリックス ファイル] パラメーターで、カスタム .swm ファイルを指定することもできます。 指定した場合、.swm ファイルを使用して MEM が作成および選択され、上記の 28 個の SWM はテストされません。

MEM を計算する前に、各 SWM は、すべての行と列の合計が 0 になるように調整されます (二重中心化と呼ばれます)。 SWM が対称でない場合 (近傍数近傍を使用する場合など)、SWM は二重中心化の前にその転置に追加されて対称になります。

参考文献

このツールの実装には以下の参考文献が用いられています。

  • Bauman, David, Thomas Drouet, Stéphane Dray, and Jason Vleminckx. 2018. "Disentangling good from bad practices in the selection of spatial or phylogenetic eigenvectors." Ecography 41.10: 1638-1649. https://doi.org/10.1111/ecog.03380.

  • Bauman, David, Thomas Drouet, Marie-Josée Fortin, and Stéphane Dray. 2018. "Optimizing the choice of a spatial weighting matrix in eigenvector-based methods." Ecology 99, no. 10: 2159-2166. https://doi.org/10.1002/ecy.2469.

  • Blanchet, F. Guillaume, Pierre Legendre, and Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.

  • Dray, Stéphane, David Bauman, Guillaume Blanchet, Daniel Borcard, Sylvie Clappe, Guillaume Guenard, Thibaut Jombart, Guillaume Larocque, Pierre Legendre, Naima Madi, and Helene H. Wagner. 2022. "adespatial: Multivariate Multiscale Spatial Analysis." R package version 0.3-16. https://CRAN.R-project.org/package=adespatial.

  • Griffith, Daniel A. 2003. "Spatial Autocorrelation and Spatial Filtering." Advances in Spatial Science. Springer. ISBN 978-3-540-24806-4. https://doi.org/10.1007/978-3-540-24806-4.

  • Griffith, Daniel A., and Pedro R. Peres-Neto. 2006. "Spatial modeling in ecology: the flexibility of eigenfunction spatial analyses." Ecology 87, no. 10: 2603-2613. https://doi.org/10.1890/0012-9658(2006)87[2603:SMIETF]2.0.CO;2.

関連トピック