値のパーセンタイル コンター の仕組み

Spatial Analyst のライセンスで利用可能。

[値のパーセンタイル コンター (Value Percentile Contours)] ツールは、ラスター値に基づいてマップの上位 (または下位) p パーセントを囲むポリゴンを生成します。 ツールでは、固定値を最初に選択する代わりに、少なくとも定義されたパーセンタイルの有効セルがその値以上になるようなパーセンタイル閾値が決定されます。 パーセンタイル p における各出力ポリゴンは、p 番目のパーセンタイル以上の値を含むエリアです。 複数のパーセンタイルが指定された場合、出力ポリゴンは入れ子になります。 最も内側の (最小) ポリゴンは最高値に対応し、最も外側の (最大) ポリゴンはより広い範囲をカバーします。 ポリゴン形状の面積は、その極端なバンドに含まれる地表の広さを示します。

使用する状況

範囲に関する問題、たとえば最高値がエリアの p パーセントを占める場所の特定などに、[値のパーセンタイル コンター (Value Percentile Contours)] ツールを使用します。 次に、例を示します。

  • 地表面温度の上位 10 パーセントの特定
  • 医療施設にアクセスできるエリアの下位 20 パーセントの特定
  • 犯罪発生密度の上位 5 パーセントのフットプリントの特定
  • 騒音ホットスポットの上位 1 パーセントの特定

総値 × エリアの p パーセント (たとえば、全インシデントの 50 パーセント) を保持する領域の広さを求める場合、[ボリュームのパーセンタイル コンター (Volume Percentile Contours)] ツールを使用することをおすすめします。

他のコンター ツールとの比較

[コンター (Contour)] ツールおよび [コンター リスト (Contour List)] ツールは、指定した数値間隔で等値線を作成します。 これらのツールは、抽出したい正確な値が分かっている場合に特に役立ちます。

これらのツールと比較すると、[値のパーセンタイル コンター (Value Percentile Contours)] ツールは、ラスター値の順位に基づいてポリゴン コンターを作成します。

特性[コンター (Contour)] ツール[コンター リスト (Contour List)] ツール[値のパーセンタイル コンター (Value Percentile Contours)] ツール[ボリュームのパーセンタイル コンター (Volume Percentile Contours)] ツール

指定した内容:

固定の間隔または基準 (等間隔)

固定の値リスト (不等間隔)

1 つ以上のパーセンタイル値

1 つ以上のパーセンタイル値

出力(O):

ポリゴンまたはポリラインの出力

ポリライン出力

セルの p% を囲む

総体積の p% を囲む

パーセンタイルの考慮事項:

いいえ

いいえ

はい

はい

強度 (体積) の考慮事項:

いいえ

いいえ

いいえ

はい

出力ジオメトリー:

ポリラインおよびポリゴン

ポリライン

ポリゴン

ポリゴン

複数値の入力:

はい (間隔を使用する多数のライン)

はい (リストを使用する多数のライン)

はい (複数パーセンタイル入力)

はい (複数パーセンタイル入力)

等間隔または不等間隔:

規則的 (間隔)

不規則 (明示リスト)

不規則

不規則

ネスト (オーバーラップ) 動作:

N/A

N/A

ネストしたポリゴン

ネストしたポリゴン

面積単位の出力:

ラスターと同じ

該当なし

平面マップ単位2 または測地線 m2

平面マップ単位2 または測地線 m2

主な質問に対する回答:

この間隔でこれらの値の等値線を表示

指定されたこれらの値の等値線を表示

値によるエリアの上位 p% はどこか

総量の p% が集中しているのはどこか

重要な概念

このツールの基本概念は、値からパーセンタイル (閾値) を計算し、対応するデータの部分を出力ポリゴン レイヤーとして表示することです。 すべての有効セルを最小から最大まで並べると想像してください。 セルの p パーセントに達するまで順にたどり、その位置にある値がパーセンタイル閾値となります。 出力ポリゴンには、その閾値を超えるすべての値が含まれ、極端な値が示されます。

パーセンタイル計算は順位に基づいて行われるため、負の値も使用されます。 ただし、[負の値を無視] パラメーターを使用すると、パーセンタイル計算から負の値を除外できます。

入力サーフェス ラスターでは同一の値を持つセルが複数含まれる場合があります。 そのような場合、p パーセントを正確に満たす単一のセルは存在しません。 ツールには、その値に該当するすべてのセルが含まれます。 ツールでは、閾値における同じ値のバンド全体が対象となるため、出力コンター ポリゴンは p パーセントよりわずかに大きくなる場合があります。 また、2 つのパーセンタイル値が同じ値となる場合、同一の閾値が生成され、結果として同じ出力コンター ポリゴンが作成されます。

ワークフローの例

次に、さまざまなシナリオにおいて出力値の取得方法を示した例を挙げます。

正の値のみを含む入力

この例は、入力がすべて正の値の場合に出力値がどのように決定されるかを示しています。

9 つのセルを持つラスターがあり、各セルの面積は Ai=1 だとします。 ラスター値は以下のとおりです:

行 1:

8

2

1

行 2:

5

4

3

行 3:

7

6

0

値のリストは {8, 2, 1, 5, 4, 3, 7, 6, 0} です。

値を昇順に並べ替えると、リストは {0, 1, 2, 3, 4, 5, 6, 7, 8} となります。

この値リストから 75 番目のパーセンタイル値を計算すると、閾値は次のようになります。

p75 = 75 / 100 * 9 = 6.75

この値を整数値に四捨五入すると 7 になります。 ランク付けされたリストの 7 番目の値は 6 です。 したがって、6 以上の値はすべて出力値のパーセンタイル コンター ポリゴンに含まれます。

正の入力値を使用した値のパーセンタイル コンター計算例

正と負の両方の値を含む入力

すべてのラスター サーフェス値が一意であるが、すべてが正の値ではない別のシナリオについて考えてみましょう。

正と負の両方の値を持つ 9 つのセルを持つラスターがあるとします。 ラスター値は以下のとおりです:

行 1:

-8

2

1

行 2:

5

-4

3

行 3:

7

-2

0

値を昇順に並べ替えると、リストは {-8, -4, -3, -2, 0, 1, 2, 5, 7} となります。

この場合、ランク付けされたリストの 7 番目の値は 2 です。 したがって、2 以上の値はすべて出力値のパーセンタイル コンター ポリゴンに含まれます。

正と負の入力値を使用した値のパーセンタイル コンター計算例

繰り返された値を持つ入力

複数のセルが同じ値を持つ別のシナリオを考えてみましょう。 この場合、繰り返された値はすべて選択されます。

9 つのセルを持つラスターがあるとします。その値は次のとおりです:

行 1:

8

3

1

行 2:

5

5

6

行 3:

7

6

4

値を昇順に並べ替えると、リストは {1, 3, 4, 5, 5, 6, 6, 7, 8} となります。

この場合、ランク付けされたリストの 7 番目の値は 6 です。 ただし、6 は繰り返された値であり、リストの 6 番目の値でもあります。 ツールでは、両方の値が選択されます。 その結果、出力ポリゴンのフットプリントは大きくなりますが、正しいパーセンテージがレポートされます。

繰り返された値を含む入力値を使用した値のパーセンタイル コンター計算例

適用例

このツールには次のような適用例があります:

  • 地表面温度ラスターから 90 番目のパーセンタイル以上の温度値を抽出し、任意の分類をせずに高温セルを特定します。
  • 犯罪発生密度ラスターから 90 番目のパーセンタイルまたは 95 番目のパーセンタイルの密度値をレポートします。これにより、地区全体で一貫したホット スポットを特定し、それに応じてパトロール資源を配分します。
  • 大気質指標ラスターを使用し、固定されたグローバル基準ではなく、90 〜95 番目のパーセンタイルといった経験的パーセンタイルで健康警告クラスを設定して地域的なランク付けを行います。
  • 交通機関の移動時間サーフェスから 80 番目のパーセンタイルの移動時間を算出します。 それを超えるものは、長時間または不公平なアクセスとしてフラグを設定することができます。

参考資料

詳細については、次をご参照ください:

Hyndman, R. J., & Fan, Y. (1996). "Sample Quantiles in Statistical Packages." The American Statistician, 50(4), 361–365. https://doi.org/10.1080/00031305.1996.10473566.

関連トピック