ヒストグラムでは、特定の値がデータセット内に表示される頻度を計測して、連続数値変数の分布を視覚的に集約します。ヒストグラムの X 軸は、数値範囲 (ビン) に分割された数値ラインです。ビンごとにバーが描画され、バーの幅はビンの範囲を表し、バーの高さはその範囲内にあるデータ ポイントの数を表します。データの分布を理解することは、データ探索プロセスにおける重要な足掛かりになります。
変数
ヒストグラムでは、X 軸上に 1 つの連続 [数値] 変数が必要です。
変換
解析手法には、データが正規分布していることを必要とするものもあります。データが偏っている (分布が不均衡) 場合は、データを変換して、正規化できます。ヒストグラムを使用すると、データ分布で対数変換や平方根変換の効果を探索できます。参考までに、[チャート プロパティ] ウィンドウの [正規分布の表示] チェックボックスをオンにすると、正規分布オーバーレイをヒストグラムに追加できます。
対数変換
対数変換は、データの分布が正に偏り、非常に大きい値がいくつかある場合によく使用されます。これらの大きな値がデータセット内にある場合、対数変換は、分散をより一定にし、データを正規化するのに役立ちます。
たとえば、左側にある正に偏った分布は、右側のチャートで対数変換を使用して正規分布に変換されます。
メモ:
対数変換は、0 より大きい数値にのみ適用できます。
平方根変換
平方根変換は、データセットの右の歪度を減らした対数変換に似ています。対数変換とは異なり、平方根変換は 0 に適用できます。
メモ:
平方根変換は、0 以上の数値にのみ適用できます。
ビン
ビンは、デフォルトでデータセット内のレコード数の平方根に設定されています。この値を調整するには、[チャート プロパティ] ウィンドウの [データ] タブで [ビン] を変更します。クラスを変更すると、データの構造の詳細または概要を確認できます。
統計情報
いくつかの記述統計が計算され、ヒストグラムの縦線として表示されます。平均値と中央値はそれぞれ 1 つのラインで表示され、平均値を上回る標準偏差と平均値を下回る標準偏差は 2 つのラインで表示されます。チャートの凡例に含まれるこれらのアイテムをクリックして、オン/オフを切り替えることができます。
[統計] テーブルは [チャート プロパティ] ウィンドウの [データ] タブに表示されます。ここには、選択された数値フィールドの次の統計が含まれます。
- 平均値
- 中央値
- 標準偏差
- 個数
- 最小値
- 最大値
- 合計値
- Null
- 歪度
- 尖度
チャートのソース レイヤーに選択セットがある場合、統計テーブルには完全なデータセットの統計情報を表示する列と、1 つの選択セットの統計情報のみを表示する列が含まれます。
統計テーブルには、ヒストグラムの平均値、中央値、標準偏差のラインのオンとオフを切り替えたり、色を変更したりするためのコントロールも含まれます。
統計テーブルを右クリックし、クリップボードへの [テーブルのコピー]、[行のコピー]、[値のコピー] を行うコマンドを選択できます。この操作により、[チャート プロパティ] ウィンドウの統計情報をコピーし、他のウィンドウやアプリケーションに貼り付けることができます。
軸
Y 軸範囲
デフォルトの Y 軸範囲は、Y 軸上に表示されるデータ値の範囲に基づいて設定されます。これらの値をカスタマイズするには、新しい目的の軸範囲値を入力します。軸の範囲を設定すると、チャートの縮尺を一定に保つことができ、値を比較する際に役立ちます。リセット アイコンをクリックすると、軸範囲がデフォルト値に戻ります。
数値形式
数値形式のカテゴリを指定するか、カスタム形式の文字列を定義して、軸が数値を表示する方法を書式設定できます。たとえば、「$#,###」は通貨の値を表示するカスタム形式の文字列として使用できます。
表示設定
タイトルと説明
チャートおよび軸には、変数名およびチャート タイプに基づいてデフォルトのタイトルが与えられます。これらのタイトルは、[チャート プロパティ] ウィンドウの [一般] タブで編集できます。[説明] にチャートの説明 ([チャート] ウィンドウの下部に表示される一連のテキスト) を入力することもできます。
色
[チャート プロパティ] ウィンドウの [データ] タブの [ビン] の横にあるカラー パッチを使用し、ヒストグラムのビンの色を変更できます。
ガイド
参照または重要な値をハイライト表示する方法として、ガイドのラインまたは範囲を追加できます。新しいガイドを追加するには、[チャート プロパティ] ウィンドウの [ガイド] タブで、[ガイドの追加] をクリックします。ラインを描画するには、ラインを描画したい [値] を入力します。範囲を作成するには、幅の値を入力します。[ラベル] を指定して、ガイドにテキストを追加することもできます。
例
ワシントン D.C. の国勢調査ブロック グループ全体での人口密度の分布を視覚化するヒストグラムを作成します。
- 数値 - 人口密度