考古学のための統計処理その7_データの形に応じたグラフの選択 |
連続量と離散量
「データの形」を考える前に連続量と離散量について解説します。
連続量は土器の口径とか底径のような数値で表される属性です。
これに対して離散量は「カテゴリカル変数」とも呼ばれますが、「分類」のことです。
遺跡、型式、器種などがこれに相当します。
連続量と離散量の組み合わせによって可視化の手法が決まります。
連続量のみ=ヒストグラム
連続量のみの1変量の場合はヒストグラム一択です。
後に紹介するように連続量と離散量の組み合わせや連続量が2変量以上ある場合は、一気に箱ひげ図や散布図を作りたくなりますが、まずは1変量ずつヒストグラムを作成して分布の形を確認する癖をつける必要があります。
離散量のみ=棒グラフ
土器型式ごとに分類された土器の破片数や遺跡ごとに集計された遺物のデータなどがこれに該当します。
連続量と離散量=箱ひげ図
連続量の分布の形を離散量ごとに比較します。
土器型式ごとの口径の分布を比較するような場合です。
以前の記事では、(1)ファセットされた棒グラフ、(2)密度図、(3)箱ひげ図を紹介しましたが、わかりやすさでは箱ひげ図に軍配が上がりそうです。
この形のデータはまず箱ひげ図を描画することを考えるべきです。
箱ひげ図はエクセルなどで作成することはできないのですが、中央値、四分位値、95%値などが算出できれば手書きでも作成できるので、作成の難易度も低いという利点があります。
離散量と離散量=構成比棒グラフ
遺跡ごとの土器型式の比率や土器型式ごとの器種の比率を調べるケースです。
この場合、2つの方法が考えられます。
(1)構成比棒グラフ
まずはこの方法で可視化することを考えるべきです。
塗りつぶしに使用する変数を適切に統合して見やすくする工夫などが必要になりますが、そのような統合を行いたくない場合には次の方法を検討します。
(2)遺跡ごとにファセットした棒グラフ
連続量と連続量=散布図
散布図一択になります。
散布図は連続変数の因果関係を可視化することが目的となります。
Y軸に結果を示すと思われる変数、X軸に原因を示すと思われる変数をあてはめます。
まとめ
- 連続量のみ=ヒストグラム
- 離散量のみ=棒グラフ
- 連続量と離散量=箱ひげ図
- 離散量と離散量=構成比棒グラフ
- 連続量と連続量=散布図
この 記事 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。