考古学のための統計処理その6_ヒストグラム編 |
分布の形を可視化する最善の方法はヒストグラムを描くことです。
刀身長の分布
前回の散布図編で使用したのと同じ古代の刀剣のデータ(恵庭市西島松5遺跡出土の刀剣類)を使用します。
私たちには予備知識として、刀剣には刀子のようなマキリ状の小さなもの、刃渡り30cm前後の短刀、刃渡り60cmを超えるような太刀があることを知っていますが、そうした予備知識をいったん忘れてデータを観察します。
刀身長の分布は15cm、23cm、40cmあたりに峰をもつ3峰分布となっているようです。
刀子、短刀、短めの太刀に相当する刀身長の分化があると推測できます。
ここではこれ以上踏み込みませんが、「分布の形はヒストグラム」というのが鉄則です。
散布図ではだめなのか?
2変量が用意できる場合は散布図で比較することも可能と思われるかもしれません。
実際、考古学の論文や発掘調査報告書を読むと、分布の可視化に散布図を用いているケースが非常に多いと感じます。
下の図は、刀身長と刀身元幅の散布図です。
この図が間違いとは言いませんが、ヒストグラムと比較して、分布の形がわかりやすいと言えるでしょうか?
下の散布図から分布に関して何らかの結論を出すのは「結論有りき」と批判されてもやむを得ないと思います。
なぜヒストグラムなのか?
ヒストグラムのもう一つの利点は、分布の形状を数的モデルに近似して比較できることです。
下の図は正規曲線を重ねた刀身長のヒストグラムです。
正規化しているので、Y軸は密度になっていますが、分布の形は変化しません。
これは、散布図では絶対に表現できません。
上記のヒストグラムから、私たちは確信をもって、古代の刀剣は複数のサイズ規範があり、それは15cm前後、23cm前後、40cm前後と推測できる、と主張できます。
なぜヒストグラムは(考古学で)使われないか
ヒストグラムのもつ「数的モデルとの近似が容易である」という特性を考古学の研究者が活かせていない、ということが考えられます。
正規分布とは何か、正規分布で近似できるということはどのような意味をもつのか、そのような判断が難しいのだろうと思います。
エクセルでヒストグラム
考古学でヒストグラムがあまり使われない最大の理由は、意外にも「エクセルでヒストグラムを作りにくい」ということかもしれません。
エクセルでヒストグラムを作れないわけではないのですが、度数分布表を作成してから棒グラフとして作成するので、一手間かかります。
ビン幅の調整をするにも、いちいち度数分布表を作り直さないといけない、というのも面倒です。
こうした理由でヒストグラムが敬遠されるのかな、と思いますが、そうだとすればちょっと残念な話です。
この 記事 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。