佐藤郁郎「私説・統計学(非正規分布統計学のすすめ)」。

統計解析とは基準値からのずれを本物とみなすべきか,統計的誤差範囲内とみなすべきかを客観的な基準によって判定する方法ですが,それに数値解析(ノイズによって歪められた情報の中からシグナルを検出する方法)の技法を組み合わせることによって,母集団分布が正規分布とならない場合においても精度保証が可能になります.これによって,データ解析の基盤をさらに拡大させることができます.
(中略)
正規分布確率密度関数は複雑そうに見えますが,一般的な誤差の分布関数として導かれたものであって,自然界において普遍的な分布とされています.また,母集団分布が正規分布でなくても標本が大きくなると標本平均値の分布は次第に正規分布に近づく(中心極限定理)や正規分布をする変数どうしの和と差はまた正規分布になる(再生性)など,非常に扱いやすい性質をもっています.
(中略)
それでは「正規分布でなく,しかも分布形が違うときに,位置やバラツキ,形の違いを検出できる方法はないだろうか?」という問題が提起させるのは自然な成り行きでしょう.
 このような状況に遭遇したとき,個人個人の性格がズバリ現れます.それは性格というよりもデータ解析に対するフィロソフィーといってもよいのですが,厳密に考えようとするひと,前提条件を無視して旧来の方法を無理矢理適用するひと,何も考えないひと・・

http://www.geocities.jp/ikuro_kotaro/koramu/toukei3.htm

この短い文章に、カネゴンの知りたかったことがぎっしり詰まっている。

  • 統計解析の本質とは、ずばり「基準値からのずれを本物とみなすべきか,統計的誤差範囲内とみなすべきかを客観的な基準によって判定する方法」なのだということ
  • 母集団分布が正規分布とならない場合があるということ
  • 正規分布は、それが事実であるから採用されているのではなく、さまざまな分布のうちで何かと扱いやすい性質を持っているから採用されているのだということ。
  • 統計の基準は客観的であっても、統計というツールを扱う肝心な人間の側にものすごいばらつきがあるということ。

その人間側の扱いのばらつきがこれまた正規分布していなかったりしたらどうしよう。

カネゴンが以前から疑問に思っていたにもかかわらず恥ずかしくて誰にも尋ねられなかったのが【いい年こいておれカネゴン】、「誰も実際には調べきれていないはずの母集団の分布が、どうして正規分布しているとわかるのか」ということだった。
対象データの量が多すぎたりデータをもれなく調べるのが極端に困難だったりするからこそ、統計という手段で部分から全体(母集団)を推測するしかないはずなのだけど【葦の髄からおれカネゴン】、カネゴンがこれまで見てきた統計の教科書では分布はもう正規しかありえないような感じで書かれていて、母集団が実は正規分布でなかったら便所に行って泣くしかないのだろうかとカネゴン不安で先に進めなかった。いずれにしろ統計という手法はまだまだ発展途上であることを痛感【止まった発展おれカネゴン】。