2008年10月30日木曜日

統計的仮説検定廃止論

理系の人であれば必ず習うものに、統計的仮説検定なるものがあります。何らかの仮説に対して、白黒をつけるための統計的な方法論です。もうそろそろお役目御免なのではないかと思っています。じつは、最近また「Business Statistics」という授業で、仮説検定やら回帰分析やらを一通りレビューして、やっぱり、仮説検定は使いづらいと思うのです。

その昔、今のMBAに入学する前、工学系の大学院にいた頃は、企業やベンチャー企業と協働で、データマイニングといった大規模なデータ解析をしていた頃もそんな問題意識をもっていたのをふと思い出します。

なぜそう思うのかというと、まず、第一に、ロジックが分かりにくい、ということです。たとえば、ある集団の平均年齢に関する仮説を議論しているとしましょう。統計的仮説検定では、こういう問題意識をもつことが出発点になります。

「平均年齢は25歳ではないのではないか?」

その問題意識のもと、仮に真実の平均年齢が25歳だとして、今手元にあるデータと照らし合わせ、どれだけありえそうかという確率を計算しにいくのです。もし、その確率が低ければ、

「平均年齢は25歳ではない」

という結論が得られることになります。

逆に、もし、その確率があまり低くなければ、「平均年齢は25歳ではないとはいえない」という何とも歯切れの悪い結論になるわけです。

これが仮説検定の論法なのですが、なんというか、わかりにくくありません?

もうひとつ、この論法には、弱点、もっといえば、致命的な欠陥があるのです。上の議論で、真実の平均年齢が25歳だとするという前提を置いているわけですが、この前提が正しいことはほとんどありえません、というかありえないでしょう。真実の平均年齢がぴったり、寸分たがわず、25.000000000000000000000000000000000000000000....になるなんてほとんど、もっと強くいえば絶対にないからです。

ですので、そもそも絶対に正しくない仮説をおいて、それが正しい、正しくないを判断しにいくというなんとも、ロジックが破たんしている議論をすることになるわけです。実際、統計のデータ分析で、サンプル数をあげていけば、すなわち、精度をあげていけば、必ず、「平均年齢は25歳ではない」という結論が得られるようになります。

そもそも、この仮説検定の枠組みが構築されたのは、コンピュータもない、ただただ手計算でデータ処理をする時代にうまれたもの。サンプル数もたかだ20-30個の時代の理論ということを考えれば、やはり時代錯誤的な論法ということになるでしょう。今ですと、サンプル数が平気で数千、数万、もっと多い場合もざらにありますから。

ではどうすればいいのか?

統計には、仮説検定論とは別に、推定論というのがあります。私は、仮説検定はさっさとやめてしまって、その中の区間推定だけでいいのではないかと思っています。区間推定とは、手元にあるデータからすると、「95%の確度で、平均年齢は、24歳~26歳の間にあるといえます」、という主張を導き出す方法です。こちらの方が100倍素直な感じがすると思いますし、ビジネスにも応用がききやすいと思います。

そうはいっても、統計的仮説検定は、今でも世界中の大学で教えられているし、MBAのような学位でも、必ず教えられる、まさにユニバーサルな方法論になっているので、なんとも不思議な感じがします。

要は、統計の理論が構築されたころに比べて、データの入手方法、分析の方法、解析の方法もろもろが変化し、結果として、ビジネスからの要請も大きく様変わりしている中、アカデミックサイドがこたえ切れていない、ひとつの学問分野だと思っています。

0 件のコメント: