2015年12月1日火曜日

統計学者たちのP値の解釈について

有名なことらしい。
Soberさんも描いてるけど、いくつかの学派にわかれて悪口ばっかり言い合っていて、
学会もジャーナルも別に立てるようになっている。

これを(自らも統計学者である)Bergerさんは3つのグループにみたてて、
それぞれ頻度主義者(ネイマン)、ベイズ主義者(ジェフリーズ)とフィッシャリアン(フィッシャー)に分けた。

めんどくさいのは、それぞれの人々がいろんなことにかかわっていて、
それぞれの人々の思想はそんなに単純でなくて、
それぞれにからみ合っていそうだということ。

扱う問題も多岐にわたってるし。

ここでは単純な検定についてに限っておきます。

かれらはたとえばt検定の方法については一致している。
そして、たとえば2σずつのプラマイのなかに95%くらいが入るってことでも一致している。

何が違うっていうとそのP値の説明、物理的な説明について。


なんでこうも違っているのか。

私はこう想像しています。
彼らは、扱ってたデータが違ってた。

ネイマンたちのは、産業界からの要請があってやってた。
たとえば毎日ネジをつくっていて、それから抜き取りチェックをして、
サイズが変わってきたかどうか(製品を出荷していいかどうか
機械を更新せねばならないかどうか)が知りたかった。
ネジには誤差がある。
サンプルの過程で、ちょっと偏ったものを拾うことがありえる。
しかしロットを破棄すればお金がかかる。
だから、ある確率以下に、そうした事故を保っておきたい。

フィッシャーは実験結果に信頼をおいていいかどうか、
観測された違いが確かなのかをチェックしたかった。
もちろん肥料のやりかたを変えれば収量は変わってしかるべき。
しかし実験には誤差がつきもの。
はたして再現が得られているか、ただの誤差の範囲なのかを客観的にみる必要がある。

ジェフリーズは(彼のはよく知らないながらですが)、
データが日々追加されてくるなかで、明日どう行動すればいいのかを知りたかった。
もっとも有利なのはどんな解釈だ?

というわけで、データの使いみちが違う。データも違う。だから解釈が違う。
ってことじゃないかと。

これは数学でいったら、哲学とか、公理に近い考え方のちがい。
公理は認めることになってるから、そこで違いがでたときにどう議論したらいいのか、
数学者は慣れてない。

でつい、ローブローをふくむ、すごくみっともないケンカになっちゃってるんじゃないかな。

0 件のコメント:

コメントを投稿