読者です 読者をやめる 読者になる 読者になる

亀岡的プログラマ日記

京都のベッドタウン、亀岡よりだらだらとお送りいたします。

LEANだ何だいう人はバカにされないために「ダメな統計学」くらい読んでおいた方がいい

新年二冊目。実ページ数80ページに満たないながらも、非常に勉強になりました。

無償ながらも、Gumroadで寄付歓迎っぽいので、そこまで内容に踏み込まないようにして紹介します。

どういう本か

最初は「ヤバい統計学」のような、統計使って世の中の欺瞞を暴いてやるぜ!系の本かなぁと思ったんですが、違います。これは、『正式な論文などで使われている統計手法がいかに間違っていることが多いか』、あるいは『Excelに数値打ち込んで有意差だけ検定している人が以下に間違った(可能性が高い)結論を出しているか』を、丁寧に解説している本です。

まず前提として、『t検定』『正規分布』『p値(有意水準)』くらいは理解していないとツラいです。そして、それが「統計計算の全て」な人が、まさにこの本の想定読者です。

ようは、これくらい読んでればよろしい。

はじめての統計学

はじめての統計学

あるいは、これの次の本でもいいかも。

統計学が最強の学問である

統計学が最強の学問である

『p <= 0.05』が意味するものとは

上記二冊くらいの知識があれば、『p <= 0.05』という統計結果を見ると、こんなふうに思うでしょう。

  • なるほど、この結果が得られる可能性は5%以下だな
  • つまり、この仮設(帰無仮説)は95%誤っているので、もとの仮説は95%ただしいのだな

こんなくらいの理解で、統計値を使って何かを判定しようとしている人、ちょっと立ち止まって二時間くらいきっちりダメな統計学を読んでおいたほうがいいです。例えば、5%の有意水準を満たす結果であっても、『得られたサンプルの67%が間違っている』という衝撃的な結果が得られる可能性だってあるのです。

ポイントは「基準率」や「検定力」といった、初等教科書ではあまり触れられない概念にあります。

付け焼き刃の統計知識で火傷しないために、個人的には必読の書です。