統計学を自分の道具にするための本

卒論や修論の締切りが近づき、ぎりぎりになって実験のデータの集計や考察をすることになり、「どうすればいいのか分からない」状態では困る。そんな状態で集めたデータでは、そもそも集計するために適しているかさえも分からないだろう。

一般的に、実験データを集計したり考察する際には統計学の知識が役に立つ。統計学の裏付けをもってして、自分の集計や考察が正しいと言うことが出来る。
これからそういう状況になるだろうと考えている人達、あるいは、道具としての統計学を身に付けておくことに興味がある人達に、幾つか本を勧めたい。
勧める本を以下のレベルに分けた。

正規分布」「平均」「分散」とは何かを他人に正確に説明できない人へ

何かを道具として用いるということは、その道具の特性について理解し適切に活用できるということである。それははさみやArduinoなどモノに限らず、数学や史学などの知識あるいはアルゴリズムにも当てはまる。
そして、その「理解」を測るには「それを他人に正確に説明できるか」という指標を用いるのが良いと、僕は考えている。
そして、統計学の入門レベルの振り分けとして、この「正規分布」「平均」「分散」の理解が肝になると考える。この単語は中学もしくは高校の数学の教科書に出ている筈だ。これを、誤魔化し無く、後輩や姉弟にきちんと説明出来ないと思ったら、以下の2冊が良い入門書になると思う。


完全独習 統計学入門

完全独習 統計学入門


マンガでわかる統計学

マンガでわかる統計学

この2つの本は、統計学の入門についてほぼ同じ範囲をカバーしている。『マンガでわかる統計学』が扱っていて『完全独習 統計学入門』が扱っていないテーマとして、「F分布」「2変数の相関」「Excelによる計算」がある。

また、『マンガでわかる統計学』には以下の関連書籍がある。

統計による予測


マンガでわかる統計学 回帰分析編

マンガでわかる統計学 回帰分析編

これはマーケティング調査などにおける回帰分析/重回帰分析/ロジスティック回帰分析を用いた「予測」について解説している。登場する数式はぐんと増えるが、その当たりはマンガのお陰ですらすら読めるようになっている。
付録に「Excelによる計算」が掲載されている。
ちなみに、『マンガでわかる統計学 回帰分析編』は『マンガでわかる統計学』と著者、作画の人が同じだが、マンガの話は独立している。

統計によるアンケート調査


マンガでわかる統計学 因子分析編

マンガでわかる統計学 因子分析編

これはアンケート、調査票を用いた主成分分析、因子分析について扱っている。アンケートを取る際に「どのような質問をすればいいか」からどう集計すればいいかまで、マンガで解説している。
表紙で分かるが、マンガの話として『マンガでわかる統計学』の続編で『マンガでわかる統計学 回帰分析編』のメインキャラがサブキャラ化している。


以上を踏まえて、「統計学というものの全体を押さえて、いざとなった時に活用できるようにしたい」と考える人には『マンガでわかる統計学』『マンガでわかる統計学 回帰分析編』『マンガでわかる統計学 因子分析編』の3冊をざっと読むことをお勧めする。必要な時に、この手法を使えばいいのだと思い付くことが出来るだろう。
また、「統計学の基礎をしっかりとマスターしたい」と考える人には『マンガでわかる統計学』または『完全独習 統計学入門』のどちらか1冊をお勧めする。選ぶ基準はマンガにするかしないか、程度だと思う。どちらかを読んだ後には、統計学とは何か、統計学を用いる場面はどこかをちゃんと理解しているだろう。

選択した入門書を、演習問題を解きながら最後まで読み終わったときに、本を閉じて自問する必要がある。「「正規分布」「平均」「分散」とは何かを他人に正確に説明出来るか」と。1回で統計学の基礎を理解出来ると過信してはいけない。入門で横着をしてはいけない。何度も繰り返してようやく理解して、次のステップに進むのが正しい姿勢である。

ちなみに次のステップには、各入門書の末尾の参考文献を参考にして、自分にあった本を選ぶと良い。


「時間がない。今すぐにデータを集計してペーパに載せる結果を得たい」人へ

Microsoft Officeに付属するExcelは、統計に用いるにはいささか不正確な点があるそうだ。詳しくはExcelの統計機能は不正確 | スラド IT辺りを参照して欲しい。OpenOffice.org Calcの方がまだ正確なんだだそうだ。

しかし、最近はより優れた統計ツールとしてRがある。Rを用いて統計を説明、実践している本として以下をお勧めする。


Rによるやさしい統計学

Rによるやさしい統計学

大きく2部構成に分かれ、前半:基礎編、後半:応用編となっている。基礎編をスムーズに理解するためには少なくとも上記『マンガでわかる統計学』または『完全独習 統計学入門』の知識が必要になる。闇雲にRを使って結果が出たとしても、統計学の基礎知識がないと、論文や発表の展開で未熟さが見え見えになるので注意が必要だ。
この本の全体がおおよそ理解できたら、後は、自分が得たデータあるいは得ようとしているデータと、この本の目次を頼りにRの機能を使い、集計なり考察をすれば、それなりのものが出来上がるだろう。この本で必要な知識はこの本の中でほぼ完結しているので、これ1冊持っていても十分、統計を道具として活用できるのではないかと思う。

この本の長所にも短所にもなり得る特徴として、各章が独立していて、本の全体に1本のストーリィが無いことが挙げられる。従って、目的意識が弱い状態で冒頭から読み始め、Rを使って手を動かして勉強していくと、途中で飽きるかもしれない。まず、ざっと目次を読んで、自分が学びたいテーマの章をかいつまんで「なるほど、Rではこういうデータを集めて、こうやって結果を出して、こう見るのか」と理解を進めるのが良いと思う。


「統計を使ったうんちくを語りたい」という人へ

ただ学ぶだけではつまらない。論文を書くような予定もないし、統計に使えそうなデータも持っていない。という人は多分多いだろう。
しかし、統計学を理解することで、現実の社会にちょっとした刺激を感じるとすれば、面白そうだと思うのではないだろうか。


統計でウソをつく法 (ブルーバックス)

統計でウソをつく法 (ブルーバックス)


統計数字を読み解くセンス―当確はなぜすぐにわかるのか?(DOJIN選書27)

統計数字を読み解くセンス―当確はなぜすぐにわかるのか?(DOJIN選書27)

  • 作者: 青木繁伸
  • 出版社/メーカー: 化学同人
  • 発売日: 2009/11/30
  • メディア: 単行本(ソフトカバー)

これらの本を読むには少なくとも上記『マンガでわかる統計学』または『完全独習 統計学入門』の知識が必要になる。その知識を持った上で、現実の社会にあるさまざまな事象を統計という観点で読み解いている本である。
いわゆる、「宝くじを買いたいと思わなくなる本」シリーズだ。章タイトルが「小さい数字はないも同然」「こじつけた数字」(『統計でウソをつく法 (ブルーバックス)』)、「平均することでなにがわかるか」「もっともらしい結論に惑わされない」(『統計数字を読み解くセンス―当確はなぜすぐにわかるのか?(DOJIN選書27)』)といった具合に、視点が学術よりではなくぐっと現実寄りで、生活の中で統計学を意識していないときにも、はっと思い出されるような内容になっている。
特に最近は、インターネットの普及からあらゆるデータを得られるようになり、その膨大なデータの中から何を信じるのか、(故意かそうでないかにしろ)間違ったものは無いか、少し敏感になっておく必要がある。自分が騙されない様に、またそれに伴って損をしないように、道具としての統計学は必要なものになっている。