2013/01/11

読み物として面白い「統計学」の本を紹介してみる

タイトルのまんまです。統計学を普段使わないような人でも「統計学って面白いな」と思ってもらえるような本を、エピソード付きで紹介したいと思います。参考までにどうぞ。

各コメントは、書籍の内容に準拠していますが、テンションのままに私が勝手に書き殴ったものなので、あんまりマジメに受け止めすぎないでください。疲れてるからちょっとぶっとんでるけど気にしないでね。





1:人物・歴史を知ろう!系


『ナイチンゲールは統計学者だった!-統計の人物と歴史の物語』 


   

クリミアの天使と呼ばれた看護師ナイチンゲールですが、実は歴史上かなり重要な統計学者だった、ということはあまり知られていません。彼女はクリミア戦争の現場に出向き、戦死者の数よりも伝染病で亡くなる人の数が多いことに気付きました。

伝染経路は、病院でした。戦地の病院では衛生面が蔑ろにされていたのです。亡くならなくてもいいはずの人が亡くなっている。その不条理な状況を打開すべく、ナイチンゲールは数学的根拠に基づいた調査報告書を提出し、社会に訴えかけたのでした。

もちろん数学的根拠と言っても数式の羅列ではありません。難しい言葉をいくら並べても、事態の深刻さなど理解できるはずがないからです。では、どうやって多くの人を説得しようとしたのでしょうか。死亡者数を原因別で割った数値を、「病院の不衛生」が一番の死因であることを、一目で理解させるにはどうしたらいいでしょうか。

彼女が説得のために利用したのは「円グラフ」です。私たちが当たり前のように使っている数学の表現技術の1つ。これを開発したのがナイチンゲールなのです。どう?どう?どう?ちょっとびびったっしょ?www





『統計学を拓いた異才たち』


超オススメ。統計学者たちがどのような課題と向き合い、どのように考え、そしてどのように解決していったのかが描かれています。ところどころ数式展開が含まれていますが、数字が苦手な人や統計学を知らない人は、飛ばし読みでも大丈夫です。

   

少しの間だけでいい、名探偵シャーロック・ホームズになりきってみてほしい。あぁ、勘違いしないでくれ、彼は架空の人物だ。だけど、聞き慣れない統計学者の名前に比べたら、幾分か感情移入しやすいだろう。さて、では本題に入ろう。

親愛あるシャーロック、君の目の前には1つの論文がある。論文じゃなくてもいい。詩でも手紙でも小説でも構わない。とにかく「誰かが書いた文章の束」がある。内容は何でもいい。問題なのは「誰が書いたか分からない」ということだ。名探偵を呼んだ理由が分かったかな。そう、この文章を書いた人間が誰なのかを当ててほしいのだ。

というのも、2人の研究者 ―― 詩人でもいい、もちろん小説家でも ―― が現れて、その両方が「俺の書いた文章だ!」と主張するってわけさ。まったく嫌になってしまう。似たようなイザコザがここ半月で5回はあった。ん?21世紀の現代社会ではそんなこと滅多に起こらない?そりゃそうさ。だけど昔は違ったのさ。

文学を専攻している人間ならこの問題を良く知っているはずだ。誰がこの文章を書いたのか?この作品が書かれた時期は?どこにそんな証拠が残ってる?記録がないならどうやって推定する?果たしてヒントはどこにもないのか? ―― いや、目の前にある。ここには「文字」というヒントがある。単語の使用パターンを統計的に分析することでA氏とB氏のどちらが書いた可能性が高いのかを推定することができる。

ちなみにこの技術、実は「ある砂漠のどこに遺跡があるか」を推計するために考案されたものなんだ。え?遺跡発掘と文学が結びつかない?そう、普通に考えたら結びつかないような出来事が繋がるから歴史は面白いんだ。意味が分からないって?とりあえず本書を読んでみればいい。





2:身近なテーマをガチで考えようぜ!系


『ヤバい統計学』


なんというか、ヤバいです。書籍紹介の文章をコピペすれば魅力が分かると思います。余計な説明をする必要がない気がします。というわけで以下コピペ。

   

---------------------------------------------------------------------------
世の中を知るには、経済学より、まずは統計学です。

●ディズニーランドの行列をなくす方法は?
●宝くじに当たる確率は実際どのくらい?
●テロ対策とドーピング検査の共通点とは?

ディズニーランド、交通渋滞、クレジットカード、
感染症、大学入試、災害保険、ドーピング検査、
テロ対策、飛行機事故、宝くじ――
10のエピソードで探求する
「統計的思考」の世界。
そのウラ側にある数字を知れば、
統計学者のように思考し、
自分の世界を自分で支配できるようになる。
---------------------------------------------------------------------------





『統計学とは何か ― 偶然を生かす』


しっかりした専門書なのですが、数式や理論の部分を「何となくこういうことを言ってるのだな」程度で良いので適当に流してどんどん読み進めてもらいたいです。「統計学」という学問を概観できる良書です。

   

早速ですが、1つ課題を出してみましょう。紙と書くものを用意して下さい。そこに横長の長方形を描いて、内部に横線2本と縦線4本を引いてください。

                    
                    
                    

すると、15マスの空欄ができます。
このそれぞれの空欄の中に、マル(◯)かバツ(×)をランダムに入れていって下さい。

ある統計学者が、多くの人に対してこの実験を行ったところ、興味深いことが分かりました。

最初の横1列のマル(◯)は合計で2または3。
次の横1列のマル(◯)も合計で2または3。
最後の横1列のマル(◯)も合計で2または3。

個人差はあれど、これが最も頻度の高い結果だったのです。

機械が自動的にマル(◯)かバツ(×)をつける場合、横1列のマル(◯)の合計は、0、1、2、3、4、5と幅広い値が選択されます。しかし、人間が「ランダムに選ぼう」と考えてしまうと、バランスを保とうとして2か3を選んでしまい、極端に2−3に偏った統計結果になるのです。

これが「人為的にねつ造されたデータ」の特徴です。
この考え方を応用することで、データの正確性を測ることができるのです。

自分の理論の正しさを証明するためにデータをねつ造した(と言われている)科学者は数多く存在しています。例えば、理科の授業で習う「メンデルの法則」というものがあります。メンデルはエンドウ豆を交配させることで遺伝の特徴を示しました。このデータは、あまりにも不自然だと考えられています(理論自体への批判ではない)。

こういった世の中のあれこれをデータから読み解いていくのが統計学の醍醐味なのです。





3:数字で嘘を見破れ!系


『統計数字を疑う なぜ実感とズレるのか?』


   

はい、問題です。

[問] 凶悪犯罪は増えているか?





[答] 増えてねえええええよばーーーーーかwwwwwwwwwwwwwww

[解説]

・検挙数は上昇している。
・犯罪件数に対する検挙率は減少している。

これだけを見ると凶悪化しているような気もする。メディアではこうした数字を取り上げ、強烈な事件のエピソードを引用することで、見事に「犯罪者の数が増えて凶悪化している」ような雰囲気を作り出すのに成功している。

しかし実際はどうだろうか。

まず、なぜ検挙数が上昇しているのだろうか。答えは「警察の方針が変わった」からだ。軽犯罪でいいから、とにかくバンバン取り締まる。それまでは大きな事件に費やしていたエネルギーを方向転換したのだ。その結果どうなるか。当然、検挙数が増加する。

同時にある問題が生じる。それは、大きな事件に費やすエネルギーが減る、ということだ。容疑者1人当たりに費やせる時間が圧倒的に短くなる。その結果、余罪を追求できなくなる。もし凶悪殺人犯が、逮捕されたのとは別の事件を3回起こしていたとしよう。しかしその人物は今回の1回分でだけ検挙されている。残る3件は「未解決の事件」になり、「犯人を検挙できない」結果になる。検挙率は、当然低下する。

こういった「印象操作」の弊害は、意外な所に表れる。例えば「刑務所」の現状をあなたは知っているだろうか。統計学の話題から脱線することになるので細かくは言及しないが、(一見して正しそうな数字であっても)世の中が誤った判断を下すことによって、どこかで誰かがその歪みの被害を受けているということを忘れないでほしい。





『ウソを見破る統計学―退屈させない統計入門』


こういう系も気軽に読めて楽しいと思います。
以下、コピペで。面倒臭いとかそういうんじゃないよ。

   

太った人ほど年収が高い!?
マラソン世界記録の限界が分かる!?
40歳までに結婚すると長生きする!?

その統計、信じていいの?
数字の裏に潜む「隠れた関係」をあぶり出し、事実を正しく見極める「統計思考力」が身につく。

大学で統計を教える主人公・素呂須譲二(そろすじょうじ)。彼のもとに、統計アレルギーの学生や怪しい営業マン、はては文系女子の妻や娘が次々と難題を持ち込んで……。平均、標準偏差から相関、検定、回帰分析、推測統計まで、難しい数式は一切使わず、統計の基本と使い方が会得できる!





4:意識高い系


『不透明な時代を見抜く「統計思考力」』


スキルとして統計学的なモノの見方を体得しようぜ!というお話。社会や経済の問題を議題にしているので新社会人や就活生にもいいかもです。疲れちゃったからコピペするけどズッ友だょ…。

   

その報道は真実か?
その解説は適切か?
その通説は正しいか?

多くの報道、通説、専門家による解説の多くが、正確なデータに基づいて書かれているものではありません。ほとんどの人が元データに当たることなく、あるいは、データを正しく扱うことなく、言説だけが一人歩きしているのです。

けれども、的確な判断、対策のためには、現状を正しくとらえることが必要であり、そのためには、今起こっている事実をとらえなければなりません。その事実の多くは、データすなわち、統計という形で、今や多くが公開されています。

すなわち、データを正しくとらえることができれば、誰でも評論家やジャーナリストに勝るとも劣らない「眼」をもつことができます。そして、それは、この不透明な時代を生きるわたしたちの必須のスキルです。





くぅ~疲れましたw これにて完結です!

以上、テーマ1〜4(合計7冊)の紹介でした。私が読んだことのある統計学の本のうち、初学者にも読み物として面白がってもらえそうなものを選びました。せっかくの新年ですので、1つ新しい分野にチャレンジしてみてはいかがでしょうか。

終わり。


[追記] 余計なことを書かずに書籍の概要だけしっかりとレビューしておけば良かったなぁと反省しております、はい。紹介した本はどれも良書だと思うのでぜひ手に取ってみて下さい。

0 件のコメント:

コメントを投稿