「数学で犯罪を解決する」を読んだ

October 03, 2010 at 11:29 PM | View Comments

統計学の知識を得たい。ここ最近いろいろ思うところがあってそう思うようになり、いろいろ本を読んでいるのだけど、まともな高等数学を勉強したことがない僕にとってはかなり難しい。

そもそも統計学でいいのかもよく分からない、データマイニング、確立、ベイズ推論、パターン抽出、、、これらをひっくるめると統計学でいいのか?もっと違う言い方があるのか?統計学という言い方で合っているので分からないので、ここでは統計学(仮)ということにする。

今思うのはそれらの知識を得ると抱えている問題をより良く解決できる予感がするということだ。

と言うわけで、いろいろ統計学(仮)についての本を手にとって読んでみたが難しい。どうも頭に入ってこない、、、なんとなく分かる気もするが、こういうのは大体勘違いというのが相場だ。

そもそも前提知識や理解力少ないことは大きな理由だが、ここまで頭に入ってこないのは統計学(仮)への愛情が少ない、好きさが足りない、、と思う。と言うか、あまりにも理解できないので、そう思いたい。

ということで、統計学(仮)の入門書はいったん置いて置いて、統計学(仮)をもっと愛せるような本を読むことにする。今回読んだ「数学で犯罪を解決する」は、そういった意味でなかなかよい本だった。

そもそも統計学(仮)は世の中のいろいろな場面で役に立っている。例えば、

  • Gmailの迷惑メール自動判別

Gmail以前に使っていたOutlookみたいなメーラーは、自分で差出人が〇〇のもの、、件名に××という単語があるもの、、とルールをきめて迷惑メールを削除していた。

ところがGmailの迷惑メール自動判別機能は、「このメールは迷惑メール」「このメールは迷惑メールでない」というのを世界中の人が判別することで、かなりの確立で迷惑メールを迷惑メールとして扱ってくれる。よく分からないが、これはベイズなんとかという統計学(仮)の考え方を使っているらしい。

例えば、レッドソックスの岡島。

日本でそこそこの選手と思われていた岡島がメジャーリーグの名門レッドソックスからオファーがあったとき、同時に入団した松坂の話し相手として取ったのだろうさえ言われた。

ところが、松坂に劣らないというか、チームへの貢献度では確実に松坂を上回る活躍をみせた。コストパフォーマンスは確実に松坂より上だ。レッドソックスは松坂のついでに岡島を獲得したのではなくセイバーメトリックスと呼ばれる統計学(仮)を利用した選手分析の手法で岡島の価値を発見したのだ。

(ちなみに岡島の価値は四球と奪三振の比率から算出したらしい)

統計学(仮)は楽しそうだ。ちょっと好きになってきた。

「数学で犯罪を解決する」は、アメリカの連続ドラマ「NUMB3RS」で使われている数学を解説した本だ。

数学で犯罪を解決する
キース・デブリン ゲーリー・ローデン
ダイヤモンド社
売り上げランキング: 51896

「NUMB3RS」というドラマは、、Wikipediaによると

FBI特別捜査官ドン・エプス(ロブ・モロー)と、数学の天才で犯罪者の行動を予測する公式を導き出す弟のチャールズ・エプス(デイビッド・クロムホルツ)の活躍を描くドラマである。

となっている。このドラマのウリは使われる数学がキテレツなものではなく、実際の犯罪捜査でも使われるちゃんとした数学ということだ。

ナンバーズ 天才数学者の事件ファイル シーズン1 コンプリートDVD-BOX (4枚組)
パラマウント ホーム エンタテインメント ジャパン (2009-06-12)
売り上げランキング: 7719

ドラマの中で

スプリンクラーから落ちる次の水滴は分からない、でもスプリンクラーの場所が分からないとすると、これまで落ちた水滴からスプリンクラーの場所を割り出すことはできる。この犯罪犯でも同じだ。

数学者の弟はこういって黒板に方程式を書き、連続殺人事件の犯人の居場所をつきとめた。

それはドラマだからだ!

と、言いたくなるが、実はこれは実際の話を元に作られた話で、使われた数式も同じものだと言う。

実際に数式を使って連続殺人犯をつきとめたのはカナダの警察のキム・ロスモという人物だった。先ほどのスプリンクラーの話はキム・ロスモ氏自身が地理的プロファイリングを説明するときに使う比喩ということだ。

地理的プロファイリング―凶悪犯罪者に迫る行動科学
D.キム ロスモ
北大路書房
売り上げランキング: 38210

この方程式は、犯罪は犯罪者の拠点から離れると増えるが、あまり遠くなると減るという現象を元に

方程式は地図に座標をふって、任意の(i,j)に対し

  • 犯罪が起きた(x,y)と(i,j)との距離を全て図り、任意の関数をあてる
  • バッファー(犯罪が増えて減るまでの幅)から、先ほどの距離を引いて、先ほどと違う関数をあてる
  • 任意の重みをつける
  • 過度に特徴が出ないように単位をまとめる

(理解できてないので上手く説明できない上にこれであっているか分からない)

というように「それぞれの犯罪の貢献を合計して、(ij)グリッドの確立を求める」方程式をつくり、それを全ての座標で行い、確立が高いエリアに色をつける。そのエリアを中心に捜査を行う。

どの事件も同じ計算でOKというわけではなく、任意の関数や重みなどをそれぞれの事件の特性によって変える必要がある。

実際のキム・ロスモの事件では、特定した住所を調べた結果、犯人はいなかった、、、しかし、タレコミのあった警察関係者を調べたところ、その人物はそのエリアから引っ越していたことが分かり、さらに証拠が出て逮捕された。

「数学で犯罪を解決する」はこのように、ドラマ「NUMB3RS」で数学がどのように使われ、その数学がどういうものなのか、実際にも使われているか、、、を、数学の知識のない人でも分かるように分かりやすく解説している。

統計学(仮)ではないが、RSA,SHA-1,MD5などの仕組みはこれまで読んだ解説のなかで一番分かりやすかったし、指紋神話(同じ指紋は世の中に存在しない)はかなり根拠が危ういなど、、興味深い話も多く、この本は買ってよかった。

おかげで統計学(仮)への愛情が少し増した。

また、和訳された本書には、それぞれのChapterに出てくる数学をより知りたい人向けのための参考本の紹介を訳者がしてくれている。

ちなみに暗号に関する参考文献では結城浩先生の「暗号技術入門 - 秘密の国のアリス」が紹介されてあって個人的に好感が持てた。

暗号技術入門-秘密の国のアリス
結城 浩
ソフトバンククリエイティブ
売り上げランキング: 114465
数学で犯罪を解決する
キース・デブリン ゲーリー・ローデン
ダイヤモンド社
売り上げランキング: 51896
categories: statistics, book
blog comments powered by Disqus
track feed ueblog