アウトプット記録

生物学×化学×ITな人材を目指して

【書評】図解・ベイズ統計「超」入門

みなさまこんにちは。
生物学×化学×ITで勉強中のメーカー研究員toryzaeです。


この3連休は少し体調を崩して寝込んだりしていましたが、
本日辺りから体調も良くなりました。
勉強は継続が大事ですが、休むときは思いっきり休むことも大事ですね。


さて、本日紹介する本はこちら。

図解・ベイズ統計「超」入門
涌井 貞美(著)

www.sbcr.jp


前回と同じく、米国データサイエンスのかめさんのブログで紹介されていた本です。

datawokagaku.com


本書はベイズ統計学を学ぶに辺り、導入として最もわかりやすいとの評判でした。
私自身は前回の書評でも述べた通り、古典的な統計学は学生時代に授業で受けたことがあるため、一般的な平均や分散の考え方については、基礎は押さえています。

一方で、ベイズ統計学は全く触ったことがなく、初見であったため、超基礎からやったほうが良いと考え、こちらの本を購入しました。
結論から述べますと、初めてベイズ統計学を学ぶのであれば、本書はとてもお勧めです。
ベイズ統計学は、ネット上のさまざまな記事を読んだところ、「とっつきにくい」「よく分からない」といった声が多いようです。超入門書の位置づけである本書でも、繰り返し読まないと理解できない箇所がいくつかありました。機械学習の分野ではベイズ統計学は必須のようですので、スピードは遅くても良いから、確実に理解していきたいものです。


本書は大きく分けて4つのパートに分かれています。
以下、それぞれについて部分的に紹介していきます。

1. 基本的な確率論

ベイズ統計学ですが、確率論を全面に出しているところが従来の統計学との大きな差異になります。そのため、基本的な確率論をまず押さえる必要があります。

  • 同時確率と条件付き確率
  • 乗法定理と加法定理

対になる2つの考え方をマスターすれば十分です。理系の方や、大学入試で確率を勉強した方であれば、すんなり理解できると思います。

2. ベイズの定理とは

ここでは、とっつきにくいベイズの定理にのみ焦点を当て、さまざまな言い換えや具体例を用いてベイズの定理を学習します。くどいくらいに説明があるのですが、それくらい無いと、本当に分かりにくかったです。

ちなみにベイズの定理ですが、

Bが起こったときにAの起こる確率
  = (Aが起こったときにBの起こる確率 × Aの起こる確率) / Bの起こる確率

で定義されます。
この文面を読んだだけで理解できる方は、本書を読まなくて良いと思います。笑

私はさっぱりでしたので、具体例を追いながら、ベイズの定理についてじっくり学習しました。モンティ・ホール問題や、難病Xの例題といった具体例で、ベイズの定理の有効性を学習できます。


余談ですが、現在流行している新型コロナウィルスの検査について、ベイズの定理の考え方を理解すると、検査の有効性とは?と思うようになりました。偽陽性偽陰性について、本書を読むといろいろ理解できます。


3. 理解不十分の原則とベイズ更新について

続いては、理解不十分の原則とベイズ更新についてです。
この2つの考え方があることで、データがない現象に確率を当てはめることができる、データの時系列情報を確率に持ち込むことが出来る、といったことが可能になります。
事前知識で、ベイズ統計学機械学習に応用する場合、データ数が少なくても機械学習が可能、ということを知っていました。理解不十分の原則とベイズ更新、特にベイズ更新の考え方が、データ数を少なくできるポイントなのかな、と直感的には感じましたが、それは勉強が進んだときに、改めて振り返りたいと思います。

4. ベイズ統計学とは


最後に、いよいよベイズ統計学についてです。
これまで学習したベイズの定理を、統計学にどのように活かすか、ということを、具体例を交えながら紹介していきます。具体例が非常に簡単なものであったためか、ベイズの定理を利用することでどういうメリットがあるのかを理解しきれませんでしたが、ベイズ統計学の考え方の基礎を押さえることが出来たと思います。

なお、本書の最終頁にベイズ統計学の応用分野として意思決定の理論、人工知能への応用、など、いくつかの具体例が挙げられていましたが、その内容に関する紹介はありませんでした。



本書はベイズ統計学を全く触ったことが無い方にとって、非常に良い入門書になると思います。基礎的な統計学の知識はあったほうが良いので、分散や正規分布って何?って方は、まずは統計学の基礎から始めることをお勧めします。


次は、基礎編でお勧めされたいた本として、以下の二つをやっていく予定です。どちらもPythonで実行しながら、少しずつ進めていきたいです。


古典統計学

shop.ohmsha.co.jp

ベイズ統計学

www.oreilly.co.jp