lazy diary

統計とその周辺

僕の図書館(2019/08/17更新)

https://www.pakutaso.com/shared/img/thumb/elly20160628465420_TP_V.jpg

ちゃんと読んだもの一覧

Python

Python学習講座~PythonエンジニアによるPython3学習支援サイト~

これで十分。あとはリファレンスを読む。
PythonエンジニアによるPython3学習サイト



・【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

Udemyの講座です。分析の一通りの手順を教えてくれます。
実際にSignateに出てくる問題を扱っているので、実践形式で学べるところが良し。
https://www.udemy.com/optworks_1/


機械学習

・Coursera:Machine Learning

この世界なら知らない人はいないであろうAndrew Ng先生の授業です。
内容は機械学習の基礎で、大半は日本語字幕があります。WEEK1-11まであり、各WEEKの最後にはクイズやプログラミングの宿題が課されます。具体的な授業内容は別の記事に書いたので、良ければ参考に。
Coursera:Machine Learningを受講しました - lazy diary
www.coursera.org


・ゼロから作るDeep Learning――Pythonで学ぶディープラーニングの理論と実装

NNをPythonでスクラッチして理論を学んで最終的にCNNまでやってみようという本です。第5章の計算グラフを使ったback propagationの説明は好みが分かれるような気がします。



伝統的な統計学

古典的な統計学。いわゆる〇〇検定とかの本です。

統計学入門 (基礎統計学Ⅰ)

統計の赤本の名で有名な統計学の入門書です。統計学を始めるときの1冊にどうぞ。線形代数だと行列の基本的な扱い、解析だと重積分あたりが前提知識かと思います(要は大学1年生が学ぶ数学です)。日常でも聞く平均などの統計量の説明から始まり、そこに確率変数を導入して分布の説明、次に標本の話と推定や仮説検定を行なったりする話、最後に少しですが回帰分析の話が載っています。
私はこの本を統計検定2級を受験する際の教科書として利用しました。統計検定2級の受験記も良ければ見て下さい。
統計検定2級に合格しました - lazy diary

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)


・現代数理統計学の基礎

上にある統計の赤い本より深い内容まで突っ込んだ本です。この本の良い点は誤植や演習問題の解答、補足等を著者がWEBサイトで公開している点だと思います。数学書でこれほどありがたいことはないです。
私はこの本を統計検定1級を受験する際の教科書として利用しました。統計検定1級の受験記も良ければ見て下さい。
統計検定1級に合格しました - lazy diary

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)



統計モデリング

モデリングの話。ベイズベイズしていない本。

・An Introduction to Generalized Linear Models

GLMの古典的名著です。GLMの構築、パラメータ推定、モデルチェックを具体例とともに一通り理解できます。検定の部分には少し行間があるように感じますが、パラメータ推定は非常に分かりやすかったです。第3版になっておまけ程度にベイズの話題が追加されました。最新版は第4版らしいです。
サポートページにデータセットとstatsmodelsをベースにしたPythonの実装があるのが有り難いです。
An Introduction to Generalized Linear Models - CRC Press Book

An Introduction to Generalized Linear Models, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)

An Introduction to Generalized Linear Models, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)


・多変量解析入門――線形から非線形

線形から非線形への橋渡しに。基底関数展開や判別分析、SVM、主成分分析を丁寧に数式を展開しながら説明しています。最後に教師なし学習が少しだけ説明されています。私好みの数式だらけの本でした。以下、本で紹介されているものをいくつか私がPythonで実装したものです。
基底関数展開を使った非線形回帰 - lazy diary
XORのようなデータを非線形ロジスティック回帰で分類する - lazy diary
ハードマージンSVMによる分類 - lazy diary
ソフトマージンSVMによる分類 - lazy diary
非線形SVMによる分類 - lazy diary

多変量解析入門――線形から非線形へ

多変量解析入門――線形から非線形へ




・経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

沖本本の名で有名な時系列解析の本です。この本を含め、時系列の本はもう少し詳細な解説が欲しくなります。

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)



ベイズモデリング

ベイズモデリングについての本です。

・データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

みどり本の名で有名な統計モデリングの本です。下記のPyStanに移植したというありがたい記事が参考になりました。人によっては数学的要素が少し物足りないかもしれません。
データ解析のための統計モデリング入門(緑本)の読書メモ(PythonとStanで) - Qiita


・続・わかりやすいパターン認識教師なし学習入門―

前半はベイズ統計学の基礎。そのあと教師あり学習との対比をしたうえで教師なし学習で頻出のEMアルゴリズム、HMM(Viterbiアルゴリズム、Baum-Welchアルゴリズム)があります。次に、k-means法、凸クラスタリング、最後にノンパラベイズ(ディリクレ過程混合モデル)の説明があります。丁寧に記述されていてとても読みやすいです。

続・わかりやすいパターン認識―教師なし学習入門―

続・わかりやすいパターン認識―教師なし学習入門―


パターン認識機械学習

PRMLの名で有名な本です。ベイジアンなら読まないとモグリだと思うので読みました。1度読んだだけで理解したとはとても言い切れぬ。

パターン認識と機械学習 上

パターン認識と機械学習 上

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)


ベイズ統計の理論と方法

渡辺ベイズ本とかベイズの赤本とか言われるやつです。WAICの導出があります。数式は難解かもしれませんが「質問と回答」を読むだけでも十分に価値があると思っています。

ベイズ統計の理論と方法

ベイズ統計の理論と方法


・StanとRでベイズ統計モデリング (Wonderful R)

ヒル本と呼ばれるやつです。Stanの使い方と緑本や一般化線形モデル入門で扱われているモデリングの良い復習になりました。この本はRで書かれていますが、私は一部を除いて全てPyhonで実装しました。Pythonによる可視化の練習にもなりました。以下の記事が実装で困ったときの参考になりました。
StanとRでベイズ統計モデリング(アヒル本)をPythonにしてみる - 目次 - Qiita



その他

・入門 機械学習による異常検知―Rによる実践ガイド

異常検知に興味が湧いたので読みました。式はあまり行間が飛ぶことなく丁寧に書かれており、著者の親切さ(のようなもの?)をひしひしと感じました。異常検知の流れを掴むことができました。