こんにちは、GMOアドマーケティングのS.Sです。
今回は機械学習について少し知りたいと思ったときに、参考になりそうな書籍をご紹介します。
ここで紹介する書籍の多くは、目次やドラフトが著者や出版社のご厚意で閲覧できるようになっているので、中身を確認してから購入することができます。
機械学習全般
いざ機械学習を知ろうと思っても必要となる事前知識やカバーされるトピックの範囲が広すぎて、いきなり分厚い鈍器のような本をcover-to-coverで読むのはしんどい気がするので、全体像をつかむ初めの一冊によさそうなのがはじパタと言われています。
- はじめてのパターン認識
平井 有三
https://www.morikita.co.jp/books/book/2235
はじパタなどで概観をつかんだら、次は主要な機械学習手法についてもう少し詳しく学んで見たくなった場合に参考になる書籍を紹介します。
次の3冊の中では、PRMLはベイズ成分が強めな気がします。
MLaPPは基本となる線形回帰・分類からグラフィカルモデル、変分ベイズ、MCMC、トピックモデル、ニューラルネットワークまでかなり幅広いトピックをカバーしています。
- Pattern Recognition and Machine Learning
Christopher Bishop
orig: https://www.microsoft.com/en-us/research/publication/pattern-recognition-machine-learning/
日本語版: https://www.maruzen-publishing.co.jp/item/b294524.html - The Elements of Statistical Learning: Data Mining, Inference, and Prediction
Trevor Hastie, Robert Tibshirani, Jerome Friedman
orig: https://web.stanford.edu/~hastie/ElemStatLearn/
日本語版: https://www.kyoritsu-pub.co.jp/bookdetail/9784320123625 - Machine Learning: a Probabilistic Perspective
Kevin Patrick Murphy
https://probml.github.io/pml-book/book0.html
様々な機械学習モデルを学んだところで、それらのモデルがどのような条件であればうまく学習できるのかは気になるところです。
以下は学習理論に近い話を交えつつ様々な機械学習手法について紹介しています。
モデルの複雑さというものを定義して、どのくらいのデータがあればモデルを学習できるかというような話題も出てきます。
- Understanding Machine Learning: From Theory to Algorithms
Shai Shalev-Shwartz, Shai Ben-David
https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/ - Foundations of Machine Learning
Mehryar Mohri, Afshin Rostamizadeh, and Ameet Talwalkar
https://cs.nyu.edu/~mohri/mlbook/ - Learning Theory from First Principles(draft)
Francis Bach
https://francisbach.com/i-am-writing-a-book/
最適化
機械学習だと解きたい問題を念頭にモデルやlossを決めて最適化問題を解くことが多く、最適化について少し知っていると納得がいく議論もあります。
以下では最適化に関する2冊を紹介します。
- これなら分かる最適化数学 ―基礎原理から計算手法まで―
金谷 健一
https://www.kyoritsu-pub.co.jp/kenpon/bookDetail/9784320017863 - Convex Optimization
Stephen Boyd, Lieven Vandenberghe
https://web.stanford.edu/~boyd/cvxbook/
確率・統計っぽい話
上記の書籍を読んだ後は、理解をさらに深めるために確率・統計方面からの切り口で機械学習手法を見直してみるのもよさそうな気がします。
データ数に対して説明変数が多い状況で有効なLassoに関する説明は、Statistical Learning with Sparsityがわかりやすいです。
- Computer Age Statistical Inference: Algorithms, Evidence and Data Science
Bradley Efron, Trevor Hastie
https://web.stanford.edu/~hastie/CASI/ - Statistical Learning with Sparsity: The Lasso and Generalizations
Trevor Hastie, Robert Tibshirani, Martin Wainwright
http://web.stanford.edu/~hastie/StatLearnSparsity/ - High-Dimensional Probability An Introduction with Applications in Data Science
Roman Vershynin
https://www.math.uci.edu/~rvershyn/papers/HDP-book/HDP-book.html
おわりに
機械学習についてちょっと知りたいと思った時によさそうな書籍をいくつかご紹介しました。
ご参考になれば幸いです。