こんにちは
昨年末に発売された「Kaggleコンペティション チャレンジブック」を買って、スタバとかでゆっくり読み進めてようやく読み終わりました。
- 作者:Jung Kweon Woo
- 発売日: 2020/12/28
- メディア: 単行本(ソフトカバー)
実際にkaggleでメダルを取ったコードの解説を読める本
この本の特徴は過去のkaggleコンペティションを4つピックアップして、EDA、baselineモデルの解説をじっくり行い、入賞者が公開したコードを元に筆者が解説を加えながら紐解いていくというところにあります。 また、テーブル、音声、画像と分野が広いだけでなく、GBDT,pytorch,kerasのコードが扱われているところも美味しさの一つだと思います。
選ばれているコンペ
実際にピックされているコンペと、どんなデータのコンペか等は下記のようになっています。
Santander Product Recommendation
- 開催時期
- 2016年10月-2016年12月
- テーブルデータ
- 多クラス分類
- xgboost,lightgbm
TensorFlow Speech Recognition Challenge
- 開催時期
- 2017年11月-2018年1月
- 音声データ
- 多クラス分類
- pytorch
Porto Seguro’s Safe Driver Prediction
- 開催時期
- 2017年9月-2017年11月
- テーブルデータ
- 二重クラス分類
- lightgbm,keras
State Farm Distracted Driver Detection
- 開催時期
- 2016年4月-2016年8月
- 画像データ
- 多クラス分類
- keras
感想
執筆、翻訳を経ているためしょうがないですが取り扱ってるコンペがやや昔のものになっているということは留意して手にする必要はあると思いました。それでもEDAの解説はかなり丁寧にされていて貴重な一冊だと思います。もし今後取り組むコンペに類似するものがこの本にピックされていたら活躍するのではないでしょうか?