はじめに
こんにちは
先日初めてのKaggleをどう取り組んだかをまとめましたが、今回は感想よりの部分を書きます。
反省、感じたこと
以下、反省と感想をつらつらと・・・
- 写経において1つ1つのコードが読めず1つのnotebookを写経し、理解することにかなり時間がかかった
- 特徴量エンジニアリングをする過程で今のデータがどうなっているのか頭の中で把握し続けることが出来なかった(めっちゃノートにまとめた
- モデルのトレーニング中の時間の活用ができなかった
- reduce_mem_usageのようなよく使う便利な関数は自分用のTIPSにまとめていきたい
- 学ぶことが本当に多い、情報の取捨選択をして上手にメモを取る力が足りていない
- 環境の整備 開始三日目くらいにnotebookのリソースの足りなさを感じることができました
- EDAをみて特徴量の考案につなげることが難しい
- 店舗別(10店舗)にモデルを作成するといいことは分かったけどどうするのが効率がいいのかわからなかった
- 時系列データなので、パブリックとプライベートに使うデータの範囲が違うので、モデルも違ってきて、CVテストをたくさんトライする方法がわからなかった
今後の課題
まとめ
今回1か月、開催中のコンペに取り組んで感じた身に着けたい能力は大きく分けて2つ
- プログラミング(読み書き)する能力
- 機械学習の戦略を考える能力
考え方を学ぶことは意識して学ぼうとしないと身につかないと思うので常に意識して必要ならメモを取る必要があるように感じました。
また、今回は一人で走りましたがもしKaggleに慣れた方とコンペを走ることができたら学ぶことが多くかなり力がつくと感じたので機会があればチームを組んでみたいなと感じました。
以上、脈絡もなく綴りましたが半年後1年後の自分がこんな時期もあったかと思えるようになりたいと思います。