まだタイトルない

アウトプット用です

分析コンペ勉強会で勉強してきた。 #33dsoc

※ほぼ日記です。

こんにちは、面白そうな勉強会があったので聴講してきました。1
何れの発表も発表者様の考えがうまく言語化されていてとても勉強になると同時に、考えを言語化する力の凄さを感じました。

具体的には下記のような能力についてでしょうか。考えて、試して、振り返って、力にすることの大切さを改めて学ぶことが出来ました。

  • 課題の中にある課題を理解し、分解し、置換して事例を探したり解決する力
  • 自分とトッププレイヤーの力の差をうまく測ること
  • コンペとして(機械学習で解決する対象として)適切かどうか審判する力
  • 多用なリソースを使いこなる力
  • ノイズに立ち向かう力
  • より効果的にコンペのスコアを上げる力

メモ

下記に書く発表中に取ったメモというか感想を乗っけときます。なかなか伝わらないと思うので資料を確認出来次第リンクをはろうと思います。

■脱! Deepでポン🎶ハイパラチューニング芸人を卒業するために

  • 資料
  • 課題を理解・分解・置換する
  • コンペの難しい部分を理解する
  • 課題の調べ方も工夫すると良い
  • 難しいポイント(ノイズや、CV,LB相関)はディスカッションでわかることも多い印象なので、そこから自分なりに分解してどうするかまで考えることでやることが見えてくるのかなと感じた

■atmaCup#6 を開催したときの体制や流れについて

  • コンペを開催することで得られるもの
    • トッププレイヤーのソリューション
    • EDA等の知見
    • 自前でやることと比較してレベルの差等の情報収集
  • もちろん人事、法務のちからもあってコンペの準備をしていく
  • お互い(課題提供側とプラットフォーム側で)解いてみて精度の差を確認
    • 大きいと見落としポイントがあるかも?
  • shakeやleakの確認

■Colaboratoryで分析コンペをする時のテクニック集

  • 資料
  • (環境的に)汎用的なコードを書くと空いてるリソースで学習をできる
  • colabからkaggleデータセットの新規作成や進バージョンもできるので使いこなすことで手札が増える

■Noisy label 対抗記 ~Cassava Leaf Disease Classification~

  • noisy label に立ち向かう
    • アンサンブルで対抗
    • lossで対抗
  • バッチノーマライゼーションを前半は固定
  • confident learning
  • clean lab

■atmaCupなど短期間コンペのススメと戦い方について

  • 資料
  • 息子さんの写真でにやけちゃいました
  • 短期間コンペと長期間コンペの最終的な精度の内訳についての説明がわかりやすかった
    • 長期間:できる限り全部のアイデアを組み込まないと勝てない
    • 短期間:いかに重要なアイデアを組み込むか
  • 効果 x 実装時間 x 成功確率 から効果的にアイデアを絞っていく
  • 短期間で勝つためのノウハウだがkaggleにおいても実装力が低い現段階で次何やるとLBを登れるかという選択の参考になりました。