質問
ポッドキャスト聞いてから Signate の存在を知りました。Kaggle 関連の話が面白かったのでもっと聞きたいです。例えば、最近コンピティションで話題の技術や、自分が参加したコンピティションではどういうことを考えてモデル作成の戦略を立てているか、などなど @ハシビロコウさんより最近話題の技術(どちらも最新ではないが、必須?)LightGBMマイクロソフト作成早い!!精度が高い、大量の特徴量も入れられる、kaggle-ja で共有されていた xgboost LightGBM CatBoost の比較記事CatBoost vs. Light GBM vs. XGBoostアンサンブル相関が低い予想をアンサンブルし、スコアを上げるSantander コンペで金メダルをとった戦略失点を減らすフォーラムをつねにチェックリークを見つける加点を狙う他の人が見つけていないことをみつけるポイントを絞る時間は有限なので、キーとなりそうなところに集中画像のコンペは好きじゃない、と思われるのはなぜですか?優秀なモデルを持ってきて力技勝負になっちゃうとかでしょうか(マシュマロ)画像のコンペを真剣にやろうとすると、GPU が必須になるGPU が必要なためか参加人数は増えない傾向にある個人的には画像のコンペは楽しい技術の進歩すごいって感じられる人間の認識能力もすごいと感じる前処理とかも難しいブログ記事なども少ない少ないという意味は、殆どがサンプルコードを動かして Mnist 解析するだけみたいな気もしてる論文を読んでいく必要があるjupyter の tips
Jupyter Tips 募集中への回答です。PyCharm + Jupyter NoteBook を使うことによって PyCharm の強力なコードの自動補完が利用出来て便利です。jupyter notebook と PyCharmJetbrains 系は Professional 版(お値段高め)と Community 版(無料)がある違いは web 開発機能とかなので機械学習で利用するのであればいけそう気になるニュース
AI/機械学習の利用がストレージ支出に大きな影響を与えると 70%の企業が判断、IDC Japan 調査 - クラウド Watch機械学習のストレージ問題なんか対処してる?Box JapanBigQuery - アナリティクス データ ウェアハウス | BigQuery | Google Cloud田中 TOM
自然言語処理を学ぼう #5 doc2vec 理論編 - 田中 TOM と愉快な仲間たち量子コンピュータ関連
メルカリのインターンシップに出ている学生達のブログ記事が出ているD-wave を触っている現状の量子コンピューターでの限界(妥協点)や問題がなんとなくわかるメルカリがこういう分野にもすでにお金を出しているD-Wave マシンで Graph Golf に挑戦した話 - Mercari Engineering BlogD-wave マシンで最大カット問題を解く - Mercari Engineering Blogオレオレ機械学習ライブラリ構想(機械学習名古屋第1 7 回勉強会)
機械学習のアルゴリズムに関係ない部分多すぎ問題試したものがちゃんと記録される・再現できる煩わしいデータ管理をどうにかしたいモデル管理をちゃんとしたいオレオレライブラリって結構大事でみんな Kaggle に夢中すぎてやってない分野も多い気がする
自分も Julia から Neural Network Console フォーマット向けのオレオレライブラリとか書いてる今日の一句
抜け道を先ゆく風や彼岸花 恋言