ZENKEI AI ポッドキャスト

S26E03 久しぶりに Kaggle に挑戦


Listen Later

ZENKEI AI ポッドキャスト、シーズン26は2022年2月23日に開催した ZOOMライブの模様です。
この日のテーマは「祝日も AI やるよ!」です。
エピソード3は、メインの第1部「久しぶりに Kaggle に挑戦」です。
当日の市來の発表資料
zenkei-ai-podcast-20220223-03.m4a
ビデオ見れる人はこちらからご覧ください。
(以下は、OpenAI の Whisper を使って文字起こししたものを修正したものです。)
** 注:以下は未編集の草稿です **
ということでメインのA.I.Forumのメインの話に入ります7時51分で、ネタは困った時の、困った時の最近の話題からっていうのは僕がいつも逃げるというんですけども今日は困った時のカグルね、久しぶりに、実際問題久しぶりにカグルなんか面白いのないのかなーと思って見に行ったんですねで、面白いのっていうセンスはね新しいタイプの問題とかコンペとかだともうその状況をマスターするのもなんかもうすごい大変でなんか画像のね、画像分類みたいな古き良き、馴染みのある問題とかあと画像だったら眺めてるだけで楽しいとかねそういう心の癒しを求めてちょっとカグルをさまよってたんですけどもただなんか面白そうなものが面白そうでファミリアなものが目についたのでちょっと紹介したいなと思いますで、2つありますけども1つここに書きました目指せ!植物博士ハーバリアンコンペティションっていうのこれなんか見たことあるなーっていう記憶がありましてでもね、2022これ多分数日前かな見たんですけどもこれ同じやつあったやんっていう話ですねちなみにこれは賞金かかってませんなのでのどかに、ぼっか的にそれこそね、映像をめでながら楽しむタイプのコンペティション学会と連動してるやつですね僕詳しく知らないですけどもあとデータの提供がニューヨークアーバトリアムかなメディエイトなんかあれですねボタニカルガーデン主催ですねです。まだまだ3ヶ月ありますがタイムラインねこれ実はファミリアだって言ったように2年前にも同じようなっていうか何が違うのか僕まだきちんと詳しく見てないんですがハーバリアム2020っていうコンペがありました同じようにコミュニティコンペですけどもこの時はEDAぐらいまで僕やったんですね映像もきれいだし、どんなんかなと思ってなので、そこの部分をご紹介するっていうのはねオンゴーイングなコンペについて相談しちゃいけないよっていうのはコンペのルールあるもんねティームを作ったらティームの中だけにしなきゃいけないとか不特定多数の人でしゃべるんだったらみんなにコンペの人たちのみんなに届くような形で情報共有しなきゃいけないとかなんか面倒くさいことあるんでお話は2020年のハーバリアムの話に限定させていただきますがこの時の多分ね今今回のパッと見た時にルールっていうか分類課題なんだけども分類のターゲットが多分2022は絞られているんじゃないかなっていう15000クラスカテゴリーとかって書いてあったと思いますが2020年のやつは3万超えのカテゴリー分類のタスクでしたで、何っていうとハーバリアムっていうのはどういうんだっけ植物学か違う標本かあのググってくださいで、画像見てわかるように標本画像がサンプルなんですね生物は皆さんねご承知の通り知らない僕は知らない怪、門、猛、木、家、族、種種が一番細かいやつでスピーシーズですねで、何々木、何々火、人、火何々族、ホモサピエン僕よくわかんないんだけどもそういう風に分類はヒエラルキーになってるわけですねで、なんだっけ植物大雑把に言うと植物と動物っていうのが生物にはあってで、植物の中の移管側植物に含まれる門かなり上のレベルですけども門、4つの門がカバーされてるのがターゲットですよっていうあれですねで、その4つっていうのはこれですね秘詞植物、羅詞植物、シダ植物となんとかなんとか要するに植物全般っていう風に僕認識しましたけどもこの時ね植物の総数3200、違う3万2000何が子種が含まれてるデータセットに対して分類しましょうっていうのがすごいよね、恐るべきハーバリアム2020コンペティションでしたそれの今年版っていうのが出てましたサンプルを見るだけでも楽しい浮世絵みたいなものを見て楽しそうですねはい、この時僕EDAしたんだけどこれねこんな巨大なやつの分類ってどうすんの?と思って実際普通に素朴に画像分類とかやってみたんだけどまあうまくいかないですよねで、ようわからんなと思ってその他の忙しい日々の雑事に飲み込まれてコンペを終わってて忘れててみたいなことになってましたで、今回ね、ちょっと結果どうなった?みんなどうやったんだろうなと思ってあの、眺めたら1位の人の、もちろんコンペ終わってたんでどういう風にやった?みたいな話が上がってましたで、1位の人がこうやったんだよって書いてありましたふむふむとアークフェイスってここに書いてあるねっていうのを覚えておいてくださいなるほどといいですとで、これがねカグル久しぶりに癒しを求めていったカグル久しぶりに見た時の見つけたコンペの1つで、もう1個はもう1個、2つ見つけたって言いましたもう1個はさっきちらっと見えましたがこれもね、ファミリアなコンペで、ハッピーホエールっていうコンペティションが始まりました2月1日スタートで、これもすごくファミリアなんですねで、全景AIフォーラムのオーディエンスの人たちにとってもファミリアだと思うんですけどもこれは3年前に通称クジラコンペと呼ばれるですねハンバックホエールアイデンティフィケーションっていうコンペがありました開催されたんですねあ、ちなみにねこっちのコンペティションは金かかってますしまだ始まってないあと2ヶ月ありますみんな結構真剣勝負にやってるんでここに関する話はですね僕は今日はしゃべらないようにしようと狙ってるんですけどねそれにあたって過去の3年前のコンペティションをちょっと詳しく見とこうと勉強しようと正式にね、がっつりやるためにっていう話が今日のメインですで、この時も賞金かかってましたちなみにもっと言うとこの前にコミュニティコンペみたいなんでお金かからずにやっぱりクジラ同じクジラの帯で個体識別をやる画像コンペっていうのが開催されててその時に画像コンペだと思って僕見てただから3年前のさらに2年前とかなのかな見てて、それのコンペ版がこれでそれの2022年版がこれですねっていう話今回はクジラだけじゃなくてドルフィンまで入ってっていう、なんかよりカバレッジが広がって難しくなってるよっていう話らしいですねあんまり詳しくは言えませんが言ってもいいんだけどね回答とか言わなきゃどういう風にやってるとか言わなきゃはいで、皆さん全景AIフォーラムの人ファミリアーですよねって言ったのは実は全景AIフォーラムの2020年の12月にですねの会に古川さんがホエルアイデンティフィケーションってAIによる生体認識っていう発表をしてくれましたで、これはねビデオもここに上がってますしYouTubeだからYouTubeにYouTubeやるとめんどくさいんだけどもPodcastも上がってますシーズン12のエピソード2が古川さんのこの回です皆さん聞いてくださいで、簡単にこのコンペティションねこのコンペティションについて説明してくれてますっていうご紹介で今日はここを学ぼう半分でその後ちょっと技術について入ろう古川さんの話聞いたときに不運と思ってて実際に腹落ちしてないんですねなんで今回ねここを狙ってる僕はカグルは勝てないっていうかカグル勝負するタイプの勝負士じゃないんで自分のスキル上がったらいいなぐらいの感じですけどもちょっと真面目にやってみよう勉強しようと思ってるんで今回それのいいきっかけになるかと思ってやってますがこいつのね3年前のコンペの回答ソリューションっていうのがいっぱい上がってますで、それから学ぼうっていうことをまずやります1位のソリューションコメントとコードもGitHubに公開されてますねこういうモデルの構成にしてって書いてありましたトリプルレットロスを使ってっていうキーワードがありますけども2位の人2位の人はこれもGitHubに上がってますで、3位の人1位、2位、3位とりあえず押さえておいて3位の人はArcFaceを使ってやりましたよってジャーンって書いてありますなるほどということでで、古川さんもこの発表でコメントしていたようにArcFace勉強されてました古川さんのフォーカスはしかし多分1位の人がそれを使ってなくてっていうノリだったんだと思うんですけどもArcFaceっていうものがカテゴライズされてるものっていうのは何かっていうとメトリックラーニングって呼ばれる手法の一種なんですね距離学習って日本語の訳語がついてるものでで、その中にの手法の一つであるところのArcFaceっていうのはその中の一つなんだけどもで、さっきポロって言ったトリプレッドロスっていうのもその中の一つなんですがサイアミーズモデル?アプローチ?っていうのもそういうものなんですね古川さんはそれをフォーカスしてなんかエムニストで話をするみたいなことを発表してましたこの回の発表ではで、僕は今日は古川さんも元気だけはしてたんですがArcFaceをちょっとマスターしたい今回は思ってるどうしてかっていうと2位も3位もArcFaceっての結構重要だよって言ってるのともう始まって20日くらい経ってますがディスカッションとかを読んでるとですねArcFaceっていうのは結構重要なテクノロジーみたいな気がしたのでで、僕はわかってないのでよし、それをやってみようということですということで、カグルのご紹介はあくまでここへの導入っていうことでArcFaceをちょっと調べてみようっていうのが今日のメインの話になりますで、そっちにそのまま進めます
...more
View all episodesView all episodes
Download on the App Store

ZENKEI AI ポッドキャストBy 市來健吾