ZENKEI AI ポッドキャスト、シーズン28は2022年4月27日に開催した ZOOMライブの模様です。
この日のテーマは「ゴールデンウィークも AI」です。
エピソード5は、第2部「Kaggle 〓〓コンペ」の振り返りです。
当日の市來の発表資料
zenkei-ai-podcast-20220427-05_q200.m4a
ビデオ見れる人はこちらからご覧ください。
(以下は、OpenAI の Whisper を使って文字起こししたものを修正したものです。)
** 注:以下は未編集の草稿です **
ということで、一応今のところスケジュールオンスケで来てますが、第2部はですね、準備しようと思ってコンテンツをこれだけ書いたんですが、ちょっとね、深められなかったんで、紹介するだけで終わっちゃいますが、なので早めに終わりそうな気がします。ネタはですね、カグルのネタです。で、振り返りなんですけど、気づいたら終わってたんです。何もできなかったっていう話をします。振り返りですけども、全景AIフォーラムの今年に入ってから2月の回ね、その時多分祝日だったんだな。祝日もAIやるよっていうタイトルついてますが、その時にカグル、面白いコンペ、面白いっていうかな、画像分類系のコンペ探してて、これがあるじゃんっていうのを紹介しました。クジラコンペっていうのがもともと歴史的にあって、そいつのバージョンアップ版として、クジラだけじゃなくてイルカも、しかもこれね、画像分類のタスクっていうよりは個体識別が目的で、個体識別も画像から個体を識別するっていう意味では画像分類だろうっていう話はありますが、そういう個体識別の分類コンペ。で、前はクジラのAさんBさんみたいなものだけじゃなくて、イルカのCさんDさんみたいなね、も含まれてくるようなレベルになるっていうのがありました。あったっていうのを2月にやってですね、まだ2ヶ月ぐらいあるぜって言って、頑張んなきゃいけないね、アークフェイスとかその辺を使わなきゃいけないのかな、勉強しようって言ってたのが2月でした。で、予想通りで結局その時にやってたまんま、また放置されてですね、何も結局勉強もできなかったし、コンペも全然できませんでした。結果ね、サブミット何もできなかったし、研究、学習も進まなかった。で、もう終わっちゃったんですね。これが4月の2…18かな?先週とか終わって、っていうかね、Twitterタイムラインでカグラの人とかを僕何人かフォローしてるんですが、コンペ終わって、やりました!優勝しました!っていうようなのをポンと僕のタイムライン上がってきた。あ、もう終わってたー!と思う。それで気付くっていうパターンでしたけども、私の結果です。結果自慢するんじゃなくてね、自慢にならないですが、1ヶ月前の投稿でもう止まってました。8個しか投稿できてませんが、スコアがね、43…0.436、1153位でした。パブリックスコアランクから6個落としてます。まあどうでもいい話ですけどね。ちなみにトップのスコアは0.875に対して、僕の初期の段階っていうか、初めの頃の段階、0.436。順位的には今こう1153ってありますが、分母が1589なので、お前どれぐらいの場所にいるんやったら、上から数えて72%ぐらいのところですね。全然ダメですね。あの…頑張んなきゃいけない。頑張んなきゃいけないっていうかな。計画性が大事ですよね。やっぱカグルはいつも思うけど。行き当たりばったりで、なんかひらめきだけでなんかやりたいなとかっていうのは通用しない世界です。っていう反省ばかりですけども。で、今日のネタはね、これで終わって1週間弱なんで、ソリューションね、上位の人たちのこういうのを、でこういう結果出ましたよっていう風な投稿がガーッとまとまった段階なので、それをおさらいして、それをまとめを発表しようかなって今日は企んでたんですけども、ちょっとね時間取れなくて、そういうのできなかったので、人様のね、そういうことをしてくれてる人がいます。この方、ゆめねこさんですけども、クジラコンペの上位解放をまとめしてくれてます。これ読んだらもうこれでいいやんと思ったので、僕も泣いてしまったっていうかね、時間もなかったから。で、今日これをなぞるつもりもないんですね。これすらも僕きちんと読めてないし、これはね、僕の話じゃないので、各人ここに行って見てもらうか、してもらったらいいと思いますが、この人自身もコンペに参加してて、いろいろやってて、僕よりもずっと上に行ってますけどね。だけど、いろんな、これがキーポイントだったみたいなね、書いてあって、ふむふむと読ませるものがありますので、僕は後できちんと自分で読もうと思ってるっていうのがあるので、今ここでですね、しったかぶりするつもりはないです。で、Kaggleのサイトに行くと、リーダーボードがあって、順位も確定してますけども、これ賞金かかってるね。見たらわかるんだけど、まあいいや、これ後ろの方でやる。開放ね、このディスカッションのところに投稿してくれてる人たちっていうのが、上位の方から僕ずっと探してて、1,2,3,4、5位の有名なベストフィッティングさんの投稿は僕見つけられなかったんだけど、1,2,3,4、5、飛んで6,7,8、10,11、14、18,22、29,30、あと36と19を多分追加で見つけたのかな、この上の有名猫さんの投稿見てね。っていう人たちの開放の投稿をですね、ピックアップっていうか見つけてリストにした。これを土台に読んで、今日の解説のネタにしようと思って準備してる途中で結局時間切れになっちゃったっていう話ですけども、でも情報としてシェアしておきます。で、見ていきますが、見ていくっていうかね、コメントね。1位。1位のソリューションはこれですよって言うんですが、さっき言ったね、あの、あ、コンペもうこの週末で終わったんだって気づいたのは彼のね、この投稿でした。けんしんさんですね。いきなりね、初参加で優勝しちゃったんだって1位、すごいよね。プリファード、プリファードすげーな。はい、本当に1位だよね、これすごいなと思いましたけども。で、ソリューションここに書いてあるんで、後できちんと読もうと思ってます。このコンペ1位は日本の方でしたと。で、これチームメイトの人。この人強かったんでしょうね。プリファードの公式にもすごいぜって書いてあります。で、2位の人。2位の人もね、石けいってアカウントあるね。これ2位。この人のツイッターアカウントはこれなのかどうか僕はそこまできちんと覚えてないですが、石けいさんって石けいさん明らかに日本人っぽいよね。2位もじゃあ日本人だったのっていう感じですけどね。3位。3位はね、3人チームでいろんな人たちが。これ多分ね、オレンジ色、これはグランドマスターがこの色?それともマスター?要するにもう上位の人ですね。僕とかは青丸みたいなね、さっきのね。さっきのこの人、この人も青丸。でもこの人1位になったからいきなり上がるんだよな。結構、カグラーの、つよつよカグラーの人たちが3人集まって第3位になってですね。次。第4位。これがぐるっと丸くなってるからこれグランドマスターか。よくわかんないですけどね。4位でしょ。で、6位。6位はゆうじさんですからこれも日本の方ですね。日本多いなと思いました今回。7位、8位、9位。これ8位は3人チーム。10位。10位の人も多分ね、これ日本の方ですね。ツイッターアカウントでやったーって言ってました。11位。11位はこれはあれだ。これもチームで日本の方ですね。内田さんのチームだな。アークフェイスの解説投稿してくれた方のチームじゃないかな。きちんと見てません。印象としてなんか身近なっていうのかな。我が同胞の日本の人たちがすげー活躍してるところで、僕もきちんとやらなきゃいけないなと思った。と思ったということですね。はい。画像コンペね。で、あれだ。そう、きちんとソリューションをね。何が大事だったのかっていう。カグルに参加してる目的って、勝つことに賞金もらえたら嬉しいかもしれないけど、それが目的じゃないですからね。終わった後にこの問題の答え合わせっていうかね、何を学ぶのかっていうのが大事なので、今からが本番だと言い訳を負け犬の登場してますが、勉強しようと思ってて、この夢猫さんのページを特化かかりにね、やっていこうと思ってます。思ってますと。で、それはそれと。終わったものは終わったものと。終わったものは終わったものと。で、2月にね、2月のコンペ、もう今ちら見せしましたが、それはその後の話で、実はね、2月にクジラコンペの話をしたって言いました。言いましたが、クジラコンペの話だけをしたわけじゃなかったんですね、2月はね。カグルコンペの話をしたんですね。カグルコンペの話は他にもあって、ハーバリアムコンペっていうのがですね、あります。これはこの時もうスタートして、賞金かかってません。この時スタートしてましたが、まだやってます。内容は似てるんでね。これも個体識別じゃなくて、種別を大量にある種別を分類するっていうやつで。タイムスケジュールどこに出てるんだっけ。あと1ヶ月あります。何日?何日?日付は?日付は?デッドラインは?これがだからまだまだオンゴーイングで、僕はこれ投稿したんだっけ。投稿したんだっけ。ジョインコンペティション、俺まだジョインもしてないじゃん。ジョインしよう。ログインしてないからジョインしてないだけや。OK。これまだ残ってるんで、言いたいことは、クジラコンペの学びをしましょうって言って、その学んだ知識をこのコンペにつぎ込もうっていうモチベーションを持ってですね、やろうかなと。やろうかなと。やろうかなと。やろうかなと。この時の話はこれで終わりかな。アークフェイスの話ね。そう、って思ってます。っていうのが1個。カグルに関してはね。で、もう1個。さっきチラッと見えましたが、ゆめねこさんにまとめしてくださって、すごいなぁと思ったんですが、Twitterフォローしたら、こんなコンペがあるよってツイートを流してきてて、このコンペね、面白そうだなと思って。これ何かというと、さっきもね、画像を上げてデプス推定、モンちゃんが浮き立ってるようになったっていう話がありました。あと、前回かな。NERFって言って、たくさん画像を撮ってる画像の撮影位置を推定するディープラーニングのモデルっていうのがありましたけども、その系統のコンペですね、これね。イメージマッチングチャレンジ2022。画像がどっから撮られたかっていうのを、多分、推定しようっていう話かな。論文も読まないし、コンペも読まないで勝手に紹介するっていうのは本当にダメダメですけども、これ面白そうなのちょっとやってみようかな。あと1ヶ月しかないっていうふうな話ですけども。これ結構、僕の趣味と実績っていうかね、全形AIフォーラムは基本的に趣味っていうポジションに置いてるんですが、仕事でもこれはね、重要なね。パノラマの全形株式会社ですから。あとね、AIの全形株式会社で、メタバースの全形株式会社で、Web3の全形株式会社ですから、ちょっと頑張っていこうかなと。これは面白そうなんで、ちょっと悪い癖は、できもしないのにあれもやりたい、これもやりたいって散漫になることがいけないんですよね。今締めながらやっていきたいなと思ってます。ということで、あっという間にですね、結局きちんと時間深掘りすることが何もできなかったので、今日は第2部はこれだけで終わっちゃいました。ということで、またシェアを戻して、ちゃんもりさんに助けを求めます。YouTubeに見てる方、コメントください。見てる方はね、たぶんね、3人くらいしかいないんですけど。コメントください。待ってます。で、ちゃんもりさんに戻ります。ちゃんもりさんは、カグルとかはやってる暇はない?微妙なところですね。なんか、電話番号の認証で失敗してて。あー、なんか言ってたね。カグル、アカウントがまだできてないんだね。そうです。前はできたんですけど、認証が通らなくて。それは電話番号打ち間違ってるとか、国番号とかそういうところじゃない?なんかその番号もう使われてますって言われて。あー、そうか。1回承認しようと思って使ったからってことか?わかんないけどね。窓口に相談してみたら、それが一番早いかも。人間を使うっていうのがね。追い合わせが早いかなと思って。うんうん、だね。カグルは、携帯だって、何のために携帯って2段階承認って結局、本人をアイデンティファイするためだから別な携帯番号を使うとかってできないものだから使われてるわけだからね。そこを突破するのは本人ですって人間に交渉するしかないわね、やっぱりね。あまりオードなコンペはやったことないんですけど、なんかお試しみたいなタイタニックとか数字のやつとか、フェミニストのやつとかはやったことあるんですけど、なんかすごいマシンがなくても上位に食い込めるものなんですかね、ああいうのって。上位に食い込むっていう、てかね、そこは多分考えない方が良くて、そこまで行くと本当にもう、アフターファイブを全投入してる人たちと戦わなきゃいけない世界になるけど、そうじゃないレベルで、メダルを取るぐらいのレベルだったら、メダル取れてない僕が言ってるのは意味がないかもしれないけど、CPUとかは今、Googleのコラボがあるじゃない。あれでまず1インスタンス確保できるでしょ、誰でも、ただで。そうですね。今、KaggleがTPUまで使えるインスタンスを、あれ時間クォーターが結構厳しいっていうか、24時間ずっとは使い切れないんだけども、それでもかなり使える、計算に使えるから、その辺を使い回すと、手元にGPUマシンがない人でも何もできないわけではない。もちろんやりくりして上手いことやらなきゃいけないとは思うけど、結構今はできるものがありますね。そうですね。使ったことはありますけど、普通に使えるんやって感じで、Kaggleのもコラボのも。C、結構Kaggleの方はもうデータセットも簡単にインポートできるし、コラボもKaggleのあれだよね、Library API SDKかなんかを入れればダウンロードは時間はかかるけども、普通にコマンド一発で持ってこれるし、結構。そう、だからね、周りが、Kaggleもね、牧歌的なもんじゃないよね、いろんな周辞ノウハウっていうかシステム的なものが結構あって、僕とか久しぶりに今回のクジラとかあの辺で他の人たちのディスカッションとかコードとか見てたら、MLops系のサービスなのかな、1DBとかって学習のログとかをクラウドで保存して可視化するサービスとかみんなバンバン使ってるんだよね。まずそれってどうやって使うもの、どういう仕組みなのってそこから始めなきゃいけなかったりするから、結構あっという間に時代は変わってるんだなと思って、そこに追いつくのは結構個人的には大変だったりして、結局追いつけてないんだけどね。それのメリットもいまいちよくわかってないんだけど。なんか、あれだね、そういう、それでもKaggle日本強いっていうのは、あれだよね、プリファードの人たちって、その辺のノウハウの伝承するっていうのは結構重要な要素の一つなんだろうなっていう気がするね。あと、計画性っていうかな、性格ですね。僕はやっぱ合わないんだな。地道に計画通りにスケジューリングして、いや時間は数ヶ月で長いとはいえ、ディープラーニングの学習ってさ、タスクが長いから一晩走らせて一個結果が出るとかだから、それこそ気が長いっていうか計画性が大事なんだよね。貴重面な人、貴重面差も短期的な貴重面差じゃなくて長期的な貴重面差を持ってる人が多分すごい強いんだろうなと思って、僕はイラチだから、パラメータペペって書いてやってやって、すぐに結果が出てそこをまた調整してペッてやりたくなるからね。って言い訳をしてるね。なかなかね、メダルすら取れないんでね。もうね、なんかうううってなってるんだよね。もうしょうがないね。でも、やっぱりどっかでこう、自分の限界を超えたところで切磋琢磨しないと学びっていうのは身につかないからね。なんかやりたいなぁとは口では言ってますけどね。なかなか難しいな。ハーバリアムちょっと真面目にやろうかなって言っといて何もしないっていう善化を、もうここでね、全敬愛フォーラムでもさらしてるから。もう狼少年にすらなってないですけどね。ぜひ、あのちゃんもりさんも携帯電話を突破して参加して。はい、問い合わせください。えーっと、YouTubeは誰もコメントくれないので、今日はもうこんな感じかな。8時半でまだ予定だと30分残ってるけど、なんか、なんかあの、みんなに伝えたいことがあれば。ちゃんもりさんタイム。いや、特にないですね。はい。はい、あの、体に気をつけて季節の変わり目ですけども。ゴールデンウィークは何か予定がありますか?どっか行くみたいなやつですか?どっか行くみたいなんでも、なんかやるでも。あんまり人と会うぐらいですかね。人と会う。あれはすっこめって言ってるような。人と会うんですね。青島さんに会うかもしれないですね。戻ってくるの?それともあっちに行くの?戻ってこられるみたいです。あ、ほんと。はい、青島さんね。元気にしてるのかな。はい。してると思います。はい、よろしくお伝えください。AIフォーラムにもお待ち。あ、ところでさ、僕まとめ全然できないくせに聞くだけ聞いてんだけども、原稿ってできたんだっけ?原稿は今作ってます。あ、OK。気長に待ってますので。なんか締め切りとかってあります?あると僕言えない立場にあるので、ないけど、僕自身も書いて出さなきゃいけないっていう気持ちはあるけども、今日もう次回が終わっちゃったからね、多分締め切りは今日っていうかね、あれだったんですけども。いや大丈夫です。僕も遅れてるんで。でもせっかくなんでね、形にしましょう。頑張って。はい。ということで、YouTubeもね、コメントがないので、じゃあこれで今日は2022年の4月の全形AIフォーラムはこれでお開きにします。ちゃんもりさん、わざわざありがとうございました。ありがとうございました。YouTubeをご覧の皆さんもありがとうございました。あと、後でね、事後的にアーカイブビデオを見てくださる方も、わざわざ長い時間ありがとうございましたということで、今日はこれで終わりにします。おやすみなさい。ありがとうございました。