先日参加した関西Kaggler会が楽しかった + 勉強になったので、忘れないうちにまとめておこうと思います。
オープニング
まずはいつもの「始まりの儀式」で開始。
過去の写真と見比べるとすごく参加者が増えましたね!
関西kaggler会はじまりの儀式
— ころんびあ (@colum2131) 2023年10月20日
关西kaggle会议开幕式
Kansai kaggle meeting opening ceremonyhttps://t.co/OZw8IFGyx2#関西kaggler会 pic.twitter.com/LchZsS2NsC
そしてmgnさんのオープニング。
いい感じに会場を暖めて笑いも引き出すトークは流石です。
「どんどんツートしましょう」ということでこんな仕掛けが。
他のイベントでも使えそうです。
仕掛けがすごい。
— すえ (@sue1242) 2023年10月20日
QRを読み込むと自動でつぶやける#関西kaggler会 pic.twitter.com/6GYq4rOvhr
ちなみに関西は「お行儀いい関東と違って笑いも」とのことです。
これは突然イジられるベルーガさん。
#ashibinaa #関西kaggler会 pic.twitter.com/QvLKLoTbRT
— Beluga@AIテックカンパニーElith(エリス) (@Beluuuuuuga) 2023年10月20日
どりぃさん発表
まずは会場を提供くださったR3 instituteからどりぃさんが登壇。
素敵な会場を使わせていただき、ありがとうございます。
以下のリンクに会場の詳しい説明や写真があります。
会場がすごいいい感じ。https://t.co/nrnqRRlQmS
— すえ (@sue1242) 2023年10月20日
#関西kaggler会 #ashibinaa
たいちさん発表
ここからKaggleの話、と思いきや自作キーボードの話。
関西Kaggler会では自作キーボード講座 (超初心者向け) やります。
— たいち@なんもやってない (@HomesickTic) 2023年10月18日
Kagglerとは。 pic.twitter.com/GnK7p1mTPS
関西kaggler会、初手はまさかのキーボードの話。ありのまま今起こったことを話すぜ。いま、自作キーボードをひたすらすすめられている。#関西kaggler会
— K_mat (@Kmat67916008) 2023年10月20日
ちなみにこのレポの筆者はHHKBを愛用しています。
HHKBと同じぐらいの出費で自作キーボードの世界に入門できるそうで、かなり興味が湧きました(特に左右分離してるやつ)。
あと「自作キーボードを使うと持ち歩かないといけなくて重いんですが、、」という質問に「なら2つ持てばいい」と食い気味に回答していて、ここでも爆笑がw
ちなみに「持ち運ぶことが気にならなくなるくらい楽しい」とのことです。
持ち運ぶことが気にならなくなるくらい楽しいですよ!!(運んだ方が楽
— たいち@なんもやってない (@HomesickTic) 2023年10月20日
ころんびあさん発表
続いてのころんびあさんの発表は「コンペに勝つには」。
こちらはコンペはコンペでもCVPRのお話。
次はコミュ力おばけのcolumbiaさん。「勝ちたいですか?!」という問いかけからスタートした。これは強いkaggle トークが期待できる!
— K_mat (@Kmat67916008) 2023年10月20日
…ありのまま今起こったことを話すぜ。なぜかCVPRの話を聞かされている。#関西kaggler会
ただ入りが全員で爆笑していただけに、技術の深い話になるとなんか会場が異様に静かに。。
(全員が全員画像のプロじゃないだけに、この辺の塩梅はすごい難しいですね)
Encoderに2D物体検出学習済みモデルを使って3Dの物体検出ができるらしい。
— すえ (@sue1242) 2023年10月20日
最初の笑い寄りの話と比べて話が難しくなってきた。
#関西kaggler会
結果、結論としては「いい感じに」やるということに。
(以降「いい感じに」「よしなに」が会場で流行り出すw)
複数のカメラを、カメラパラメータを「いい感じに」組み合わせるのがポイント
— すえ (@sue1242) 2023年10月20日
「いい感じに」「よしなに」がポイント
#関西kaggler会
なるほど
— Ryushi (@Ryukwirt) 2023年10月20日
良い感じに
よしなに
実装するのか....#関西kaggler会
みんな「いい感じ」がトレンドワードになってる #関西kaggler会
— eikichi (@eikichi838) 2023年10月20日
ちなみに3D物体検出を「いい感じに」やれるようにはなるには、「とにかく論文読みましょう!」とのこと。
(後どれぐらい論文を読めば「いい感じに」扱えるようになるだろうか)
T88さん発表
こちらは関西Kaggler会に先立って開催されたコミュニティコンペをGPT-4にコードを書かせてみた、というもの。
発表します!
— T88 (@take213) 2023年10月20日
忙しくて手を動かせない時もいい感じに進捗出してくれるAgent作りたい https://t.co/ufD0xe1iwO #関西kaggler会
こちらは「githubのissueにcv改善のアイディアを書けば、GPT-4がコードを書いてくれてcv下がったか確認してくれる」という優れもの。
ちゃんと確認しないと初歩的なミスをしたり、存在しない列名を指定してエラーを出したり、盛大にリークさせたりするものの、最終的にはなんとコミュニティコンペで11位相当スコアだったとのこと。
盛大にリークさせちゃうのかわいい #関西kaggler会
— ころんびあ (@colum2131) 2023年10月20日
(このブログの筆者はギリギリでした。ただ私のsubmitは「特定の市の不動産価格を1.3倍する後処理」を入れているので、それを入れない条件で揃えるとGPT-4に負けます)
危うくGPT-4に負けるところだった。
— すえ (@sue1242) 2023年10月20日
もと関西人のメンツを保てた。よかった。
#関西kaggler会 pic.twitter.com/SNzJfjMsl4
ronさん発表
お次はパパさんKagglerで社会人博士で出張の多いronさんによる「時間のないKagglerのすすめ」。
社会人博士パパkagglerのろんさんは、時間がなさすぎて、論文書きながら子供あやしながら家事しながらレッドブルを飲みながら講演中。#関西kaggler会
— K_mat (@Kmat67916008) 2023年10月20日
「いかに隙間時間でKaggleをするか」がポイントとのこと。
#関西Kaggler会
— taruto (@taruto067268802) 2023年10月20日
ろんさん、Kagglerの最適な1日 pic.twitter.com/MYbGaWKwWb
スマホからGPUマシンにアクセスしたり、
子どもを寝かしつけながらスマホでdiscussion読んだり、
スマホでsubmitしたり、
とにかくスマホを大活用してます(キーボードいらないとか言わない)。
関東Kaggler会でも「Redbullは1日1本まで」と言うお話でしたが、こちらでは「RedbullとChilloutを交互に飲む」メソッドが紹介されてました。
(ronさん、お身体は大事にしてください。。)
関西Kaggler会のLTでOPENにしました<Red Bull-CHILL OUTメソッド>がこちらとなります。用法用量を守って皆さまぜひご活用ください💪
— ろん (@mipypf) 2023年10月20日
#関西kaggler会 pic.twitter.com/gIAZKY2tHD
RedBull⇔CHILLOUTを交互に飲むことで無限に最強状態になれる #関西kaggler会
— Taro (@taro_stst) 2023年10月20日
ろんさんの生活最適化、目的関数から健康の項が削られていた............... #関西kaggler会
— johannyjm1 (@johannyjm1) 2023年10月20日
あと「大自然の中でsubmitするといいスコアが出る」と言うお話でしたが、、
大自然の中でsubmitするといいスコアが出るらしい
— すえ (@sue1242) 2023年10月20日
#関西kaggler会 pic.twitter.com/0vqraLeZBX
Jackさん発表
お次はJackさんから「Feature Importanceによる特徴量選択とリーク」のお話。
Jackさんは少ないsub数で上位に入ることから「忍者」と呼ばれているそうで。
Jackさんは忍者だったのか #関西kaggler会
— ころんびあ (@colum2131) 2023年10月20日
CV全体でFeature Importanceを平均しちゃうと、バリデーションデータのノイズ情報も入り込んでしまうとのこと。
あとは「全foldで改善しているか」と言う観点も重要だそうで。
その辺りを真面目に見ないことがあるので気をつけたいところです。
Jackさんの特徴量選択とリークの話。なんとなくでやっちゃうことがよくあるので勉強になる #関西kaggler会
— Taro (@taro_stst) 2023年10月20日
Jackさんはfeature importanceで特徴量選択(CV全体)してリークさせる話。
— K_mat (@Kmat67916008) 2023年10月20日
こういうほんのりとしたリークはすごくよくある。個人的に、他人のCVはそれほど信用してない。#関西kaggler会
くるぴーさん発表
お次は最近Grand Masterに昇格されたくるぴーさんのLLMコンペの話。
GMになったくるぴーさんの発表。会場からの拍手喝采 #関西kaggler会
— T88 (@take213) 2023年10月20日
kurupicalさん、2021年にGMリーチしてから7回目のソロ金チャレンジでようやくGMになれたとのこと。
— すえ (@sue1242) 2023年10月20日
おめでとうございます。
#関西kaggler会
実験を高速に回すコツを色々伺えました。
60kのデータから1.5kのデータを抽出してモデル抽出の探索を高速に実施 #関西kaggler会
— T88 (@take213) 2023年10月20日
retrievalの評価。wikipediaのaから始まるものだけ使って、retrieval評価データセットを作った #関西kaggler会
— T88 (@take213) 2023年10月20日
また「❌GPUを止めるな ⭕️思考を止めるな」「信じたアイディアと心中する」など、私含め多くのKagglerに刺ささる名言をいただきました。
(疲れてくると適当にハイパラだけ変えてGPU動かしたりしがち。。)
❌GPU を止めるな
— johannyjm1 (@johannyjm1) 2023年10月20日
⭕思考を止めるな#関西kaggler会
くるぴーさん
— taruto (@taruto067268802) 2023年10月20日
Kaggleの戦い方:
広く浅く検証。GPUを止めるな。❌
信じたいアイデアと心中。思考を止めるな⭕️
心に染みる言葉。#関西Kaggler会
くるぴーさんの信じたアイディアと心中・思考を止めるな、めちゃくちゃ参考になる🚀 #関西kaggler会
— ろん (@mipypf) 2023年10月20日
nejumiさん発表
お次はこの関西Kaggler会に先立って行われたコミュニティコンペを設計くださったnejumiさんから、まさしくコミュニティコンペの話。
ここ数年で、商用利用がOKになったり、Visibilityが制御できるようになったり、Custom Metricが使えるようになったりと、何かと機能が増えて便利になっているようです。
「コンペ設計のポイント」という「開く側」でないとノウハウを積めない貴重なお話も伺えました。
「コンペを開く側」お話はなかなか伺えないので、非常に興味深かったです。
職場の有志とかでコミュニティコンペを開くのも面白そう、と思えるお話でした。
ねじゅみさんによるkaggle コミュニティコンペの話。初めて聞くことばかり。
— K_mat (@Kmat67916008) 2023年10月20日
コンペをコピーできる話とか、コンペのタイムゾーンをローカルにできる話とか、シミュレーションコンペできる話とか。確かにやってみたくなる。#関西kaggler会
kaggleを授業で使うのおもしろそう#関西kaggler会
— ちょりーぬ (@choririnu) 2023年10月20日
あとチーターは丸わかりらしいですよ!
丁寧にコンペ設計してもshake盛大にするのかぁ
— taruto (@taruto067268802) 2023年10月20日
チーターも丸わかりらしい笑#関西Kaggler会
johannyjm1さん発表
お次はjohannyjm1さんの「Polarsと遅延評価」
Polars の遅延評価について今わかっていることをまとめてみました!https://t.co/qX74XyxZv0
— johannyjm1 (@johannyjm1) 2023年10月20日
ざっくり性能評価するための Colab. です!https://t.co/z4XgbU10mH
#関西kaggler会
筆者は「遅延評価」をちゃんと分かってなかったのですが、"式の評価を「必要になるまで」行わない、サボる仕組みのこと" とのことです。
気になる方は↑の資料が非常にわかりやすいのでそちらをご覧ください。
polarsを使う時は、"df.lazy()" で遅延評価を使いましょう!
今日も元気に df.lazy() #関西kaggler会
— ころんびあ (@colum2131) 2023年10月20日
ヨハンさんの遅延評価の話。必要になるまで処理をおこなわない仕組み。polarsはlazy apiがあるのでdf.lazyで簡単に変換できる。
— K_mat (@Kmat67916008) 2023年10月20日
一方ヨハンさんはすごく丁寧でハキハキ話しすぎて息切れしており、lazy感ゼロな発表。#関西kaggler会
あまえびんさんLT
お次はあまえびんさんの「オレオレ開発Kaggle環境」。
筆者はKaggle用のAWS環境を立てる際、これまではAWS推奨のTraning job用のDoeck imageを使ってましたが、ライブラリのバージョンやディレクトリの構成も考えるとKaggleに合わせたイメージを使う方が良さそうです。
今度からそれで開発してみようと思います。
すでに「オレオレ開発Kaggle環境」のユーザーもいらっしゃるようです。
あまえびんさんの「オレオレ開発Kaggle環境」すごい便利です!自分もユーザーです🙌https://t.co/jChhAb2HTl
— ろん (@mipypf) 2023年10月20日
#関西kaggler会
ベルーガさんLT
お次はベルーガさんのLT。
ここはその場限りの話が多かったため、割愛させていただきます。
paoさんLT
最後はpaoさんのLT。
ABEJAさんの紹介や、Kaggleと実務に関して「Kagglerのどんなところが実務の中で役立っているのか」「Kagglerの安心感」などの話でした。
Kagglerの安心感、わかりみが深いです #関西kaggler会
— ろん (@mipypf) 2023年10月20日
そりゃあ役に立つやろまでの流れが綺麗#関西kaggler会
— 教訓太郎 (@kyoukuntaro) 2023年10月20日
懇親会
夜の懇親会では新しくGMに上られたchunmajinさんとくるぴーさんに運営からお祝いにTシャツのプレゼントがあったり、
昨日は関西kaggler会でコンペGMになったお祝いを盛大にして頂きました。プレゼント(Tシャツや個別にモンハングッズ)もらっただけじゃなくて、話して頂いた方、皆さんからおめでとうと言われて嬉しかったです!ありがとうございました!#関西kaggler会 pic.twitter.com/B9TfyaIiuB
— chumajin (@ChuMajin) 2023年10月21日
抽選会があったり、
抽選で、DataRobotのTシャツ当たりました!!!🤖
— taruto (@taruto067268802) 2023年10月20日
ありがとうございます!#関西Kaggler会 pic.twitter.com/xk9NupQIhj
当たりました〜! #関西Kaggler会 pic.twitter.com/DzlRog6xCt
— Hajime Tamura (@thajime_ds) 2023年10月20日
関西Kaggler会の景品抽選会で、@choririnu @yuki93753711 @taro_stst
— ろん (@mipypf) 2023年10月20日
がろんさんにって車くれました😭!ありがとうございます😭
うち1台は@Kmat67916008 さんにあげました🙌#関西kaggler会 pic.twitter.com/Yrd0N0n5v4
コンペの賞の贈呈があったり
コンペ注目の賞いただきました✨
— today (@today555555) 2023年10月20日
家に帰るまで開けるなと言われて
浦島太郎的な鶴の恩返し的なフリもいただきました♪
ちょっと覗いたらさらに素敵なラッピングされてました!!!!!!!!#関西kaggler会 pic.twitter.com/EZvwdYCqVp
とイベントが盛り沢山な上に、普段そうそう会えない方々とお話しすることができ、大盛り上がりの楽しい & 勉強に場でした。
関西Kaggler会、とても和気藹々とした雰囲気で、学生の方や社会人の方、色々な方とお話しできて楽しかったです。ありがとうございました。Kaggleのモチベーション高まりました。頑張るぞ!#関西Kaggler会
— Hajime Tamura (@thajime_ds) 2023年10月21日
初参加でしたが、沢山の方と繋がれて嬉しかったです。また来たい!
— ぐちやま (@goose_haaan) 2023年10月21日
皆さん本当にありがとうございました!!
#関西kaggler会
以上、関西Kaggler会 参加レポでした!
少しでも雰囲気をお届けできていたら幸いです。
最後に、このような非常に勉強になりかつ楽しい場を設けていただいた運営の方々、末筆ながら感謝申し上げます。
会場でお話しいただいた方々も、本当にありがとうございました!