Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

データマイニングの国際学会KDD2023に現地参加し、ポスター発表してきました

皆さんこんにちは
機械学習チームYAMALEX@tereka114です。
YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。
(詳細はリンク先をご覧ください。)

私自身8月4日〜8月12日までアメリカ・ロングビーチ渡航し、KDD2023に参加とポスター発表してきました。
ここ数年、コロナウィルスの影響で自分自身、オフライン参加は控えていましたが、今年はそろそろかなーともあり、行くことにしました。

展示場(ランチ会場)人が多い

KDD2023概要

KDDは正式名称、29th ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MININGです。
主に取り扱うテーマはデータマイニングを扱っているものです。

今回の会議としてはKeyNote3本、各セッションへの参加、Workshopへの参加など盛りだくさんです。
リモートでの参加はできず、基本現地への参加になるものでした。

KDDは主に以下のような内容からなります。

  • SIGKDD Conference(本会議)
    • KeyNote、Workshop/Tutorialに加え、各論文を説明するセッションやポスター発表がありました。
      今回は、10~15ほどのテーマのセッションが常時開催されており、約180ほど開催され盛り上がってました。
  • KDDCup

KDDのスケジュールは次のとおりです。
8/7の夜からポスターセッション開始で、本会議が開始されました。8/9の午後にKDDCupがありました。
KDDCupには当社のチームが入賞したので、ポスター発表をしました。

日付 内容
8/6 Workshop/Tutorial
8/7 Workshop/Tutorial/Opening/Poster
8/8 KeyNote/Session/Poster
8/9 KeyNote/Session/KDDCup
8/10 KeyNote/Session

研究志向であるのResearch Track、応用事例を中心としたApplied Data Science(ADS)の2つの種類と各2つの中でそれぞれの技術傾向(Graph, Recommendation)に別れたトラックがあります。
CVPR・ICCVといった私が参加していたCV系の学会ではResearch,ADS2つは区別されておらず、論文の紹介のみだったので新鮮に感じました。傾向が違うのでより話を聞きたいほうにいけるので良いですね。

kdd.org

会場写真

学会の様子

Opening

2日目の夜に開催されたOpeningでは参加者やペーパーの統計、及び、また、ベストペーパーをはじめとした賞の紹介がありました。
KDD2023は2200名ほど参加しています。

Opening Slide

セッション

今回私は、Workshopは大規模言語モデルやマルチモーダルのような今のトレンドがあるワークショップに参加していました。
反面、本会議のセッションは普段触れていないものに可能な限り触れたいと思いGraphや時系列など他のセッションへ参加していました。
セッションに参加した感想は次のとおりです。

  • 大規模言語モデルの注目度は高く、セッションの参加者が多い。KDDではKeyNoteの2/3が大規模言語モデル関連、かつ、Workshopもあった。しばらく大規模言語モデルはブームが続きそう。
  • データサイエンスに関する技術が万遍なく紹介されているように思える。テーブル系のものであればこのカンファレンスで新しい技術に関して大きな学びがありそう。
  • Graph(Graph Neural Network)、Federated Learningの例が想像以上に論文の数が多かった。
  • Causal AI系の話もところどころ聞いたので、追いかけたほうが良い。
セッション会場

KDDCup

KDDCupは毎年開催されるKDDが主催のコンペティションです。
今年はAmazonのセッションデータを用いて、3トラック開催されていました。

Task1:セッション・アイテム数が多い3カ国に関してセッションが次に購入するアイテムは何かを推薦する。
Task2:セッション・アイテム数が少ない3カ国に関してセッションが次に購入するアイテムは何かを推薦する。
Task3:セッションが次に購入するアイテムは何かのタイトルを当てる。

また、Workshop内では、コンペの上位者から口頭のプレゼンテーションの発表もあり、具体的な手法に関して説明があり、後で入賞者のポスター発表です。
先にも書いた通り、今年は当社チームでTask2で9位に入賞したことにより、ポスター発表していました。
発表を聞いた感触、上位者と比べて、細かいところの積み重ねで差分があり、まだまだ詰めが足りませんでした。

来年は異なるテーマだと思うので、また、入賞目指してコンペには参加したいと思います。
なお、Workshopの公式HPは次の通りです。

kddcup23.github.io

KDDCupのポスター発表

KDD Annual Celebration

最終日より1日前にKDD Annual Celebrationが開催されました。
スポンサーの発表、KDDCupの表彰や次回開催地(バルセロナ)の発表がありました。
今まで参加していた学会がそこまで発表ベースではなく、催し物系のが多かったので、少し驚きでした。
オンラインでの発表サイトもなく、特にオフラインにおける交流・ライブ感といったものを大切にしているように思えます。

全く関係ありませんが、こちらは、懇親会会場で遊んでいる筆者です。

懇親会会場で遊んでいる筆者

食事

KDDではビュッフェ形式でランチやポスタータイミングでの夕食(軽食)があります。
ポスタータイミングは夜18時~20時ですので、お腹が空いてくる頃になります。食事内容は概ねハンバーガーと軽食です。(費用は参加費に含まれています)

ビュッフェ形式の食事

ちなみにアメリカのハンバーガーセットは$20ほどです。
日本円では考えないことにしました。

一般的なハンバーガーセット

最後に

アメリ渡航、久々すぎて不安もいっぱいでした。
その中で、今回、送り出してくれた会社の皆さん、Twitterなどでアメリカの過ごし方をアドバイスいただいた方、現地で交流していただけた方のおかげでKDD初参加でしたが、非常に楽しいものでした。

来年も参加したいと思いますのでコンペでの対戦も引き続きよろしくお願いします。

Acroquest Technologyでは、キャリア採用を行っています。

  • ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
  • Elasticsearch等を使ったデータ収集/分析/可視化
  • マイクロサービス、DevOps、最新のOSSを利用する開発プロジェクト
  • 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Kaggle Grandmasterと一緒に働きたエンジニアWanted! - Acroquest Technology株式会社のデータサイエンティストの採用 - Wantedlywww.wantedly.com