皆さんこんにちは。@tereka114です。
先週はICMRに参加していましたが、今週からはソルトレイクシティに移動し、CVPRに参加しています。
CVPRはコンピュータビジョンのトップカンファレンスの一つです。
事前メールに記載があり、参加者が6300人をオーバーしているとのことです。
6300人が世界各国から集まるほど、非常に盛り上がっているカンファレンスです。
1日目はWorkshop & Tutorialでした。
昼食から迷子になるほど、広い会場です。
さて、本日は次の2つのセッションに参加しました。
- Tutorial: Weakly Supervised Learning for Computer Vision
- Workshop: Large-Scale Landmark Recognition: A Challenge
Tutorial: Weakly Supervised Learning for Computer Vision
「Weakly Supervised Learning for Computer Vision」に参加しました。
教師あり(=Supervised Learning)DNNの方法は人間の精度を超えてきています。
しかし、この多くのアノテーション済のデータセットが必要です。
複雑なタスク(Classification < Detection < Segmentation)であるほど、1枚に必要なアノテーションの時間は多く必要です。
そのためデータセットのアノテーション方法を変えたり、既存のデータを用いてデータセットが少ない状態で学習ができるよう工夫しています。
業務上、様々な局面で利用できそうなので、調べて勉強しておこうと思います。
Workshop: Large-Scale Landmark Recognition: A Challenge
このセッションは、以前Kaggleで開催されていたコンペティションで上位になった人たちの発表で、Kaggleでは私はRecognition Trackに参加していました。
そのため、このコンペから学びたいことは多くあり、参加しました。
Recognition Track
1, 2, 8位の方が発表しました。局所特徴と大域特徴を組み合わせた方式です。
局所特徴の獲得にDEep Local Features(DeLF)、大域特徴の獲得でGeneralized-Mean(GeM)が使われておりそれらを組み合わせて良い結果を獲得しています。GeMは存在すら知らなかった。
このコンペティションに通常のいわゆる画像認識の分類問題を解いていましたが、どうやらその方式から良くなかったようです。
このコンペティション自体は来年もあるかもしれないので、次回は反省を生かして頑張りたいところ。
Retrieval Track
Retrieval(=検索)は画像を使い、同じカテゴリの画像を検索するコンペティションです。
1,2,3位の方が発表しています。特に面白いのは1位のREMAPです。
CNNの各レイヤーから出力された特徴を利用し、Entropy Weightingが使われていました。
詳しいところの説明はなかったので、実際にEntropy Weightingをどう計算するのかは気になるところです。
1位のソリューションで驚きだったのが、局所特徴を使わず、大域特徴量を抽出する提案手法のREMAPと既存手法のR-MACを使って行っているところです。
局所特徴(DeLF)を使わなかった点について、質疑応答でScaleの変化により、獲得できる特徴が減るからだといった見解があり面白かったです。
最後に
CVPRも初日から勉強することが多くありました。
明日からようやく本会議です!しっかり学んできます。
Acroquest Technologyでは、キャリア採用を行っています。
- ビッグデータ(Hadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
- マイクロサービス、DevOpsなどの技術を使ったり、データ分析、機械学習などのスキルを活かしたい。
- 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
- 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。
www.wantedly.com