Taste of Tech Topics

Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

CVPR2018 2日目:遂に本会議開始、面白い論文がたくさん #cvpr2018

皆さんこんにちは。@です。
引き続きCVPRのレポートです。本日はCVPRの2日目で本会議の1日目になります。

※CVPR1日目の記事はこちら
acro-engineer.hatenablog.com

本日参加したセッションは次の通りです。

  1. Opening
  2. Oral Analyzing and Humans Image Ⅰ
  3. Poster/Exhibision
  4. Machine Learning for Computer Vision
  5. Social

Opening

本会議1日目ともあり、Openingが開始です。
事前のメールから6300人超えといった参加者数の数値が出ていましたが、実数が発表され6512人でした。

f:id:acro-engineer:20180620030959j:plain:h250

今回のアワード(他にもありますが、特に注目すべき賞)は次の通りです。
Best Paper Award
f:id:acro-engineer:20180620031034j:plain:h250

Best Student Paper Award
f:id:acro-engineer:20180620031639j:plain:h250

Honorable Mention
f:id:acro-engineer:20180620031712j:plain:h250

ほとんど目を通せていない論文なので、どんな発表なのかが非常に楽しみです。

Oral Analyzing and Human Image

基本的には10分程度の発表に加えて、Spotlight(短い)セッションがOralのセッションになっています。
このSessionは人物画像の解析で、画像から小さい顔写真を獲得する、顔写真のエイジング、そして、新しいスタイルの顔写真作成と様々な論文がありました。

スタイルの顔写真作成のアイデア、アプリケーションとGANを複数用いた工夫が個人的には面白かったポイントです。
後々、ポスター回ったらGANの工夫が取り入れられた論文が多く、非常に驚きです。

Poster/Exhibision

Exhibisionは毎日開催されているスポンサー企業のブースです。
コンピュータビジョンに関係する発表や各企業の製品デモがあります。
後ほど話を聞いてみたいと思います。

f:id:acro-engineer:20180619111051j:plain:h250

ポスターは各日付、カテゴリごとに交代で実施しています。
毎日貼り出しているポスターが変更されるかは不明ですが、かなり混んでいます。
空いているタイミングを見計らって行くと著者の方とお話ができてこれはこれで面白いです。

Oral Machine Learning for Computer Vision

ニューラルネットワークの構成についての論文が多くありました。
ResNet→Dense Netときて次はどのような構成になるのかといった内容が多くありました。
各レイヤーの結果の集約する方式やマルチスケールなニューラルネットワークアーキテクチャの提案がありました。

特に印象に残ったのは、「Practical Block-Wise Neural Network Architecture Generation」です。
この論文を一言でいえば、NASNet構築のようなニューラルネットワーク自動生成手法です。
既存の自動生成手法では、学習に大幅なリソースと時間が必要であるところをブロックベースで探索し、全体のニューラルネットワークの構成を生成しています。
まだ、私にとって、実用性が皆無なほどリソースが必要です。
今後この研究が進むと人間は前処理を実施するのみになってしまうのでしょうか。

Social

最後にSocialと呼ばれるイベントがありました。平たく言ってしまえばパーティーです。
日本からも様々な立場の方が多く参加されていました。
このパーティーですが、ライブやパフォーマンスがあり、特に最後の方はライブの近くで参加者が踊るなど盛り上がっていました。

f:id:acro-engineer:20180620133632j:plain:h250

最後に

明日は3日目、引き継き多くのポスター発表があり、注目している論文も多いので頑張ってきます!

Acroquest Technologyでは、キャリア採用を行っています。

  • ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
  • Elasticsearch等を使ったデータ収集/分析/可視化
  • マイクロサービス、DevOps、最新のOSSを利用する開発プロジェクト
  • 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長

少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

www.wantedly.com