皆さんこんにちは。@tereka114です。
引き続きCVPRのレポートです。本日はCVPRの2日目で本会議の1日目になります。
※CVPR1日目の記事はこちら
acro-engineer.hatenablog.com
本日参加したセッションは次の通りです。
- Opening
- Oral Analyzing and Humans Image Ⅰ
- Poster/Exhibision
- Machine Learning for Computer Vision Ⅰ
- Social
Opening
本会議1日目ともあり、Openingが開始です。
事前のメールから6300人超えといった参加者数の数値が出ていましたが、実数が発表され6512人でした。
今回のアワード(他にもありますが、特に注目すべき賞)は次の通りです。
Best Paper Award
Best Student Paper Award
Honorable Mention
ほとんど目を通せていない論文なので、どんな発表なのかが非常に楽しみです。
Oral Analyzing and Human Image
基本的には10分程度の発表に加えて、Spotlight(短い)セッションがOralのセッションになっています。
このSessionは人物画像の解析で、画像から小さい顔写真を獲得する、顔写真のエイジング、そして、新しいスタイルの顔写真作成と様々な論文がありました。
スタイルの顔写真作成のアイデア、アプリケーションとGANを複数用いた工夫が個人的には面白かったポイントです。
後々、ポスター回ったらGANの工夫が取り入れられた論文が多く、非常に驚きです。
Poster/Exhibision
Exhibisionは毎日開催されているスポンサー企業のブースです。
コンピュータビジョンに関係する発表や各企業の製品デモがあります。
後ほど話を聞いてみたいと思います。
ポスターは各日付、カテゴリごとに交代で実施しています。
毎日貼り出しているポスターが変更されるかは不明ですが、かなり混んでいます。
空いているタイミングを見計らって行くと著者の方とお話ができてこれはこれで面白いです。
Oral Machine Learning for Computer Vision Ⅰ
ニューラルネットワークの構成についての論文が多くありました。
ResNet→Dense Netときて次はどのような構成になるのかといった内容が多くありました。
各レイヤーの結果の集約する方式やマルチスケールなニューラルネットワークのアーキテクチャの提案がありました。
特に印象に残ったのは、「Practical Block-Wise Neural Network Architecture Generation」です。
この論文を一言でいえば、NASNet構築のようなニューラルネットワーク自動生成手法です。
既存の自動生成手法では、学習に大幅なリソースと時間が必要であるところをブロックベースで探索し、全体のニューラルネットワークの構成を生成しています。
まだ、私にとって、実用性が皆無なほどリソースが必要です。
今後この研究が進むと人間は前処理を実施するのみになってしまうのでしょうか。
Social
最後にSocialと呼ばれるイベントがありました。平たく言ってしまえばパーティーです。
日本からも様々な立場の方が多く参加されていました。
このパーティーですが、ライブやパフォーマンスがあり、特に最後の方はライブの近くで参加者が踊るなど盛り上がっていました。
最後に
明日は3日目、引き継き多くのポスター発表があり、注目している論文も多いので頑張ってきます!
Acroquest Technologyでは、キャリア採用を行っています。
- ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
- Elasticsearch等を使ったデータ収集/分析/可視化
- マイクロサービス、DevOps、最新のOSSを利用する開発プロジェクト
- 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。