こんにちは。@tereka114です。
CVPR3日目に参加してきました。本日は本会議の2日目です。
※CVPR2日目のレポートは次の通りです。
acro-engineer.hatenablog.com
本日は次のセッションに参加しました。
- Oral Object Recognition & Scene Understanding Ⅱ
- Poster/Exhibision
- Oral Object Recognition & Scene Understanding Ⅲ
- Poster/Exhibision
Oral Object Recognition & Scene Understanding Ⅱ
このセッションでは、物体検出に関する論文の発表が多くありました。
その1つ「An Analysis of Scale Invariance in Object Detection-SNIP」ではスケール耐性のある物体検出の手法が紹介されています。
この論文では、小さい物体の検出の精度が向上しています。
いずれ使ってみようと少々思いましたが、どうやらこの手法は低速であることが問題らしいです。
そのため、著者が改良版の「SNIPER」を開発したようです。こちらも公開されているようなので使ってみたいところです。
Oral Object Recognition & Scene Understanding Ⅲ
タイトルが今朝の内容と同じですが、Visual Question Answering(VQA)に関する論文が多かったように思えます。
特にVisual Dialogを使った対話応答・Dialog生成のタスクについて、私自身が初見で、興味を惹かれました。
論文中のアイデアも良いと思いましたが、Dialogのシーケンスを畳み込みで処理できると説明されておっとなりました。
畳み込みで複数の文章を扱う方法は様々なタスクで応用できると感じたところです。
Poster/Exhibision
連日多くのポスターがあり、毎日見るのが楽しみでもあり、大変です。
本日は、RANSACの改良やOccursionを考慮したSegmentationもあり、個人的には面白いと思ったところです。
特に面白かったのは、「Future Frame Prediction for Anomaly Detection- A New Baseline」です。
画像からの行動異常検知の論文です。後日、CVPR論文読みのイベントで心の中で発表予定の論文でもあったので、本日、ポスターにあったので詳細を直接、聞いてみました。
実際に聞くとパラメータの差異や書いていない実験などの内容も聞けたので著者と直接話せるのはその点が良いところです。
ポスター中に聞いた話は発表時に入れようと思っています。
最後に
本日で本会議の2日目が終わりました。たくさんの論文があって、毎日が面白いです。
明日は本会議の3日目になり、盛り上がりそうなので楽しみです!
Acroquest Technologyでは、キャリア採用を行っています。
- ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
- Elasticsearch等を使ったデータ収集/分析/可視化
- マイクロサービス、DevOps、最新のOSSを利用する開発プロジェクト
- 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。