SlideShare une entreprise Scribd logo
1  sur  30
Nakayama Lab.
Machine Perception Group
The University of Tokyo
東京大学 大学院情報理工学系研究科
創造情報学専攻 中山研究室
中山 英樹
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 どちらがハヤブサでしょう?
http://birds.mints.ne.jp
2
http://plaza.rakuten.co.jp
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 どちらがハヤブサでしょう?
http://birds.mints.ne.jp
3
http://plaza.rakuten.co.jp
タカ ハヤブサ
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 車種はなんでしょう?
4
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 車種はなんでしょう?
5
Acura RLMitsubishi
Lancer
Toyota Camry
Audi S4 Honda Accord Mercedes-Benz C-Class
識別結果
識別結果
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 ある特定の対象領域における高粒度の多クラス画像識別
◦ 意味的・視覚的に非常に類似したクラスを扱う
 クラス間の違いは極めて細かく、局所的である場合が多い
◦ 一般的な人間を遥かに超えるレベルの詳細な識別能力を目指す
6
Fine-grained Visual Categorization (FGVC)
Subordinate-level Categorization
詳細画像識別
Yellow
Warbler
Pririe
Warbler
Pine
Warbler
従来の一般物体認識
Car Flower Dog
鳥 車 人
小鳥 …
…
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 いろいろな応用可能性
◦ 官能検査, 目視検査
◦ 物性予測(X線拡散)
◦ 道路交通状況認識
◦ 商品画像認識・検索
◦ 医療画像診断
 研究分野でよく扱われる題材
◦ 動植物の種類識別
◦ 人の動作識別
◦ 顔の属性識別
7
具体的なアプリケーションに特化した対象に絞り、
人間以上の識別能力の実現を目指す!
[Kiapour et al.,
WACV’14]
[Stark et al.,
BMVC’12]
Nakayama Lab.
Machine Perception Group
The University of Tokyo
8
http://leafsnap.com/
Leaf snap : 植物画像識別 Bird snap : 鳥画像識別
http://birdsnap.com/
Thomas Berg et al., Birdsnap: Large-scale Fine-
grained Visual Categorization of Birds, In Proc.
CVPR, 2014.
Neeraj Kumar et al., Leafsnap: A Computer Vision
System for Automatic Plant Species Identication, In
Proc. ECCV, 2012.
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 意味的・視覚的に類似したクラスは識別困難
◦ 同じ程度のクラス数の識別問題でも、一般物体認識に比べて
著しく低い識別精度しか得られない
9
Jia Deng, Alexander C. Berg, Kai Li, and Li Fei-Fei, What Does Classifying
More Than 10,000 Image Categories Tell Us?, In Proc. ECCV, 2010.
キノコ(134クラス)
一般物体(200クラス)
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 大規模一般物体認識からスピンオフする形で誕生
 ECCV 2010: 詳細画像識別の難しさが指摘される [Deng et al. ]
 CVPR 2011: 1st workshop on Fine-grained visual categorization
 CVPR 2013: 2nd workshop on Fine-grained visual categorization
 ICCV 2013: FGVC competition
◦ ImageNet large-scale visual recognition challenge と同時開催
10
0
1
2
3
4
5
6
7
8
タイトルに
“Fine-grained”
が入った論文数
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 1.完全自動の識別における精度向上
◦ 基本的には従来のパラダイムの延長
◦ 対象が“物体”であることを前提とするものが多い
 2.識別過程の意味づけ・可視化
◦ 最終的には人間が納得できるかどうかが重要
◦ 人間とのハイブリッドシステム
11
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 明確な方向性は必ずしも定まっていない
 既存の大規模一般物体認識・検出技術を総動員
12
技術要素①: 領域を記述する画像特徴量
技術要素②: 物体領域のセグメンテーション
技術要素③: 部位モデルに基づく正規化
これらの組み合わせを軸として手法開発が進められている
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 Bag-of-Features が基本
◦ Locality-constrained linear coding [Wang et al., 2010],
Improved Fisher vector [Perronnin et al, 2010] 等の最新の手法を利用
◦ 一般物体認識よりもコードブックを大きくする必要があることが指
摘されている
 識別に有用なパッチはごく少数であり、大部分は似通っているため
量子化誤差に埋もれやすい
13
J. Lin et al., Is Fine Grained Classification Different?, In Proc. CVPR
workhop on FGVC, 2013.
P.-H. Gosselin et al., Inria+Xerox@FGcomp: Boosting the Fisher vector
for fine-grained classification, INRIA Tech. Rep. 2013.
[Fei-Fei et al., Recognizing and
Learning Object Categories
(ICCV’09 short course)]
コードブック
(クラスタリングによって生成)
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 テンプレートベース
◦ 量子化を行わず、生の画像パッチをコードブック的に用いる
◦ 量子化誤差の影響を緩和
[B. Yao et al., CVPR’12], [S. Yang et al., NIPS’12]
14
Bangpeng Yao, Gary Bradski, Li Fei-Fei, A Codebook-Free and Annotation-
Free Approach for Fine-Grained Image Categorization, In Proc. CVPR, 2012.
学習データからランダムにサンプリング
したパッチとの反応を特徴量化
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 局所特徴量の教師付次元圧縮 [中山, 2013]
◦ 識別的な情報を局所特徴量レベルで抽出した後、bag-of-features へ利用
◦ 隣接する局所特徴の共起関係を埋め込み
◦ 一般的な方法 (PCAによる圧縮) から大きく識別精度向上
15
Hideki Nakayama, Augmenting
descriptors for fine-grained visual
categorization using polynomial
embedding, In Proc. ICME, 2013.
Descriptor
(e.g. SIFT)
Dense sampling
polynomial
vectors
latent
descriptor
Fisher
vector
logistic
regression
classifier
category
label
CCA
(training)
Flower FruitLeaf Stem Entire
Kaki
Persimmon
Silver
birch
Boxelder
mapple
ImageCLEF 2013の
植物画像識別タスクで第一位
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 特徴抽出の前処理として、物体領域のみを抽出
◦ GrabCut等の標準的な手法がよく用いられる
◦ [A. Angelova et al., CVPR’13], [Chai et al., ECCV’12]
16
Anelia Angelova, Shenghuo Zhu, Efficient object detection and
segmentation for fine-grained recognition, In Proc. CVPR, 2013.
(1) 画像中の各スーパーピクセルが物体領域に属するかを判定する識別器を学習
(2) スーパーピクセルの識別結果を初期入力とし、label propagationにより
物体全体の詳細なセグメンテーションを行う
(3) 物体領域のみからbag-of-features (LLC) を求め、カテゴリ識別を行う
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 物体の各部位(頭、羽、etc.)を検出し、位置や姿勢の違いを吸収
◦ セグメンテーションベースよりも頑健である場合が多い(対象による)
 検出手法はDeformable Part Model [Felzenszwalb et al., 2008] が定番
 Deformable Part Descriptor [Zhang et al., ICCV’13]
◦ DPMで検出された部位の領域内の特徴を抽出し、識別に利用
17
Ning Zhang, Ryan Farrell, Forrest Iandola, Trevor Darrell, Deformable Part Descriptors
for Fine-grained Recognition and Attribute Prediction, In Proc. ICCV, 2013.
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 POOF: Part-Based One-vs-One Features [Berg et al., CVPR’13]
◦ 部位を正規化した上で、任意の2クラスをできるだけ分離する重みを学習
◦ 最終的に、重みに応じた特徴量を各部位領域から抽出
18
Thomas Berg, Peter N. Belhumeur, POOF: Part-Based One-vs-One Features for Fine-
Grained Categorization, Face Verification, and Attribute Estimation, In Proc. CVPR, 2013.
学習データセット
(部位情報もついて
いることが前提) (1) ある2クラスに注目
(2) 部位をとりだし、正規化
(3) 2クラスを分離する
重みをSVMで学習
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 Part transfer [Göring et al., CVPR’14], [Gavves et al., ICCV’13]
◦ 類似する学習サンプルの部位の位置をそのまま利用
◦ 学習サンプルに部位情報がアノテーションされていることが前提
◦ Exemplar-SVM [Malisiewicz, ICCV’11] の考え方に基づく
19
Christoph Göring, Erik Rodner, Alexander Freytag, and Joachim Denzler,
Nonparametric Part Transfer for Fine-grained Recognition, In Proc. CVPR, 2014.
(1) HOG特徴で類似
サンプルを検索
(2) 類似サンプルの部位の
位置から特徴抽出
(3) それぞれ識別したあと
結果を統合
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 セグメンテーション手法との同時最適化 [Chai et al., ICCV’13]
◦ Saliencyモデルを介してDPMによる部位検出とGrabCutを統合
20
別々に学習
(一般的方法論)
同時最適化
(提案手法)
Yuning Chai, Victor Lempitsky, Andrew Zisserman, Symbiotic Segmentation
and Part Localization for Fine-Grained Categorization, In Proc. ICCV, 2013.
Nakayama Lab.
Machine Perception Group
The University of Tokyo
21
https://sites.google.com/site/fgcomp2013/
※網掛けのエントリは訓練セット外のデータを学習に使用(ランキング対象外)
1.
2.
Fisher vector
をチューニング
セグメンテーション
+
パートディテクション
+
Fisher vector
 優勝チームはFisher vectorのチューニングのみに注力
◦ 詳細画像識別においても特徴量は最も大事(ノウハウが必要)
◦ 識別精度を上げるだけなら、従来の枠組でもまだまだ
工夫の余地がある
P.-H. Gosselin et al., Inria+Xerox@FGcomp: Boosting the Fisher vector for
fine-grained classification, INRIA Research Reports, 2013.
Deep
learning
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 1.完全自動の識別における精度向上
◦ 基本的には従来のパラダイムの延長
◦ 対象が“物体”であることを前提とするものが多い
 2.識別過程の意味づけ・可視化
◦ 最終的には人間が納得できるかどうかが重要
◦ 人間とのハイブリッドシステム
22
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 詳細画像識別は非常に困難なタスク
◦ 識別の根拠や過程が人間にとって納得できる形であることが重要
◦ 完全自動の識別手法は基本的にブラックボックス
 キーワード:Human in the loop
◦ 人間とのハイブリッドシステム
◦ データ作成、学習時、識別時のさまざまなタイミングで
人間の手助け (知見) をインタラクティブに取り入れる
◦ 識別の根拠を”人間の言葉”で説明できるように
23
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 属性 (Attribute) [Lampert et al., CVPR’09], [Farhadi et al., CVPR’09]
◦ 異なるクラス間で潜在的に共有される(と思われる)
基本的な視覚プリミティブ
◦ 人間にも理解できる中間表現として、識別結果の意味づけに利用可能
 (例) “しましま” 属性識別器が強く反応した結果、最終的にシマウマと判断
◦ 多くの場合、属性の辞書は人間が
天下り的に準備
 明確にルールが決まっている
わけではない
 コンピュータが本当に抽出可能
であるかは保証されていない
24
Christoph H. Lampert Hannes Nickisch Stefan Harmeling, Learning To Detect Unseen
Object Classes by Between-Class Attribute Transfer, In Proc. CVPR, 2009.
?
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 コンピュータは可能な範囲で解の候補を生成
 難しいところは人間に問い合わせる
 インタラクティブに処理を進め、徐々に解答を絞りこむ (20の扉)
◦ できるだけ情報量が得られる質問を生成
◦ 識別の精度を上げると同時に、納得感も得られる
 属性 (attribute) を問い合わせ [Branson et al., ECCV’10]
25
Steve Branson, Catherine Wah, Florian Schro, Boris Babenko, Peter Welinder,
Pietro Perona, and Serge Belongie, Visual Recognition with Humans in the
Loop, In Proc. ECCV, 2010.
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 属性に加え、部位の位置も問い合わせ [Wah et al., ICCV’11]
26
Catherine Wah, Steve Branson, Pietro Perona, Serge Belongie , Multiclass
Recognition and Part Localization with Humans in the Loop, In Proc. ICCV, 2011.
入力画像
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 識別に有効なテンプレートパッチをクラウドソーシングで獲得
◦ ゲーム形式で人間にBubble (パッチ)を選択させる [Deng et al., CVPR’13]
◦ 学習時に集合知を活用することで、完全自動のシステムを大きく上回る
識別精度を達成
27
Jia Deng, Jonathan Krause, and Li Fei-Fei, Fine-Grained Crowdsourcing for
Fine-Grained Recognition, In Proc. CVPR, 2013.
クラス1 クラス2
与えられた低品質画像がクラス1・2
のどちらであるかを答えるゲーム
小領域(Bubble)を
指定しヒントを得る
少ない回数で当てる
ほど高得点
得られた多数のBubbleをテンプレート
として利用し特徴ベクトルを生成
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 属性 (attribute) の対話的な発見 [Duan et al., CVPR’12]
◦ クラスを弁別するために有効と思われる局所パターンをlatent CRFで
自動的に抽出し、妥当性を人間へ問い合わせ
◦ コンピュータにとっても人間にとっても理解できる中間表現
 天下りで定義されたattributeと異なり、システムが検出できることが
保証されている
28
Kun Duan, Devi Parikh, David Crandall, and Kristen Grauman, Discovering
Localized Attributes for Fine-grained Recognition, In Proc. CVPR, 2012.
システムが自動的に発見したパターンと、ユーザが与えた名称
(フォントの大きさはそれを与えた人数に対応)
Nakayama Lab.
Machine Perception Group
The University of Tokyo
(1) 図示したい特徴がはっきり
表れている
(2) その他の特徴が(たまたま)
差として表れていない
(3) 似たような構図を持つ
 似通ったクラスの識別に有効な特徴を発見し、提示する
◦ 図示に最も適したサンプルを自動的に選択 [Bert et al., ICCV’13]
29
Thomas Berg and Peter N. Belhumeur, How Do You Tell a Blackbird from a
Crow?, In Proc. ICCV, 2013.
特に類似したクラスを発見
(POOF特徴 + 線形判別分析)
最も識別的な特徴を図示
この際に,出来る限り以下を
満たすサンプルを選ぶ.
Nakayama Lab.
Machine Perception Group
The University of Tokyo
 詳細画像識別(Fine-grained visual categorization, FGVC)
◦ 意味的・視覚的に非常に類似した対象の多クラス識別
◦ 特定のドメインで、非専門家を大きく超える識別能力の実現
◦ 応用先は広い
 官能検査、概観検査、医療画像識別、商品識別…
 識別手法の発展
◦ 大規模一般物体認識の技術をもとに、独自の進化を遂げつつある
 識別に“意味”を与える
◦ 人とのハイブリッドで成長するシステム
◦ 数年後には、人を超え、人に教えるシステムの登場を期待
30

Contenu connexe

Tendances

SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向Kensho Hara
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Preferred Networks
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for VisionDeep Learning JP
 
画像処理AIを用いた異常検知
画像処理AIを用いた異常検知画像処理AIを用いた異常検知
画像処理AIを用いた異常検知Hideo Terada
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial NetworksARISE analytics
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted WindowsDeep Learning JP
 
自動運転におけるCNNの信頼性
自動運転におけるCNNの信頼性自動運転におけるCNNの信頼性
自動運転におけるCNNの信頼性Fixstars Corporation
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and EditingDeep Learning JP
 
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーDeep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーnlab_utokyo
 
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...Deep Learning JP
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
 
動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)cvpaper. challenge
 
[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習Deep Learning JP
 
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Koichi Hamada
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )cvpaper. challenge
 

Tendances (20)

SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向3D CNNによる人物行動認識の動向
3D CNNによる人物行動認識の動向
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
 
画像処理AIを用いた異常検知
画像処理AIを用いた異常検知画像処理AIを用いた異常検知
画像処理AIを用いた異常検知
 
【論文読み会】Self-Attention Generative Adversarial Networks
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial Networks
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
 
自動運転におけるCNNの信頼性
自動運転におけるCNNの信頼性自動運転におけるCNNの信頼性
自動運転におけるCNNの信頼性
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までーDeep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
 
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...
[DL輪読会]Invariance Principle Meets Information Bottleneck for Out-of-Distribut...
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)動画認識における代表的なモデル・データセット(メタサーベイ)
動画認識における代表的なモデル・データセット(メタサーベイ)
 
[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習
 
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )動画認識サーベイv1(メタサーベイ )
動画認識サーベイv1(メタサーベイ )
 

Similaire à SSII2014 詳細画像識別 (FGVC) @OS2

実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2Kuniyuki Takahashi
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 Preferred Networks
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2Hirokatsu Kataoka
 
Muramatsu Bachelor Thesis
Muramatsu Bachelor ThesisMuramatsu Bachelor Thesis
Muramatsu Bachelor Thesispflab
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会nlab_utokyo
 
Lecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanoharaLecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanoharaPreferred Networks
 
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてCVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてAkisato Kimura
 
優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)cvpaper. challenge
 
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningDiscriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningTomoyasuOkada
 
実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習Kuniyuki Takahashi
 
TAI_GDEP_Webinar_1a_27Oct2020
TAI_GDEP_Webinar_1a_27Oct2020TAI_GDEP_Webinar_1a_27Oct2020
TAI_GDEP_Webinar_1a_27Oct2020ssuser5b12d1
 
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習Preferred Networks
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介Ryohei Ueda
 

Similaire à SSII2014 詳細画像識別 (FGVC) @OS2 (20)

20150414seminar
20150414seminar20150414seminar
20150414seminar
 
実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2実社会・実環境におけるロボットの機械学習 ver. 2
実社会・実環境におけるロボットの機械学習 ver. 2
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
Muramatsu Bachelor Thesis
Muramatsu Bachelor ThesisMuramatsu Bachelor Thesis
Muramatsu Bachelor Thesis
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
DeepLearningDay2016Spring
DeepLearningDay2016SpringDeepLearningDay2016Spring
DeepLearningDay2016Spring
 
20160601画像電子学会
20160601画像電子学会20160601画像電子学会
20160601画像電子学会
 
Lecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanoharaLecture univ.tokyo 2017_okanohara
Lecture univ.tokyo 2017_okanohara
 
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移についてCVPR2016 reading - 特徴量学習とクロスモーダル転移について
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
 
優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)優れた問いを見つける(中京大学講演)
優れた問いを見つける(中京大学講演)
 
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningDiscriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
 
実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習実社会・実環境におけるロボットの機械学習
実社会・実環境におけるロボットの機械学習
 
TAI_GDEP_Webinar_1a_27Oct2020
TAI_GDEP_Webinar_1a_27Oct2020TAI_GDEP_Webinar_1a_27Oct2020
TAI_GDEP_Webinar_1a_27Oct2020
 
Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習Jubatusにおける大規模分散オンライン機械学習
Jubatusにおける大規模分散オンライン機械学習
 
2011研究室紹介
2011研究室紹介2011研究室紹介
2011研究室紹介
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
 

Plus de nlab_utokyo

画像の基盤モデルの変遷と研究動向
画像の基盤モデルの変遷と研究動向画像の基盤モデルの変遷と研究動向
画像の基盤モデルの変遷と研究動向nlab_utokyo
 
大規模言語モデルとChatGPT
大規模言語モデルとChatGPT大規模言語モデルとChatGPT
大規模言語モデルとChatGPTnlab_utokyo
 
Non-autoregressive text generation
Non-autoregressive text generationNon-autoregressive text generation
Non-autoregressive text generationnlab_utokyo
 
2020年度 東京大学中山研 研究室紹介
2020年度 東京大学中山研 研究室紹介2020年度 東京大学中山研 研究室紹介
2020年度 東京大学中山研 研究室紹介nlab_utokyo
 
マシンパーセプション研究におけるChainer活用事例
マシンパーセプション研究におけるChainer活用事例マシンパーセプション研究におけるChainer活用事例
マシンパーセプション研究におけるChainer活用事例nlab_utokyo
 
Machine Translation Introduction
Machine Translation IntroductionMachine Translation Introduction
Machine Translation Introductionnlab_utokyo
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介nlab_utokyo
 
Lab introduction 2014
Lab introduction 2014Lab introduction 2014
Lab introduction 2014nlab_utokyo
 

Plus de nlab_utokyo (14)

画像の基盤モデルの変遷と研究動向
画像の基盤モデルの変遷と研究動向画像の基盤モデルの変遷と研究動向
画像の基盤モデルの変遷と研究動向
 
大規模言語モデルとChatGPT
大規模言語モデルとChatGPT大規模言語モデルとChatGPT
大規模言語モデルとChatGPT
 
Non-autoregressive text generation
Non-autoregressive text generationNon-autoregressive text generation
Non-autoregressive text generation
 
2020年度 東京大学中山研 研究室紹介
2020年度 東京大学中山研 研究室紹介2020年度 東京大学中山研 研究室紹介
2020年度 東京大学中山研 研究室紹介
 
マシンパーセプション研究におけるChainer活用事例
マシンパーセプション研究におけるChainer活用事例マシンパーセプション研究におけるChainer活用事例
マシンパーセプション研究におけるChainer活用事例
 
Machine Translation Introduction
Machine Translation IntroductionMachine Translation Introduction
Machine Translation Introduction
 
画像処理分野における研究事例紹介
画像処理分野における研究事例紹介画像処理分野における研究事例紹介
画像処理分野における研究事例紹介
 
ISM2014
ISM2014ISM2014
ISM2014
 
RecSysTV2014
RecSysTV2014RecSysTV2014
RecSysTV2014
 
20150930
2015093020150930
20150930
 
MIRU2014 SLAC
MIRU2014 SLACMIRU2014 SLAC
MIRU2014 SLAC
 
Lab introduction 2014
Lab introduction 2014Lab introduction 2014
Lab introduction 2014
 
ICME 2013
ICME 2013ICME 2013
ICME 2013
 
Seminar
SeminarSeminar
Seminar
 

Dernier

My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」inspirehighstaff03
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfoganekyokoi
 
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイントshu1108hina1020
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」inspirehighstaff03
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」inspirehighstaff03
 
My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」inspirehighstaff03
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」inspirehighstaff03
 
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」inspirehighstaff03
 
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrKARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrRodolfFernandez1
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」inspirehighstaff03
 
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfinspirehighstaff03
 
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」inspirehighstaff03
 
My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」inspirehighstaff03
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」inspirehighstaff03
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」inspirehighstaff03
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdfoganekyokoi
 
My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」inspirehighstaff03
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfoganekyokoi
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1Toru Oga
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」inspirehighstaff03
 

Dernier (20)

My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
My Inspire High Award 2024「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
 
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
 
My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」My Inspire High Award 2024    「孤独は敵なのか?」
My Inspire High Award 2024    「孤独は敵なのか?」
 
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
My Inspire High Award 2024「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」
 
My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」My Inspire High Award 2024      「家族とは何か」
My Inspire High Award 2024      「家族とは何か」
 
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
My Inspire High Award2024「外国人が日本のテーブルマナーに驚く理由は?」
 
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」My Inspire High Award 2024「なぜ議会への関心が低いのか?」
My Inspire High Award 2024「なぜ議会への関心が低いのか?」
 
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrKARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
 
My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」My Inspire High Award 2024 「AIと仲良くなるには?」
My Inspire High Award 2024 「AIと仲良くなるには?」
 
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdfMy Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
My Inspire High Award 2024「Yakushima Islandってなんか変じゃない?」.pdf
 
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
My Inspire High Award 2024「世の中の流行はどのようにして生まれるのか」
 
My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」My Inspire High Award 2024  「正義って存在するの?」
My Inspire High Award 2024  「正義って存在するの?」
 
My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」My Inspire High Award 2024 「本当の『悪者』って何?」
My Inspire High Award 2024 「本当の『悪者』って何?」
 
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
My Inspire High Award 2024「なぜ、好きなことにいつかは飽きるの」
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdf
 
My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」My Inspire High Award 2024「老いることは不幸なこと?」
My Inspire High Award 2024「老いることは不幸なこと?」
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1
 
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」My Inspire High Award 2024「他者と自分、対立を防ぐには?」
My Inspire High Award 2024「他者と自分、対立を防ぐには?」
 

SSII2014 詳細画像識別 (FGVC) @OS2

  • 1. Nakayama Lab. Machine Perception Group The University of Tokyo 東京大学 大学院情報理工学系研究科 創造情報学専攻 中山研究室 中山 英樹
  • 2. Nakayama Lab. Machine Perception Group The University of Tokyo  どちらがハヤブサでしょう? http://birds.mints.ne.jp 2 http://plaza.rakuten.co.jp
  • 3. Nakayama Lab. Machine Perception Group The University of Tokyo  どちらがハヤブサでしょう? http://birds.mints.ne.jp 3 http://plaza.rakuten.co.jp タカ ハヤブサ
  • 4. Nakayama Lab. Machine Perception Group The University of Tokyo  車種はなんでしょう? 4
  • 5. Nakayama Lab. Machine Perception Group The University of Tokyo  車種はなんでしょう? 5 Acura RLMitsubishi Lancer Toyota Camry Audi S4 Honda Accord Mercedes-Benz C-Class 識別結果 識別結果
  • 6. Nakayama Lab. Machine Perception Group The University of Tokyo  ある特定の対象領域における高粒度の多クラス画像識別 ◦ 意味的・視覚的に非常に類似したクラスを扱う  クラス間の違いは極めて細かく、局所的である場合が多い ◦ 一般的な人間を遥かに超えるレベルの詳細な識別能力を目指す 6 Fine-grained Visual Categorization (FGVC) Subordinate-level Categorization 詳細画像識別 Yellow Warbler Pririe Warbler Pine Warbler 従来の一般物体認識 Car Flower Dog 鳥 車 人 小鳥 … …
  • 7. Nakayama Lab. Machine Perception Group The University of Tokyo  いろいろな応用可能性 ◦ 官能検査, 目視検査 ◦ 物性予測(X線拡散) ◦ 道路交通状況認識 ◦ 商品画像認識・検索 ◦ 医療画像診断  研究分野でよく扱われる題材 ◦ 動植物の種類識別 ◦ 人の動作識別 ◦ 顔の属性識別 7 具体的なアプリケーションに特化した対象に絞り、 人間以上の識別能力の実現を目指す! [Kiapour et al., WACV’14] [Stark et al., BMVC’12]
  • 8. Nakayama Lab. Machine Perception Group The University of Tokyo 8 http://leafsnap.com/ Leaf snap : 植物画像識別 Bird snap : 鳥画像識別 http://birdsnap.com/ Thomas Berg et al., Birdsnap: Large-scale Fine- grained Visual Categorization of Birds, In Proc. CVPR, 2014. Neeraj Kumar et al., Leafsnap: A Computer Vision System for Automatic Plant Species Identication, In Proc. ECCV, 2012.
  • 9. Nakayama Lab. Machine Perception Group The University of Tokyo  意味的・視覚的に類似したクラスは識別困難 ◦ 同じ程度のクラス数の識別問題でも、一般物体認識に比べて 著しく低い識別精度しか得られない 9 Jia Deng, Alexander C. Berg, Kai Li, and Li Fei-Fei, What Does Classifying More Than 10,000 Image Categories Tell Us?, In Proc. ECCV, 2010. キノコ(134クラス) 一般物体(200クラス)
  • 10. Nakayama Lab. Machine Perception Group The University of Tokyo  大規模一般物体認識からスピンオフする形で誕生  ECCV 2010: 詳細画像識別の難しさが指摘される [Deng et al. ]  CVPR 2011: 1st workshop on Fine-grained visual categorization  CVPR 2013: 2nd workshop on Fine-grained visual categorization  ICCV 2013: FGVC competition ◦ ImageNet large-scale visual recognition challenge と同時開催 10 0 1 2 3 4 5 6 7 8 タイトルに “Fine-grained” が入った論文数
  • 11. Nakayama Lab. Machine Perception Group The University of Tokyo  1.完全自動の識別における精度向上 ◦ 基本的には従来のパラダイムの延長 ◦ 対象が“物体”であることを前提とするものが多い  2.識別過程の意味づけ・可視化 ◦ 最終的には人間が納得できるかどうかが重要 ◦ 人間とのハイブリッドシステム 11
  • 12. Nakayama Lab. Machine Perception Group The University of Tokyo  明確な方向性は必ずしも定まっていない  既存の大規模一般物体認識・検出技術を総動員 12 技術要素①: 領域を記述する画像特徴量 技術要素②: 物体領域のセグメンテーション 技術要素③: 部位モデルに基づく正規化 これらの組み合わせを軸として手法開発が進められている
  • 13. Nakayama Lab. Machine Perception Group The University of Tokyo  Bag-of-Features が基本 ◦ Locality-constrained linear coding [Wang et al., 2010], Improved Fisher vector [Perronnin et al, 2010] 等の最新の手法を利用 ◦ 一般物体認識よりもコードブックを大きくする必要があることが指 摘されている  識別に有用なパッチはごく少数であり、大部分は似通っているため 量子化誤差に埋もれやすい 13 J. Lin et al., Is Fine Grained Classification Different?, In Proc. CVPR workhop on FGVC, 2013. P.-H. Gosselin et al., Inria+Xerox@FGcomp: Boosting the Fisher vector for fine-grained classification, INRIA Tech. Rep. 2013. [Fei-Fei et al., Recognizing and Learning Object Categories (ICCV’09 short course)] コードブック (クラスタリングによって生成)
  • 14. Nakayama Lab. Machine Perception Group The University of Tokyo  テンプレートベース ◦ 量子化を行わず、生の画像パッチをコードブック的に用いる ◦ 量子化誤差の影響を緩和 [B. Yao et al., CVPR’12], [S. Yang et al., NIPS’12] 14 Bangpeng Yao, Gary Bradski, Li Fei-Fei, A Codebook-Free and Annotation- Free Approach for Fine-Grained Image Categorization, In Proc. CVPR, 2012. 学習データからランダムにサンプリング したパッチとの反応を特徴量化
  • 15. Nakayama Lab. Machine Perception Group The University of Tokyo  局所特徴量の教師付次元圧縮 [中山, 2013] ◦ 識別的な情報を局所特徴量レベルで抽出した後、bag-of-features へ利用 ◦ 隣接する局所特徴の共起関係を埋め込み ◦ 一般的な方法 (PCAによる圧縮) から大きく識別精度向上 15 Hideki Nakayama, Augmenting descriptors for fine-grained visual categorization using polynomial embedding, In Proc. ICME, 2013. Descriptor (e.g. SIFT) Dense sampling polynomial vectors latent descriptor Fisher vector logistic regression classifier category label CCA (training) Flower FruitLeaf Stem Entire Kaki Persimmon Silver birch Boxelder mapple ImageCLEF 2013の 植物画像識別タスクで第一位
  • 16. Nakayama Lab. Machine Perception Group The University of Tokyo  特徴抽出の前処理として、物体領域のみを抽出 ◦ GrabCut等の標準的な手法がよく用いられる ◦ [A. Angelova et al., CVPR’13], [Chai et al., ECCV’12] 16 Anelia Angelova, Shenghuo Zhu, Efficient object detection and segmentation for fine-grained recognition, In Proc. CVPR, 2013. (1) 画像中の各スーパーピクセルが物体領域に属するかを判定する識別器を学習 (2) スーパーピクセルの識別結果を初期入力とし、label propagationにより 物体全体の詳細なセグメンテーションを行う (3) 物体領域のみからbag-of-features (LLC) を求め、カテゴリ識別を行う
  • 17. Nakayama Lab. Machine Perception Group The University of Tokyo  物体の各部位(頭、羽、etc.)を検出し、位置や姿勢の違いを吸収 ◦ セグメンテーションベースよりも頑健である場合が多い(対象による)  検出手法はDeformable Part Model [Felzenszwalb et al., 2008] が定番  Deformable Part Descriptor [Zhang et al., ICCV’13] ◦ DPMで検出された部位の領域内の特徴を抽出し、識別に利用 17 Ning Zhang, Ryan Farrell, Forrest Iandola, Trevor Darrell, Deformable Part Descriptors for Fine-grained Recognition and Attribute Prediction, In Proc. ICCV, 2013.
  • 18. Nakayama Lab. Machine Perception Group The University of Tokyo  POOF: Part-Based One-vs-One Features [Berg et al., CVPR’13] ◦ 部位を正規化した上で、任意の2クラスをできるだけ分離する重みを学習 ◦ 最終的に、重みに応じた特徴量を各部位領域から抽出 18 Thomas Berg, Peter N. Belhumeur, POOF: Part-Based One-vs-One Features for Fine- Grained Categorization, Face Verification, and Attribute Estimation, In Proc. CVPR, 2013. 学習データセット (部位情報もついて いることが前提) (1) ある2クラスに注目 (2) 部位をとりだし、正規化 (3) 2クラスを分離する 重みをSVMで学習
  • 19. Nakayama Lab. Machine Perception Group The University of Tokyo  Part transfer [Göring et al., CVPR’14], [Gavves et al., ICCV’13] ◦ 類似する学習サンプルの部位の位置をそのまま利用 ◦ 学習サンプルに部位情報がアノテーションされていることが前提 ◦ Exemplar-SVM [Malisiewicz, ICCV’11] の考え方に基づく 19 Christoph Göring, Erik Rodner, Alexander Freytag, and Joachim Denzler, Nonparametric Part Transfer for Fine-grained Recognition, In Proc. CVPR, 2014. (1) HOG特徴で類似 サンプルを検索 (2) 類似サンプルの部位の 位置から特徴抽出 (3) それぞれ識別したあと 結果を統合
  • 20. Nakayama Lab. Machine Perception Group The University of Tokyo  セグメンテーション手法との同時最適化 [Chai et al., ICCV’13] ◦ Saliencyモデルを介してDPMによる部位検出とGrabCutを統合 20 別々に学習 (一般的方法論) 同時最適化 (提案手法) Yuning Chai, Victor Lempitsky, Andrew Zisserman, Symbiotic Segmentation and Part Localization for Fine-Grained Categorization, In Proc. ICCV, 2013.
  • 21. Nakayama Lab. Machine Perception Group The University of Tokyo 21 https://sites.google.com/site/fgcomp2013/ ※網掛けのエントリは訓練セット外のデータを学習に使用(ランキング対象外) 1. 2. Fisher vector をチューニング セグメンテーション + パートディテクション + Fisher vector  優勝チームはFisher vectorのチューニングのみに注力 ◦ 詳細画像識別においても特徴量は最も大事(ノウハウが必要) ◦ 識別精度を上げるだけなら、従来の枠組でもまだまだ 工夫の余地がある P.-H. Gosselin et al., Inria+Xerox@FGcomp: Boosting the Fisher vector for fine-grained classification, INRIA Research Reports, 2013. Deep learning
  • 22. Nakayama Lab. Machine Perception Group The University of Tokyo  1.完全自動の識別における精度向上 ◦ 基本的には従来のパラダイムの延長 ◦ 対象が“物体”であることを前提とするものが多い  2.識別過程の意味づけ・可視化 ◦ 最終的には人間が納得できるかどうかが重要 ◦ 人間とのハイブリッドシステム 22
  • 23. Nakayama Lab. Machine Perception Group The University of Tokyo  詳細画像識別は非常に困難なタスク ◦ 識別の根拠や過程が人間にとって納得できる形であることが重要 ◦ 完全自動の識別手法は基本的にブラックボックス  キーワード:Human in the loop ◦ 人間とのハイブリッドシステム ◦ データ作成、学習時、識別時のさまざまなタイミングで 人間の手助け (知見) をインタラクティブに取り入れる ◦ 識別の根拠を”人間の言葉”で説明できるように 23
  • 24. Nakayama Lab. Machine Perception Group The University of Tokyo  属性 (Attribute) [Lampert et al., CVPR’09], [Farhadi et al., CVPR’09] ◦ 異なるクラス間で潜在的に共有される(と思われる) 基本的な視覚プリミティブ ◦ 人間にも理解できる中間表現として、識別結果の意味づけに利用可能  (例) “しましま” 属性識別器が強く反応した結果、最終的にシマウマと判断 ◦ 多くの場合、属性の辞書は人間が 天下り的に準備  明確にルールが決まっている わけではない  コンピュータが本当に抽出可能 であるかは保証されていない 24 Christoph H. Lampert Hannes Nickisch Stefan Harmeling, Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer, In Proc. CVPR, 2009. ?
  • 25. Nakayama Lab. Machine Perception Group The University of Tokyo  コンピュータは可能な範囲で解の候補を生成  難しいところは人間に問い合わせる  インタラクティブに処理を進め、徐々に解答を絞りこむ (20の扉) ◦ できるだけ情報量が得られる質問を生成 ◦ 識別の精度を上げると同時に、納得感も得られる  属性 (attribute) を問い合わせ [Branson et al., ECCV’10] 25 Steve Branson, Catherine Wah, Florian Schro, Boris Babenko, Peter Welinder, Pietro Perona, and Serge Belongie, Visual Recognition with Humans in the Loop, In Proc. ECCV, 2010.
  • 26. Nakayama Lab. Machine Perception Group The University of Tokyo  属性に加え、部位の位置も問い合わせ [Wah et al., ICCV’11] 26 Catherine Wah, Steve Branson, Pietro Perona, Serge Belongie , Multiclass Recognition and Part Localization with Humans in the Loop, In Proc. ICCV, 2011. 入力画像
  • 27. Nakayama Lab. Machine Perception Group The University of Tokyo  識別に有効なテンプレートパッチをクラウドソーシングで獲得 ◦ ゲーム形式で人間にBubble (パッチ)を選択させる [Deng et al., CVPR’13] ◦ 学習時に集合知を活用することで、完全自動のシステムを大きく上回る 識別精度を達成 27 Jia Deng, Jonathan Krause, and Li Fei-Fei, Fine-Grained Crowdsourcing for Fine-Grained Recognition, In Proc. CVPR, 2013. クラス1 クラス2 与えられた低品質画像がクラス1・2 のどちらであるかを答えるゲーム 小領域(Bubble)を 指定しヒントを得る 少ない回数で当てる ほど高得点 得られた多数のBubbleをテンプレート として利用し特徴ベクトルを生成
  • 28. Nakayama Lab. Machine Perception Group The University of Tokyo  属性 (attribute) の対話的な発見 [Duan et al., CVPR’12] ◦ クラスを弁別するために有効と思われる局所パターンをlatent CRFで 自動的に抽出し、妥当性を人間へ問い合わせ ◦ コンピュータにとっても人間にとっても理解できる中間表現  天下りで定義されたattributeと異なり、システムが検出できることが 保証されている 28 Kun Duan, Devi Parikh, David Crandall, and Kristen Grauman, Discovering Localized Attributes for Fine-grained Recognition, In Proc. CVPR, 2012. システムが自動的に発見したパターンと、ユーザが与えた名称 (フォントの大きさはそれを与えた人数に対応)
  • 29. Nakayama Lab. Machine Perception Group The University of Tokyo (1) 図示したい特徴がはっきり 表れている (2) その他の特徴が(たまたま) 差として表れていない (3) 似たような構図を持つ  似通ったクラスの識別に有効な特徴を発見し、提示する ◦ 図示に最も適したサンプルを自動的に選択 [Bert et al., ICCV’13] 29 Thomas Berg and Peter N. Belhumeur, How Do You Tell a Blackbird from a Crow?, In Proc. ICCV, 2013. 特に類似したクラスを発見 (POOF特徴 + 線形判別分析) 最も識別的な特徴を図示 この際に,出来る限り以下を 満たすサンプルを選ぶ.
  • 30. Nakayama Lab. Machine Perception Group The University of Tokyo  詳細画像識別(Fine-grained visual categorization, FGVC) ◦ 意味的・視覚的に非常に類似した対象の多クラス識別 ◦ 特定のドメインで、非専門家を大きく超える識別能力の実現 ◦ 応用先は広い  官能検査、概観検査、医療画像識別、商品識別…  識別手法の発展 ◦ 大規模一般物体認識の技術をもとに、独自の進化を遂げつつある  識別に“意味”を与える ◦ 人とのハイブリッドで成長するシステム ◦ 数年後には、人を超え、人に教えるシステムの登場を期待 30