目標としています。随時更新します。
◎ クラス認識とは
☆クラス認識とは、入力画像内の物体の属する概念を予測するものです。
例えば、橋をクラス認識する場合、橋は様々な形や色のものがありますが、どの橋を見ても「橋」と認識し出力します。
また、クラス認識には「詳細物体認識」という分野もあります。
詳細物体認識
詳細物体認識では、例えば犬の画像をみて「ゴールデンレトリバー」という犬の種別まで認識し出力します。
◎ クラス認識の基本フロー
クラス認識の基本フローは以下になります。
入力は入力画像、出力はクラス名になります。
- サンプリング
- 記述
- 統計的特徴抽出
- コーディング
- プーリング
- 分類
詳細は後ほど説明します。
○ サンプリング
☆ サンプリングとは、入力画像における多数の代表点を選択する事。サンプリングには、「疎なサンプリング」と「密なサンプリング」があります。疎なサンプリングとは画像内のエッジやコーナーなどの特徴的な点を抽出する方法です。この特徴的な点を見つけるアルゴリズムを「検出器」と呼びます。
密なサンプリングとは、画像内の一定の画素ごとに代表点を抽出する方法です。サンプリングされた代表店のことを「特徴点」もしくは「キーポイント」と呼びます。
図を挿入。
○ 局所記述
☆ 局所記述とは、サンプリングで抽出した特徴点の周りに小さな領域(局所領域)を設定し、この小領域から何らかの方法で特徴を抽出することです。この小領域のことを、「画像パッチ」もしくは「パッチ」と呼びます。まら得られたパッチの特徴量を「局所記述子」と呼びます。
○ 統計的特徴抽出
☆統計的特徴抽出とは、画像撮影時のノイズや外乱の影響を受けにくくするための特徴抽出のことです。
○ コーディング
☆ コーディングとは、局所特徴を認識に有効なある決まった次元数の特徴ベクトルに変換する操作のことです。コーディングの代表的な手法として、ベクトル量子化があります。
○ プーリング
☆ プーリングとは、ある画像領域から得られた特徴ベクトル群を一本の特徴ベクトルにまとめる操作のことです。プーリングの代表的な手法として平均化プーリングがあります。
○ 分類
◎ クラス認識の詳細
○局所特徴・・・画像中の局所的な小領域を表現する特徴。
大域特徴・・・画像全体を表現する特徴。
○局所特徴が満たすべき性質。
・再現性・・・同じ物体が映った2枚の画像がある時、
どちらも同一の局所特徴が検出される性質。
・頑健性・・・ノイズやブレに対して検出結果や記述が変化しない性質。
・不変性・・・幾何学変化に影響を受けない性質。
・弁別性・・・取得した局所特徴が他の物体や背景と区別できる性質。
どちらも同一の局所特徴が抽出されること。
・頑健性
・不変性
・弁別性
検出器
疎なサンプリング・・・形状(物体の角や縁)に特徴がある点を抽出する方法。
抽出する点はキーポイントとも言う。
検出器 ・・・エッジ検出、コーナー検出
空間フィルタリング・・・局所特徴からエッジやコーナーを抽出するたに必要な操作
カーネル・・・画素に対する重みを表現した行列。マスクとも呼ばれている。
平均化フィルタ・・・画像の画素に対して平均(平滑化)を用いたフィルタ。平滑化はノイズの低減を意味します。
カーネルサイズが大きいほど平滑化される。
ガウシアンフィルタ・・・画像の画素に対して加重平均を用いたフィルタ。ノイズを低減することが出来るが、有用なエッジの情報なども提言してしまう。
バイラテラルフィルタ・・・エッジ情報を維持しつつ、平滑化をする。
○エッジ検出器
・1次微分の絶対値の大きいところ、2次微分による0交差点により
エッジを発見することが出来る検出器。
○1次微分によるエッジ検出
一般には水平方向と垂直方向に微分を行います。
○プリューウィットフィルタ
上記のカーネルをノイズに強くしたフィルタ。
○ソーベルフィルタ
注目画素を重要視したフィルタ。
○キャニーフエッジ検出器
ガウシアンフィルタとソーベルフィルタを合わせた検出器
○2次微分によるエッジ検出
ラプラシアン・・・x軸方向とy軸方向の2次微分の和
○ラプラシアン・ガウシアンフィルタ
ガウシアンフィルタとラプラシアンを合わせたフィルタ。
○コーナ検出器
・物体の角のような点を見つける検出器
・直交する2方向で共に輝度が大きく変化している点をコーナとして
発見する検出器。
○ヘシアンコーナ検出器
○モラベックコーナ検出器
○ハリスコーナ検出器
○SUSAN
○セグメントテスト
○FASTコーナ検出器
密なサンプリング・・・一定間隔で特徴点を抽出する方法。
検出器 ブロブ検出器・・・?
○ブロブ検出器
・ある小領域に注目した時に、その小領域と周囲の領域と状況が
異なることを利用する検出器。
ブロブ・・・ある小領域に注目した時に、その小領域と周囲の領域と状況が異なる部分。
○ラプラシアン・ガウシアンフィルタを利用した検出器
○ヘシアンを利用した検出器
○回転、アフィン変形に頑健な検出器
○回転不変
・輝度勾配ヒストグラム
・ボックスフィルタによる高速の計算
・パッチ内の画素値のモーメント
記述
画素記述子
局所バイナリパターン(LBP)
局所輝度勾配
局所輝度勾配
SIFT記述子
HOG記述子
バイナリ局所勾配
高次局所自己相関特徴
GIST記述子
CNNを用いた局所記述子
統計的特徴抽出
主成分分析
白色化
フィッシャー線形判別分析
偏最小2乗法
○コーディングとプーリング
コーディング・・・局所特徴を決まった次元の特徴ベクトルに変換します。
プーリング・・・特徴ベクトル群を1本のベクトルにまとめます。
○分類
分類・・・画像特徴ベクトルをクラスに割り振る過程。
分類器・・・分類を行うアルゴリズム。
最適化
識別関数
アンサンブル学習
サポートベクトルマシン(SVM)
分類結果の評価