画像認識コンテスト

★ この記事では、画像認識コンテストを調査することで画像認識の歴史的な流れや、
  最新技術を把握することを目標としています。随時更新します。

◎ 画像認識データセット

ImageNet

参照元:ImageNet公式

  • 1,000万枚以上の画像
  • 画像に写っている物体にクラス名を付与
  • クラス名は2万種類以上

MNIST

  • 手書き数字(0-9)画像を数十万枚収録

CIFAR-10

  • 飛行機、鳥など10クラスの画像を数万枚収録

◎ 画像認識コンテスト

○ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)

☆ ILSVRCとは、2010年から始まった「ImageNetという一般物体認識データセット」を使い1000クラスを認識する画像認識コンテストのことです。

ILSVRC2012

ILSVRC2012では、畳み込みニューラルネットワーク(CNN)を使ったAlexnetというモデルが圧勝しました。これが、ディープラーニングブームのきっかけとなりました。

また、僅差になると思われてた勝負でしたが、2位以下を10%以上引き離して勝利しました。

ILSVRC2015

ILSVRC2015では、優勝者のモデルがついに人間の認識性能を超えました。エラー率は3.57%でした。

ILSVRC2019

○ Object Detection Task 

◎ NIST

NISTの主な試験は2種類あり、「2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」「大勢の中から特定の人の顔を見つけ出すアルゴリズム」となっています。

○ NIST2019

2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」

上位6位を中国とロシアの企業が占めました。両国ともに政府が顔認識技術の開発に力を入れていて、プライバシーへの危機意識が比較的弱い国です。

「大勢の中から特定の人の顔を見つけ出すアルゴリズム」

マイクロソフトが首位となりました。

人種や性別の識別精度の偏りが課題となっています。

○ kaggle

空港でのテロ防止のAI開発(150万ドル)、住宅価格の予測(120万ドル)、肺ガンの画像検出コンテスト(100万ドル)

○ 有名モデル

Alexnet(ILSVRC2012優勝)

VGGNet(ILSVRC2014準優勝)

GoogleNet(ILSVRC2014優勝)

ResNet(ILSVRC2015優勝)

○ AIエッジコンテスト

>画像という分野

画像という分野

画像に関連することを網羅していきます。

ぜひお時間がある方はのぞいてみてください。

CTR IMG