画像認識コンテスト

未分類

未分類

★　この記事では、画像認識コンテストを調査することで画像認識の歴史的な流れや、
　　最新技術を把握することを目標としています。随時更新します。

1 ◎ 画像認識データセット
2 ◎ 画像認識コンテスト
- 2.1 ○ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)
3 ○ Object Detection Task
4 ◎ NIST

◎ 画像認識データセット

ImageNet

参照元:ImageNet公式

1,000万枚以上の画像
画像に写っている物体にクラス名を付与
クラス名は2万種類以上

MNIST

手書き数字(0-9)画像を数十万枚収録

CIFAR-10

飛行機、鳥など10クラスの画像を数万枚収録

◎ 画像認識コンテスト

○ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)

☆ ILSVRCとは、2010年から始まった「ImageNetという一般物体認識データセット」を使い1000クラスを認識する画像認識コンテストのことです。

ILSVRC2012

ILSVRC2012では、畳み込みニューラルネットワーク(CNN)を使ったAlexnetというモデルが圧勝しました。これが、ディープラーニングブームのきっかけとなりました。

また、僅差になると思われてた勝負でしたが、2位以下を10%以上引き離して勝利しました。

ILSVRC2015

ILSVRC2015では、優勝者のモデルがついに人間の認識性能を超えました。エラー率は3.57%でした。

ILSVRC2019

○ Object Detection Task

◎ NIST

NISTの主な試験は2種類あり、「2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」「大勢の中から特定の人の顔を見つけ出すアルゴリズム」となっています。

○ NIST2019

2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」

上位6位を中国とロシアの企業が占めました。両国ともに政府が顔認識技術の開発に力を入れていて、プライバシーへの危機意識が比較的弱い国です。

「大勢の中から特定の人の顔を見つけ出すアルゴリズム」

マイクロソフトが首位となりました。

人種や性別の識別精度の偏りが課題となっています。

○ kaggle

空港でのテロ防止のAI開発(１５０万ドル)、住宅価格の予測(１２０万ドル)、肺ガンの画像検出コンテスト(１００万ドル)

画像認識コンテスト

◎ 画像認識データセット

ImageNet

MNIST

CIFAR-10

◎ 画像認識コンテスト

○ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)

ILSVRC2012

ILSVRC2015

ILSVRC2019

○ Object Detection Task

◎ NIST

○ NIST2019

○ 有名モデル

Alexnet(ILSVRC2012優勝)

VGGNet(ILSVRC2014準優勝)

GoogleNet(ILSVRC2014優勝)

ResNet(ILSVRC2015優勝)

○ AIエッジコンテスト

TOEIC

構造体

画像という分野