★ この記事では、画像認識コンテストを調査することで画像認識の歴史的な流れや、
最新技術を把握することを目標としています。随時更新します。
最新技術を把握することを目標としています。随時更新します。
◎ 画像認識データセット
ImageNet
参照元:ImageNet公式
- 1,000万枚以上の画像
- 画像に写っている物体にクラス名を付与
- クラス名は2万種類以上
MNIST
- 手書き数字(0-9)画像を数十万枚収録
CIFAR-10
- 飛行機、鳥など10クラスの画像を数万枚収録
◎ 画像認識コンテスト
○ ILSVRC(ImageNet Large Scale Visual Recognition Challenge)
☆ ILSVRCとは、2010年から始まった「ImageNetという一般物体認識データセット」を使い1000クラスを認識する画像認識コンテストのことです。
ILSVRC2012
ILSVRC2012では、畳み込みニューラルネットワーク(CNN)を使ったAlexnetというモデルが圧勝しました。これが、ディープラーニングブームのきっかけとなりました。
また、僅差になると思われてた勝負でしたが、2位以下を10%以上引き離して勝利しました。
ILSVRC2015
ILSVRC2015では、優勝者のモデルがついに人間の認識性能を超えました。エラー率は3.57%でした。
ILSVRC2019
○ Object Detection Task
◎ NIST
NISTの主な試験は2種類あり、「2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」「大勢の中から特定の人の顔を見つけ出すアルゴリズム」となっています。
○ NIST2019
2枚の写真に写った顔が同じものかどうかを識別するアルゴリズム」
上位6位を中国とロシアの企業が占めました。両国ともに政府が顔認識技術の開発に力を入れていて、プライバシーへの危機意識が比較的弱い国です。
「大勢の中から特定の人の顔を見つけ出すアルゴリズム」
マイクロソフトが首位となりました。
人種や性別の識別精度の偏りが課題となっています。
○ kaggle
空港でのテロ防止のAI開発(150万ドル)、住宅価格の予測(120万ドル)、肺ガンの画像検出コンテスト(100万ドル)