★ この記事では、学習データの品質について分かりやすく説明することを
目標としています。随時更新します。
目標としています。随時更新します。
○ 学習データとして必要な量
学習をする際に、最も大切なものが学習データです。一般的に、ディープラーニングでは大量の学習データが必要でGAFAといった、学習データを多く保有できる仕組みを持っている会社が有利だと言われています。
しかし、これは一般的な話で、データが足りない場合がほとんどですので、少ないデータ量で精度の良いモデルを作れる方法はいくつか考案されています。
その方法を使えば1000枚中50枚程度の正解画像で80%程度の正解率で認識をすることができます。(これは、比較的種類の多いバラを対象にした場合の枚数です)