★ この記事では、ブースティングについてわかりやすく説明することを
目標としています。随時更新します。
目標としています。随時更新します。
◎ ブースティングとは
☆ブースティングとは、複数の識別器を組み合わせて1つの強力な識別器を学習するアンサンブル学習の1つです。
◎アダブースト
☆アダブーストとは、代表的なブースティングの1つです。
逐次的に学習サンプルの重みを更新しながら識別器を選択することを繰り返し、最終的な識別関数を学習する手法。
個々の識別器を弱識別器、弱識別器を組み合わせた識別器を強識別器と呼ぶ。
メリット
分類器を逐次的に学習させるので、分類器の多様性が生じにくい。
デメリット
分類器を逐次的に学習させるので、場合によっては時間がかかる。
アダブーストはリアルタイムな顔検出に利用されて非常に有名になりました。googleが教師なしで猫の画像を認識した事件()では1000台のコンピュータ(2000個のCPU)を使用しました。
◎ アダブーストのアルゴリズム
入力に対して出力ラベルを予測する2値分類問題。
作成した分類器を評価する。
前段階の分類器で誤分類されたデータの重みを大きくし、後段階の分類器の学習に利用される。(誤分類したデータを間違えないようにする。)
すべての分類器が学習された後に、分類器の信頼度に応じた重み付け多数決で最終的な分類を行う。
図を挿入
上記のように学習を行うことで、最適な学習器を得ることができる。