R-CNN (Regios with Convolutional Neural Networks) は直訳すれば,領域切り出し付き畳み込みニューラルネットワークとなります。
画像認識では,画像を小領域に分割して,分割した領域ごとに畳み込みニューラルネットワークによる認識を行うことが行われます。
領域の切り出しには矩形(画像の中の左上と右下をの点を指定する四角形など)領域が用いられる場合が多いです。
どのように領域を切り出すのか,切り出し方によって認識性能も変わってきます。
ですので関心領域の切り出しは,認識性能を高めるためのポイントとなります。
2014年までは既存手法によって関心領域を切り出し,その領域を畳み込みニューラルネットワークに送ることが行われてきました。そのため計算時間のかかる処理でした。ですが領域の切り出しと認識とを同時に行う Fast RCNN が提案され,この分野のブレークスルーとなりました。
さらに高速な Faster RCNN も提案され,ほぼ実時間で領域切り出しを行うことができるようになりました。中級者向け話題