细粒度图像识别!

#细粒度图像识别初步学习 ##说明本篇文章是「见微知著」——细粒度图像分析进展综述的学习 ##overview

细粒度图像识别是图像分类中一个难点，它的目标是在一个大类中识别子类，比如说在鸟的大类下识别鸟的种类，在车的大类下，识别车的型号。由于相同的子类中物体的动作姿态可能大不相同，不同的子类中物体可能又有着相同的动作姿态，这是识别的一大难点。不止对计算机，对普通人来说，细粒度图像识别的难度和挑战也很巨大。

细粒度图像分类的关键点在寻找一些存在细微差别的局部区域（比如鸟类的喙、眼睛、爪子等），因此，现有的细粒度图像识别算法不但寻找图像中的整个物体（object），还寻找一些有区别的局部（part）。

##细粒度图像分类

###基于强监督信息的细粒度图像分类模型所谓“强监督细粒度图像分类模型”是指：在模型训练时，为了获得更好的分类精度，除了图像的类别标签外，还使用了物体标注框（Object Bounding Box）和部位标注点（Part Annotation）等额外的人工标注信息，如下图所示。 icon

####几个经典模型 Part-based R-CNN 总体流程图为 icon2

Pose Normalized CNN icon3

Mask-CNN icon4

###基于弱监督信息的分类模型

思路同强监督分类模型类似，也需要借助全局和局部信息来做细粒度级别的分类。而区别在于，弱监督细粒度分类希望在不借助part annotation的情况下，也可以做到较好的局部信息的捕捉。

当然，在分类精度方面，目前最好的弱监督分类模型仍与最好的强监督分类模型存在差距（分类准确度相差约1～2%）。

###三个弱监督细粒度图像分类模型的代表。 Two Level Attention Model

Constellations

Bilinear CNN