期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于改进特征袋模型的奶牛识别算法(2)

时间:2016-10-04 14:27 文章来源:http://www.lunwenbuluo.com 作者:陈娟娟等 点击次数:


  HOG是计算机视觉领域中常用于目标检测的描述符,传统HOG特征实现步骤为:首先对图像进行归一化处理,将检测窗口内的图像划分为若干个cell(细胞单元);然后统计每个cell中各像素点的梯度或边缘的方向为每个cell建立直方图,将相邻的若干个cell组成block(块),统计整个块的直方图并对其进行归一化;最后,把所有block的直方图组合得到HOG特征描述符,即36维的HOG特征。
  为进一步降低特征复杂度,提高算法计算性能,本文采用与文献[19]相似的思想,在不引起性能损失的前提下对传统36维HOG特征解析降维,得到31维的优化HOG特征并将其作为本文特征描述符。优化HOG特征相比传统HOG特征省去了计算稠密特征映射时的投影过程,减少了特征维度,降低了特征复杂度,节省了特征计算时间,缩短了整个算法的运行时间,从而提高了算法计算效率,但是识别性能并未因此受到影响。优化31维HOG特征的具体实现如下:
  在实际使用中发现,有些目标类别适合使用对比度敏感特征,有些则适合使用对比度不敏感特征。为了使本文的优化HOG特征能适用于尽可能多的目标类别,文本既使用了对比度敏感特征又使用了对比度不敏感特征。假设C是聚合有9个对比度不敏感方向基于cell的像素级特征映射,D是聚合有18个对比度敏感方向基于cell的像素级特征映射。使用式(8)定义C和D的4种归一化因子,从而得到4×(9+18)=108维的特征向量F(i, j)。本文没有直接使用这个108维的特征向量,而是对其解析投影降维:27个在不同归一化因子上的累加和,F中的每个方向通道对应一个;4个在不同方向上的累加和,每个归一化因子对应一个。这样最终得到的特征映射是31维:27维对应不同的方向通道,其中包括9个对比度不敏感方向和18个对比度敏感方向;另外4维捕获(x,y)周围4个cell组成的block的梯度能量信息。
  2.2直方图交叉核
  若要实现图像的识别分类,在提取得到图像的优化HOG特征后,要选择适当的分类器利用提取到的特征完成识别分类任务,BOF算法多采用SVM作为分类器,因此本文也选用SVM作为分类器。SVM作为分类器时,一个很关键的步骤是核函数的选取[20-21],选择适当的核函数可在一定程度上提高算法的识别性能,本文在3.3.1节中为对比分析高斯核与直方图交叉核的识别性能进行了大量实验,最终确定选用后者作为本文SVM分类器核函数。直方图交叉核是图像分类领域常使用的核函数,常适用于图像的直方图特征分类。直方图交叉核的形式可表示为:
  2.3算法描述
  本文算法在BOF模型基础上,通过引入优化HOG特征等对其进行了一系列优化改进。算法具体流程如图2,图中SVM分类过程使用LIBSVM软件包实现,选择的SVM类型为C-SVC,松弛变量为200,所用核函数为自定义的直方图交叉核。
  将从牛场拍摄得到的奶牛头部图像规格化,统一命名,初始化算法的一系列路径变量,为所有图像分配指定标签(用数字表示),如第一类奶牛的标签为1。将图像名称、存储位置、标签等相关信息以mat文件保存。
  提取优化HOG特征
  利用优化HOG特征提取算法对预处理后的奶牛头部图像进行特征提取和描述,获取每张奶牛头部图像的特征信息。在local文件夹中为每张图像建立一个文件夹,将每张图像的HOG特征以mat文件的格式保存在相应的文件夹中。
  K-Means聚类
  用K-Means聚类算法构造视觉词典,本文初始聚类质心随机选取,通过限定迭代次数收敛出最终的聚类中心,构造出视觉词典。构造的视觉词典以mat文件的形式保存在global文件夹中。
  引入SPM对图像进行基于视觉词典的直方图表示
  利用第1章介绍的方法生成所有奶牛头部图像的直方图表示,结果以mat文件的格式保存在global文件夹内。
  SVM分类器识别分类
  该过程直接使用由林智仁等开发出来的LIBSVM软件包[17]实现,核函数选用本文自定义的直方图交叉核。
  3实验结果与分析
  3.1实验环境
  本文实验是在64位的Windows 7操作系统下完成,Matlab版本为2014a;主机内存为4.0GB,CPU为4核的i5-3470,主频为3.2GHz。
  3.2实验数据集
  本文实验用奶牛头部图像是项目组从牛场中实地拍摄而来,包含15类奶牛,共7500张奶牛头部图像。每类奶牛有500张图像,将该类奶牛所有头部图像统一命名后按照名称排序,取前400张作为训练集,其余100张作为测试集。本文将奶牛头部图像规格化为400×400像素大小,选择cellsize=8,p=9,因此每张图像的优化HOG特征为(400/8)×(400/8)×31维。字典大小为200,金字塔层数为3。该数据集取自现实自然场景,奶牛姿态比较多,图像背景比较复杂,部分图像光照条件不好,比较模糊。数据集中部分图像截图如图3所示。  
  3.3实验结果与分析
  本节在收集得到的数据集上对基于直方图交叉核和高斯核的分类器的识别性能进行比较分析,并分析研究空间金字塔匹配原理对识别性能的影响,最后对基于传统HOG特征算法、基于SIFT特征算法和本文算法的识别性能和计算性能比较分析,以验证本文算法的有效性和合理性。实验中算法计算性能用运算时间衡量,识别精度用平均正确率衡量。
  3.3.1识别性能分析
  1)直方图交叉核提高识别精度。

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli