加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

利用HOG+SVM训练自己的XML文件

发布时间:2020-12-16 09:45:07 所属栏目:百科 来源:网络整理
导读:http://blog.csdn.net/Armily/article/details/8333862 原文链接 在人脸检测中,我们一般利用训练好的XML文件去预测图像中是否存在人脸,那么XML文件是如何得到的,按照人脸的XML文件,它应该是提取样本的Haar特征,利用某个机器学习方法,最终得到的。本文

http://blog.csdn.net/Armily/article/details/8333862 原文链接

在人脸检测中,我们一般利用训练好的XML文件去预测图像中是否存在人脸,那么XML文件是如何得到的,按照人脸的XML文件,它应该是提取样本的Haar特征,利用某个机器学习方法,最终得到的。本文主要讨论如何得到自己的XML文件。

在机器学习中,首先应该是采集样本,然后提取他们的特征,本人主要利用HOG特征进行实验。

1、采集样本图像(正样本和负样本),将其归一化到一个的尺度,如48X48.

2、将样本图像的名称写到一个TXT文件,方便程序调用.

3、依次提取每张图像的HOG特征向量.

4、利用SVM进行训练.

5、得到XML文件

具体代码如下:

HOG特征向量计算方法:

利用矩形HOG结构,2×2个cell组成一个block块,每个cell由8×8像素的图像区域组成,步长N为8,而每个cell的梯度方向从00-3600分成9个方向块。对于00-1800的方向均匀投影到9个方向块,比如00-200投影到a1块,200-400投影到a2块。也就是说每个cell要对9维的特征进行梯度幅度投影,形成9维的特征向量,block内的四个cell独立产生9维的特征向量,计算某个cell的特征向量时,投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影,投影的权重使用三线性插值方法,这样在48×48的图片大小下,利用公式N = ((W–wb)/stride +1)*((H-hb)/stride+1)*bins*n

其中W为图片的宽,H为图片的高,wbhb为block的宽与高,stride为cell的大小,bins为投影的区块,n为一个block中包含的cell的个数。

就产生900维的特征向量。

[html] view plain copy
  1. //////////////////extractthehogfeaturefromimages//////////////////////////////////////////////////////////////
  2. #defineHOG_VECTOR900//图像HOG特征向量((48-16)/8+1)*(48-16)/8+1)*9*4=900
  3. #defineTRAIN_IMG_NUM800//总共的样本(图像)数
  4. HOGDescriptorhog(cvSize(48,48),cvSize(16,16),cvSize(8,8),9,1,-1,HOGDescriptor::L2Hys,0.2,false,HOGDescriptor::DEFAULT_NLEVELS);//初始化HOG描述符
  5. vector<float>descrip;
  6. vector>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM);//将所有HOG特征向量保存在vector中
  7. >::iteratorpos;
  8. pos=totaldescrip.begin();
  9. intImageNum=0;
  10. Matimg;
  11. FILE*f="pictures.txt";//存放样本图像
  12. char_filename[1024];
  13. for(;;)
  14. {
  15. char*filename=_filename;
  16. if(f)
  17. {
  18. if(!fgets(filename,(int)sizeof(_filename)-2,f))
  19. break;
  20. //while(*filename&&isspace(*filename))
  21. //++filename;
  22. if(filename[0]=='#')
  23. continue;
  24. intl=strlen(filename);
  25. while(l>0&&isspace(filename[l-1]))
  26. --l;
  27. filename[l]='';
  28. img=imread(filename);
  29. }
  30. printf("%s:n",filename);
  31. if(!img.data)
  32. continue;
  33. fflush(stdout);
  34. hog.compute(img,descrip);//计算每幅图像的HOG特征向量
  35. >::iteratoriter;
  36. for(iter=descrip.begin();iter!=descrip.end();iter++,pos++)
  37. *pos=*iter;
  38. }
  39. float*buf2=&totaldescrip[0];
  40. Matdata_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);
  41. //将图像标记为两类:1->正样本;2->负样本
  42. Matres_mat=Mat::ones(TRAIN_IMG_NUM,CV_32SC1);
  43. for(intk=400;k800;k++)
  44. res_mat.atunsignedint>(k,0)=2;
  45. //利用SVM进行训练,生成XML文件
  46. TermCriteriacriteria;
  47. SVMsvm=SVM();
  48. SVMParamsparam;
  49. criteria=cvTermCriteria(CV_TERMCRIT_EPS,1000,FLT_EPSILON);
  50. param=SVMParams(SVM::C_SVC,SVM::LINEAR,10.0,0.09,1.0,0.5,NULL,criteria);
  51. svm.train(data_mat,res_mat,Mat(),param);
  52. svm.save("svm_image.xml");


预测的代码:

copy
    hog.compute(img,descrip3);
  1. float*buf3=&descrip3[0];
  2. Mathog_data_mat(1,900,buf3);
  3. SVMsvm_hog=CvSVM();
  4. svm_hog.load("svm_image.xml");
  5. floatindex=0.;
  6. index=svm_hog.predict(hog_data_mat);
  7. cout<<"index="indexendl;

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读