博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
rcnn 理解笔记
阅读量:6206 次
发布时间:2019-06-21

本文共 526 字,大约阅读时间需要 1 分钟。

 

经过分割与重组后,得到的proposals为2000个,将得到的不同大小的proposals进行warp操作得到尺寸统一的inputs,得到的特征矩阵是2000x4096,然后SVM的权重矩阵是4096 x N。 如下是AlexNet网络,《ImageNet Classification with Deep Convolutional Neural Networks》,知输入是一张一张输入的,然后得到此矩阵。

 

RCNN分为的四个步骤:

1、每张图片1k~2k个候选区域

2、对每个侯选区域,使用深度网络提取特征

3、特征送入SVM分类器,判别是否属于该类

4、使用回归其精细修正候选框位置

 

已经对第2个步骤进行了理解,对于第4个步骤,如何位置精修?

回归器:线性脊回归

通过损失函数最小化,训练回归器,然后对每一类的结果进行修正。

输入是pool5层的4096维特征,输出为xy方向的缩放和平移。

 

参考博客:https://blog.csdn.net/shenxiaolu1984/article/details/51066975

转载于:https://www.cnblogs.com/xiaoheizi-12345/p/9206371.html

你可能感兴趣的文章
如何给VEEAM 7 分配角色权限
查看>>
AlphaGo Zero用它来调参?【高斯过程】到底有何过人之处?
查看>>
《Redis官方教程》Redis集群规范(二)
查看>>
卸载金蝶kis记账王的方法
查看>>
centos中系统启动故障排除
查看>>
Linux平台Oracle多个实例启动说明
查看>>
bash腳本編程之三 条件判断及算数运算
查看>>
php cookie
查看>>
linux下redis安装
查看>>
Sqlserver表值函数
查看>>
NYOJ-271 The 3n + 1 problem
查看>>
弃 Java 而使用 Kotlin 的你后悔了吗?| kotlin将会是最好的开发语言
查看>>
JavaScript 数据类型
查看>>
量子通信和大数据最有市场突破前景
查看>>
跟益达学Solr5之使用Tika从PDF中提取数据导入索引
查看>>
StringBuilder用法小结
查看>>
UVa 10252-Common Permutation
查看>>
Oracle RAC环境下如何更新patch(Rolling Patch)
查看>>
Delphi调用大漠插件示例
查看>>
BUAAOO第一单元的总结
查看>>