感谢子豪兄的分享-关于RCNN的学习(一)

https://www.bilibili.com/video/BV1d64y1W74E?spm_id_from=333.999.0.0https://www.bilibili.com/video/BV1d64y1W74E?spm_id_from=333.999.0.0https://www.bilibili.com/video/BV1d64y1W74E?spm_id_from=333.999.0.0感谢子豪兄的开源精神

红色表示图像分类算法,绿色表示目标检测算法,但是这个年份是不是有点问题

语义分割:区分每一个像素的类别

实例分割:在语义分割的基础上区分每个物体

 keypoint detection:关键点检测

做一些单词区分

detection 意味着你能看到目标。比如手势识别,骨干识别,keypoint detection

recognition 意味着你能认识目标。比如它是车,人,或动物。目标检测,object recognition

identification 意味着你能分辨目标。能找出同一类下的不同,比如它是什么车。

bounding box 边界框

RCNN原理的简述

在原图上提取2000+的候选框,将候选框缩放至统一尺寸,逐一送进同一个卷积网络,每个候选框最终的到4096维的卷积特征,一方面送进class个数个用于分类的SVM中,一方面用于预测框的回归

功耗分布

光以此图来看,将2000+的候选框逐一送进网络最为耗时,可不嘛,一张图当2000张用,这数据规模可是不得了

为了解决RCNN的性能问题,有大量的方法:

 像共享卷积运算,就是从原图提取卷积特征,然后所有候选框共享这个特征

RCNN的各个模块-选择搜索算法

产生2000+的候选框

 

通过聚类,先对图像进行初步分割,然后做融合,逐步收敛候选框的数量

 得到候选框之后,将候选框缩放至227*227的尺寸

 填充的灰条的值等于整张图片像素的平均值

扩大候选框dilate proposal,一边是扩大16pix

 另外,

这句话说的很抽象,没看懂?

RCNN的错误分布:

为什么使用SVM而不是用softmax??

 这里也是不太明白

RCNN:regions with CNN features

先讲RCNN的测试阶段:

提取好rigion proposals,对每一个proposal做dilate,目的是增加rigion的上下文信息

 开始做分类

bbox回归,refinement提炼

 由此产生一个问题:bbox的回归怎么做的??是有一个训练好的回归器吗??这个回归是反映到原图上,还是说只是针对这个proposal??

训练RCNN的思路(有当时的时代局限性):

鉴于当时用于目标检测的数据集很少,使用在数据丰富的辅助任务上预训练出的模型,然后再迁移到目标检测上

 

 这个fine tune 需要做到什么程度呢??RCNN是有SVM和回归器的,这俩是否参与预训练??

还有几个问题:

1.正负样本怎么定义

正负样本是相对的概念,不同的正负样本定义对问题解决没有本质影响,但好的正负样本定义可以减轻认知负担、方便人对问题的理解。

比如说做分类任务,对于类别 cat, 的确是猫的图片就判定为正样本,否则判定为负样本

又比如说错误检测任务,那么这时候就将存在错误的样本判定为正样本,这虽然有点反直觉,但这正体现了上述的所谓相对的概念

正负样本的设定应该以目标为导向,或者说他就是为了我们的目标而服务

2.预测框回归是怎么做的?借助神经网络??

3.SVM怎么实现的分类

4.预训练模型和fine tune模型之间的关系 

hands_up_down
关注 关注
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
人脸验证识别区别
Sun7_She的专栏
04-27 3482
Face verification 人脸验证,一对一 Face identification / recognition 人脸识别,一对多 闭集:已知此人在该数据集中 开集:不知道此人在不在这个数据集中 Face alarm ratio (一般设置为万分之一) 识别错误的人脸个数/总人脸个数 识别错误的人脸:两个人脸来自不同人脸,但是
人脸验证与人脸识别(Face verification and Face identification / recognition)
LDC1314?
12-18 2万+
前言: 人脸验证与人脸识别在人脸识别过程中是不相同的.首先介绍下人脸识别的概念,其次对于人脸识别人脸验证进行区别对比分析,以及相关概念介绍.最后对于这两个过程的评测进行说明. 内容: 1.人脸识别的相关概念 人脸识别(Facial Recognition),即通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度进行计算分析,进而和自身数据库里已...
Faster R-CNN、Mask R-CNN和Keypoint R-CNN概况
最新发布
fydw_715的博客
07-24 920
Faster R-CNN是用于对象检测的模型,Mask R-CNN在其基础上增加了实例分割功能,而Keypoint R-CNN进一步扩展Mask R-CNN以实现关键点检测和姿态估计。
【AI-1000问】Face detection、alignment、verificationidentification(recognization) 你能分的清楚吗?
hacker_long的专栏
03-13 1982
文章首发于微信公众号《有三AI》 【AI-1000问】人脸的4个方向,你还分的清楚吗? 往期视频(前往公众号观看) Facedetection、alignment、verificationidentification(recognization) 你能分的清楚吗? 人脸识别一直以来都是当前生物特征识别研究的热点之一,人脸识别技术在工业界应用价值尤为突出。如今随着互联网技术的发展,似...
目标检测理论知识
qq_46454669的博客
10-30 1266
Fast R-CNN是基于R-CNN和SPPnets进行的改进。SPPnets,其创新点在于只进行一次图像特征提取(而不是每个候选区域计算一次),然后根据算法,将候选区域特征图映射到整张图片特征图中。
Speaker recognition/identification、speaker verification
weixin_39087379的博客
01-18 762
Speaker recognition/identification 语者识别可以看成是一个多分类任务。我们需要从输出取概率最大那个索引对应的类别。 ** speaker verification ** 给定之前一段记录好的声音(注册语音)和一段新输入的声音,模型会判断二者的相似度,并输出一个表示相似度的概率,通过阈值来判断二者是否是同一个人说的。 ...
蒋子豪-209030224-实验一Linux系统安装.docm
10-10
蒋子豪-209030224-实验一Linux系统安装.docm
蒋子豪-209030224-实验二 Linux shell 使用.docm
10-10
蒋子豪-209030224-实验二 Linux shell 使用.docm
fast-style-transfer讲解视频资料,包含唐宇迪版本与同济子豪兄版本
03-24
本资源包提供了唐宇迪和同济大学子豪兄两个版本的fast_style_transfer讲解视频,将帮助我们深入理解这一技术的核心原理和实现方法。 唐宇迪,一位在人工智能领域有着深厚研究的专家,他的讲解通常深入浅出,注重...
回复: 付子豪-学习日报-2022.09.26.eml
09-27
回复: 付子豪-学习日报-2022.09.26.eml
同济子豪兄github_【B站UP主-同济子豪兄】华为云ModelArts零代码开发病虫害识别应用...
weixin_42522518的博客
01-12 1163
大家好,我是B站UP主同济子豪兄,我希望让人工智能和大数据赋能每一个行业,每一个人。今天给大家带来的是使用ModelArts快速开发农作物病虫害识别微信小程序,用人工智能的力量赋能农业,助力乡村振兴、精准扶贫!参考文档和视频资料ModelArts预备工作:葡萄病虫害数据集,见附件ModelArts准备工作本文档适用于初次使用ModelArts的用户。使用ModelArts之前,需要做如下工作:注册...
VerificationIdentification区别
heroacool的专栏
01-05 4984
简明扼要的说: 1,Verification: 1-1 2, Identification: 1-n参考资料: 1, http://www.biometricupdate.com/201206/explainer-verification-vs-identification-systems
[调研报告]人脸识别
热门推荐
faiculty
10-31 2万+
一、前述 1. 发展 以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出,人脸识别系统已经由简单的图像处理发展到了视频实时处理。而且算法已经由以前的Adaboots、PCA等传统的统计学方法转变为CNN、RCNN等深度学习及其变形的方法。现在也有相当一部分人...
【AI测试】Face Recognition(人脸识别)性能度量,评价
凌晨的博客
12-24 4827
Face Recognition 包括 Face Verification 和 Face Identification 性能度量数据集是: 底库(gallary)数据集G; Verification Verification 是每次进行一对人脸图像的比较,判断是否是同一个人; 也叫做1:1 matching 验证任务下提交两张图像,比较两张图像,得到相似度值,如果该值超过了指定阀值,则完成验证...
读《FVT: Finger Vein Transformer for Authentication
weixin_40459958的博客
06-01 381
2022,SCI ViT应用于FV识别
验证(Verification)与确认(Validation)的区别
分布式应用与服务器架构专栏
10-15 1万+
验证(Verification)与确认(Validation)的区别
图像分类Classification,目标检测Object detection,实例分割Instance segmentati,语义分割semantic segmentation,全景分割等概念的区别
qq_46276946的博客
11-27 3001
Image Classification(图像分类):判断图像的分类,知道里面的东西是什么,不需要知道在哪里,只需要标出存在的类别名称即可。 Object detection(目标检测):知道图像有什么东西,在哪里,但不需要知道是什么,用方形框框出来。 semantic segmentation(语义分割):需要知道每一个像素点的是什么物体的一部分,而不是用矩形框,体现为一个花花绿绿的图像。但同一种类多个个体使用同一种颜色。 Instance segmentation(实例分割):等于是目标检测和语义
[RCNN] Rich feature hierarchies for accurate object detection and semantic segmentation
sinat_30618203的博客
07-02 261
Overview 1、文章主要贡献 CNN服务于detection任务: 1) CNN提取proposal特征 2)pretrain的CNN网络显著提高mAP 2、创新点 传统定位方法: 1)回归方法定位frame (mAP低) ...
同济子豪兄yolov1
08-05
你好!对于同济子豪兄的 YOLOv1,它是一种用于目标检测的深度学习模型。YOLO(You Only Look Once)是一种实时目标检测算法,它能够在单个网络中同时预测对象的边界框和类别。而 YOLOv1 是 YOLO 系列算法中的第一个版本。 YOLOv1 的核心思想是将目标检测问题转化为一个回归问题,通过将图像划分成网格,并在每个网格中预测边界框和类别信息来完成目标检测。相比于其他目标检测算法,YOLOv1 的优势在于其实时性和简单性。 然而,YOLOv1 在处理小目标和重叠目标时存在一些问题,并且定位精度相对较低。后续的 YOLO 算法如 YOLOv2、YOLOv3 和 YOLOv4 都对这些问题进行了改进和优化,提升了目标检测的性能。 希望以上信息对你有所帮助。如果你还有其他问题,请随时提问!
写文章

热门文章

  • 关于注意力机制的学习 3558
  • MySQL(一) 3438
  • 关于resnet(残差网络)(一) 3099
  • 每天一个算法(简单) 2887
  • 关于YOLO2的学习 2805

分类专栏

  • 算法 2篇
  • JAVA编程语言 17篇
  • 蓝桥杯
  • 深度学习 1篇

最新评论

  • 我的创作纪念日

    码密码密轰: 已打赏,期待后面更多的精彩博文输出~~~

  • 关于yolo2论文的学习

    TYSON_0401: 你好,请问怎么理解置信度标签? 文中说置信度标签使用预测框与标定框的IOU, 那么置信度标签是在训练模型后再打的?那这样损失函数加在一起还有意义吗?

最新文章

  • web开发发展历程-前端、后端、消息队列、后端架构演进
  • 动态规划专题第一章-第三章(坐标型、序列型、划分型)
  • Maven(一)maven设置,坐标,pom,java工程,web工程,目录结构,构建,依赖,继承,聚合
2024年1篇
2023年2篇
2022年22篇
2021年27篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家玻璃钢人物雕塑哪家设计得好焦作玻璃钢浮雕不锈钢树叶雕塑玻璃钢学校抽象雕塑定制厂家白云区玻璃钢雕塑订做白银人物玻璃钢雕塑设计购物商场美陈河南玻璃钢雕塑厂四川玻璃钢雕塑哪家专业太原户内玻璃钢雕塑临河玻璃钢雕塑黔西南玻璃钢雕塑厂嵩县玻璃钢雕塑厂家玻璃钢鹿群雕塑山东欧式玻璃钢雕塑生产厂家衢州玻璃钢花盆批发玻璃钢雕塑马设计多少钱张掖玻璃钢牌匾雕塑玻璃钢软体雕塑动态图河南大型玻璃钢雕塑摆件玻璃钢迎宾雕塑制造厂永城制作玻璃钢雕塑商家选哪家上海玻璃钢仿真动物雕塑哪家有书本玻璃钢雕塑商场美陈方案蝴蝶上海定制玻璃钢雕塑性价比出众长治人物玻璃钢雕塑玻璃钢玻璃钢动物雕塑铜陵商场新年美陈合肥个性化玻璃钢雕塑定制汤阴玻璃钢雕塑厂家香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化