【阅读笔记】《Panoptic Segmentation》

26 篇文章 7 订阅
订阅专栏
3 篇文章 0 订阅
订阅专栏

本文记录了博主在阅读《Panoptic Segmentation》一文过程中记录的笔记。更新于2018.12.27。

文章目录

  • Useful links
  • Introduction
  • Related Work
  • Panoptic Segmentation Format
  • Panoptic Segmentation Metric
    • Segment Matching
    • PQ Computation
    • 与现有度量的比较
  • 全景分割数据库
  • 人类行为研究

Useful links

COCO challenge 2018: panoptic segmentation
panoptic segmentation data set
Panoptic Segmentation API
中文介绍

Cityscapes
ADE20k
Mapillary Vistas

Introduction

全景分割(PS,Panoptic Segmentation)的task format: 每个像素点都必须被分配给一个语义标签(stuff、things中的各个语义)和一个实例id。具有相同标签和id的像素点属于同一目标;对于stuff标签,不需要实例id。

论文作者认为目前分割任务在things或stuff之间分别进行而非统一分割的一个很重要的原因是缺少合适的度量矩阵。因此,文中提出了一种适用于二者的panoptic quality(PQ) metric。

与语义分割相比,全景分割的困难在于为了区分不同类别的实例,全连接网络的设计要更困难一些;
与实例分割相比,目标的分割必须是非重叠的(non-overlapping),因此对那些每个目标单独标注一个区域是不同的。

Related Work

作者在这一部分写的还是很有启发性的,建议看一下。博主后面会更新这一部分。

Panoptic Segmentation Format

Task format: 全景分割的任务要求一个算法能够将图片内的每一个像素点 i i i投射成 ( l i , z i ) (l_i,z_i) (li,zi),其中 l i l_i li是其语义分割的类别, z i z_i zi是其实例分割的id。具有相同 z i z_i zi标注的像素点会被聚集成不同的部分。模棱两可或无法确定类别的点可以被赋予一个空标注,也就是说不是所有的点都必须有一个语义标注。

Stuff and thing labels: 这里,所有语义类别都要么属于stuff,要么属于thing,不会有一个类别既属于Stuff又属于thing。且,如果一个像素被标注为stuff,那么其实例类别就无所谓了,即默认所有具有相同stuff类别的物体都被认为是同一样东西(如都是蓝天);否则,只有具有相同实例类别的点才会被标注成同类目标(如同一辆车)。

与语义分割的关系: 如果所有的类别都是stuff,那么PS确实与语义分割相同(但task metrics不同)。且引入了thing类别后,图片中可能出现多个实例,这也对分割造成了影响。

与实例分割的关系: PS中不允许重叠,但是实例分割中可以有重叠区域。

Confidence scores: 与语义分割相同但不同于实例分割,PS不需要每个segment的置信概率。尽管不提供置信概率更贴近人类认知世界的方法;但是对于底层机器而言,置信概率还是有用的,因此论文作者提出也需要能够提供置信概率的PS算法。

Panoptic Segmentation Metric

论文作者认为,将stuff分割和thing分割统一起来的度量应当具有:

  • 完整性:这个度量需要统一对待stuff和thing,将任务中所有方面都考虑到。
  • 可解释性: 我们追求可定义的度量,因为其可以促进交流和理解。
  • 简单:该度量应当定义简介,使用简单,能够被简单地复现。

考虑到上面几点,论文作者们提出了下面这个度量,其分为两步:segment matching和给定matches下的PQ computation。

Segment Matching

两个条件:

  • IoU(intersection over union)要严格大于0.5才算匹配(predicted segment与ground truth segment);
  • 不可以有重叠区域(non-overlapping property)。

上述这两个条件就限制了,每一个点最多只能有一个与之对应的ground truth segment(unique matching)。
这段话比较难理解,这里放上原文以辅助:

… gives a unique matching: there can be at most one predicted segment matched with each ground truth segment.

针对上面这个陈述,原文中给出了Theorem 1并附有证明,感兴趣可以看 原文第四页。

在这个基础上,原文中归纳出了由定理1给出的两个性质:

  • First, it is simple and efficient as correspondences are unique and trivial to obtain.
  • Second, it is interpretable and easy to understand (and does not require solving a complex matching problem as is commonly the case for these types of metrics).

这些性质还是比较难理解的,博主个人认为,这两个性质的主要带来的好处也就是,一个位置就只能给一个标签了,不会像实例分割中那样,一个点还可能给多个分割标签(因为实例分割允许重叠),那么这一个点就是独特的了,对于该点所携带信息的理解也就是唯一的了。这种唯一性就使得:首先,分割任务更简单(因为不存在“一词多义”);其次,可解释(一个点就一个分割也就是一个含义)。这段理解如果各位在阅读原文后有不同的理解,欢迎在评论区讨论,这里博主仅将个人理解放在这里抛砖引玉。

另外,论文作者在文中还给出了一个博主认为很重要的结论:不需要考虑小于0.5的IoU,因为实际应用中,以IoU$\leq$0.5匹配的情况非常稀少。

PQ Computation

PQ:Panoptic Quality

论文作者首先单独计算每个类别对应的PQ,随后对所有类别取平均。这样就使得PQ对于类别不均衡(class imbalabce)不敏感。

对于每个类别,unique matching将predicted segments和ground truth segments分为三类:true positives (TP), false positives (FP), 和false negatives (FN),分别对应配对的分割(matched pairs of segments),不配对的估计分割(unmatched predicted segments),不配对的真值分割(unmatched ground truth segments)。

下图是一个例子:

在这里插入图片描述

给定上述三个类别,PQ由下式定义:

PQ = ∑ ( p , g ) ∈ T P IoU ( p , g ) ∣ T P ∣ + 1 2 ∣ F P ∣ + 1 2 ∣ F N ∣ \text{PQ}=\frac{\sum_{(p,g)\in TP}\text{IoU}(p,g)}{\vert TP\vert + \frac{1}{2}\vert FP\vert+\frac{1}{2}\vert FN \vert} PQ=TP+21FP+21FN(p,g)TPIoU(p,g)

其中, 1 ∣ T P ∣ ∑ ( p , g ) ∈ T P IoU ( p , g ) \frac{1}{\vert TP\vert}\sum_{(p,g)\in TP}\text{IoU}(p,g) TP1(p,g)TPIoU(p,g)很好理解,就是对于所有匹配上的分割求平均IoU,分母中增加的 1 2 ∣ F P ∣ + 1 2 ∣ F N ∣ \frac{1}{2}\vert FP\vert+\frac{1}{2}\vert FN\vert 21FP+21FN是为了惩罚没有匹配正确的点(因为分母增加后,PQ的值降低,即分割质量下降)。需要注意的是,无论segments的位置,它们都具有相同的权重。

另外,PQ通过变换也可以理解为分割质量(SQ,segmentation quality)与识别质量(PQ,recognition quality)的乘积:

PQ = ∑ ( p , g ) ∈ T P IoU ( p , g ) ∣ T P ∣ ⎵ segmentation quality (SQ) × ∣ T P ∣ ∣ T P ∣ + 1 2 ∣ F P ∣ + 1 2 ∣ F N ∣ ⎵ recognition quality (RQ) \text{PQ}=\underbrace{\frac{\sum_{(p,g)\in TP}\text{IoU}(p,g)}{\vert TP\vert}}_\text{segmentation quality (SQ)}\times\underbrace{\frac{\vert TP\vert}{\vert TP\vert + \frac{1}{2}\vert FP\vert + \frac{1}{2}\vert FN \vert}}_\text{recognition quality (RQ)} PQ=segmentation quality (SQ) TP(p,g)TPIoU(p,g)×recognition quality (RQ) TP+21FP+21FNTP

其中RQ就是检测中常用的质量估计 F 1 F_1 F1 score。

空标注(Void labels)
在真值中有两种空标注类型:超出类别像素(out of class pixels)和模糊或未知像素(ambiguous or unkown pixels)。在评估过程中,对应真值空标注的这些点不参与评估。具体移除方式文中有说明,见原文第5页void labels。

组标注(Group labels)
在某些情况下,区分具有相同语义分割的不同相邻实例有一定困难,此时一种常用的做法是用group labels替代instance ids。在PQ中,首先,不使用group labels;其次,对于包含一部分相同类别像素点的unmatched predicted segments,这一部分将被去除并不视作false positives。

与现有度量的比较

语义分割度量
用于语义分割的现有度量主要包括像素准确度(pixel accuracy)、平均准确度(mean accuracy)和IoU。然而这些分割方法都只关注了像素级的正确率,而没有考虑实例正确性,因此不适合用于thing类别的分割任务。

实例分割度量
标准的实例分割度量是平均精度(Average Precision,AP)。AP要求所有的目标分割都有一个置信概率用于估计precision/recall曲线。然而,这种方法无法度量语义分割或全景分割的输出。

全景质量(Panoptic quality)
PQ不是单纯的语义分割度量与实例分割度量的组合,SQ和RQ对于每一个类别(stuff和thing)都被计算了,分别用于评估分割和识别的精度。

全景分割数据库

就论文作者已知的,目前只有三个数据库同时包括稠密语义分割与实例分割标注: Cityscapes、 ADE20k和 Mapillary Vistas。在全景分割中,这三种数据库都被使用了,论文作者也将进一步扩展COCO数据集(其中stuff类别已经有了标注)。

关于数据库的情况,博主直接截图放在下面了:

在这里插入图片描述

人类行为研究

论文中从人类标注(human annotations)、人类表现(human performance)、stuff vs. things、小物体vs.大物体、IoU阈值和SQvs.RQ平衡几个方面做了描述。博主认为这一部分的内容还是具有很大的启发性的,然而博主目前的理解仅限于机械的翻译,而没有办法对这一部分给出自己的理解,因此建议感兴趣的话自行阅读原文对应部分。当然博主后面如果有了不同的理解,会回来更新。

更多内容,欢迎加入星球讨论。
在这里插入图片描述

论文阅读理解 - Panoptic Segmentation 全景分割
长风破浪会有时,直挂云帆济沧海
01-15 2万+
论文阅读理解 - Panoptic Segmentation 全景分割 [Paper] 摘要 新的任务场景 —— 全景分割 Panoptic Segmentation: 统一了实例分割(Instance Segmentation) 和语义分割(Semantic Segmentation). 实例分割 - 检测每个 object instance,并进行...
《VPS:Video Panoptic Segmentation》论文笔记
m_buddy的博客
05-06 1026
参考代码:vps 1. 概述 导读:文章的这篇文章整合了全景分割(实例分割+语义分割)和视频分割算法,从而得到在视频场景下的全景分割算法。其算法是构建在Mask RCNN/ MaskTrack RCNN/ UPSNet的基础之上,但是在这个基础之上文章还强调了视频时序中信息的萃取(spatial-temporal attention),从而增加了视频中实例的分割性能鲁棒性(也就是文章中提到的pixel level fusion)。针对文章的任务,作者在全景分割的基础上提出了视频场景下的性能评价指标VPQ
全景分割(Panoptic Segmentation)(CVPR 2019)
热门推荐
77wpa的博客
09-02 1万+
全景分割(Panoptic Segmentation
Panoptic Segmentation论文笔记
陈建驱的博客
04-13 1574
个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-113.html 论文:Alexander Kirillov,Kaiming He,Ross Girshick,Carsten Rother,Piotr Dollar.Facebook AI Research (FAIR),Heidelberg U...
Reading Note: Panoptic Segmentation
joshua_1988
01-10 2297
TITLE: Panoptic Segmentation AUTHOR: Alexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, Piotr Dollar ASSOCIATION: FAIR, Heidelberg University FROM: arXiv:1801.00868 CONTRIBUTION A
CVPR 2020-Panoptic Segmentation
John's Blogs
06-24 809
目录研究概况论文列表 研究概况 全景分割(Panoptic Segmentation)在CVPR 2019 被提出,但一年多来已经引起广泛关注,CVPR 2020 总计有8篇文章。概念:即同时实现对背景的语义分割和前景的实例分割。下图中,(b)语义分割的结果是相同语义的对象标成相同的颜色,(c)实例分割是对目标前景分个体的像素级标注来,(d)全景分割结合了语义分割和实例分割的结果。 论文列表 Panoptic-DeepLab: A Simple, Strong, and Fast Baseline fo
【计算机视觉 | 目标检测】术语理解8:模型的实时处理能力,Panoptic Segmentation(全景分割),解耦结构,Anchor-Based,Anchor-Free,特征金字塔网络
wzk4869的博客
07-05 1332
【计算机视觉 | 目标检测】术语理解8:模型的实时处理能力,Panoptic Segmentation(全景分割),解耦结构,Anchor-Based,Anchor-Free,特征金字塔网络
论文笔记Panoptic-DeepLab: A Simple, Strong, and Fast Baseline for Bottom-Up Panoptic Segmentation
richard_che的博客
07-11 2568
核心思想: 一种高效的bottom-up全景分割方法,比two-stage更快 一个统一的backbone,分出两个结构非常相似的头部,实现两种任务:一个是one-stage的实例分割,一个是语义分割,最终通过后处理将二者集成起来 one-stage实例分割实际上是class-agnostic(类别无关)的offset回归 + 实例中心heatmap 这个框架可以用任意的语义分割的代替,具有很强的灵活性 Intro 全景分割的目的:对每个像素点给予不同的label + instance ID(如果对于
[论文笔记] (CVPR2019) Panoptic Segmentation
Holeung blog
08-04 888
[论文笔记] (CVPR2019) Panoptic Segmentation
[论文笔记] (CVPR2019) An End-to-End Network for Panoptic Segmentation
Holeung blog
08-04 582
[论文笔记] (CVPR2019) An End-to-End Network for Panoptic Segmentation```
coco数据集里的annotations_trainval2017.zip
08-07
COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features: Object segmentation Recognition in context Superpixel stuff segmentation 330K images (>200K labeled) 1.5 million object instances 80 object categories 91 stuff categories 5 captions per image 250,000 people with keypoints
《UPSNet:A Unified Panoptic Segmentation Network》论文笔记
m_buddy的博客
05-06 442
参考代码:UPSNet 1. 概述 导读:在这篇文章中提出了一种端到端的全景分割方法,其在Mask RCNN的基础上通过添加一个语义分割分支,之后使用一个无参数的全景分割预测头使用之前预测头的输出(指的是使用了这部分的参数)经过整合实现全景分割。为了解决语义分割和实例分割之间的冲突,文章在全景分割的预测结果中添加一个未知的类别(文中指出是按照规则选择一定的比例实例作为未知类别),从而使得其在性能指标上表现更佳。 全景分割解决的是实例分割/语义分割融合的方法,这篇文章中将全景分割的目标是否可数性质划分为两
Panoptic Segmentation全景分割
hajungong007的博客
01-22 1108
paper keyPoint 概念: things - 可数的 objects (countable obects),如 people, animals, tools 等。 stuff - 相同或相似纹理或材料的不规则区域,如 grass,sky,road 等的关注较少。 新的任务场景 - 全景分割 Panoptic Segmentation(PS) 全景(panoptic) - 对视...
sklearn.metrics.classification_report例子说明
RikkaTakanashi的博客
01-12 1827
关于sklearn.metrics.classification的说明,不少博客都是列几行代码再说一下precision,recall,F1-score定义就完事儿,实在是难以理解其用法,本文将用例子与算式结合的方式说明 例子 import numpy as np from sklearn.metrics import classification_report y_true =np....
Panoptic Segmentation论文阅读
FLY的博客
11-14 340
简介 文章提出了一个新的概念-全景分割。传统任务中语义分割是对图像中的所有像素分类,实例分割是对图像中的实例级目标进行检测和分割,而全景分割是对这两个任务的统一。这种统一是自然而然的,但是也带来了算法挑战。文章还为全景分割的评估定制了标准Panoptic Quality(PQ),这个标准具备简单可解释性。使用PQ标准,文章还在目前存在全景分割标注的数据集上测试了人类的分割质量,有助于更好的理...
Panoptic Segmentation 论文阅读笔记与感想
qq_31049727的博客
06-18 975
Panoptic Segmentation Alexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, Piotr Dollár 论文地址 作者介绍 于2018年1月3日提交至arXiv,最新一次arXiv提交为2019年4月10日。 第一作者毕业于德国海德堡大学。 Introduction 什么是thin...
Panoptic Segmentation论文阅读笔记
wxl
05-20 1002
Panoptic Segmentation论文下载地址】 【github代码实现】 摘要与介绍 要点 提出了一个概念“全景分割”(Panoptic Segmentation,PS),全景分割统一了两个经典的任务:语义分割(semantic segmentation,为每一个像素点分配类别标签)、实例分割(instance segmentation,检测并分割每一个对象实例)。 全景分割的目标:生成丰富且完整的连贯场景分割。 提出了一种新的度量panoptic quality(PQ),它以可解释和统一的方
译《Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network》
weixin_39667908的博客
01-02 934
Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network联合语义和实例分割网络的全景分割Abstract 摘要 Abstract 摘要   We present region-based, fully convolutional networks for accurate and efficient...
阅读笔记】《Weakly- and Semi-Supervised Panoptic Segmentation》(一)——论文部分
ShuqiaoS的博客
03-04 4075
本文记录了博主阅读论文《Weakly- and Semi-Supervised Panoptic Segmentation》的笔记,论文有代码,主页。 更新于2019.02.27。 文章目录AbstractIntroductionRelated WorkProposed ApproachTraining with weaker supervisionApproximate ground truth...
coco数据集segmentation
最新发布
09-22
COCO数据集是一个用于图像检测,语义分割和图像标题生成...COCO数据集可以应用于目标检测,image segmentation,DensePose密集姿势估计,关键点检测,Stuff SegmentationPanoptic Segmentation和图像标题生成等任务。
写文章

热门文章

  • TypeError: ‘int‘ object is not iterable 136294
  • 【已解决】ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 72439
  • Latex特殊符号、公式、颜色整合 62254
  • 【已解决】RuntimeError: cuda runtime erorr (77): an illegal memory access was encountered at ... 37671
  • 【文档学习】tensorboardX——summary writer 36674

分类专栏

  • 代码 1篇
  • 笔记 67篇
  • 论文代码学习 26篇
  • Python基础 29篇
  • linux系统 26篇
  • 自然基金
  • 论文发表
  • Caffe 14篇
  • Windows系统 6篇
  • 深度学习 3篇
  • 项目方案 1篇
  • 挑战赛 3篇
  • 图像分割 25篇
  • 总结
  • Matlab 1篇
  • torch 3篇
  • 找工作 1篇

最新评论

  • 【已解决】PDF中点击参考文献如何回到正文

    @JC689: 是怎么实现的,我现在也是在困惑PDF怎么跳转到指定文档的指定位置

  • TCSVT论文结构整理

    Hubelief: 请教一下大佬,TCSVT返修稿页数还是限制在14页吗?还是说这个页数限制只是针对初稿,返修稿和终稿没有页数限制呢?

  • 【阅读笔记】《Depth-Aware CNN for RGB-D Segmentation》(D-CNN)(一)——论文部分

    Marcia..: 友友,请问你有复现成功吗

  • 【已解决】Latex高亮文本,简单有效

    什么是快乐星球!?: 比如: \sethlcolor{yellow!20} \hl{}

  • 【已解决】Latex高亮文本,简单有效

    时光不老,我们不散。: soul包和ctex存在冲突,而且soul包的代码相当脆弱

大家在看

  • 你的创意被“偷”了吗?——揭秘专利的力量
  • Linux下操作文件时提示:Operation not permitted
  • 在企业开发中的并行计算与异步UI更新方式
  • 题目:MATLAB数字验证码提取和识别 1022
  • 如何在磁盘清理后恢复误删除的照片

最新文章

  • 从ChatGPT出发:大模型与自然语言模型
  • GPT系列详解:初代GPT
  • 【已解决】Latex高亮文本,简单有效
2023年2篇
2021年2篇
2020年5篇
2019年64篇
2018年61篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家杭州户外玻璃钢雕塑制作玻璃钢雕塑园林采购白城具有价值的沈阳玻璃钢花盆海南玻璃钢雕塑生产自己做玻璃钢雕塑畅销玻璃钢植物雕塑定做黑白玻璃钢花盆西北玻璃钢雕塑玻璃钢雕塑制品厂电话鹤壁景观标识玻璃钢人物雕塑安阳玻璃钢卡通雕塑玻璃钢彩色雕塑公司张掖玻璃钢座椅雕塑玻璃钢室外不锈钢雕塑小品订做浙江特色商场美陈生产公司德阳玻璃钢雕塑制作厂家修武玻璃钢雕塑厂家园林景观雕塑鹅卵石玻璃钢雕塑蒙自市玻璃钢雕塑哪里买阿坝玻璃钢雕塑公司酒店玻璃钢雕塑厂家党旗玻璃钢雕塑商场美陈工艺品园林玻璃钢卡通雕塑制作泰州商场美陈策划汕头玻璃钢子母座椅雕塑金华景区玻璃钢雕塑订做价格玻璃钢仿铜校园雕塑哪家好北京创意玻璃钢雕塑设计玻璃钢门头雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化