如何改进目前最新的Mask R

台湾省 | 炒股 | Legion | 室内设计 | 钢笔 | 历史故事 | 手机摄影 | 小店区 | 四大会计师事务所 | 首次公开募股（IPO） | 文言文 | 网络营销 | 哔哩哔哩 | 保险业 | 期货交易 | 屏幕 | 三国 | 前端开发 | 秦时明月之天行九歌 | 红楼梦（小说） | 电子技术研发 | 手绘 | 赛事 | 背景音乐（bgm） | 视频会议 | 香港购物 | 哲学 | 取名 | 城市规划 | 德州扑克 | 在线教育 | 雅马哈 | 加湿器 | 今日头条 | 金融数学 | 创业团队 | 网络推广 | 冷知识 | 互联网创业 | 文化 | 软件开发 | 写字楼 | 戒指 | 读后感 | 姓氏 | 总决赛 | 智利 | 字体设计 | 图像处理 | 文案 | 高二 | 迅雷（软件） | 欧洲历史 | 刘胡兰 | 海军 | 坦克世界（游戏） | 硬笔书法 | 化妆品 | 塞浦路斯 | 英国 | 华为路由器 | 狼牙山五壮士 | pdf | 服饰搭配 | 网站运营 | 美术生 | 重大疾病保险 | Windows 7 | 江苏银行 | 中国中央电视台 | 西瓜视频 | 耽美小说 | 微信群 | 几米 | O2O | 孔子 | 用户界面 | 百度输入法 | NBA | 地理 | 武术 | 阿富汗伊斯兰共和国 | 图书 | 韭菜 | 风水 | 职业规划 | 股权转让 | 报纸 | 新媒体 | Javascript | 斗鱼直播 | 西游记 | 艺考 | 风水堪舆学 | 战役 | 人口 | 信托 | 女生 | 澳门 | 非洲 | 汉服 | 项目管理 | 户型 | 前女友 | 燕窝 | APK | Adobe Illustrator | 创意 | 主机 | 老挝 | 植物辨识 | 花样姐姐 | 澳大利亚 | 开幕式 | 团队管理 | 索尼 | 神话 | 李时珍 | 日本动漫 | 易纲 | 展会 | youtube | 艺术品 | 舞蹈 | 外汇投资 | 品牌营销 | 大学专业 | 字幕 | 发型 | 热血传奇 | 越南 | 希腊 | 南航 | 现货原油 | Python | 哈萨克斯坦 | 饮酒 | 韩非 | 企业邮箱 | 赵一曼 | 罗永浩 | 水晶 | 西藏自治区 | 雾霾 | 直播 | 亚马逊中国 | 优酷视频 | 固态硬盘 | 交互设计 | 配音 | 蜜蜡 | 投资银行 | 优酷土豆 | 月饼 | 国家开发银行 | 生日 | 手工艺 | 油画 | 谷歌浏览器 | 盈利模式 | 游戏原画设计师 | 女性 | 基金定投 | 衣服 | 洛奇英雄传 | 荆州市 | 债券 | 遵义市 | 视频网站 | 宝马（bmw） | 水果 | 世界杯 | 流氓软件 | 后宫·甄嬛传（书籍） | 表情包 | 漫步者 | 红河哈尼族彝族自治州 | 攀枝花市 | 爱奇艺 | android开发 | 长城 | 微观经济学 | 缅甸 | 易经 | 运动锻炼 | 包装设计 | r（编程语言） | 求职 | 唯品会 | 汽车养护 | 皮肤护理 | ISIS（伊斯兰国） | 亚洲 | 国际物流 | 互联网广告 | ansys | 风景园林 | 苏州市 | 股市 | 康佳 |

你的位置：网站首页 >> 频道首页 >>硬件 >>如何改进目前最新的Mask R

如何改进目前最新的Mask R

来源：蜘蛛抓取(WebSpider) 时间：2018-08-13 05:46 标签： R=

　　机器视觉领域旳核心问题之┅就是目标检测(object detection)；它旳任务是找出图像当中所?感兴趣旳目标(物体)；确定其位置以及大小°做为经典旳目标检测框架Faste -CNN；虽然是②0①⑤年旳论攵；但是它至今仍然是许多目标检测算法旳基础；这在飞速发展旳深度学习领域十分难得°而在Faste -CNN旳基础上改进旳Mask -CNN在②0①⑧年被提出；并斩獲孒ICCV②0①⑦年旳最佳论文°Mask -CNN可以应用到人体姿势识别；并且在实例分割；目标检测；人体关键点检测三个任务都取得孒很好旳效果°因此；百度深度学习框架PaddlePaddle开源孒用于目标检测旳CNN模型；从而可以快速构建强大旳应用；满足各种场景旳应用；包括但吥仅限于安防监控；医学圖像识别；交通车辆检测；信号灯识别；食品检测等等°

关注最新科技资讯网站（②0①⑨ ）；每天推送你感兴趣旳科技内容°

特别提醒本網内容转载自其他媒体；目旳在于传递更多资料；并吥代表本网赞同其观点°其放飞自我性以及文中陈述文字以及内容未经本站证实；对本文以及其中全部或者部分内容；文字旳真实性；完整性；及时性本站吥做任何保证或承诺；并请自行核实相关内容°本站吥承担此类做品侵权行为旳直接责任及连带责任°如若本网?任何内容侵犯您旳权益；请及时；本站将会处理°

导读：自从将卷积神经网络引入叻目标检测领域后从cnn到fast-cnn，然后到end-to-end的faste-cnn,除了yolo一枝独秀外基本垄断了整个目标检测领域；而何凯明的esnet基本成了整个图像分类算法的巅峰。这┅次他们强强联手准备狙击实例分割（instance segmentation）了。

什么是instance segmentation：简单讲一群人在图片里面，我希望把每个人都给我分割出来分类只能做到识別这个图片是人；目标检测只能检测到这个图片里有人，把人的地方框出来对每一个人这个个体不一样是没有判断的，统一认为是人；洏图像分割主要是将人和背景分割出来而实例分割就是要把每个人清晰的分割出来。

Facebook人工智能研究小组提出更简单灵活和通用的目标实唎分割框架Mask-CNN文章提出了一种从概念上更简单、灵活和通用的用于目标实例分割（objectinstance segmentation）的框架Mask -CNN，该方法能有效地在每个实例中探测同时出现嘚目标并对每个实例生成一个高质量的分割掩码（segmentation mask）。

上的扩展——在其已有的用于边界框识别分支上添加了一个并行的用于预测目标掩码的分支Mask-CNN的训练很简单，只是在-CNN的基础增加了少量的计算量大约为5fps。另外-CNN掩码能够更好地适用于其他任务，例如估计同一图片中囚物的姿态本文在COCO挑战中的3种任务（包括实例分割、边界框目标探测、任务关键点检测）种都获得了最好的成绩。在没有适用其他技巧嘚情况下Mask ?-CNN的表现超过了现有的单个模型，包括COCO 2016挑战赛的获胜模型本报道将会简要从提出背景、关键概念、Mask ?-CNN简介以及相关实验结果㈣个发面进行介绍。

视觉领域的研究飞速提升了目标探测和语义分割在近年来的成绩Facebook提出的这一框架将对如Fast/Faste -CNN和完全卷机网络（FCN）在内的目标探测和语义分割在内的基础框架有重大作用。

实例分割工作之所以很难是因为它要求对同一图像中的多个对象进行精确的探测和分割，这样的工作需要结合经典经算计视觉的目标探测任务（tasks of object detection）中的多个元素目标探测任务需要将每个个体实例进行分类，并在边界框内進行定位最后进行语义分割（将每个像素进行分类的工作）。基于以上的描述你可能觉得实例分割工作需要一个复杂的模型才能达到良好的效果，但是Facebook提出的Mask -CNN模型却出乎意料地集简洁、灵活和快速于一身并拥有目前来说最好的表现。

总的来说Mask -CNN是基于Faste -CNN的基于上演进改良而来，Faste-CNN并不是为了输入输出之间进行像素对齐的目标而设计的为了弥补这个不足，我们提出了一个简洁非量化的层名叫oIAlign，oIAlign可以保留夶致的空间位置除了这个改进之外，oIAlign还有一个重大的影响：那就是它能够相对提高10%到50%的掩码精确度（Mask Accuacy）这种改进可以在更严格的定位喥量指标下得到更好的度量结果。第二我们发现分割掩码和类别预测很重要：为此，我们为每个类别分别预测了一个二元掩码基于以仩的改进，我们最后的模型Mask -CNN的表现超过了之前所有COCO实例分割任务的单个模型本模型可以在GPU的框架上以200ms的速度运行，在COCO的8-GPU机器上训练需要1箌2天的时间我们认为训练和测试速度、框架的灵活性以及精确性的改进会有益于未来的实例分割工作。

图2 Mask -CNN在COCO 测试集合中的结果展示这些结果基于esNet101，在 5 fps 的速度下实现了 35.7 的 mask AP图中以不同的颜色表示不同的掩码，图中也显示了边界框、类别的置信度

CNN），简称为-CNN方法它处理邊界框中目标探测工作的原理是将区域理解为多个可管理的潜在实例区域，并评估每个oI的卷积网络-CNN之后被延展到可以适用oIPool来得到特征地圖上的oIs，这大大提高了框架的速度和精确度通过使用egion Poposal Netwok（PN）来学习注意力工作机制，研究人员得到了更先进的Faste-CNN框架Faste -CNN以其灵活性和鲁棒性嘚优越性成为目前集中基准的主导框架。

segmentation”中提出的“完全卷积实例分割”方法更详细的分割方法论述请参见原文。

Mask -CNN拥有简洁明了的思想：对于Faste -CNN来说对于每个目标对象，它有两个输出一个是类标签（classlabel），一个是边界框的抵消值（bounding-box offset）在此基础上，Mask -CNN方法增加了第三个分支的输出：目标掩码目标掩码与已有的class和box输出的不同在于它需要对目标的空间布局有一个更精细的提取。接下来我们详细介绍Mask -CNN的主要え素，包括Fast／Faste -CNN缺失的像素对齐（pixel-to pixel alignment）

Mask -CNN 使用了与Faste-CNN相通的两阶段流程，第一阶段叫做PN（egionPoposal Netwok）此步骤提出了候选对象边界框。第二阶段本质上就昰Fast-CNN它使用来自候选框架中的oIPool来提取特征并进行分类和边界框回归，但Mask

掩码将一个对象的空间布局进行了编码与类标签或框架不同的是，Mast -CNN可以通过卷积的像素对齐来使用掩码提取空间结构

网络架构（Netwok Achitectue）：为了证明Mast -CNN的普遍性，我们将Mask -CNN的多个构架实例化为了区分不同的架構，文中展示了卷积的主干架构（backboneachitectue）该架构用于提取整张图片的特征；头架构（headachitectue），用于边框识别（分类和回归）以及每个oI的掩码预测

图3 Head框架介绍：我们拓展了两种现有的Faste -CNN头框架。左／右的图分别展示了He等人（2016）年提出的esNetC4／Lin等人（2016）年提出的FPN的主干框架在这两个框架Φ都加入了掩码的分支。图中的数字代表了空间像素和信道箭头表示卷积（conv）、去卷积（deconv）或全连接层（fc），具体情况可以实际推断（卷积会保持空间维度去卷积会增加空间维度）。输出卷积是1x1之外其他都是3x3，去卷积是2x2步幅为2.我们再隐藏层中使用了Nai和Hinton（2010）提出的eLU修囸线性单元技术。在左图中est5表示esNet的第五阶段，为了简明起见我们对架构进行了修改，将第1层卷积层放在一个7x7的oI上运行步幅为1（而不昰在He等人在“图片认知中的深度剩余学习”研究中使用的14x14/步幅为2）；右图中的‘x4’代表了4个连续卷积的堆叠。

我们将Mask -CNN的方法与已有的方法進行了对比在所有实验中使用了COCO数据集。

我们的实验在COCO数据集上进行的测试标准COCO测度包括AP（IoU阈值的平均值）、AP50、AP75和APs、APM、APL（不同规模的AP），如非特殊注明AP是通过掩码IoU来估计得到。表1是Mask-CNN与现有的实例分割方法对比的结果图2和图4都是Mask -CNN输出的可视化结果，图5是将Mask ?-CNN基准与FCIS+++对仳结果FCIS+++显示出其会受到实例分割基础性伪影的影响，而Mask -CNN并不会出现这种情况

表格 1实例分割结果：表中记录了将Mask -CNN与其他实例分割方法对仳得到的结果。我们的模型表现优于所有同类的模型MNC和FCIS分别是COCO 2015和2016分割挑战赛的冠军。Mask -CNN表现优于更复杂的FCIS+++FCIS+++包括多规模的训练／测试、水岼翻转测试和OHEM。所有的都是单模型结果

研究人员将Mask -CNN进行了多项测试，结果如下表2所示：

points使用合适的对齐（alignment）方法改善的原因之一。

图6茬COCO test上使用Mask -CNN（esNet-50-FPN）的关键点测试结果利用相同的模型预测得到了人物分割掩码。此模型有63.1的关键点掩码运行速度为5 fps。

利用Mask -CNN也可以延用到人粅姿态估计作者进行了相关实验，表4是实验结果

esNet-101），此模型使用了更多的数据因此跟Mask -CNN不能直接比较。

考虑到Mask-CNN模型对于提取约束框、掩码和关键点的有效性我们期待它是一个对于实例水平任务来说更有效的框架，Mask-CNN可以泛化到更多的实例层（instance level）的识别工作并可以延展箌更复杂的任务。

大神的世界缤纷又多彩接下来峩要开扒了。
你们在认真看吗温馨提醒，后面很惊人的同人文好吧，其实是篇科普文你们点进来看的只能够收获一堆干货，而不是凊色小说由于第二天大早上学弟要做pesentation，他打算讲这篇论文然后恰好无聊，于是学弟带着本弱渣一起连夜重看了旧的三篇论文cnn、fast cnn、faste cnn以及這篇新的mask cnn早上起床写篇知乎替学弟整理下整个系列，舒缓下想要编曲的冲动四篇论文层层递进的关系，我先简单讲下前三篇的工作吧然后再简单讲mask cnn的工作。 seach去选出若干poposals然后esize到同一个scale放入alexnet类似的网络抽特征，加k个svm或者softmax得到分类结果然后测试阶段走个非极大值抑制的算法去得到结果。整个网络是最初始化的cnn很多人都觉得思路很简单，不过在那个时候算是最开始利用CNN做detection的一批
第二篇BG去了MS，然后单手擼了一篇改进版fast cnn看看pape作者那栏，一个人孤单寂寞的编曲。还是基于ss得到的poposals，这篇论文重点在oipool那部分怎么做呢？参考论文2.1求得sub-windows大小の后划分为7*7的gid。这样无论你的oI的scale多大都可以map到同一个size。这样你可以把之前2000次前向缩减到只有一次前向就可以得到若干个oi部分的特征，然后跟两个sibling layes一个做分类，一个回归bb这样测试阶段比第一篇节省了很多很多时间。

第三篇论文oss开始和MSA的学者合作了shaoqing、kaiming、jian sun等。终于不洅孤单的编曲。这篇论文基于fast cnn干了这么一个事情，把selective seach那种很傻很笨的办法用PN的网络取代了然后这个PN网络可以直接在一个完整的网络Φ给OIpool那块提供poposal的信息。训练过程中PN的egion layes然后做是不是object的scoe和坐标回归。整个思路就是加了这些

第四篇论文，也就是知乎提问的mask cnn此时此刻，BG去了FAI而kaiming又和BG重逢了，满满的基情就是你在哪我的pape就跟你一起挂在哪。实际上本篇就在第三篇faste field确是很大的带来所谓的misalignment。那么怎么办好，借鉴STN论文里面的双线性插值我把8*7的大小扩大到14*14，然后再做聚合到7*7的大小。这样就充分利用了那个被忽略了的部分（这部分细節上可能我理解不对，具体要等oss源码公布了再能确定如有错误，希望指出）然后看论文图三，就可以分出一个banch给segmentation的部分这部分deconv做到28*28の后，直接esize到oi的大小然后参考第三页左下角，用pe-pixel

好了其实kaiming大大没有说过那句话，只是觉得从faste cnn到mask cnnkaiming大大和oss大大一路基情满满。从MS一起跳箌FAI然后又一起在两个单位合作论文。祝福你们越来越伟大！(??_?`)
btw本来打算写篇同人文结果歪楼了。对不住了老铁

我要回帖

说的太好了，我顶！

更多关于 R= 的文章

·谁有Shining Friends-2R这首歌的完整吉他谱啊，最好有和弦，图片也可以，谢谢了

·我买OPR831S手机1000元，买亏吗，质量比步步高差吗

·oppoR831s黑色手机配莎比兔天蓝色边框怎么样？

·有AUTOFORM R5.2的下载地址吗？谢谢了

·R27长篇文集Zip或者RAR都行！求打包！百度云！

·谁知道怎么给v n s r 充值？

·富勒SM680R魔幻龙是不是最便宜的RGB背光机械键盘？

·Pentium(R) Dual-Core CPU E5800 @ 3.20GHz 3.20 GHz

·新尔雅SY-3000R豪华一体效果怎么样？

·如何改进目前最新的Mask R

·TYT TH-2R 对接机如何删已存有的信道

·Inte(R) Pentium GPU G3450 @ 3.40GHz

·出租网店，京东商城，珠宝首饰全类，有R标，新店高评分。

·和泉纱雾R_adaef.7z密码

·5DS R手持拍摄容易糊吗

·PROM存储器DS2411R+T&R怎么样?在立创商城中有这库存吗?

·中国科学院基金(KSCX2-EW-R-08)

·EOS R的DP评分才79，我用的时候感觉挺好用的啊！

·VVSR美学中心会不会一直推销其他服务项目？

·Quidway R2611如何恢复出厂设置

·EOS R和Z7相比，哪个更值得购买

·领存的RSATA电子盘性能如何？

·REALR这个品牌的建立背景是什么样的啊？

·6P=(7)R结果是多少

·DL-RXS868R-868M的功能是什么？在立创商城中这个元器件质量好吗

·R-CORSET束腰有什么功能？

·汉德堡电机驱动器ASD545R怎么接线接两项57步进电机有6条线另一头接csv1.1脱机控制器

·R27DRS71M4-M6-270-2-NA181-440V60HZ都代表什么意思

·A7V0160EP/63R一NPBO1有说明书看吗

·我的手机R 15x 来电时不响铃，怎么回事？视频语音都有正常。只是来电不响铃

·中华v5防盗系统R针脚是哪根

·未注册的GSM-R手持终端可以紧急呼叫吗

·你好，请问你知道这个CPU：Intel(R) Celeron(R) CPU N28402.1 6GHz 2.16 GHz吗

·新手入门，刚刚购置了EOS R，犹豫拍风景、街景，买什么镜头合适

·荣事达WF81010S0R使用说明书

·R-vape Hybrid 80w kit电子烟是哪家公司生产的

·Sonic 150R性能如何

·泪膜:R:5sL:7s泪液R:4sL:3s正常吗

·MF4008-50-R-BV-A流量计如何设定

·健伍RC一R0803遥控器符合哪些机型

·收到一台废旧诗华SA-353R功放机，试用后，很爽！不知是哪一年生产的求此功放的使用方法

·攀钢钛白纷R-248 与R-248有什么区别

·PU‖3/R 280V 40KA是什么意思,浪涌保护器

·艾肯MOBILE R VST怎么样

·Intel（R）celeron（R）CPU G1610@2.60GHZ能玩WarFace吗

·集成IC LD7536A与LD5530R 一样吗

·对于Fashions R Us Ltd,有多少是内部决策者：银行供应商人力资源经理总经理

·6-qwlz-120(760)-R是铅酸电池吗

·6-qwlz-120(760)-R是普通电池吗

·米耐尔205/55R 16--91W 多少钱一条

·戴尔Inspiron3480,CPU英特尔Pentium(R)5405@2.3GHz笔记本怎么样

·Intel(R) UHP Graphics 620+NVIDIA GeForce MX110配置

·今机塑机KT-200R定位圈中心距是多少

·虹润NHR-7630R天然气流量积算控制仪/记录仪可以用在计算天热器系统吗

·舞厅球灯调到R几是声控

·R沙盒怎么进去

·老彩电76810芯片19脚R信号输出电压偏高(3v)是什么原因

·32G 4R*4 PC3-10600R-9-13-AB1可以配什么主板

·有人尝试过Rpluses腕表维修体验吗维修人员专业吗

·是要拍ⅤR视须

·华为系统恢复e R e co vr y

随机推荐

怎么可以如何恢复手机短信信息短信记录？

2022年什么时候打春什么时候立春春分是几号 2022年什么时候打春什么时候立春春分是几号梁园区能力作风建设攻坚实施方案

经典语录每日美好小短句心语

沈阳音乐学院附中舞蹈系怎么样师范附属艺校和南京艺术附中的中国舞哪个好？

郎有郎情妾意下句配什么有意下一句郎有郎情妾意下句配什么有意下一句,你我共赴小树林

汽车音响调节最佳效果效果怎么调节

在新西兰如何办理手机卡，手机上网流量什么手机卡通话时间最多

小7小7的1780是全网通吗怎么还原REC

图片左上角，手机手机左上角信号没有了怎么办，小孩乱按的，应该在手机哪里设置的，

一半过已世年纪的男友手机微信年龄怎么看里有情人这正常吗？还时常聊天！

有新微信号免费送吗？

希尔薇1.9安卓汉化版全屏手机安卓版下载链接，要汉化版

MIUI10这些怎么MIUI冻结应用

爱普生15080喷墨打印机可以改连供吗

自己做的人脸识别不过的原因，但是不能识别照片是不是真人？咋办

手机照相能否拍摄证件护照的照片可以在照相馆拍吗？

天马太白聚财网是什么性质的集团网一个什么性质的手机卡？我们普通人能不能办？

玩具打印机性价比推荐哪个牌子性价比高

查找长葛市石固镇朝阳村南张庄村赵志刚在哪里工作及手机号

如何改进目前最新的Mask R

jmeter怎么对HTTPS接口进行jmeter多个接口压力测试试

求《ポーカーフェイス》和《雨上がりの空とキミ》两首歌曲下载地址

松下空气消毒机怎么样？和空气净化器和空气消毒机一样吗有什么不一样吗？

哪有卖怎么屏蔽手机信号号侦测器的？

微信里的钱微信被盗了钱怎么追回来了你能追回来是吗

想实现家里通风换气吗安装家用新风系统有必要安装吗

我在杭州做空调批发的，在我家贝贝猫猫商城里的入驻了商户之后是全国采购的都能看到么？有没有人用过了解的

苹果手机群发短信怎么群发短信发？

松下如何正确的使用空气净化器器怎么样，具体有些什么功能？

点胶机品牌武藏点胶型号CMii-V5 点一次就不点了，动作正常，机器有排错报警，求帮助

工行手机银行查不到决定书编号是什么意思咋回事

哪有卖探测手机信号号侦测器的？