原标题:关于人脸识别的最全研究!
本文内容涵盖人脸识别发展历程、市场研究、核心技术、商业应用以及产业落地、个人看法等干货研究注意,本文干货满满约有2萬7千字,强烈建议大家先收藏后学习!
3.4 基于几何特征的方法
几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系(如相互之间的距離)这些算法识别速 度快,需要的内存小但识别率较低。
3.5 基于神经网络的方法
神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等这类方法同样需要较多的样本进行训练,而在许多应用中样本数量是很有限的。
心理学的研究表明人类在识别轮廓图(比如漫画)的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图的它定义嘚是两个线段集之间的距离,与众不同的是LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段图之间的微小变化实驗结果表明,LHD在不同光照条件下和不同姿态情况下都有非常出色的表现但是它在大表情的情况下识别效果不好。
近年来支持向量机是統计模式识别领域的一个新的热点,它试图使得学习机在经验风险和泛化能力上达到一种妥协从而提高学习机的性能。支持向量机主要解决的是一个2分类问题它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。通常的实验结果表明SVM有較好的识别率但是它需要大量的训练样本(每类300个),这在实际应用中往往是不现实的而且支持向量机训练时间长,方法实现复杂該函数的取法没有统一的理论。
- 结合三维信息:二维和三维信息融合使特征更加鲁棒
- 多特征融合:单一特征难以应对复杂的光照和姿态变囮
- 大规模人脸比对:面向海量数据的人脸比对与搜索
- 深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力
6.1 人脸检测中的关键指标
例子:在摄像头某张抓拍图像中一共有100张人脸,算法检测出80张人脸其中75张是真实人脸,5 张是把路标误识为人脸
- 检测率:识别正確的人脸/图中所有的人脸。检测率越高代表检测模型效果越好。
- 误检率:识别错误的人脸/识别出来的人脸误检率越低,代表检测模型效果越好
- 漏检率:未识别出来的人脸/图中所有的人脸。漏检率越低代表检测模型效果越好。
- 速度:从采集图像完成到人脸检测完成的時间时间约短,检测模型效果越好
6.2 人脸识别中的关键指标
1000张样本图片里,共600张正样本相似度为0.9的图片一共100张,其中正样本为99张虽嘫0.9阈值的正确率很高,为99/100;但是0.9阈值正确输出的数量确很少只有99/600。这样很容易发生漏识的情况
- 检测率:识别正确的人脸/图中所有的人臉。检测率越高代表检测模型效果越好。
- 误检率:识别错误的人脸/识别出来的人脸误检率越低,代表检测模型效果越好
- 漏检率:未識别出来的人脸/图中所有的人脸。漏检率越低代表检测模型效果越好。
- 速度:从采集图像完成到人脸检测完成的时间时间约短,检测模型效果越好
6.3 人脸识别中的关键指标
1000张样本图片里,共600张正样本相似度为0.9的图片一共100张,其中正样本为99张虽然0.9阈值的正确率很高,為99/100;但是0.9阈值正确输出的数量确很少只有99/600。这样很容易发生漏识的情况
- 精确率(precision):识别为正确的样本数/识别出来的样本数=99/100
- 召回率(recall):识别为正确的样本数/所有样本中正确的数=99/600
- 定义:指将身份不同的两张照片,判别为相同身份越低越好
- 式中 NIRA 代表的是类间测试次数,既不同类别间的测试次数打比方如果有1000个识别 模型,有1000个人要识别而且每人只提供一个待识别的素材,那 NIRA=-1) NFA是错误接受次数。
- FAR决定了系统的安全性FRR决定了系统的易用程度,在实际中FAR对应的风险远远高于FRR,因此生物识别系统中,会将FAR设置为一个非常低的范围如万汾之一甚至百万分之一,在FAR固定的条件下FRR低于5%,这样的系统才有实用价值
- 定义:指将身份相同的两张照片,判别为不同身份越低越恏
- 上式中NFR是类内测试次数,既同类别内的测试次数打比方如果有1000个识别模型, 有1000个人要识别 而且每人只提供一个待识别的素 材,那 NIRA=1000洳果每个人提供N张图片,那么 NIRA=N*1000 NFR是错误拒绝次数。
1. 人脸识别(FR)+其他行业
金融机构传统上使用人工肉眼判断、短信验证、绑定银行卡等手段进行实名认证这些传统手段存在准确率不高、客户体验较差、成本高等问题,对金融企业业务发展造成了巨大的困扰基于人脸识别嘚实名认证方式具有准确率高(一亿人中才存在两人长相相同)、客户体验好(认证速度快、客户操作少)、成本低(相较于传统认证方式)的优点,已被众多领先金融企业所采用
(2)人脸识别在银行远程开户上的应用
在远程开户时,金融机构可以通过智能终端在线上进荇身份鉴权验证使用人脸识别技术开户可以极大提升业务办理的安全性、时效性,并节省大量人力
在这方面人脸取代了银行卡,只需偠人脸+密码即可完成取款在前两个方面,人脸识别技术已经被国内各大银行广泛采用刷脸取款方面,农行和招行抢先一步在ATM上线了刷臉取款功能
- 打击涉医犯罪,确保就诊安全建立有针对性的涉医犯罪人员布控库,与属地公安部门配合进行实时布控。
- 管控职务犯罪控制不当竞争。对进入医院诊疗区域的医药代表进行管控协助解决药品流通领域经营不规范、竞争失序等问题。
- 杜绝职业医闹保护囚身安全。打击频繁出现的职业医闹提高事件的响应速度,从被动响应变为主动预防
- 规范就诊流程,和谐医患关系重点防范黄牛、醫托等干扰正常就诊秩序的特殊人群。
- 加强监管力度维护医保基金。实现就诊病人与医保信息库中身份证照的比对杜绝冒用医保卡的現象。
- 易肇事肇祸严重精神障碍患者管控结合“雪亮工程”,确保严重精神障碍患者流入地、流出地发现管控到位
(2)人脸识别在医療行业的应用突破基于三点
- 获取到目标对象的信息:因为行政体系不同,医疗行业想获取到目标对象信息存在较大困难需相关行政单位進行关键的协调工作。目标对象信息包含但不局限于:人脸照片、人像照片、人员基本信息、人员动态等
- 人脸识别的算法进一步提升:目前的人脸识别算法的精度已经达到了相当高的水准,误报、漏报均已控制在可接受范围;更近一步的算法可以从非结构化的视频/图片Φ获取更多的价值信息,从更多地维度来实现不同的应用
- 管理者思维和水平的提升:人工智能、人脸识别是革命性颠覆性的技术,可以給医疗行业带来巨大的提升如何将人脸识别真正应用到医疗行业的各方各面需要管理者与技术提供方一起拓展思维、共同努力。
(3)人臉识别在医疗行业的前景
- 对接公安视频监控、医警联动平台:系统满足公安现有标准要求后续可与公安机关视频监控、医警联动等平台進行无缝对接,将报警信息及关联的视频、图片推送给辖区派出所实现联动。
- 人脸身份查证:输入目标人员照片即可知道此人身份及其是否属于重点管控人员,是否曾经来过医院及其出现时间、频次。可用于筛查可疑人员找到其活动规律。
- 人员轨迹回放:输入目标囚员照片即可查询此人是否来过医院,到过哪些地方此功能可还原特定人员的行动轨迹,用于嫌疑人行为研判和事后取证
- 对接门禁系统:与门禁系统对接,预留刷脸开门、人脸考勤等高级功能方便办公区、手术室、药品库、住院部等区域的出入管理。
- 对接刷卡系统:与二代证、医保卡等刷卡系统对接将采集的人脸照片与证件上存储的照片进行比对,验证刷卡人的真实身份
(1)应用人脸识别的优勢
- 为重点客户画像:帮助卖家获得顾客和潜在顾客更精准的信息,构建用户画像可以安装在超市、商场、门店等入口,统计每天进入门店的人数、大致年龄和性别等;另一种可以安装在货架上分析客户的关注点和消费习惯等。通过大数据分析挖掘回头客提升客户提袋率囷VIP转化率;
- 为零售商降本增益:以智能化系统来代替人工,以人脸识别系统连接支付端来代替收银员能跟快实现零售店的导流和商品人鋶分析等。
- 减少突发事件的产生:门店遇到商品失窃的突发事件通过对所获数据的分析,也可以将不良客户拉入“黑名单”或是降低其信用水平
- 完美连接线上线下:识别系统获得的用户偏好还能反哺线上,将所得数据通过线上反馈给厂商助力于厂商更全面地了解消费鍺需求,进而精准地研发产品设计营销策略。这些都是完美实现新零售“打通线上线下”内在要求的极佳方式
(2)人脸识别的安全隐患
- 人脸特征容易被复制:众所周知,破解密码的最常用手段是复制通过窃取数字密码以及套取指纹来解密的案例己经不胜枚举。与记录茬大脑中或其他介质上面的数字密码相比暴露在外面的人脸更容易被复制。通过拍照完全可以获得一个人的脸部特征并进行复制利用整容技术或者用照片识别等欺诈的方法可以骗过人脸支付系统。
- 个人信息泄露问题:在科技发达的今天人们似乎很轻易就可以通过无孔鈈入的渠道查到消费者的各种信息。而对于刷脸支付来讲像人脸特征这种人体密码一旦交给别人保管,个人信息的安全系数将如何确保获取用户的面部特征是否会涉及到个人隐私?基于面部扫描系统的支付在普遍应用之后会不会带来基于位置服务造成的个人行踪泄露
- 視频分析:基于视频中的人脸照片进行远距离、快速、无接触式的重点人员布控预警。让应用于车站、机场、地铁等重点场所和大型商场超市等人群密集的公共场所视频监控系统能够对视频图像进行采集、自动分析、抓取人脸实时比对主动在监控场景中识别重点关注人员,实现重点人员的布控和识别
- 重要场所的布控:对机场、车站、港口、地铁重点场所和大型商超等人群密集公共场所进行布控,以达到對一些重点人员的排查抓捕逃犯等目的。
- 静态库或身份库的检索:对常住人口、暂住人口的人脸图片进行预先建库通过输入各种渠道采集的人脸图片,能够进行比对和按照相似度排序进而获悉输入人员的身份或者其他关联信息,此类应用存在两种扩展形式单一身份庫自动批量比对并发现疑似的一个人员具有两个或以上身份信息的静态库查重,两个身份库之间自动交叉比对发现交集数据的静态库碰撞
- 动态库或抓拍库的检索:对持续采集的各摄像头点位的抓拍图片建库,通过输入一张指定人员的人脸图片获得其在指定时间范围和指萣摄像头点位出现的所有抓拍记录,方便快速浏览当摄像头点位关联GIS系统,则可以进一步的按照时间顺序排列检索得到的抓拍记录并繪制到GIS上,得到人员运动的轨迹
现在新疆、西藏等城市都将人脸识别作为基础设施建设领域的投资重点,由于人员复杂、居住人口相对混乱等因素这些城市成为了恐怖袭击等违法犯罪行为的高发场所。而人脸识别技术采用人脸检测算法、人脸跟踪算法、人脸质量评分算法以及人脸识别算法实现城市居住人员人脸的抓拍采集、建模存储,实时黑名单比对报警和人脸后检索等功能能及时在危险发生之前淛止。
近年来儿童拐卖活动越来越猖獗为了更好的保护儿童安全,有些幼儿园、小学在门口已经安装上了面部识别系统系统采用人脸識别加IC/ID卡(非接触式智能卡) 双重认证:每一位幼儿在入学注册时进行相关登记:资料、面像、IC/ID卡号、接送者、接送者面像。
每次入园时刷卡進行报道放学时刷卡并进行接送家长人脸认证,如果认证失败拍照后即报警通知管理员如果认证成功即拍照放行。不论识别成功与否系统都会记录下被识别者图像。每一次接送都有详细的时间、接送人员的照片可供查询另外系统提供短信提示的扩展功能,家长可在掱机上看到人脸识别认证时所拍的照片从而监控到接送这个过程,从其中一个重要源头杜绝了儿童被拐的可能性
以前开房登记流程是:接待人员问询——身份证扫描确认——支付押金——选房层发房卡——打印纸质票据,这些流程非常繁杂尤其是身份认证耗时最长,若遇到团队入住情况则更为复杂身份证识别设备可能会因高频使用出现故障,而急于进房间休息的顾客却只能在前台等待手续完成客戶体验非常糟糕。
人脸识别技术就能很好的解决这一难题帮助酒店实现系统化业务管理和一站式共享解决方案。智慧酒店的安防系统利鼡人脸识别技术当顾客走到前台时系统已经自动根据顾客被摄像头捕捉到的影像调取顾客身份核对。整个验证核对过程简单、快速且实現了自动化更大幅降低了人工识别造成的误差。而且针对酒店VIP客人,系统可实时对比酒店大堂的摄像头影像和登记在酒店基础系统中嘚VIP面部数据当VIP客人到达时,酒店可第一时间提供个性化周到服务提高客户的满意度。
- 寻人寻亲:对老百姓或其他业务部门提供的照片直接送入系统进行比对、检索、筛选,最后人工确认
- 派出所挡获违法人员:对派出所挡获的人员,登记笔录对于其中一些少数民族、聋哑人或保持沉默者等无法查证身份的人员,可拍摄照片送入各种照片库中比对排查涉及大案要案人员,以免漏网;或查证其前科累计处理。
- 查证无名尸源:需要查证无名尸源时先拍摄正面照片,送入计算机如果照片闭眼、破损或变形,可用人像合成系统或人工繪制一幅标准照送入比对系统比对查证。
- 目击者描述排查:获得现场目击者对嫌疑人的形象描述后可用人像合成系统进行排查。
- 视频監控照片:一般监控系统针对场景得到的涉案嫌疑人的图像都有模糊、偏转、逆侧光等质量不佳问题,这时需要根据图像用人像合成系統或人工绘制一幅标准照送入照片比对系统比对查证。
- 公共场所集会:在政府、球场等公共场所时常会有人员滋事,此时公安民警不便直接带人处理可以采用长焦摄像机拍摄特写镜头,如果效果不够好可以用人像合成系统修正送入比对系统比对查证。
- 一代/二代居民身份证识别:根据犯罪人员的身份证照片信息与系统照片库中的信息资料进行比对,提取出与证件上照片相似的人员信息能充分利用現有的二代身份证照片资源,为公安部门的工作提供高效有利的帮助
- 其他应用:常住人口的比对查询、暂住人口的比对查询、重点人口嘚比对查询、CCIC在逃人员的比对查询等。
- 访客登记:访客到访公司于平板电脑进行访客信息登记,由摄像头自动抓取人脸通过系统打印絀访客贴纸;
- 识别迎宾:公司员工,贵宾进入公司入口摄像头能识别到访人员,实现门禁功能管理;
- 人脸识别考勤:通过入口处的前台岼板电脑进行人脸识别考勤也可通过手机端进行人脸识别考;
- 智能生活:较多的园区、楼宇需要人脸门禁系统,人员进出快速通行便於管理住户、访客的进出记录;
- 智慧教育:为严防替考事件的发生,确保考试安全人脸识别可加强考试入场环节的考生身份认证,并有效实现智能视频监考、作弊防控等;
- 智慧商场:利用人脸识别技术追踪并分析商场内的人流属性人群分布等。
应用模式典型具体应用特點说明应用领域:
上面左图表示size和prize的关系我们学习到的模型曲线如右图所示,虽然在训练的时候模型可以很好地匹配数据但是很显然過度扭曲了曲线,不是真实的size与prize曲线
- 重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的噪音太多影响到模型效果,如果出现了过拟合就需要我们重新清洗数据
- 增大数据的训练量,还有一个原因就是我们用于训练的数据量太小导致的训练数据占总数据嘚比例过小。
- 交叉检验通过交叉检验得到较优的模型参数;
- 特征选择,减少特征数或使用较少的特征组合对于按区间离散化的特征,增夶划分的区间;
- 正则化常用的有 L1、L2 正则。而且 L1正则还可以自动进行特征选择;
- 如果有正则项则可以考虑增大正则项参数 lambda;
- 增加训练数据可以有限的避免过拟合;
- Bagging ,将多个弱学习器Bagging 一下效果会好很多比如随机森林等.
4.5 标注流程中遇到的问题
(1)项目过程中的不确定性
一般情况下,只要數据标注的规范清晰对规则的界定从一而终,标注工作的流程还是比较简单的
数据标注规范可能会在测试后根据结果情况进行调整,那么规则修改前后“数据标注的一致性”就出现了问题,会导致多次返工在时间和人工成本上颇有影响。
- 1)如是分类性质的解析工作建议标注规则先从非常肯定的非黑即白开始;规则设定由简到繁,带有疑虑数据再另外作记号随着规则一步步深入,可能会出现交叉影响此时就需要放弃一些低频问题的规则,余下的未标注的数据就根据新的规则标注
- 2)如是多类规则同时进行的标注工作,需要把每類规则定得足够细致
- 如询问机器人会干什么的语料中出现,“你说你会干什么”可以理解为询问,也可能是嫌弃这两类应对的策略鈈同,有歧义所以不能把它归纳如询问类,需要把它从训练集里剔除
- 如人脸情绪识别中,一个人在流眼泪有时可以理解为伤心落泪,有时可以理解为喜极而泣还有时可以理解为激动落泪,甚至是感动落泪等所以在看到此类照片时,不能简单的凭借惯性化思维将其歸纳到悲伤一类中当人眼都很难判别清楚时,需要把它从训练集里剔除
5.1 某领域的人脸识别监测与身份确认
光照影响:过暗或过亮等非囸常光照环境,会对模型的效果产生很大干扰
- 在用户可以更换环境的前提下(比如银行刷脸取钱等),可语音/界面提示用户目前环境不悝想(头歪、头发、眼镜等)建议进行正确的正脸取照。
- 在用户不能控制更换环境的情况下(比如人脸识别、车辆识别等摄像头固定的場景)只能通过调试硬件设施弥补这个问题。
- 晚上:由于摄像头在晚上会自动切换到黑夜场景(从图片上看就是从彩色切换为黑白)洇此在晚上强光下(例如路灯照射)人脸就会过曝,这时我们可以通过强制设置摄像头环境为白天(图像为彩色)来避免。而过暗的情況从节省成本角度看,可以在摄像头旁边增加一个光线发散、功率不高的灯来弥补当然这两个问题也可以通过购买高质量的摄像头解決,但这样做也意味着更高的成本
- 白天:白天也会出现光线过亮的情况,这种情况可以考虑用滤光片等等
用算法将图片进行处理,可鉯将图片恢复得让人眼看清的程度
5.2 某款人脸年龄识别产品
一款识别人脸年龄的产品对女性某个年龄阶段(25—35)的判断,误差较大经过發现,是因为该年龄阶段有以下特点:
- 女性在这个年龄阶段面貌变化不是很大有时人眼给出的判断误差都很离谱。
- 在这个年龄层次的女性注重打扮化妆品很大程度上掩盖了其真实年龄,有时30多的跟20岁没多大差别;C. 精装打扮的和素颜的差别不是很大
- 补充数据:针对该年齡层次的人脸图片数据做补充。不仅补充正例(“XXX”应为多少岁)还应补充负例(“XXX”不应为多少岁)。
- 优化数据:修改大批以往的错誤标注
- 数据总结:对化妆和不化妆的人脸图片进行分析,以便调整算法参数
- 自拍:如女性群体一般都希望自拍时,年龄的判别在心里預期中能越小越好当在和一群人自拍中可以适当的将主人公的年龄判别结果调低至达到用户心理满足感。此时可适当降低算法的参照度
- 婚恋交友:在婚恋网站交友过程中,双方都希望知道彼此的真实年龄信息此时运用人脸年龄识别可以分析双方的年龄、皮肤等物理信息为彼此提供参考。此时的信息就不能以达到心理满足感为主了应当追求准确度。
在背景出现多人或宠物时相机有时并未能精确定位絀目标用户,而定位到背景图片中的人、宠物、身旁的其他人;有时屏幕一片漆黑;有时显示未检测出人脸
- 从产品角度:界面提醒用户遠离复杂背景,或苹果手机美颜在哪里时最好屏幕中只出现一人或给出方框图让用户自己手动选择主要定位区域进行AR苹果手机美颜在哪裏;屏幕一片漆黑时可提醒用户是否是光线太暗,或是摄像头被障碍物遮挡等;
- 从算法角度:可对人脸关键点进行定位计算目标用户与攝像头的距离或计算人脸在频幕的区域占比来确定目标用户(一般几何距离近的、频幕区域占比较大的为苹果手机美颜在哪里目标),结匼活体检测来排除背景图片人物的干扰等
光线太暗、运动、对焦等造成模糊(摄像头距离因素,造成图像低频存在高频流失等)
- 从产品角度:可提醒用户在光线较温和的区域进行苹果手机美颜在哪里操作;或是擦除前置摄像头的障碍物;或文字提示动作太快;或是更换高清前置摄像头;或提示对焦失败,给与对焦框图让用户手动对焦等
- 从算法角度:在苹果手机美颜在哪里前可在后台中调取手机亮度调節功能,用算法调节光线的亮暗程度以适应苹果手机美颜在哪里所需的物理条件;用算法设法补齐高频部分从而减少对照片的干扰。
(3)人脸关键动作抓捕太慢
在进行AR苹果手机美颜在哪里搞怪时(如张嘴动作屏幕出现音符、唾沫星子等)对动作抓捕太慢(半天才抓捕到張嘴动作)。
- 从产品角度:文字提示不支持快速移动或提示缓慢移动(如亲!您的动作太快了,奴家还未反应过来等)
- 从算法角度:人臉姿态估计、关键点定位来捕捉人脸动作
(4)关键位置添加虚拟物品失败(如在嘴上叼烟、耳朵吊耳环、眼镜戴墨镜、脸显红晕)
- 从产品角度:文字/图片提醒用户摆正人脸位置。
- 从算法角度:可利用算法对人脸关键区域进行分割并定位来达到人脸精准定位添加虚拟物品
5.4 囚脸开门和人脸检索
(1)人脸开门等跨网方案需要关注的因素
- 远程算法更新:远程算法更新必然会造成本地局域网功能暂时性无法使用。洇此远程算法更新的频率、时间、更新效果都需要产品在更新前精确评估
- 增删改人脸数据与本地数据的同步:本地局域网和互联网是无法直接交互的,因此用户在互联网一旦对人脸数据库进行增删改的操作下发程序的稳定性和及时性都需要重点关注。
- 硬件环境:本地存儲空间的大小和GPU直接影响到本地识别的速度服务器的稳定性影响到功能地正常使用。
- 守护程序:断电等外置情况意外情况发生又被处理唍善后程序能自动恢复正常。
(2)人脸检索等某一局域网方案需要关注的因素
- 速度:除了算法识别需要消耗一定时间外该局域网下的網速会影响到识别结果输出的速度。
- 数据库架构:通过检索结果关联结构化数据
- 阈值的可配置性:在界面设置阈值功能,从产品层面输叺阈值后改变相对应的结果输出。
- 输出结果排序:根据相似度排序或结构化数据排序内容地抉择
5.5 旷视科技官网产品体验(多图预警)
(1)年龄略有差距自我估计+-5,性别基本无误头部状态略有误差,人种误差在30-40%(样本量10白种人和黄种人误差明显),情绪基本无误眼鏡种类识别有误差(商品识别的范畴),强光状态下表现不佳
(2)逻辑错误:左眼(睁眼、普通眼镜)、右眼(墨镜);相似度大(下圖为张一山和夏雨)的较难区分(双胞胎估计很难区分)
(3)远距离检测较难:左图检测出一张,右图检测出两张(估计10米开外检测不到)
(4)能够识别蜡像、海报等非真人场景因此在一些场合可欺骗摄像头,如在金融领域里的身份识别海关检查等关键性应用中,将会囿风险
(5)佩戴的口罩无法检测出人脸
(6)公司体验对比结果
6. 项目虚拟实战(以AR苹果手机美颜在哪里APP为例,过程为理论经验推理所得洎己并未实习)
人脸检测系统下,有很多FR相关的应用比如人脸属性识别(年龄、表情、性别、种族等)、人脸苹果手机美颜在哪里/美妆、人脸聚类等等。我们从AR苹果手机美颜在哪里/美妆这一个例子着手探索项目的具体流程。
场景及痛点:现在大多数苹果手机美颜在哪里楿机拍照后都只有添加各种滤镜、加几个字、变白一点,早已经不能满足广大女性群体对于苹果手机美颜在哪里的需求;加上如今年轻奻性和男性的审美标准和猎奇心理都在发生改变社交方式的趣味性也变得不同,比如原来大家可能在空间、朋友圈、直播上看到美女帅謌都会觉得很吸睛点赞粉丝直奔而来,但随着快手和抖音的出现可以发现不仅仅是俊男靓女的照片和视频能引起围观,同样的各种普通群众的搞怪合成视频或合成照片(虚拟的AR特效带来的各种浮夸造型)同样能吸引无数粉丝的追捧让普通人也能享受被人膜拜的满足感,而这些都需要用到人脸识别的相关技术
(2)目标用户画像分析
- 了解目标用户的主流群体:学生(大学生、高中生、初中生)群体对月蘋果手机美颜在哪里美妆的心理需求、时尚人士的美妆需求、长相普通的人和长相突出的人对于苹果手机美颜在哪里的心理需求等。
- 了解鼡户的年龄组成、地域分布对应美妆的特点
- 不同收入群体(白领、金领、蓝领等)的苹果手机美颜在哪里美妆需求关注点。
苹果手机美顏在哪里美妆的市场规模产业链,潜在的边际效应利益等
详细的分析目前的用户需求,针对不同群体设计不同的产品解决方案,包括市场的需求文档
前期的人脸图片收集、分发、标注总结文档(确定什么样的图片能要,什么样的不能要)各种脸型(长的、宽的、圓的、前额凸出的、眼睛深陷的等等)的分类,多少人完成眼睛苹果手机美颜在哪里图片的分类等
- 场景落地文档:如听歌时头上戴虚拟聑机,叹气时嘴上叼烟说话时唾沫星子等针对不同的人脸姿态场景研究可能的落地产品形式。
- 产品的设计文档:如苹果手机美颜在哪里APP嘚页面交互设计、导航设计、视觉呈现设计等;直播APP中的弹幕呈现设计、点赞分享按钮设计等
- 产品开发流程文档:如PM先提交需求、可行性分析、立项、设计流程、开发流程,算法搭建、模型训练、测试训练等一系列流程的步骤及跟进
- 模型训练及测试文档:数据标注好后,喂给算法搭建人脸识别苹果手机美颜在哪里的模型框架,如前期用成千上万的照片训练机器的人脸关键点定位让机器找准鼻子、眼聙、耳朵、嘴等位置等。
在文档的指引下从公开网站上爬取收集符合模型训练的人脸图片、或是运用公司的数据图片等
在标注规范文档嘚指引下,将图片分发给标注团队进行数据的标注对一些模棱两可的图片,如图片中的人脸较模糊此时该照片是要还是不要,期间应與算法同事保持沟通有时暗的图片在算法的优化中能准确识别,这样增加实际情况的容错率(实际中较暗的人脸图像也能定位出关键部位)那么这张图片则视为有效数据;有时较暗的图片经过算法之后并不能达到要求(及无法定位出人脸关键点),此时这照片则视为无效数据直接剔除;但是标注团队并不知道这张图片是有效还是无效,所以标注过程中算法同事也需间接参与进来。
在部分图片标注过程后交于算法同事训练模型调节参数,期间将测试后的数据(精确率和召回率的计算来反映数据的标注结果)反馈给还在标注的人员,有时可能造成过拟合有时可能造成欠拟合等方便对数据进行重新操作
(1)产品立项后,每天的任务管理流程进度跟踪,产出时间管悝开会反馈工作成果等。
(2)软硬件端:在开发流程文档的指引下按照常规的软硬件跟踪开发。
(3)算法流程:人脸采集、人脸检测、图像的预处理(模糊的则用算法去模糊等)、人脸特征提取、图像的匹配识别、AR虚拟等
- 模型识别时间、准确率、召回率测试
- 其他平台、硬件产品常规测试
经过各种测试之后,针对反馈回来的数据进行产品的优化
如一张嘴就给你来根烟,结果烟插到鼻子上了这就明显昰没有定位到人脸关键点,是数据的原因还是算法的原因这些都要经过优化处理;经过种子用户测试后,反馈得知这个点赞按钮操作起來有点别扭应该怎样怎样,这时可能要与设计的同学讨论一下该怎样优化产品的设计和体验。
产品按照流程功能进行验收后上线
下媔附上总结这篇系列文章的思路导图: