为什么我高铁人脸识别失败怎么办?是我本人也不行。试了很多次了

如今人脸识别系统已经广泛应用於我们的生活中如数码相机、门禁系统、机场的安全设施 、桌面软件、互联网应用(如Facebook)等等[1]。然而今日的一则关于“高铁人脸识别抓逃犯”的新闻一出[2]在评论中又引发了一阵阵怀疑。怀疑的中心问题在于人脸识别系统真的能准确无误地在数以亿计的面孔中找出匹配嘚嫌疑人吗?

完整的人脸识别系统一般由多个模块组成在进行人脸识别之前首先要进行人脸检测(即在一张完整的图片中探测到人脸区域),以及图片的预处理、归一化等步骤(例如自动把倾斜的照片摆正)本文就来介绍一下人脸识别的过程。(至于人脸检测的问题留待以后再议就看评论中群众的呼声了。)

我们知道数码图片的基本表示方式是位图(bitmap)一张大小 360x480 的黑白照片,每个像素点的取值范围昰 0-255 之间的整数通过简单的乘法原理可以算出,它可能产生 256 172800 种不同的照片然而在这个天文数字的可能性中,不可能每一张照片都是人脸事实上,符合正常人类脸部特征的照片只占这些可能性中极小的一部分也就是说,如果以这样的方式表示图片并且每张图片都是人臉的话,那么信息就是极其冗余的:位图用了 172800 个像素——也可以称为 172800 个特征——来表示一张人脸图片由于人脸的规律性,我们其实可以鼡很少量的特征来表示比如20个、50个、或100个。当然如果我们只用20、50、100个特征表示人脸,这里的每个特征的意义就不再是一个像素点了

仩一段其实解释了数据挖掘中一个很重要的概念——降维(dimension reduction)。用数学的语言来说人脸识别中最主要的工作就是把这些 172800 维空间中的向量轉换为 20、50、100 维空间中的一组向量。这样转换的好处是什么呢下面我们用一个具体例子来说明。

主成分分析:提取有代表性的脸型轮廓

现茬有 40 个人的人脸图片每人 10 张,一共 400 张图片(ORL Database [3])为简单起见,我们把这组图片降到5维也就是只用 5 个特征来表示一张人脸图片。上面提箌如果只用5个特征,那每个特征本身就不能是一个像素点这么简单那么这5个特征是什么呢?如下所示:

我们可以看到这5个特征中的烸一个都是一张酷似人脸轮廓的图片。OK那么怎么用这 5 个特征表示一开始那400张人脸图片呢?我们用(线性)叠加的方式假设(仅仅是假設)某张图片有这般组成:

那么这张图片就可以用(0.1,0.3-0.7,02)这个向量(5维向量)表示。(这个公式中似乎有些奇怪的东西看不懂没關系,我们后面再解释)

到此为止我们用到的降维方法叫做主成分分析(PCA:Principle Component Analysis)[4],如果你用过任何数学软件或统计软件(如 Matlab、SPSS)里面肯萣有这个功能。从字面意思上讲通过把图片的表示从很高维的空间降到5维,我们提取出了这组人脸图片的“主要成分”(说白了就是人臉)第一个特征(Eigenface1)刻画出了人脸最主要的构架,后面的几个特征(Eigenface2-5)再慢慢的细化像素点可以称为低级(low-level)特征,相应地“主要荿分”可以成为高级(high-level)特征。同一个人的照片可以千变万化为了实现人脸识别,我们当然不能一个一个像素点地去比对而应该通过這些“主要成分”考察人脸图片是怎么构造/叠加出来的。不同的面孔有不同的构造方式比如有的用 Eigenface2 的权重大一些,有的用 Eigenface3 的权重大一些这样就实现了不同人面孔之间的区分。

关于上面的公式我们还注意到以下两点:

1.左边和右边是约等号,也就是说当我们用这 5 个特征鉯不同权重叠加起来,得到的是原始图片的一张近似图片其实这就是生成这5个特征时采用的标准:用叠加的方式试图复原所有原始图片時产生的误差总和最小。虽然这里面有信息损失但这5个特征反映出来的的确是400张图片里最关键的部分。如果需要我们可以近似地把原始图片复原出来,比如这400张图片里的第一张:

2.每个特征有个奇怪的名字:Eigenface + 序号如果你在大学学过线性代数并且到今天还没忘的话,或许伱会联想到线性代数里的一个概念:特征向量和特征值(Eigenvector and Eigenvalue)没错,这些 Eigenface(或许可以译作特征脸或本征脸)实际上就是原始图片协方差矩陣的特征向量(更多数学免去)很奇妙吧?通过求特征向量就能做基本的人脸识别或文本分析你是否也感到了数学之美?

堪比铁路网仩订票系统

当然,主成分分析用于实际中的人脸识别系统还是远远不够的上世纪90年代的计算机科学家们又利用统计理论开发出了更好嘚方法,如线性判别分析(Linear/Fisher Discriminant Analysis)[6]这是另一种降维方法,与主成分分析相比同一个人的照片在转换后的低维空间中会更加紧凑,从而提高識别精度跟 Eigenface 类似, 线性判别分析生成的特征也有一个名字叫做费舍脸(Fisherface),以伟大的统计学家罗纳德?费舍(Ronald Fisher)命名

实际场合中的囚脸图片极为复杂,可能有各种姿势、表情照相时的光线明暗和角度变换更加大了识别的难度。继 Eigenface 和 Fisherface 之后人脸识别的研究成为计算机領域的热点之一,识别算法逐渐可以适应各种光线、角度或脸部本身的变化例如下图是卡内基梅隆大学约10年前发布的人脸识别研究数据[7],可以看到同一个人照片呈现出的巨大差异在这样复杂的环境中现有算法已经能达到大约95%的识别精度[8]。

万一哪个逃犯换了发型、戴了墨鏡怎么办呢比如有人说“我今年入关的时候,为了迷惑他们的识别系统特意换上了黑框眼镜”,这样行得通吗根据近年最新的研究[9],即使脸部有大面积遮挡(如下图)也能实现高精度的识别。但是这有个前提就是说虽然每张图片都可以有所遮挡,但是人脸的每个蔀位必须在已有的数据中无遮挡的出现过至少一次

关于高铁新建人脸识别系统的新闻中还提到,“作案后的犯罪分子即使整容,也能夠被识别”很多人的第一反应是“这也太不可思议了吧?整容之后肉眼都未必认得出来”这话只说对了一半。的确整容之后的人脸與整容之前有了很大区别(见“李小璐被误认为范冰冰……是老外脸盲还是女星实在整得太像了? ” [10])但是从另外一个角度上讲,相比於整容前后的区别不同个体的脸部区别或许还要更大,而识别系统说到底是要找出相似度最大的人依据脸部的骨架特点,整容是有限喥的调整而不是把一个人完全变成另一个人,只要不是真的把李小璐整成范冰冰的样子算法还是有可能识别出来的。

如果上面的内容伱都理解了那么恭喜你已经对当今最先进的人脸识别技术或许有了大致的认识。人脸识别系统是否能准确无误地识别出逃犯现在还不恏说,特别是对于我们这样有着十几亿人口的国家因为目前任何识别系统应该都没有处理/索引过如此大量的不同个体。高铁新安装的逃犯识别系统效果如何就像铁路网上订票系统一样,还得通过实践的检验

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

本文参与,欢迎正在閱读的你也加入一起分享。

其实现在很多高铁等地方已经开始试运行高铁人证票核实系统简单点就是,人脸+身份证+票三合一下面小编带大家来看看中兴智能视觉人脸识别高铁人证票核实系统,夲系统是为了解决火车站、长途汽车站实行实名制后需要对进站旅客进行人、证、票三合一查验而定制开发的一款产品。系统由前端人證票核验设备和后端应用管理平台组成前端人证票核验设备部署在车站安检通道处,分别完成人、证、票的三合一核验另外,另外这類系统还需要与公安部的黑名单库对接实现嫌犯报警提醒,协助公安机关追逃极大的减少警力资源和违法事件的发生概率,是一款集信息采集人脸识别,人证票比对报警提醒和大数据统计分析于一体的车站安检安防产品。

  1.     采用智能动态人脸识别技术非接触、无干擾,对旅客没有侵犯性也无需旅客刻意配合(支持低头和侧脸)。

        在设计中考虑了不同复杂场景各种不同身高和体态的乘客,可自动適应室外强光、弱光、逆光等复杂的车站环境各种不同身高和体态的乘客都可以顺利完成人证票核验。

        采用特有智能识别算法在捕捉箌旅客正脸图像并确保通关效率的情况下,识别准确率高达97.3%;

        经实践检验人均通关速度只需1-2秒。支持千万级别嫌犯库的快速检索比对

        囚证票核验工作台按照人体工学设计、结合验票员的使用习惯,保证用户在使用过程中舒服方便,使用户的体验性更好和舒适度更高

        設计中充分考虑了设备的安全防护,防止被盗和非法拆卸

        适用于各大火车站、长途汽车站进站安检通道处的人、证、票核验。

经验内容僅供参考如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士

我要回帖

更多关于 高铁人脸识别失败怎么办 的文章

 

随机推荐