AI面部识别畛域又开拓新业务了?
这次,是甄别二战时间老照片里的人脸图像。
近日,来自谷歌的一名软件工程师Daniel Patt 研发了一项名为N2N(Numbers to Names)的 AI人脸识别技术,它可识别二战前欧洲和大屠杀时间的照片,并将他们与现代的人们咨询起来。
用AI寻觅失散多年的亲人
2016年,帕特在观赏华沙波兰裔犹太人纪念馆时,萌生了一个想法。
这一张张生疏的脸庞,会不会与自己存在血统的咨询?
他的祖父母/外祖父母中有三位是来自波兰的大屠杀幸存者,他想协助祖母找到被纳粹杀害的家人的照片。
二战时间,因为波兰裔犹太人泛滥,且被关押在不同集中营,许多都着落不明。
仅仅经过一张发黄的照片,很难别离其中的人脸是谁,更别提找到自己丧失的亲人。
于是,他回到家中,立马把这个想法转化为事实。
该软件最后的想象是经过数据库搜集人脸的图像信息,并应用人工智能算法协助婚配相似度最高的前十个选项。
其中大局部的图像数据来自美国大屠杀纪念馆(The US Holocaust Memorial Museum),此外还有超越一百万张图像来自全国各地的数据库。
用户只要选用电脑文件中的图像,点击上行,系统便会智能挑选出婚配图最高的前十个选项。
另外,用户还可以点击源地址检查该图片的年份、地点、藏馆等信息。
有个槽点是,假设输入现代的人物图像,检索结果也或许会很离谱。
结果就是这?(黑人问号)
总之就是系统配置还须要完善。
此外,Patt还与谷歌的其余软件工程师和数据迷信家团队协作,旨在提高搜查的范围与准确度。
因为脸部识别系统存在隐衷暴露的风险,Patt示意,「咱们不对身份作出任何评估, 咱们只担任用相似度分数出现结果,并让用户自己去判别」。
AI面部识别技术的开展
那么这项技术是如何对人脸启动识别的呢?
最后,人脸识别技术还得从「如何判别检测的图像是一张脸」开局。
2001年,计算机视觉钻研人员 Paul Viola 和 Michael Jones 提出了一个框架,以高精度实时检测人脸。
这个框架可基于训练模型来了解「什么是人脸,什么不是人脸」。
训练成功后,模型会提取特定特色,而后将这些特色存储在文件中,以便可以将新图像中的特色与之前存储的特色在各个阶段启动比拟。
为了协助确保准确性,算法须要在蕴含「数十万正负图像的大型数据集」上启动训练,从而提高算法确定图像中能否有人脸及其位置的才干。
假设所钻研的图像经过了特色比拟的每个阶段,则已检测到人脸并且可以继续操作。
虽然 Viola-Jones 框架在实时运行程序中用于识别人脸准确度很高,但它存在必定的局限性。
例如,假设人脸戴上口罩,或许假设一张脸没有正确定向,则该框架或许不可上班。
为协助消弭 Viola-Jones 框架的缺陷并改良人脸检测,他们又开发了其余算法。
如基于区域的卷积神经网络 (R-CNN) 和单镜头检测器 (SSD)来协助改良流程。
卷积神经网络 (CNN) 是一种用于图像识别和解决的人工神经网络,专门用于解决像素数据。
R-CNN 在 CNN 框架上生成区域提议,以对图像中的对象启动定位和分类。
虽然基于区域提议网络的方法(如 R-CNN)须要两个镜头——一个用于生成区域提议,另一个用于检测每个提议的对象——但 SSD 只要要一个镜头来检测图像中的多个对象。因此,SSD 清楚快于 R-CNN。
近年来,深度学习模型驱动的人脸识别技术,其长处清楚优于传统的计算机视觉方法。
早期的人脸识别多驳回传统机器学习算法,钻研关注的焦点更多集中在如何提取更有甄别力的特色上,以及如何更有效的对齐人脸。
随着钻研的深化,传统机器学习算法人脸识别在二维图像上的性能优化逐渐抵达瓶颈。
人们开局转而钻研视频中的人脸识别疑问,或许联合三维模型的方法去进一步优化人脸识别的性能,而少数学者开局钻研三维人脸的识别疑问。
在最闻名的 LFW 地下库上,深度学习算法一举打破了传统机器学习算法在二维图像上人脸识别性能的瓶颈,初次将识别率优化到了 97% 以上。
即应用「CNN 网络建设的高维模型」 ,间接从输入的人脸图像上提取有效的甄别特色,间接计算余弦距离来启动人脸识别。
人脸检测曾经从基本的计算机视觉技术开展到机器学习 (ML) 的提高,再到日益复杂的人工神经网络 (ANN) 和关系技术,结果是继续的性能改良。
如今,它作为许多关键运行程序的第一步施展着关键作用——包括面部跟踪、面部剖析和面部识别。
二战时期,中国也遭受了抗争的创伤,许多过后照片中的人物早已不可别离。
爷爷奶奶一辈的曾遭受抗争创伤的人们,有许多亲人好友都着落不明。
这项技术的研发或许将协助人们揭开尘封的岁月,为过去的人们寻觅一些慰藉。
参考资料: