人脸检测的一篇外文翻译中的一章,请高手帮忙翻译完,谢谢

来源:百度知道 编辑:UC知道 时间:2024/07/02 23:54:41

3. 属性方法
难题:能够从一张随意选择的图像探测到人脸。

3.1 滑动窗
被研究的两种分类技术(神经网络和支撑矢量机)将20X20窗口像素归类于一个人脸/非人脸。因此,系统将20X20 窗口在图像上滑过。为使分类机能够正确地探测一张人脸,脸型的大小必须匹配并占据整个窗口,就是说,它不可大过或小于窗口。如果认为每次都能这样,当然那是荒谬的,为了补救,我们使用一个常数重复将图像缩小,然后在这较小的窗口上滑过一张20X20图像。通过这种操作,我们可以探测到比原来图像的窗口更大的人脸。

3.2 图像预处理
人脸图像的变化程度很大---不同的种族、肤色、性别等等使人脸相片错综复杂。更有甚者,在不同的光线条件及使用不同的设备等所拍摄的照片,由于分类机的鉴定是受这些因素的影响,所以它会被搞得很困惑的。
为了避免这情况,每张图像送至分类机前都进行预处理;具体包括下列步骤:
* 光源纠正:从窗口像素值减掉一个最佳拟合的亮度平面,以让光线与浓重阴影可以降低。
* 直方图均衡:这可对光源的亮度、照相机反应、肤色等等的差异作补偿。
这些步骤是针对每个窗口使用,而不是用于整个图像。

3.3 自举方法
为神经网络/支撑矢量机创造一个培养集是一个备受挑战的任务,因为要在培养集增添非人脸图像特征是颇具难度的。要人脸图像的代表性样本毫无困难,但是要从庞大数量的非人脸图像选择正确的组合却是一个复杂的工作。
因此,每次培养期后,被误测为人脸的非人脸图像都加到下一轮的培养期。这种“自举”方法可以避免在培养集里使用大量的非人脸图像的难题,这种图像很多是对培养毫无影响的。

3.4 培养集阐述
人脸探测领域的研究使用两种常用的培养集[CMU, MIT(Poggio)], 不过很难获取。根据我们的目的,我们使用一些来自CMU测试集的图像(参阅资源)、“生物识别安全”BioID的人脸数据(参阅资源)以及在印度坎普尔IIT生成的印度人脸数据。
放置在培养集的每张图像,其眼、鼻、嘴的左、中、右都被标上记号;然后将脸转为一个20X20 窗口,有记号的特征都在预定的方位{ELABORATE}。
最初,从底片样本