基于灰度的共生矩阵法的人脸表情识别探究-电子发烧友网

人脸表情是人类进行情感交流的一种重要方式，从表情的变化中可以感知出人的情绪、感受、秉性和气质。自动化的人脸表情识别（FER）技术可以协助进行人脸识别、智能人机交互以及行为科学和医学研究等。根据所研究数据的不同， FER 算法可以分为针对多幅图像和针对单幅图像两大类。由于单幅图像包含较少的表情信息，从单幅图像识别表情比从多幅图像中进行更具挑战性。然而，在有些情况下，单幅图像中已包含了足够的表情信息，而且计算相对简单。因此，本文主要探讨基于单幅图像的人脸表情识别。

人脸表情识别主要分为三个步骤：寻找感兴趣区域（ROI）、特征提取和表情图像分类。寻找感兴趣区域，目前常用的方法有基于模板匹配的方法和基于特征提取的方法，前者考虑图像全局；后者则考虑图像局部区域，主要考虑形状和纹理。通过特征提取过程降低维数，目前常用的方法有主成分分析（PCA）、Gabor过滤等方法。通过对从ROI中提取出来的特征向量进行分类，目前常用的方法有神经网络（NN）、隐式马尔可夫链（HMM）和支持向量机（SVM）。上述基本方法使研究仅仅考虑到如何在各个步骤中优化算法，忽略了步骤之间的依赖性，因为先要选定ROI，然后再进行特征提取，所以步骤连接中需要人工干预。针对此问题，本文有效地利用CGA，通过CGA的不断迭代将前两步有机结合，实现了自动机制，并且简化了设计。

最近，HERNANDEZ B等人提出利用灰度共生矩阵和遗传算法相结合的方法解决红外线图像上的人脸表情识别问题，其中存在一些不足之处：遗传算法中个体是随机产生的，造成个体在空间内分布的不均匀性，使得实验效果并不明显；仅可解决红外线图像。针对以上不足，本文首先将灰度共生矩阵拓展到可视化图像上，并用相应的实验数据证明其可行性。利用混沌的随机性、遍历性和规律性，将混沌原理加入遗传算法中，对传统遗传算法进行改进，有效地解决了个体分布的不均匀性，同时也没有忽略其差异性。经过理论推导和实验仿真，证明本文的方法是切实可行的。

1 灰度共生矩阵（GLCM）

纹理是图像分析中常用的特征，一般说来可以认为纹理由许多相互接近的、互相交织的元素组成，并具有一定的周期性。量化图像的纹理内容是描述图像的一种重要方法。基于统计的方法是纹理分析中最基本的一类方法，而基于灰度的共生矩阵法又是一种典型有效的基于统计的纹理提取方法。因此，本文选取灰度共生矩阵来提取特征。

基于灰度的共生矩阵法的人脸表情识别探究

这样得到的矩阵可以反映不同像素相对位置的空间信息。共生矩阵中还包含了图像的纹理信息，对于具有不同特点的图像纹理，其灰度共生矩阵也会明显不同。对纹理较为粗糙的区域，其灰度共生矩阵中mij的值较集中于主对角线附近，对于粗糙纹理，像素对一般具有相同的灰度；而对于纹理较为细腻的区域，其灰度共生矩阵中mij的值则散布在各处，其像素对灰度差异较大。

1.2 GLCM用于表情识别的可行性分析

1978年，EKMAN和FRIESEN提出了面部表情编码系统（FACS），并研究了六种基本表情，即高兴、悲伤、惊讶、恐惧、愤怒和厌恶。

表情变化的区域主要集中在眼睛、眉毛和嘴巴，因此，采用公式（1）选取JAFFE 图库中“Neutral”、“Happy”、“Surprise”三种表情对三个主要集中区域之一的嘴部区域进行实验，如图2所示。

由以上三种表情嘴部区域所生成的灰度共生矩阵如图3所示。由图3可以看出，对于“Happy”这种表情来说，其嘴部区域的灰度值比之另外两种表情的嘴部区域变化要频繁，其图像的纹理特性相对属于“细纹理”。而另两种属于“粗纹理”，其灰度共生矩阵中的值较集中于主对角线附近。对于粗纹理，像素对趋于具有相同的灰度；而对于细纹理的区域，其灰度共生矩阵中的值则散布在各处。就“Neutral”与“Surprise”这两种表情而言，“Neutral”表情的嘴部区域口形较小，因为嘴附近肤色的缘故，其灰度值多处于高亮度区域，反映在灰度共生矩阵上则是主对角线上小序号行列的数值较低，连通性较差。而“Surprise”表情的嘴部区域口形较大，其灰度值多处于低亮度区域，因而其灰度共生矩阵主对角线上数值比较均衡，连通性较好。

由此可见，用灰度共生矩阵可以反应出各种表情之间的差异，不难想象从中提取出的各种统计量就可以作为表情特性的度量。

基于灰度的共生矩阵法的人脸表情识别探究

2 支持向量机（SVM）

支持向量机（SVM）起初由VAPNIK提出时，是作为寻求最优（在一定程度上）二分类器的一种技术，后来它又被拓展到回归和聚类应用。

2.1 SVM定义

定义2 SVM是一种基于核函数的方法，它通过某些核函数把特征向量映射到高维空间，然后建立一个线性判别函数（或者说是一个高维空间中的能够区分训练数据的最优超平面）。解是最优的在某种意义上是两类中

基于灰度的共生矩阵法的人脸表情识别探究

2.2 SVM多分类方法

SVM算法最初是为二值分类问题设计的，当处理多类问题时，就需要构造合适的多类分类器。目前，构造SVM多类分类器的方法主要有两类：一类是直接法，直接在目标函数上进行修改，将多个分类面的参数求解合并到一个最优化问题中，通过求解该最优化问题“一次性”实现多类分类，这种方法看似简单，但其计算复杂度比较高，实现起来比较困难，只适用于小型问题中；另一类是间接法，主要是通过组合多个二分类器来实现多分类器的构造常见的方法有两种。（1）一对多法（one-versus-rest）。训练时依次把某个类别的样本归为一类，其他剩余的样本归为另一类，这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。（2）一对一法（one-versus-one）。其做法是在任意两类样本之间设计一个SVM，因此k个类别的样本就需要设计k（k-1）/2个SVM。当对一个未知样本进行分类时，得票最多的类别即为该未知样本的类别。除了以上两种方法外，还有有向无环图DAG（Directed Acyclic Graph）和对类别进行二进制编码的纠错编码（Error Correcting Code）。本文采用第二种方法并结合投票策略（voting scheme）［5］来设计需要的多分类器。

2.3 k-折交叉验证（K-fold cross-validation）

由于我们的数据样本集较小，因此引入k-折交叉验证。

定义3 k-折交叉验证是指将样本集分为k份，其中k-1份作为训练数据集，而另外的1份作为验证数据集。用验证集来验证所得分类器或者回归的错误码率。一般需要循环k次，直到所有k份数据全部被选择一遍为止。

3 混沌遗传优化算法（CGA）

3.1 遗传算法的改进

遗传算法是一种模拟生物进化过程的优化方法，它能在有限代数的进化过程中，在全局解空间内自动进行搜索得到最优解或是次优解。它可以通过编码技术，将具体的问题抽象处理，仅对编码串进行操作，在进化过程中以适应度作为标准，从而避开了问题的复杂优化判别准则。但是遗传算法对初始种群最初是采用一种随机方式产生的，这些个体在解空间内分布可能不均匀，为了使遗传算法能在解空间内更好地进行全局搜索，杨宇明等人［6］提出一种新的随机个体产生方法，将混沌原理引入遗传算法。混沌具有随机性、遍历性和规律性，用它产生初始种群会提高遗传算法的效率，使遗传算法的初始种群不再随机产生，而是由混沌产生。混沌是一种非线性的映射，它看似随机的过程，其实质是一种有着内在机制的运动过程。因此，本文也将混沌原理引入，对遗传算法进行改进，采用logostic映射表示混沌的系统：

基于灰度的共生矩阵法的人脸表情识别探究

当μ=4时，这个系统是一个完全混沌系统，它没有稳定解，而且是一个满映射的过程。这些特性能够提高遗传算法初始种群的差异性。混沌遗传优化算法过程［7］如图4所示。

基于灰度的共生矩阵法的人脸表情识别探究

3.2 适应度函数（Fitness function）

GA应用于实际问题时，适应度函数的定义往往最为困难，而且其计算复杂程度对于整个GA的搜索时间有较大影响。本文方法的目标就是寻找最佳的ROI，在ROI上面提取特征用于分类。因此，每个选定的ROI分类的正确性对适应度函数起至关重要的作用。然而，当两个不同的解决方法得到同样的分类正确性时，为了简化计算应该选择特征值数量较少者，因此，本文适应度函数［8］设计如下：

基于灰度的共生矩阵法的人脸表情识别探究

其中，Accuracy为对于给定个体所有SVM的平均正确率，可由k-折交叉验证［5］求得；Zeros为染色体中起作用的特征值数量。

3.3 选择、交叉和变异

选择方法：假设群体规模为N，经交叉、变异操作后产生N个子代个体。将子父代组成的2N个群体按适应度函数值从大到小排序，取前面N/2个个体放入配对池，再从后面的N个个体中随机地选出N/2个个体放入配对池。由于既选择到适应度函数的较大值又选择到适应度函数的较小值，这样，既可保证种群向最优解收敛，又可保证种群的多样性不会迅速减少。

变异算子选择：为了简化实验，提高实验性能，本文采用基本位变异作为变异算子，即以变异概率对个体编码串中基因座上的基因值做变异运算。

交叉算子选择：同样为了简化实验提高实验性能，本文的交叉算子采用单点杂交算子［10］，在个体编码串中随机设置一个杂交点，然后进行部分基因变换。

基于灰度的共生矩阵法的人脸表情识别探究

5 实验结果及分析

本文选用Matlab 7.0为实验平台，从JAFFE图库中选出“Happy”、“Neutral” 、“Angry”和“Surprise”四种表情的图像样本共121幅，其中：“Happy”表情31幅、“Neutral”表情30幅、“Angry”表情30幅、“Surprise”表情30幅。从这些图像样本中选择“Happy”表情16幅、“Neutral”表情15幅、“Angry”表情15幅、“Surprise”表情15幅共61幅作为训练样本，剩余每种表情15幅，共60幅作为测试样本。经过实验选定种群大小为50，最大遗传代数为50，经过三次实验，求得的识别率如表1所示。

基于灰度的共生矩阵法的人脸表情识别探究

由表1不难得出，采用灰度共生矩阵特征值表征的特征对“Happy”和“Neutral”识别效果较为理想，对于“Angry”也有较高的识别率，对“Surprise”识别率较低。总体来说，本文提出的基于灰度共生矩阵和混沌遗传优化算法相结合的算法能够得到81.67%的平均识别率，识别结果令人满意。最优个体的感兴趣区域数目为2，参数为{14 16 13 15}和{19 3 9 25}，分别对应中心点坐标（xwi，ywi）、ROI宽度hwi和ROI高度wwi。最优个体ROI在JAFFE库上一个实例的区域截图如图7所示。

本文提出了利用CGA将ROI的选取和特征的提取有机地结合，通过不断调整灰度共生矩阵的参数寻找最优个体，利用最优个体标明的ROI训练SVM，最后通过SVM进行分类。该方法的优点在于能够很好地利用人脸表情处理步骤之间的依赖性，将前两个步骤有机地结合成一步，消除了步骤连接中的人为因素，实现了自动机制，并且简化了设计，而且将混沌原理引入遗传算法当中，有效地解决了随机产生个体的不均匀性，又保持了个体的差异性。通过定理、公式推导和实验仿真，证明该方法切实可行。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人机交互

人机交互

+关注

关注
12

文章
1206

浏览量
55391
智能

智能

+关注

关注
8

文章
1710

浏览量
117500
人脸识别

人脸识别

+关注

关注
76

文章
4012

浏览量
81879

ElfBoard开源项目|百度智能云平台的人脸识别项目

百度智能云平台的人脸识别项目，旨在利用其强大的人脸识别服务实现自动人脸识别。选择百度智能云的原因

发表于 12-24 10:54 •149次阅读

ElfBoard开源项目|百度智能云平台<b class='flag-5'>的人脸</b><b class='flag-5'>识别</b>项目

《DNK210使用指南 -CanMV版 V1.0》第四十五章人脸识别实验

第四十五章人脸识别实验在上一章节中，介绍了利用maix.KPU模块实现了人脸68关键点检测，本章将继续介绍利用maix.KPU模块实现的人脸识别

发表于 11-18 14:30

开源六轴协作机器人myCobot 320结合人脸表情识别情绪！

与众不同的功能。通过结合人脸表情识别技术，我们可以让机械臂感知到我们的情绪变化。当我们开心时，机械臂可以跟着一起开心地舞动；当我们伤心难过时，它可以过来安慰我们，给予温暖的抚摸。这种基于表情

发表于 08-12 15:21 •907次阅读

基于FPGA的人脸识别技术

基于FPGA（现场可编程逻辑门阵列）的人脸识别技术，是一种结合了高效并行处理能力和灵活可编程性的先进图像处理解决方案。这种技术在安全监控、身份认证、人机交互等领域具有广泛应用前景。以下将详细介绍基于FPGA的人脸

发表于 07-17 11:42 •1434次阅读

基于OpenCV的人脸识别系统设计

基于OpenCV的人脸识别系统是一个复杂但功能强大的系统，广泛应用于安全监控、人机交互、智能家居等多个领域。下面将详细介绍基于OpenCV的人脸识别系统的基本原理、实现步骤，并附上具体

发表于 07-11 15:37 •1.2w次阅读

人脸识别技术的原理介绍

人脸识别技术是一种基于人脸特征信息进行身份识别的生物识别技术。它通过分析人脸图像，提取

发表于 07-04 09:22 •1161次阅读

如何设计人脸识别的神经网络

人脸识别技术是一种基于人脸特征信息进行身份识别的技术，广泛应用于安全监控、身份认证、智能门禁等领域。神经网络是实现人脸

发表于 07-04 09:20 •650次阅读

人脸识别模型训练流程

据准备阶段，需要收集大量的人脸图像数据，并进行数据清洗、标注和增强等操作。 1.1 数据收集数据收集是人脸识别模型训练的第一步。可以通过网络爬虫、公开数据集、合作伙伴等途径收集人脸图

发表于 07-04 09:19 •952次阅读

人脸识别模型训练是什么意思

人脸识别模型训练是指通过大量的人脸数据，使用机器学习或深度学习算法，训练出一个能够识别和分类人脸的模型。这个模型可以应用于各种场景，如安防监

发表于 07-04 09:16 •587次阅读

人脸检测和人脸识别的区别是什么

人脸检测和人脸识别是计算机视觉领域的两个重要技术，它们在许多应用场景中都有广泛的应用，如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处，但它们之间存在一些关键的区别。本文将详细介绍

发表于 07-03 14:49 •1201次阅读

人脸识别门禁系统赋能社区安防

社区出入口处收集人脸图像数据，并识别进出社区的人员，实时控制社区人员的流动。这不仅能够防止未经授权的人员进入，还能够记录进出社区的时间和身份信息，为安全管理提供重

发表于 07-02 11:09 •478次阅读

如何挑选理想的人脸识别考勤系统产品？人脸识别设备的选型

如何挑选理想的人脸识别考勤系统产品？在挑选理想的人脸识别考勤系统产品时，需要综合考虑多个方面，包括但不限于设备的性能、兼容性、数据存储能力、环境适应性以及售后服务等因素。以下是根据提供

发表于 06-05 14:59 •476次阅读

人脸识别终端 10寸人脸机

终端人脸识别

深圳市远景达物联网技术有限公司
发布于 :2024年04月22日 16:01:46

智能门禁的人脸识别设备有哪些功能优势？

如今，智能人脸识别门禁设备被广泛应用于安防领域，无论是在小区物业、园区写字楼、景区等出入口通道，还是在学校、企业、工厂工地等场景下，都不难发现它的身影。不仅能为管理者提供更安全、更便捷、更智能

发表于 03-13 14:06 •773次阅读

人脸识别技术的原理是什么人脸识别技术的特点有哪些

人脸识别技术的原理人脸识别技术是一种通过计算机以图像或视频为输入，识别、检测、跟踪和分析人脸的

发表于 02-18 13:52 •1889次阅读

搜索历史

基于灰度的共生矩阵法的人脸表情识别探究

评论

ElfBoard开源项目|百度智能云平台的人脸识别项目

《DNK210使用指南 -CanMV版 V1.0》第四十五章人脸识别实验

开源六轴协作机器人myCobot 320结合人脸表情识别情绪！

基于FPGA的人脸识别技术

基于OpenCV的人脸识别系统设计

人脸识别技术的原理介绍

如何设计人脸识别的神经网络

人脸识别模型训练流程

人脸识别模型训练是什么意思

人脸检测和人脸识别的区别是什么

人脸识别门禁系统赋能社区安防

如何挑选理想的人脸识别考勤系统产品？人脸识别设备的选型

人脸识别终端 10寸人脸机

智能门禁的人脸识别设备有哪些功能优势？

人脸识别技术的原理是什么人脸识别技术的特点有哪些