微表情识别和心理学的关系
引言在人们的日常生活、工作、交流、处理事务和决策中,情感能力同正常的理性思维和逻辑推理能力一样伴演着重要的角色。神经生理学家研究发现,#-,由于控制逻辑推理的大脑皮层和控制情感的边缘系统之间通道的缺损,病人尽管具有正常甚至超常的理性思维和逻辑推理能力,但严重阻碍了决策能力的运用。美国学者也认为情感能力是人类智能的重要标志,2-。目前的计算机从原理上讲主要是基于逻辑推理式系统,根本不存在情感能力,人工智能也只是逻辑推理能力的体现。如果将计算机赋予类似于人类的情感能力,能够感知和表达情感,将能更好地实现计算机发展以人为本、为人服务的原则。
情感计算技术通过各种传感器 获取由人的情感所引起的表情及生理变化信号,利用“情感模型”对这些信号进行识别,从而理解人的情感并做出适当的响应。因此,情感计算的研究重点就在于创建一个具有能感知、识别和理解人类情感的能力,并能针对用户的情感做出智能、灵敏、友好反应的个人计算系统。 如何对获取的多模式情感信号(如面部表情图像、声音,心 率、血压等生理信号)进行分析并推断出被观测者的情感状态是情感计算研究的一个关键。媒体实验室Picard教授的多模式情感信号的情感计算模型,特别是对面部表情、语音情感和情感状态相关的生理信号以及情感行为等的情感模型,这些模型可直接用于识别情感。这里“模
型”是指用来描述识别、合成或既识别又合成情感的一系列参数和函数。
情感模型及情感识别
情感就像思想一样,通过人的语言、姿态、行为以及其他创造性的方式如音乐、文学等来交流。交流的信息都有特定模式,而且这些模式是可以通过计算机表现出来的。
“情感识别”,并不是说计算机能直接识别或测量情感状态,应该解释为“通过观察表情、行为和情感产生的前提环境来推断情感状态”。因为情感状态是内在的并包含生理和心理的
变化,这样只能获得情感状态的一些可观测的东西,如表情、行为等等。假设这些东西的观测可靠的话,那么潜在的情感状态就可以推断出来。只有将情感识别看作一种模式识别问题、情
感表达看作模式合成问题,计算机进行情感交流才具有可行性。
情感计算受益于测量数据、分析情感信号的能力,依赖于影响它的个体和环境。因此情感计算的解决方案首先是针对不同类型个体取得个性化的测量数据,再则是在这些数据上做共性的研究来发现通用模式。通用模式适用于全部情感,在此基础上通过一些变量区分差别细微的情感。例如发现了多种愤怒表情,但所有的愤怒都有两点共性:眉毛下移以及皱眉,上眼皮抬升以及眼皮肌肉绷紧。基于这种基本愤怒表情的变量,可以识别愤怒是否受控制、自发的还是冒充的。 下面主要讨论面部表情、语音情感及与此相关的生理信号的情感模型和识别。事先说明一下,以下模型有的可直接用于情感合成,有的却不能用于识别,有的需要进一步发展后用于合成情感。
面部表情的识别和合成
情感计算要求计算机具有类似于第三方观察者一样的情感识别能力,而面部表情是最容易控制的一种,所以识别出来的并不一定是真正的情感。但是,也正由于它是可视的,所以它非常重要,并能通过观察它来了解一个人试图表达的东西。 通常面部表情识别模型都基于数字化的面部图像或者一小段面部表情序列(例如先中性的,然后微笑,最后中性)的视频。通常根据视频识别要比根据静态图像识别更准确。视频能捕捉某种表情形成过程的面部动作。因此该文所述模型是基于视频序列的,对于基于静态图形的面部表情识别目前也有研究。到目前为止,面部表情识别模型都是将情感视为离散的,即将面部表情分成为数不多的类别,例如“高兴”、“悲伤”、“愤 怒”等。Paul Ekman和他的同事研究了情感类别之间的内在关系,称为面部动作编码系统FACS。FACS系统描述了基本情 感以及对应的产生这种情感的肌肉移动的动作单元。8个人各故意做出6种面部表情(愤怒、厌恶、高兴、惊奇、扬眉和中性),面部识别器一般要花 4 分钟来处理一种面部表情(在SGI IndyR4400上),准确率达 98%。
如果要求识别速度更快,如图所示,可用一个非生理模型构造面部动作能量模板,在视频中每一相邻帧与帧之间刻画 面部动作的时候,模板处于默认模式。对于上面的8个人故意做出的6种面部表情的识别,正确率已高达98%。在有更多受试者参与的实验中,关于识别率如何变化的研究还正在进行。目前识别器还不能实时工作,识别每种情感都要几秒钟。但是随着硬件水平和识别模式的改进,在不久的将来,会出现与人交互足够快的识别器。
页:
[1]