Qu'est-ce que l'analyse des expressions faciales ? (Et comment ça marche ?)

Pour répondre à la question « Qu’est-ce que l’analyse des expressions faciales ? », nous devons d’abord nous pencher sur nous-mêmes. Les êtres humains sont des êtres émotionnels. Notre état émotionnel influence notre comportement, qu’il s’agisse des processus les plus fondamentaux, d’actions complexes ou de décisions difficiles [1, 2]. À bien des égards, nos vies sont guidées par nos émotions ; ainsi, mieux comprendre ces dernières nous permet de mieux appréhender le comportement humain en général.

Il est évident que la compréhension de l’état émotionnel des individus peut s’avérer utile dans de nombreux domaines : qu’il s’agisse d’approfondir la connaissance de la psychologie humaine, d’étudier les comportements pour améliorer l’expérience utilisateur, de concevoir des campagnes publicitaires efficaces, ou encore bien d’autres applications.

Mais si l’importance de comprendre les émotions ne fait aucun doute, il peut s’avérer difficile d’obtenir des données objectives et en temps réel sur l’état émotionnel d’une personne.

Il existe des questionnaires conçus pour évaluer l’état émotionnel d’un individu, même si des biais trompeurs peuvent facilement s’y glisser (comme c’est le cas avec tout questionnaire ; [3]). De plus, ils ne permettent d’obtenir qu’un instantané des informations à un moment donné, ce qui signifie que les données ne peuvent donner qu’une idée générale de ce que ressent une personne.

L’analyse des expressions faciales, quant à elle, peut fournir des données objectives et en temps réel sur la manière dont notre visage traduit nos émotions. Bien que le débat fasse encore rage quant à la nature exacte des émotions que traduisent les expressions faciales [4, 5], elle reste l’un des seuls outils permettant de se faire une idée de ce qu’une personne peut ressentir [6], une opportunité à ne pas laisser passer.

Mais avant d’approfondir l’analyse, commençons par les bases :

Qu’est-ce que les expressions faciales ?

Notre visage est une partie du corps à la fois complexe et très diversifiée ; en réalité, c’est l’un des systèmes de signalisation les plus complexes dont nous disposons. Il comprend 43 muscles autonomes sur le plan structurel et fonctionnel, dont chacun peut être activé indépendamment des autres [7].

Le système musculaire facial est la seule partie de notre corps où les muscles sont soit attachés à un os et aux tissus faciaux (les autres muscles du corps humain sont reliés à deux os), soit uniquement aux tissus faciaux, comme c’est le cas pour les muscles qui entourent les yeux ou les lèvres.

Tous les muscles de notre corps sont innervés par des nerfs, qui reçoivent à l’origine des signaux provenant de la moelle épinière et du cerveau. La connexion nerveuse est bidirectionnelle, ce qui signifie que le nerf déclenche des contractions musculaires en réponse aux signaux du cerveau, tout en transmettant également des informations en retour au cerveau.

Presque tous les muscles faciaux sont innervés par un seul nerf, le nerf facial, également appelé VIIe nerf crânien. Le nerf facial émerge des profondeurs du tronc cérébral (le pont), sort du crâne légèrement en dessous de l’oreille (le canal facial) et se ramifie vers tous les muscles faciaux [8]. Le nerf facial est également relié à la région motrice primaire de notre néocortex, qui contrôle tous les mouvements musculaires de notre corps (une image représentative de cette organisation est présentée ci-dessous ; [9]).

homunculus sensoriel

Nos expressions faciales trouvent donc souvent leur origine dans la région motrice primaire, qui reçoit des signaux du thalamus, et dans le cortex moteur supplémentaire [10, 11]. Ce circuit peut encore être mieux élucidé, mais il aboutit essentiellement à un réseau de plus en plus vaste de zones cérébrales capables d’activer les expressions faciales à différents stades.

Dès que le nerf facial envoie un signal à un muscle, celui-ci se contracte (ou se relâche), ce qui entraîne une modification du ou des muscles faciaux. Ce signal n’entraîne pas nécessairement un changement d’expression faciale visible de l’extérieur, mais nous y reviendrons plus en détail ci-dessous.

Comment fonctionne l’analyse des expressions faciales ?

Il existe trois principales méthodes d’analyse des expressions faciales, chacune présentant ses propres avantages et inconvénients. La plus ancienne de ces trois méthodes, l’électromyographie faciale (fEMG), consiste à enregistrer l’activité électrique des muscles faciaux.

Pour approfondir vos connaissances dans ce domaine, notamment en ce qui concerne ses diverses applications et les perspectives qu’il offre, nous vous invitons à consulter notre guide complet sur l’analyse des expressions faciales.

fEMG

électromyographie faciale du muscle corrugateur

Les enregistrements fEMG ont montré qu’une activité peut être détectée même en l’absence de tout changement visible de l’expression faciale. On a émis l’hypothèse que cette activité serait liée à l’état émotionnel de l’individu (par exemple, on a suggéré qu’une activité accrue du muscle zygomatique majeur, associée au sourire, serait liée à des sentiments de joie ; [12]).

Si l’EMG fonctionnel permet d’obtenir des données sur les mouvements des muscles faciaux impossibles à détecter à l’œil nu, les enregistrements sont toutefois limités au nombre restreint d’électrodes pouvant être placées sur le visage. La mise en place des électrodes nécessite en outre une certaine connaissance de la musculature faciale, ainsi que des techniques appropriées pour les positionner correctement.

Système de codification des expressions faciales (FACS)

Peu après l’utilisation de l’EMG de surface pour détecter les changements d’expression faciale, Paul Ekman et Wallace Friesen ont mis au point le Facial Action Coding System (FACS) [13]. Le FACS s’appuie sur les travaux de Carl-Herman Hjortsjö [14], qui avait divisé le visage en mouvements musculaires distincts.

Le FACS est devenu la référence incontournable dans l’étude des expressions faciales, façonnant le domaine de l’analyse des expressions faciales depuis ses débuts. En définissant un ensemble de mouvements faciaux liés à l’activité des muscles du visage, les chercheurs ont pu quantifier l’activité faciale et établir un lien entre celle-ci et les expressions émotionnelles.

Si l’on ne saurait trop insister sur l’importance de la FACS dans le domaine de l’analyse des expressions faciales, la mise en œuvre pratique de ses méthodes n’est pas sans poser de difficultés. Pour quantifier correctement les expressions faciales selon la méthode FACS, des codeurs FACS officiellement certifiés et formés doivent déterminer quels muscles sont en mouvement et évaluer l’intensité de ce mouvement. Concrètement, cela signifie qu’une vidéo d’une interaction doit être visionnée pratiquement image par image et traitée, ce qui peut évidemment prendre beaucoup de temps.

Logiciel d’analyse des expressions faciales

Par la suite, des logiciels ont vu le jour, visant à répondre aux exigences techniques nécessaires au traitement précis des expressions faciales, conformément aux principes de la méthode FACS ou en s’en inspirant. L’un de ces logiciels, baptisé Emotient, comptait Paul Ekman parmi ses conseillers. Emotient a ensuite été racheté par Apple en 2016.

D’autres entreprises ont également proposé des solutions automatisées pour l’analyse des expressions faciales, comme Affectiva, une société qui a entraîné ses algorithmes sur plus de sept millions de visages (le plus grand ensemble de données de ce type parmi toutes les entreprises de logiciels d’analyse des expressions faciales) et qui est intégrée à la plateforme iMotions.

Le logiciel identifie d’abord le visage, puis utilise des algorithmes de vision par ordinateur pour repérer les points de repère clés (à l’instar de la classification FACS du visage). Si les logiciels peuvent ensuite diverger dans la manière dont ils traitent les images, Affectiva utilise des algorithmes formés par apprentissage profond pour analyser ces points de repère et, par la suite, prédire les expressions faciales.

Les logiciels conçus pour analyser les expressions faciales présentent clairement un avantage en termes de temps et de ressources nécessaires : une simple webcam suffit comme matériel. On considère toutefois généralement que la précision est meilleure avec la fEMG ou la méthode FACS manuelle. En fin de compte, ceux qui travaillent dans le domaine de l’analyse des expressions faciales devront déterminer quelle méthode répond le mieux à leurs besoins et à leurs exigences.

Données issues de l’analyse des expressions faciales

Le type de données dépend bien sûr de la méthode utilisée pour les collecter (à savoir l’EMG fonctionnel, le codage manuel FACS ou l’analyse automatique des expressions faciales à l’aide d’un logiciel). Nous allons passer en revue ci-dessous les types de données pour chacune de ces méthodes.

fEMG

Comme pour l’EMG, les données se rapportent au niveau d’activité électrique généré par les muscles, une fois qu’une valeur de référence a été établie. Cette valeur de référence est déterminée à partir des enregistrements de ce qu’on appelle la contraction volontaire maximale (MVC) – c’est-à-dire l’intensité maximale de contraction musculaire dont l’individu est capable.

La différence de tension entre deux électrodes est ensuite mesurée au niveau de la peau, puis analysée par rapport au niveau d’activité maximal.

données FEMG

Système de codification des expressions faciales (FACS)

Le système FACS consiste en un code numérique attribué à chaque action musculaire distincte ; ce code peut être précisé en indiquant le côté du visage concerné (c’est-à-dire gauche ou droit), ainsi que l’intensité de l’action. L’intensité est notée de « A » (activité minime) à « E » (activité maximale). Ainsi, une forte ouverture des yeux peut être désignée par R5C + L5C (mouvement du muscle releveur de la paupière supérieure gauche et droit, d’intensité « C »).

Analyse automatique des expressions faciales

Le type de données exact dépendra du logiciel utilisé pour l’analyse automatique des expressions faciales. Affectiva, par exemple, fournit des valeurs appelées « détecteurs », dont les valeurs vont de 0 (aucune expression) à 100 (une expression pleinement présente). Ces valeurs peuvent ensuite être analysées comme n’importe quelle autre donnée.

données d'expression automatiques

À lire : Conseils pour obtenir des données d’analyse des expressions faciales de haute qualité

Conclusion

James Russell et José Fernández-Dols ont déclaré en 1997 : « Associer les visages aux émotions relève peut-être du bon sens, mais cela s’est avéré être l’idée la plus importante de la psychologie des émotions » [15]. Si les détails de ce lien avec les émotions font encore l’objet de débats, il n’en reste pas moins l’un des rares outils disponibles capables de fournir des données objectives liées aux expressions émotionnelles.

Il existe différentes méthodes d’analyse des expressions faciales, et le choix de celle qui convient le mieux à vos recherches dépendra en grande partie des ressources dont vous disposez et de l’ordre de priorité que vous leur accordez. La meilleure décision que vous puissiez prendre est une décision éclairée. Pour en savoir plus sur les expressions faciales, téléchargez notre guide gratuit ci-dessous.

Références

[1] Sanfey, A.G., Rilling, J.K., Aronson, J.A., Nystrom, L.E., & Cohen, J.D. (2003). Les fondements neuronaux de la prise de décision économique dans le jeu de l’ultimatum. Science, 300, 1755–1758.

[2] Angie, A. D., Connelly, S., Waples, E. P. et Kligyte, V. (2011). L’influence des émotions distinctes sur le jugement et la prise de décision : une revue méta-analytique. Cogn. Emotion, 25 (2011), 1393-1422.

[3] Choi, B. C. K., & Pak, A. W. P. (2005). Répertoire des biais dans les questionnaires. Preventing Chronic Disease, 2, 1-13.

[4] Carroll, J. M. & Russell, J. A. (1996) Les expressions faciales traduisent-elles des émotions spécifiques ? Évaluation des émotions à partir du visage en situation. Journal of Personality and Social Psychology, 70:205–18.

[5] Aviezer H, Trope Y, Todorov A (2012) Ce sont les indices corporels, et non les expressions faciales, qui permettent de distinguer les émotions positives et négatives intenses. Science, 338 : 1225-1229.

[6] Sebe, N., Lew, M.S., Cohen, I., Sun, Y., Gevers, T., Huang, T.S. (2004). Analyse des expressions faciales authentiques. Dans Actes de la Conférence internationale sur la reconnaissance des visages et des gestes, p. 517-522.

[7] Moore, Keith L. ; Dalley, Arthur F. ; Agur, Anne M. R. (2010). Moore’s clinical anatomy. États-Unis : Lippincott Williams & Wilkins.

[8] Gupta, S., Mends, F., Hagiwara, M., Fatterpekar, G., Roehm, P. C. (2013). Imagerie du nerf facial : une revue d’actualité. Radiol Res Pract, 248039 : 1-14.

[9] OpenStax College, CC BY 3.0. Consulté le 24 septembre 2018 à l’adresse : https://commons.wikimedia.org/wiki/File:1421_Sensory_Homunculus.jpg

[10] Behrens, T., Johansen-Berg, H., Woolrich, M., Smith, S., Wheeler-Kingshott, C., Boulby, P., Barker, G., Sillery, E., Sheehan, K., Ciccarelli, O., Thompson, A., Brady, J., Matthews, P. (2003). Cartographie non invasive des connexions entre le thalamus et le cortex humains à l’aide de l’imagerie par diffusion. Nat. Neurosci. 6 (7), 750 – 757.

[11] Oliveri, M., Babiloni, C., Filippi, M. M., Caltagirone, C., Babiloni, F., Cicinelli, P., Traversa, R., Palmieri, M. G. & Rossini, P. M. (2003). Influence de l’aire motrice supplémentaire sur l’excitabilité du cortex moteur primaire lors de mouvements déclenchés par des stimuli visuels neutres ou émotionnellement désagréables. Exp Brain Res, 149, 214–221.

[12] Schmidt, K. L., Ambadar, Z., Cohn, J. F., Reed, L. I. Différences de mouvement entre les expressions faciales délibérées et spontanées : l’action du muscle zygomatique majeur lors du sourire. Journal of Nonverbal Behavior. 2006 ; 30 : 37-52.

[13] Ekman, P., et Friesen, W. V. (1978). Facial Action Coding System : une technique de mesure des mouvements faciaux. Palo Alto, CA : Consulting Psychologists Press.

[14] Hjortsjo, C. H. (1970). Le visage humain et le langage mimique. Malmö, Suède : Nordens Boktryckeri.

[15] Russell, J. A., Fernandez-Dols, J. M. (1997). La psychologie des expressions faciales. Cambridge, MA : Cambridge UP.[/fusion_builder_column][/fusion_builder_row][/fusion_builder_container]