Comment réaliser une analyse des expressions faciales à distance

Nous traversons actuellement une période d’incertitude sans précédent dans notre histoire. Dans le contexte actuel, les chercheurs s’unissent pour mettre au point des solutions innovantes permettant de mener des recherches à distance. Parallèlement, les services de visioconférence tels que Zoom et Google Meet connaissent un essor fulgurant, attirant de nouveaux utilisateurs à mesure que les entreprises transfèrent leurs activités en ligne.

Bien que la plupart des tests en présentiel soient temporairement suspendus, une option viable pour poursuivre la recherche sur les biocapteurs consiste à exploiter le post-traitement des données relatives aux expressions faciales. iMotions intègre les meilleurs outils d’analyse des expressions faciales (FEA) disponibles sur le marché. Dans cet article, nous avons mis en avant l’utilisation du moteur d’Affectiva, AFFDEX. Affectiva mesure de manière discrète les expressions faciales d’émotions non filtrées et impartiales, en utilisant simplement une webcam standard. Cette technologie permet aux chercheurs d’observer l’expressivité faciale pendant les tests en direct ou d’effectuer des analyses a posteriori.

Face of a girl with facial coding dots

Qu’est-ce que le post-traitement des expressions faciales ?

Avec iMotions, il est possible d’importer dans le logiciel des vidéos préenregistrées des visages des participants et de les traiter afin d’analyser les émotions exprimées à l’aide d’une technologie automatisée d’analyse des expressions faciales. Que ce soit au niveau individuel ou en groupe, les visages individuels peuvent être identifiés et analysés a posteriori. Cette fonctionnalité permet aux chercheurs non seulement d’effectuer une analyse des expressions faciales sur des vidéos nouvellement enregistrées, mais aussi de réexaminer le contenu préexistant dans leurs bases de données pour une analyse plus approfondie. Ce flux de données peut constituer un atout majeur pour une multitude d’initiatives de recherche en nous fournissant des informations sur l’impact émotionnel d’un contenu, d’un produit ou d’un service donné.

Exemples d’analyse des expressions faciales : cas d’utilisation

L’analyse des expressions faciales (FEA) peut être utilisée pour soutenir divers projets de recherche. Parmi les méthodologies existantes, on peut citer :

  • Tests d'ergonomie (recherche en expérience utilisateur)
  • Groupes de discussion
  • Entretiens individuels

À lire : La recherche en expérience utilisateur : qu’est-ce que c’est et quelle est son évolution ?

L’intégration de l’analyse des sentiments (FEA) dans les entretiens et les groupes de discussion à distance peut fournir des informations précieuses sur les opinions, les émotions exprimées et les comportements des participants vis-à-vis d’un produit ou d’un contenu qui les intéresse. Nous avons constaté que ces techniques de recherche étaient mises à profit dans divers secteurs et domaines d’application, tels que :

Tests d’expérience utilisateur : comment les utilisateurs réagissent-ils à une expérience numérique donnée ?

  • Quels sont les processus ou les fonctionnalités d'une application susceptibles de susciter le plus de frustration ou de confusion ?
  • Comment les étudiants s'impliquent-ils dans le contenu des cours et les cours magistraux en ligne ?
  • La pédagogie utilisée correspond-elle aux attentes des élèves ? La conception pédagogique est-elle facile à suivre ?

Étude des médias et de la publicité : en quoi l’engagement et les émotions exprimées varient-ils selon les différentes créations ?

  • La nouvelle campagne publicitaire est-elle mieux accueillie par le public que l'ancienne ?
  • Les moments clés d'un contenu parviennent-ils à toucher les spectateurs ?

Interactions interpersonnelles : comment les individus réagissent-ils à certaines interactions virtuelles ?

  • Existe-t-il des moyens d'améliorer l'efficacité des interactions entre les patients et les médecins dans le cadre de la télésanté ?
  • En quoi le ton employé par le médecin influence-t-il l'état émotionnel du patient lors d'une consultation ?

Pour en savoir plus sur les possibilités de recherche à distance et leurs applications concrètes, regardez notre webinaire GRATUIT intitulé « La recherche à distance avec iMotions : analyse des expressions faciales et codage comportemental ».

Comment analyser les expressions faciales à partir de vidéos

La collecte et le traitement à distance des données relatives aux expressions faciales peuvent s’effectuer assez facilement. Dans le cadre de notre exemple, nous avons présenté des vidéos de contenu marketing aux employés d’iMotions afin de déterminer lesquelles susciteraient le plus d’intérêt chez les clients. Alors que certains vétérans de l’entreprise sont impatients d’abandonner l’ancienne vidéo de présentation, l’équipe souhaite tester toutes les vidéos avant de lancer la campagne.

Image du groupe FEA

Un groupe composé de collaborateurs d’iMotions a été constitué. Les participants ont pris part à un appel vidéo à distance au cours duquel ils ont visionné les trois vidéos et ont répondu à des questions complémentaires sur leur contenu. À l’issue de la projection, un entretien individuel a été mené avec un volontaire issu de l’échantillon.

Exemple de vidéo FEA
Résultats de la simulation par éléments finis (FEA)

Parmi ces trois vidéos, la nouvelle vidéo explicative (2) s’est démarquée en tête des classements dans les données issues des auto-évaluations concernant la qualité de l’information et la clarté, suivie de près par la vidéo sur les intégrations des partenaires (3). L’ancienne vidéo explicative (1), en revanche, a obtenu des notes relativement plus faibles. Ces données corroborent l’hypothèse selon laquelle la nouvelle vidéo explicative serait mieux accueillie par les consommateurs que l’ancienne.

Résultats des essais par analyse par éléments finis

Les données relatives aux expressions faciales apportent une dimension unique au récit. Bien qu’elle soit peu bien notée, l’ancienne vidéo explicative suscite le plus d’engagement facial chez les spectateurs. Cependant, ceux-ci passent une grande partie de ce temps à afficher des expressions négatives, fronçant les sourcils plus de cinq fois plus souvent lorsqu’ils regardent l’ancienne vidéo explicative par rapport à la nouvelle. Ces données indiquent que l’ancienne vidéo pourrait présenter certaines difficultés. En comparaison, les spectateurs affichent une faible expressivité générale pour la vidéo sur les intégrations des partenaires. Ces deux vidéos – la vidéo 1 et la vidéo 3 – ne suscitent peut-être pas un engagement positif chez les spectateurs.

Lorsqu’on lui a demandé si elle aurait regardé toutes les vidéos jusqu’au bout si elle était tombée dessus par hasard, notre bénévole a indiqué qu’elle préférait la nouvelle vidéo. Elle explique : « J’aurais quitté certaines d’entre elles… comme les vidéos 1 et 3. »

Interface FEA d'iMotions

« J’ai préféré la deuxième vidéo parce que… elle donnait plus d’informations sur la plateforme que la troisième et présentait le logiciel lui-même, contrairement à la première. Elle était un peu plus détaillée. »

La nouvelle vidéo explicative trouve un bon équilibre entre les avis positifs exprimés par les spectateurs et les émotions manifestées. Les spectateurs jugent le contenu clair et instructif, et les données sur les expressions faciales montrent qu’ils sont captivés, tout en ne présentant qu’un faible niveau de froncement de sourcils et d’autres expressions négatives pouvant indiquer de la frustration ou de la confusion. Ainsi, alors que l’ancienne vidéo explicative animée a peu de chances de trouver un écho auprès d’un public pour lequel le produit et le message sont pertinents sur le plan personnel, la vidéo d’intégration des partenaires ne suscite pas d’engagement émotionnel et risque de ne pas provoquer de réaction forte. Ces données indiquent que, dans l’ensemble, la nouvelle vidéo explicative, avec une meilleure qualité de production et un message plus clair, est la mieux accueillie par le public.

En effet, ce sentiment se reflète dans les données de notre groupe, et les expressions faciales des spectateurs peuvent nous aider à en comprendre les raisons. Nos spectateurs ont indiqué ne pas trouver l’ancienne vidéo explicative particulièrement instructive, et nous observons une augmentation significative des froncements de sourcils chez le public pendant le visionnage de la vidéo. Cela nous laisse penser que l’ancienne vidéo explicative peut prêter à confusion pour les spectateurs, en particulier lorsqu’elle utilise un jargon désinvolte, comme dans l’exemple illustré ci-dessous. Ici, le narrateur déclare : « passez plus de temps à conclure qu’à faire de la plomberie ». Le message clé souhaité n’est peut-être pas clair pour les spectateurs, car l’analogie avec la « plomberie » n’est peut-être pas bien comprise.

FEA_expressions_des_sourcils
Le fait que les spectateurs froncent les sourcils à ce moment-là laisse penser que la vidéo pourrait prêter à confusion 

D’autre part, tant la nouvelle vidéo explicative que la vidéo d’intégration obtiennent des notes favorables dans les évaluations subjectives pour leur clarté et leur caractère informatif. Là encore, l’expressivité faciale peut aider à nuancer notre décision : bien que les deux vidéos soient perçues comme efficaces, la nouvelle vidéo explicative suscite un engagement facial global plus élevé, ce qui pourrait indiquer que le public est plus « à l’écoute » lorsqu’il regarde cette vidéo. Dans les cas où différents stimuli reçoivent des notes auto-évaluées similaires (favorables ou défavorables !), les expressions faciales peuvent être un moyen utile de départager les candidats et de déterminer quelle vidéo a le plus capté l’attention des spectateurs.

Remarque : pour obtenir des informations quantitatives, nous pouvons recommander un échantillon plus large afin de tenir compte de facteurs tels qu’un mauvais éclairage dans les logements, des angles de prise de vue défavorables, des problèmes techniques, etc. Cela offre une certaine souplesse au chercheur, car cela permet d’obtenir une répartition géographique. Ces outils peuvent également être utilisés à des fins qualitatives. Toutefois, dans le cadre de cette démonstration, nous utilisons nos cinq employés pour représenter un échantillon complet de téléspectateurs.

 7 conseils pour obtenir des données d’analyse des expressions faciales de haute qualité

Lors de la collecte et de l’analyse à distance des données relatives aux expressions faciales, il est important de suivre les étapes nécessaires pour garantir une configuration de qualité.

Comme pour toute collecte de données à caractère personnel, veillez à ce que vos participants soient informés de la nature de la recherche et donnent leur consentement avant la collecte.

2. La boîte à visage du participant doit être de taille appropriée

Quel que soit le contexte d’enregistrement, le visage filmé doit être suffisamment visible pour que l’algorithme puisse le reconnaître et le traiter correctement. Si vous utilisez une plateforme vidéo telle que Zoom, nous vous recommandons de ne pas dépasser six participants par enregistrement vidéo.

3. Le visage du participant doit être bien éclairé

Le visage des participants ne doit pas être surexposé ni se trouver à contre-jour par rapport à une autre source de lumière. Il convient d’informer les participants des conditions d’enregistrement appropriées et de leur demander de régler leur webcam en conséquence avant le début de l’enregistrement.

4. Le visage du participant doit être centré et bien visible

Les participants doivent s’asseoir près de la webcam et regarder l’écran principal (et non un écran secondaire). Ils doivent également veiller à ce que leur arrière-plan soit sobre, c’est-à-dire sans éléments en mouvement ni filtres de fond vert.

5. Le son est clair et audible

Si les stimuli sont accompagnés d’un enregistrement audio, les animateurs doivent s’assurer que tous les participants ont désactivé leur micro et qu’ils peuvent entendre le son du contenu avant de lancer la diffusion.

6. Pour les stimuli vidéo, créez une compilation afin d’assurer une présentation plus fluide

La diffusion de plusieurs stimuli vidéo est plus efficace lorsque ceux-ci ont été montés ensemble pour former une seule et même « séquence ». Cela peut être réalisé à l’aide de n’importe quel logiciel de montage. Nous recommandons de laisser un espace vide au début de la vidéo (5 à 10 secondes) et quelques secondes entre chaque vidéo (environ 3 secondes) afin de permettre aux participants de s’adapter.

7. Il n’est pas recommandé d’enregistrer des vidéos à distance sur un téléphone

Lors de l’enregistrement d’une vidéo à distance, veillez à ce que les participants utilisent un ordinateur plutôt qu’un appareil mobile. En cas d’appel et d’enregistrement sur un téléphone, l’éclairage et les angles peuvent varier considérablement, ce qui peut nuire à la qualité de l’enregistrement et à l’analyse du visage.

Nous sommes impatients de découvrir les façons originales dont vous avez mis à profit les technologies de travail à distance dans le cadre de vos recherches. Si vous souhaitez en savoir plus, n’hésitez pas à nous contacter. 

Auteurs ayant contribué à cet article :

linkedin_logo_iconAshton Therrien


Get Richer Data

About the author


See what is next in human behavior research

Follow our newsletter to get the latest insights and events send to your inbox.