,

Qu'est-ce que l'estimation du regard et comment cela fonctionne-t-il ?

L’estimation du regard permet de déterminer où se porte le regard d’une personne, ce qui est essentiel pour l’oculométrie dans des domaines tels que la psychologie, le marketing et l’interaction homme-machine. Elle s’appuie sur l’anatomie et les mouvements oculaires pour interpréter les états cognitifs et les intentions à partir des schémas visuels, ce qui nécessite des mesures précises pour obtenir des résultats fiables. Les innovations en matière de techniques non invasives et invasives continuent de faire progresser cette technologie, élargissant ainsi ses applications et son importance.

Introduction

L’estimation du regard désigne, par essence, le processus consistant à déterminer où une personne pose son regard – un point de fixation sur un stimulus visuel, qu’il s’agisse d’un écran d’ordinateur, d’une œuvre d’art ou de l’horizon. Dans un monde où les technologies évoluent sans cesse pour déchiffrer les nuances implicites du comportement humain, l’estimation du regard s’impose comme une méthodologie centrale pour l’un des instruments biométriques les plus répandus, à savoir l’oculométrie. Cette capacité subtile mais profonde à discerner le centre de l’attention visuelle est au cœur de la recherche en oculométrie, tissant un réseau d’applications qui s’étend à des domaines aussi variés que la psychologie, le marketing, la santé et l’interaction homme-machine.

L’oculométrie, qui consiste à mesurer soit le point de fixation, soit le mouvement des yeux par rapport à la tête, est intrinsèquement liée à une estimation précise du regard. Les yeux, souvent qualifiés de « miroirs de l’âme », offrent un accès aux processus cognitifs internes, aux états émotionnels et aux intentions de chacun. En comprenant où et comment les yeux se déplacent, les chercheurs et les professionnels peuvent tirer des enseignements sur les schémas d’attention visuelle, le traitement de l’information et même les conditions physiologiques.

L’estimation du regard est essentielle pour transformer les données brutes d’oculométrie en informations pertinentes. La précision avec laquelle nous pouvons estimer le regard influe directement sur la qualité et la fiabilité des résultats de l’oculométrie. Qu’il s’agisse de comprendre l’interaction d’un utilisateur avec un site web ou une application, ou de mettre en lumière les fondements cognitifs des troubles de la lecture, l’estimation du regard est la clé qui pourrait ouvrir la voie à une multitude d’applications.

L’importance de l’estimation du regard est soulignée par sa capacité à rendre les interactions plus intuitives, à créer des expériences plus captivantes et à développer des solutions profondément personnalisées. À mesure que nous avançons dans une ère marquée par les progrès technologiques, l’étude de l’estimation du regard dans le cadre de la recherche sur l’oculométrie devient non seulement importante, mais indispensable.

Cet article a pour objectif d’explorer les subtilités de l’estimation du regard, en examinant ses méthodologies, ses applications et son rôle indispensable dans l’avenir de la recherche sur l’oculométrie. À travers cette analyse, nous souhaitons mettre en lumière la façon dont ce regard silencieux peut en réalité en dire long, comblant ainsi le fossé entre l’observation et la compréhension.

Anatomie et physiologie de l’œil

L’estimation du regard, pierre angulaire de la recherche en eye tracking, repose sur une compréhension approfondie de la physiologie de l’œil humain. Cet organe dynamique est bien plus qu’un simple récepteur passif de lumière ; il joue un rôle actif dans la vision, ce qui est essentiel pour mettre au point des méthodes de suivi précises.

Anatomie et mouvements oculaires : les fondements de l’estimation du regard

L’anatomie de l’œil est complexe, chaque composante jouant un rôle essentiel dans l’estimation du regard. La cornée et le cristallin jouent un rôle essentiel dans la réfraction de la lumière pour former des images sur la rétine, leur courbure et leur clarté ayant un impact sur la qualité des images réfléchies utilisées pour le suivi. La pupille, qui agit comme l’ouverture de l’œil, ajuste sa taille en fonction de l’intensité lumineuse et des états émotionnels, ce qui influence les techniques d’estimation du regard basées sur la pupille. L’iris, qui contrôle la taille de la pupille, contribue à la visibilité et au contraste de celle-ci, éléments cruciaux pour un suivi précis.

Qu'est-ce que l'estimation du regard et comment cela fonctionne-t-il ?

La rétine est une couche complexe de cellules photoréceptrices qui transforment la lumière en signaux électriques. Une petite dépression de la rétine, appelée fovéa, est densément peuplée de cônes et constitue le point de vision le plus net. Le nerf optique, bien qu’il ne participe pas directement à l’estimation du regard, joue un rôle essentiel dans la transmission des informations visuelles au cerveau.

Les mouvements oculaires ont également des implications profondes pour l’estimation du regard. Les saccades, ces mouvements oculaires rapides qui ajustent la ligne de visée, et les fixations, ces moments où l’œil reste immobile, fournissent des indications sur les processus cognitifs et l’attention. La durée des fixations peut être révélatrice de l’engagement cognitif. Les mouvements de poursuite oculaire, qui sont plus lents et permettent de suivre des objets en mouvement, peuvent être influencés par des facteurs tels que l’âge et les troubles neurologiques.

Signaux physiologiques et facteurs externes

La surveillance des signaux physiologiques, tels que la dilatation de la pupille et les clignements des yeux, est essentielle pour estimer le regard. Les variations de la taille de la pupille peuvent indiquer une charge cognitive et une excitation émotionnelle, tandis que la fréquence et la durée des clignements peuvent être révélatrices de fatigue. Les microsaccades, ces minuscules mouvements saccadés qui surviennent pendant les fixations, introduisent du bruit dans les données relatives au regard, mais fournissent également des indices sur la focalisation de l’attention.

Des facteurs externes, tels que la luminosité ambiante, peuvent également influencer la physiologie oculaire et, par conséquent, l’estimation du regard. Le niveau de luminosité ambiante a une incidence sur la taille de la pupille et sur la qualité des reflets utilisés pour le suivi.

Variabilité interindividuelle et considérations sanitaires

La variabilité interindividuelle, notamment les différences de forme et de taille des yeux ainsi que les anomalies de réfraction (telles que la myopie et l’astigmatisme), peut nuire à la précision de l’estimation du regard. De plus, les changements liés à l’âge et certains problèmes de santé, comme la sécheresse oculaire ou les troubles neurologiques, introduisent une variabilité dont il faut tenir compte pour garantir un suivi précis du regard.

Techniques d’estimation du regard

Il existe deux grands types de techniques d’estimation du regard : les techniques non invasives et les techniques invasives. Les techniques invasives consistent à fixer des capteurs sur l’œil ou la tête, tandis que les techniques non invasives ne nécessitent aucun contact physique avec l’utilisateur.

Techniques non invasives d’estimation du regard

  • Méthode de réflexion pupillo-cornéenne :
    • Description : Utilise une caméra et une source lumineuse pour suivre le reflet sur la cornée et le centre de la pupille.
    • Utilisations : Couramment utilisé dans les appareils d'oculométrie destinés à la recherche et aux tests d'ergonomie.
  • Estimation du regard en fonction de l'apparence :
    • Description : Utilise l'apprentissage automatique, souvent l'apprentissage profond, pour estimer la direction du regard en se basant sur l'apparence de la région des yeux.
    • Utilisations : Utilisé dans les applications en temps réel et les environnements de réalité virtuelle.
  • Oculographie infrarouge (IROG) :
    • Description : Utilise la lumière infrarouge pour suivre les mouvements oculaires en comparant l'absorption de la rétine à la réflexion de la sclère.
    • Utilisations : Utilisé dans des environnements sombres ou pour suivre les mouvements oculaires dans le cadre d'études sur le sommeil.
  • Électro-oculographie (EOG) :
    • Description : Mesure le potentiel de repos cornéo-rétinien des yeux, ce qui permet d'estimer la direction du regard.
    • Applications : Utile dans le cadre des études sur le sommeil et des technologies d'assistance.
  • Suivi des mouvements oculaires dans une vidéo :
    • Description : Analyse des séquences vidéo pour suivre les mouvements oculaires et estimer la direction du regard.
    • Applications : Utilisé dans le domaine de l'interaction homme-machine et de la recherche comportementale.
  • Suivi oculaire à distance :
    • Description : Ce système utilise des caméras spécialisées placées à distance pour suivre les mouvements oculaires sans aucun contact avec le participant.
    • Utilisations : Utilisé dans des environnements de grande envergure ou de type naturel.
  • Estimation du regard à l'aide d'appareils portables :
    • Description : Utilise des lunettes connectées ou des appareils portables similaires équipés de caméras pour estimer la direction du regard.
    • Applications : suivi du regard en conditions réelles et en déplacement.
  • Techniques d'étalonnage en un point :
    • Description : Le participant doit fixer un point précis pour l'étalonnage avant que la direction du regard ne soit estimée.
    • Utilisations : Idéal pour les configurations rapides dans le domaine de la recherche et des jeux vidéo.

Techniques d’estimation du regard envahissant (principalement utilisées dans la recherche sur les primates)

  • Technique de la bobine implantée :
    • Description : Cette technique consiste à implanter chirurgicalement une bobine dans l'œil afin de suivre les mouvements oculaires à l'aide de champs magnétiques.
    • Utilisations : Principalement utilisé dans la recherche animale en raison de son caractère invasif.
  • Électroencéphalographie intracrânienne (iEEG) avec estimation du regard :
    • Description : Associe des données EEG intracrâniennes à l'oculométrie afin de comprendre l'activité neuronale liée aux mouvements du regard.
    • Applications : Utilisé dans la recherche de pointe en neurosciences.
  • Enregistrements par microélectrode :
    • Description : Cette technique consiste à implanter des microélectrodes dans les zones du cerveau chargées du traitement visuel afin d'étudier le regard.
    • Utilisations : Souvent utilisé dans les études sur les primates et dans certains cas cliniques.
  • Optogénétique invasive avec estimation du regard :
    • Description : Associe la modification génétique à la lumière pour contrôler et surveiller les neurones impliqués dans les mouvements oculaires.
    • Utilisations : Principalement utilisé dans la recherche animale.
  • Enregistrements par électrode sous-durale :
    • Description : Permet de placer des électrodes à la surface du cerveau afin d'étudier la relation entre l'activité neuronale et la direction du regard.
    • Utilisations : Utilisé en milieu hospitalier pour les patients sous surveillance dans le cadre d'un traitement contre l'épilepsie.

Les techniques d’estimation du regard, qu’elles soient invasives ou non invasives, présentent chacune des avantages et des applications spécifiques. Si les méthodes non invasives sont plus couramment utilisées en raison de leur simplicité et pour des raisons éthiques, les méthodes invasives permettent quant à elles de mieux comprendre les mécanismes neuronaux. 

Comment estimer le regard (à l’aide de méthodes non invasives)

Le calcul de l’estimation du regard consiste à déterminer le point de fixation, c’est-à-dire l’endroit où une personne regarde sur un stimulus visuel, en se basant sur les caractéristiques de ses yeux. Plusieurs méthodes et techniques ont été mises au point pour calculer l’estimation du regard, allant des modèles géométriques aux approches d’apprentissage automatique.

Modèles géométriques :

a. Méthode de réflexion pupillo-cornéenne :

  • Étape 1 : Dirigez un faisceau infrarouge vers l'œil et capturez l'image à l'aide d'une caméra d'oculométrie.
  • Étape 2 : Localisez le centre de la pupille et le reflet de la lumière infrarouge sur la cornée.
  • Étape 3 : Calculez le vecteur reliant ces deux points.
  • Étape 4 : À partir de paramètres connus, tels que la distance entre la caméra et l'œil et la géométrie de l'œil, calculez le point de regard sur l'écran.

b. Méthodes basées sur des modèles 3D :

  • Étape 1 : Créez un modèle 3D de l'œil, comprenant la cornée, la pupille et le cristallin.
  • Étape 2 : Extraire de l'image des caractéristiques telles que le centre de la pupille.
  • Étape 3 : Repérez les éléments 2D sur le modèle 3D afin de déterminer la ligne de visée.
  • Étape 4 : Calculez l'intersection entre la ligne de visée et l'écran pour déterminer le point de regard.

Méthodes basées sur l’apparence :

a. Modèles d’apprentissage automatique :

  • Étape 1 : Extraire des caractéristiques telles que les images des yeux, la position de la tête et l'emplacement des pupilles.
  • Étape 2 : Entraîner un modèle d'apprentissage automatique (par exemple, machines à vecteurs de support, réseaux neuronaux) à l'aide de données étiquetées qui associent les caractéristiques extraites à des points de regard connus.
  • Étape 3 : Utilisez le modèle entraîné pour prédire le point de regard à partir de nouvelles données d'entrée.

b. Modèles d’apprentissage profond :

  • Étape 1 : Introduire directement les images des yeux dans un modèle d'apprentissage profond, tel qu'un réseau neuronal convolutif (CNN).
  • Étape 2 : Le modèle apprend à prédire directement le point de regard à partir de l'image de l'œil, sans extraction explicite de caractéristiques.
  • Étape 3 : Une fois qu'il dispose d'une quantité suffisante de données d'entraînement, le modèle est capable de généraliser ses résultats pour prédire avec précision les points de regard dans différents scénarios.

Méthodes hybrides :

a. Combinaison de méthodes géométriques et de méthodes basées sur l’apparence :

  • Étape 1 : Utiliser à la fois les informations géométriques (comme la position de la pupille) et les informations d'apparence (comme l'image globale de l'œil).
  • Étape 2 : Fusionner ces points de données afin d'améliorer la précision et la fiabilité de l'estimation du regard.

Étalonnage :

Quelle que soit la méthode utilisée, un étalonnage est souvent nécessaire pour améliorer la précision. Cela implique que l’utilisateur observe des points connus à l’écran et que les paramètres du modèle d’estimation du regard soient ajustés en conséquence.

Apprentissage profond et estimation du regard

Ces dernières années, l’apprentissage profond a révolutionné le domaine de l’estimation du regard. Les modèles d’apprentissage profond sont capables d’apprendre les relations complexes entre l’image d’entrée et la direction du regard, ce qui permet d’obtenir des estimations précises et fiables du regard.

L’apprentissage profond, une branche de l’apprentissage automatique, s’appuie sur des réseaux neuronaux pour apprendre et s’améliorer automatiquement à partir de l’expérience, sans être explicitement programmé. Ce paradigme est particulièrement adapté à l’estimation du regard, qui consiste à prédire le point de fixation sur un stimulus à partir de caractéristiques oculaires.

Les techniques traditionnelles d’estimation du regard nécessitent parfois un étalonnage approfondi et peuvent ne pas s’adapter facilement à différents environnements et individus. En revanche, les méthodes basées sur l’apprentissage profond exploitent la puissance des grands ensembles de données pour améliorer leur précision et leur robustesse. Ces méthodes recourent souvent aux réseaux neuronaux convolutifs (CNN), une catégorie de réseaux neuronaux profonds particulièrement adaptés à l’analyse d’images.

Les réseaux neuronaux convolutifs (CNN) peuvent extraire automatiquement des caractéristiques hiérarchiques à partir d’images brutes de la région oculaire, simplifiant ainsi le problème de l’estimation du regard. Par exemple, un CNN peut apprendre à reconnaître des motifs correspondant à la position et à la forme de la pupille, à l’état des paupières et à l’emplacement des coins des yeux, qui sont ensuite utilisés pour estimer la direction du regard. 

L’un des principaux avantages de l’utilisation de l’apprentissage profond pour l’estimation du regard réside dans sa capacité à réduire le besoin d’un étalonnage approfondi. Certains modèles peuvent être entraînés à partir de données provenant de plusieurs personnes, ce qui leur permet de généraliser leurs résultats à différents utilisateurs et environnements. De plus, ces méthodes sont capables d’apprendre de manière adaptative à partir de nouvelles données, améliorant ainsi en permanence la précision de leurs estimations.

L’apprentissage profond révolutionne l’estimation du regard en automatisant l’extraction des caractéristiques et en réduisant les besoins en étalonnage. Grâce à l’utilisation de réseaux neuronaux sophistiqués, les chercheurs et les professionnels peuvent développer des systèmes d’estimation du regard plus précis, plus conviviaux et plus adaptatifs, ce qui contribue à faire progresser des domaines tels que l’interaction homme-machine, la psychologie et les technologies d’assistance.

Applications de l’estimation du regard

L’estimation du regard, et par extension l’oculométrie, trouve des applications dans diverses disciplines, apportant de nouvelles dimensions en matière d’interaction, d’analyse et de compréhension. Voici une liste exhaustive des domaines d’application :

Interaction homme-machine (IHM) :

  • Commande par le regard : permet la navigation et le contrôle mains libres des interfaces numériques.
  • Claviers virtuels : aider les personnes en situation de handicap physique à taper au clavier ou à communiquer.
  • Systèmes sensibles au regard : adaptation dynamique du contenu en fonction de la direction du regard de l'utilisateur.

Technologies de la santé et d’assistance :

  • Communication augmentative et alternative (CAA) : aider les personnes souffrant de troubles graves de la parole et de la motricité à communiquer.
  • Évaluation des troubles neurologiques : analyse des schémas de regard pour le diagnostic précoce de troubles tels que l'autisme, le TDAH et la maladie de Parkinson.
  • Rééducation : utilisation de jeux et d'activités commandés par le regard pour la rééducation motrice.

Psychologie et sciences cognitives :

  • Études sur l'attention et la perception : comprendre les processus cognitifs grâce à l'analyse des schémas de regard.
  • Recherche sur la lecture et le langage : étude des schémas de lecture, de la compréhension du langage et de la dyslexie.
  • Tests d'ergonomie : évaluation de l'engagement et de l'expérience des utilisateurs vis-à-vis de produits ou d'interfaces.

Marketing et publicité :

  • Études sur l'engagement des consommateurs : analyse des éléments des publicités, des sites web ou des rayons de magasin qui attirent l'attention.
  • Études sur le comportement des consommateurs : évaluation de l'efficacité de l'emballage et de la présentation des produits.

Automobile et transports :

  • Systèmes de surveillance du conducteur : détection de la somnolence et de la distraction, et garantie de la vigilance du conducteur pour une conduite en toute sécurité.
  • Commande du système d'infodivertissement embarqué : permet aux conducteurs d'interagir avec les systèmes embarqués à l'aide de mouvements oculaires.

Jeux vidéo et réalité virtuelle (RV) :

  • Jeux immersifs : améliorer l'expérience de jeu grâce à l'intégration d'interactions basées sur le regard.
  • Navigation en réalité virtuelle : permettre la navigation et l'interaction par le regard dans les environnements virtuels.

Éducation et apprentissage :

  • Systèmes d'apprentissage adaptatif : personnalisation de la diffusion des contenus en fonction des priorités et des centres d'intérêt de l'élève.
  • Diagnostic des troubles d'apprentissage : identification des difficultés d'apprentissage grâce à l'analyse des schémas de regard.

Divertissement et médias :

  • Installations artistiques interactives : créer des œuvres d'art dynamiques qui réagissent au regard des spectateurs.
  • Test de films et de contenus : évaluation de l'engagement et de l'intérêt des spectateurs pour les contenus médiatiques.

Aérospatiale et défense :

  • Formation des pilotes : suivi du regard pour évaluer la conscience situationnelle et la prise de décision lors de simulations.
  • Commande à distance des drones : utilisation du regard pour améliorer les interfaces de commande des drones.

Robotique sociale et systèmes humanoïdes :

  • Interaction homme-robot : améliorer le caractère naturel des interactions entre les humains et les robots grâce à des réactions tenant compte du regard.
  • Reconnaissance des gestes : intégration des données relatives au regard pour améliorer la compréhension du contexte.

Sport et entraînement de haut niveau :

  • Évaluation des compétences : analyse des schémas de regard pour évaluer et améliorer les performances des athlètes.
  • Entraînement à la concentration : utilisation de l'oculométrie pour améliorer la capacité à se concentrer.

Conclusion

L’œil humain, avec son anatomie et sa physiologie complexes, constitue la base sur laquelle repose l’estimation du regard. En étudiant les reflets cornéens, la dynamique pupillaire et les mouvements oculaires, les scientifiques ont mis au point toute une série de méthodes permettant de déterminer le point focal du regard d’un sujet avec une précision croissante.

Les progrès réalisés dans le domaine des modèles computationnels, notamment l’intégration de l’apprentissage automatique et de la vision par ordinateur, ont considérablement amélioré la précision de l’estimation du regard. Ces avancées permettent une compréhension plus fine de l’attention visuelle et, par extension, de la cognition et du comportement humains. La science de l’estimation du regard fait partie intégrante de l’évolution de disciplines allant de la psychologie au comportement des consommateurs, offrant des perspectives qui étaient autrefois inaccessibles.

Les implications pratiques sont nombreuses. Dans la conception d’interfaces utilisateur, l’estimation du regard permet de créer des systèmes adaptatifs qui réagissent aux signaux d’attention visuelle. En matière d’accessibilité, elle offre de nouvelles façons d’interagir avec la technologie aux personnes souffrant de troubles moteurs. Dans le domaine de la santé, elle pourrait faciliter le diagnostic et le suivi de diverses pathologies.

À mesure que les technologies d’estimation du regard gagnent en sophistication, la précision et la fiabilité des données d’oculométrie s’améliorent. Cette avancée est essentielle pour le développement de systèmes et d’applications qui reposent sur une interprétation fidèle des schémas de regard. Cependant, cette méthodologie doit également faire face à des défis tels que la variabilité individuelle de la physiologie oculaire et des facteurs externes comme les conditions d’éclairage.

En résumé, l’estimation du regard est une pratique qui se caractérise par une analyse minutieuse du comportement oculaire, traduisant les mouvements subtils de l’œil en données exploitables. Les progrès réalisés dans ce domaine promettent d’affiner la symbiose entre l’homme et la technologie, garantissant ainsi que, lorsque nous nous tournons vers l’avenir, notre regard soit accueilli avec compréhension. L’évolution de l’estimation du regard laisse entrevoir un champ de possibilités inexploitées, qui ne demande qu’à être exploré à mesure que nous continuons à innover et à intégrer l’oculométrie dans divers aspects de la vie et du travail.

Eye Tracking Glasses

The Complete Pocket Guide

  • 35 pages of comprehensive eye tracking material
  • Technical overview of hardware
  • Learn how to take your research to the next level
,