Vergleich von Eye-Tracking-Methoden für die Ergonomieforschung. Entdecken Sie anhand einer vergleichenden Analyse die optimalen Eye-Tracking-Techniken für ergonomische Studien. Erfahren Sie mehr über die Vorteile und Grenzen verschiedener Eye-Tracking-Methoden, die in der Ergonomieforschung zum Einsatz kommen. Treffen Sie fundierte Entscheidungen bei der Auswahl des am besten geeigneten Eye-Tracking-Ansatzes, um Ihre Forschungsergebnisse effektiv zu verbessern.

Die Grenzen des Menschen verstehen: Die Rolle der Human-Factors-Forschung

Wir sind auch nur Menschen.

Dieser Satz fasst viele Erkenntnisse zusammen, die uns intuitiv bewusst sind: dass wir Menschen keine rein rationalen Wesen sind. Dass unsere Aufmerksamkeitsspanne und unsere Belastbarkeit begrenzt sind. Dass wir dazu neigen, Fehler zu machen und uns ablenken zu lassen.

Die Forschung im Bereich der Human Factors konzentriert sich auf diese Prämisse und zielt darauf ab, die Fähigkeiten und Grenzen des Menschen innerhalb eines Systems zu verstehen sowie Wege zu ergründen, wie wir je nach Kontext die menschliche Leistungsfähigkeit, Gesundheit oder Sicherheit optimieren können.

Die Forschung zu menschlichen Faktoren kann sich mit so einfachen Fragen befassen wie der Optimierung einer Computerschnittstelle zur Rationalisierung eines Arbeitsprozesses, aber auch mit so komplexen Themen wie der Analyse der Dynamik von Mensch-Roboter-Teams in einer Fabrik oder den Entscheidungsprozessen von Kampfpiloten im Einsatz.

Forscher im Bereich Human Factors nutzen eine Vielzahl von Instrumenten, um diese Fragen zu untersuchen. Häufig kommen Standardfragebögen zum Einsatz; ein Beispiel hierfür ist ein Fragebogen, mit dem die subjektiv empfundene mentale Arbeitsbelastung in Teamdynamiken erfasst werden kann. Daneben gibt es Standardforschungsparadigmen wie das MATB-II der NASA, das eine standardisierte Aufgabenbatterie zur Bewertung von Leistung und Arbeitsbelastung bereitstellt. Doch wie wir hier bei iMotions wissen, stößt die Selbsteinschätzung an ihre Grenzen.

Der Einsatz physiologischer Messverfahren und Biosensoren in der Verhaltensforschung ist im Bereich der Human Factors nichts Neues – in der Fachliteratur finden sich zahlreiche Studien, in denen Instrumente wie Eye-Tracking, Mimikanalyse, EEG, EMG, EDA und EKG zur Ergänzung traditioneller Forschungsansätze genutzt werden ^[3–6].

Insbesondere Eye-Tracking ist eine beliebte Methode, da das Verständnis der visuellen Aufmerksamkeit entscheidend ist, um die Fähigkeit zur Verarbeitung wichtiger visueller Informationen aus der Umgebung zu bewerten. Allerdings gibt es viele verschiedene Arten von Eye-Trackern. Wie soll man sich also für ein geeignetes Tool entscheiden?

Um diese Frage zu beantworten, haben wir eine interne Machbarkeitsstudie durchgeführt, in der wir drei Eye-Tracking-Verfahren verglichen haben: bildschirmbasiertes Eye-Tracking, Eye-Tracking-Brillen und ferngesteuertes Eye-Tracking per Webcam. Wir haben eine einfache und leicht übertragbare Aufgabe – das Stapeln von Bauklötzen – verwendet, um die Stärken und Schwächen dieser verschiedenen Eye-Tracking-Konfigurationen zu bewerten.

Methoden

Für diese Studie wurden 12 Teilnehmer rekrutiert und auf drei Versuchsbedingungen aufgeteilt, jeweils eine pro Eye-Tracking-Konfiguration (somit 4 Teilnehmer pro Gruppe). Für unsere bildschirmbasierte Aufgabe ließen wir die Teilnehmer ein frei verfügbares Bauklötzespiel spielen, während ihre Augenbewegungen mit einem 60-Hz-Smart-Eye-AI-X aufgezeichnet wurden. Die Teilnehmer der Webcam-basierten Eye-Tracking-Bedingung spielten dasselbe Spiel, wobei ihre Augen jedoch über eine Webcam und unter Verwendung des Webcam-basierten Eye-Tracking-Algorithmus von iMotions aufgezeichnet wurden. Die Teilnehmer der Eye-Tracking-Brillen-Bedingung erhielten physische Bausteine als reales Analogon zum bildschirmbasierten Bausteinspiel. Wir verwendeten zudem Webcams, um die Gesichtsausdrücke der Teilnehmer während der Aufgabe aufzuzeichnen.

In unserer Machbarkeitsstudie haben wir drei Fragen gestellt, die alle in einer Übersichtstabelle am Ende dieses Artikels zusammengefasst sind. Erstens: Wie schnitten die drei Aufbauten hinsichtlich Benutzerfreundlichkeit und Datengenauigkeit im Vergleich ab? Zweitens: Inwieweit sind die Daten aus den verschiedenen Aufbauten vergleichbar? Drittens: Inwieweit sind die Gesichtsausdrücke in den drei Aufbauten vergleichbar?

Genauigkeit, Skalierbarkeit und ökologische Validität

Bei der bildschirm- und der webkamera-basierten Eye-Tracking-Methode gab es einen deutlichen Kompromiss zwischen Genauigkeit und Skalierbarkeit. Während erstere genaue Daten liefert, erfordert sie ein ressourcenintensives Labor; letztere bietet einfache Skalierbarkeit bei deutlich geringerer Genauigkeit. Die Eye-Tracking-Brille wies aufgrund ihres größeren Sichtfelds zudem eine als gut empfundene Genauigkeit auf.

Was die ökologische Validität betrifft, so ermöglicht das webcam-basierte Eye-Tracking den Teilnehmern, bildschirmgestützte Studien bequem von zu Hause aus durchzuführen. Die Brillenkonfiguration hingegen erlaubt es den Teilnehmern, mit den Bausteinen zu interagieren, was eine andere, wohl höhere ökologische Validität mit sich bringt. Während beide bildschirmgestützten Studien leicht zu analysieren sind, verlängert sich der Zeitaufwand für die Analyse erheblich, wenn den Teilnehmern die völlige Freiheit gegeben wird, eine motorische Aufgabe so auszuführen, wie sie es normalerweise tun würden.

Kompatibilität von Kennzahlen

Eine häufige Sorge von Forschern ist, ob die Messgrößen der Prozesse, die man erfassen möchte, in verschiedenen Konstellationen vergleichbar sind. In unserem Fall bedeutete dies, die Frage zu stellen: „Verbringen die Teilnehmer gleich viel Zeit auf dem Brett, auf dem sie bauen, unabhängig davon, ob der Prozess auf dem Bildschirm oder mit tatsächlichen Bausteinen stattfindet?“

In allen drei Studien haben wir Bereiche von Interesse rund um den unteren Rand der Tafel definiert. Die Analyse ergab eine vergleichbare Gesamtverweildauer (~47 % der Zeit) auf dem unteren Rand der Tafel, sowohl bei der Brillen- als auch bei der bildschirmbasierten Eye-Tracking-Untersuchung. Das bedeutet, dass die Probanden in unserer kleinen Studie sowohl in der bildschirmbasierten als auch in der ökologisch valideren Brillenstudie etwa 47 % ihrer Zeit damit verbrachten, auf den unteren Rand der Tafel zu blicken.

Bei der Variante mit webkamera-basiertem Eye-Tracking war die Verweildauer deutlich geringer (~22 %). Die folgenden Heatmaps spiegeln die für webET typische Variabilität der Daten wider und lassen vermuten, dass viele der tatsächlichen Fixationen auf der Bauplatte möglicherweise zu verrauscht waren und außerhalb des definierten Untersuchungsbereichs lagen.

Heatmap und Fokusbereiche bei bildschirmbasiertem (oben) im Vergleich zu webkamera-basiertem (unten) Eye-Tracking, die den Kompromiss zwischen Genauigkeit und Skalierbarkeit veranschaulichen.

Mimik in verschiedenen Situationen

Die Teilnehmer zeigten die stärkste Mimik in der Brillenbedingung, in der der Versuchsleiter mit ihnen interagierte. Die Probanden lächelten zudem häufiger, wenn der Versuchsleiter anwesend war, und runzelten eher die Stirn – wahrscheinlich ein Zeichen von Konzentration –, wenn sie die Aufgabe online, im Labor oder zu Hause ausführten. Dies unterstreicht, wie wichtig es ist, den richtigen Biosensor für Ihre Forschungsfrage auszuwählen und Ihre Eye-Tracking-Studie entsprechend zu ergänzen.

Ein Vergleich der verschiedenen Konfigurationen:

	SBET-Bedingung	Zustand der Brille	WebET-Bedingung
Genauigkeit	Hohe Genauigkeit	Geringere Genauigkeit, größeres Sichtfeld	Geringste Genauigkeit
Analysetiefe	Kleinere AOIs (z. B. auf Blöcken) sind möglich	Längere Analysezeit für die dynamische Verfolgung aller AOIs	Empfohlen bei größeren AOIs, um Genauigkeitsfehler auszugleichen
Ökologische Validität	Kontrollierte Umgebung	Hohe ökologische Validität	Höhere ökologische Validität, beschränkt auf ein Screening
Skalierbarkeit	Die Datenerhebung ist zeitaufwendig	Die Erfassung und Auswertung ist zeitaufwendig.	Leicht skalierbar
FEA	Lässt sich problemlos integrieren	von Bewegungen beeinflusst	Lässt sich problemlos integrieren
Integration mit anderen Sensoren	Integration mit GSR, EMG, EKG und EEG möglich	Einfach zu integrieren mit GSR, EKG, EMG	Auf der Online-Plattform nicht möglich
Kostenwirksamkeit	Erfordert spezielle Hardware und fachspezifische Ressourcen	Erfordert spezielle Hardware und fachspezifische Ressourcen	Webcam-basiert. Minimaler Personalaufwand.

Zusammenfassend lässt sich sagen, dass jede Konfiguration ihre Vor- und Nachteile hat. Einige bieten eine höhere ökologische Validität, andere ermöglichen es Ihnen, Ihre Forschung zu skalieren, wieder andere bieten eine höhere Genauigkeit, und jede unterscheidet sich hinsichtlich ihrer Benutzerfreundlichkeit. Je nach Ihrem Forschungsdesign und dem Umfang Ihrer Studie bietet iMotions eine Reihe flexibler Lösungen zur Optimierung Ihres Arbeitsablaufs. Kontaktieren Sie uns, um die für Sie passende Lösung zu finden.

Literaturverzeichnis

Sellers et al., Proc. Hum. Factors Ergo. Soc. (2014)

Santiago-Espada et al., Die Software „Multi-Attribute Task Battery II“ (MATB-II) für die Forschung zu menschlicher Leistungsfähigkeit und Arbeitsbelastung: Ein Benutzerhandbuch (2011).

Mele & Federici, Cogn Process (2012)

Hazlett, CHI ‘06 (2006)

Hardy et al. Proc. Hum. Factors Ergo. Soc. (2013)

Hankins & Wilson, Aviat Space Enviro Med (1998)

iMotions, „Whitepaper zur Genauigkeit von Webcam-ET, Version 2“ (2022)

Bishay et al., arXiv.org (2022)