Entdecken Sie, wie Hidden Markov Models die Eye-Tracking-Technologie durch die Analyse der visuellen Aufmerksamkeit und Blickmuster verbessern. Dieser formale Überblick untersucht ihre Anwendungen in Bereichen wie Psychologie, Marketing und User Experience Research.

Eye Tracking zeigt, wohin Menschen schauen, aber bei der Expertenanalyse geht es darum, zu verstehen, wie sich die Aufmerksamkeit unter lauten, realen Bedingungen im Laufe der Zeit entwickelt. Blickdaten sind von Natur aus unvollkommen und werden durch Faktoren wie Hardwarequalität, Aufnahmeumgebungen, Kopfbewegungen und individuelle Unterschiede zwischen den Teilnehmern beeinflusst.

Mit den Fortschritten im Bereich ökologisch valider und vielfältiger Eye-Tracking-Verfahren, beispielsweise durch den Einsatz von Webcams, gewinnen Überlegungen zum Umgang mit individuellen Störfaktoren zunehmend an Bedeutung. Da es keine spezielle Hardware und kontrollierte Umgebungen für die Erfassung von Eye-Tracking-Daten durch die Teilnehmer gibt, ist das Signal-Rausch-Verhältnis variabler und wird eher auf individueller Ebene als auf Studienebene beeinflusst.

Das Problem bei der Klassifizierung von Fixierungen mit Webcam-Eye-Tracking:

Bei Vorhandensein von Rauschen auf individueller Ebene ist es wichtig, sich mit der Frage zu befassen, wie mit Rauschen bei der Fixationsklassifizierung umgegangen werden soll. Die aktuellen Goldstandards der Fixationsklassifizierung beinhalten die Festlegung harter Grenzwerte auf der Grundlage der Blickgeschwindigkeit oder der zeitlichen und räumlichen Nähe der Blickdaten.

Wenn ein solcher Klassifikator verwendet wird, laufen Forscher Gefahr, Rauschen fälschlicherweise als falsche positive Sakkaden oder Fixationen zu klassifizieren. Ohne einen Klassifikator bleiben den Forschern alle Datenpunkte, einschließlich des Rauschens mit dem Signal, und sie haben nicht den Vorteil zu wissen, wo die Teilnehmer aktiv Informationen aus Fixationen erhielten und wo sie mit Sakkaden scannten.

Wie Hidden Markov Models bei der Webcam-basierten Blickverfolgung helfen können:

Genau aus diesem Grund spielen Hidden Markov Models (HMMs) eine so zentrale Rolle im modernen Eye-Tracking und sind weltweit der wichtigste Markov-basierte Ansatz, der in Plattformen implementiert wird.

Anstatt Augenbewegungen als klare, leicht voneinander trennbare Ereignisse zu behandeln, berücksichtigen HMMs Unsicherheiten. Sie modellieren das, was wir nicht direkt beobachten können, und leiten es probabilistisch aus verrauschten Signalen ab. Dadurch eignen sie sich besonders gut für die Blickverfolgung.

Eine Visualisierung der Implementierung von Hidden Markov Models im Eye Tracking könnte wie folgt aussehen:

Hidden Markov Models, kurz erklärt

Ein Hidden Markov Model (HMM) beschreibt ein System, das sich im Laufe der Zeit durch eine Abfolge von nicht beobachtbaren (verborgenen) Zuständen entwickelt und dabei beobachtbare Signale erzeugt, die probabilistisch mit diesen Zuständen verbunden sind. Die definierende Annahme, bekannt als Markov-Eigenschaft, lautet, dass die Wahrscheinlichkeit des nächsten verborgenen Zustands nur vom aktuellen Zustand abhängt, nicht von der gesamten Abfolge vergangener Zustände.

Denken Sie daran, wie Sie eine Textzeile lesen. Sie kehren nicht jedes Mal zum Anfang der Seite zurück, wenn Sie ein neues Wort erreichen, sondern lesen in einer Reihenfolge weiter, bei der Sie nur den letzten bekannten Punkt benötigen, um den nächsten zu bestimmen.

Dies ist ein entscheidender Unterschied beim Eye-Tracking. Augenbewegungszustände wie Fixationen, Sakkaden und Blinzeln werden nicht direkt beobachtet. Stattdessen müssen sie aus verrauschten Blickrichtungsignalen wie Position, Geschwindigkeit und Signalstabilität abgeleitet werden. HMMs bieten eine fundierte Methode, um diese Ableitung durchzuführen, indem sie Informationen über die aktuellen Beobachtungen mit realistischen Einschränkungen hinsichtlich der zeitlichen Entwicklung der Augenbewegungen kombinieren.

Versteckte Markov-Modelle für die Eye-Tracking-Klassifizierung

Versteckte Markov-Modelle sind ein statistisches Modell für Zeitreihendaten, bei dem davon ausgegangen wird, dass jede Stichprobe eine Beobachtung eines von mehreren möglichen Zuständen ist, deren Wahrscheinlichkeiten nicht beobachtbar, also versteckt sind.

Im Szenario der Fixationsklassifizierung wird davon ausgegangen, dass jede Eye-Tracking-Probe entweder einen während einer Fixation oder einer Sakkade erfassten Datenpunkt darstellt, wobei das Augenbewegungsmuster als nicht beobachtbarer Markov-Prozess angenommen wird. Der Übergang von einem Zustand (der Fixation) zum anderen (der Sakkade) hat eine bestimmte Wahrscheinlichkeit, die unbekannt ist und vom Algorithmus aus den aufgezeichneten Daten gelernt werden muss.

Da diese Berechnung für jeden einzelnen Befragten unabhängig von den anderen Befragten durchgeführt wird, kann sich der Algorithmus an individuelle Augenbewegungsmuster und Datenrauschpegel anpassen.

Wie funktioniert das Hidden Markov Model?

Das Modell erhält eine bestimmte Menge an Informationen, bevor es auf einen neuen Datensatz trifft. Beispielsweise werden ihm Kriterien dafür vorgegeben, wie eine Fixation und eine Sakkade aussehen. Das Modell nimmt auch die Wahrscheinlichkeit an, in einem bestimmten Zustand zu bleiben oder diesen Zustand zu verlassen.

Wenn dem Modell ein neuer Datensatz vorgelegt wird, ermittelt es auf der Grundlage bekannter Definitionen und Wahrscheinlichkeiten den Markov-Parameter, der in die Klassifizierung einbezogen werden soll. Dieser wird vom Modell auf individueller Ebene angepasst, wodurch es Probleme mit Rauschen in einzelnen Datensätzen bewältigen kann.

HMM im Vergleich zu anderen Klassifikatoren in iMotions

Der Standardklassifikator für Webcam-basierte Eye-Tracking-Daten in iMotions sind Hidden Markov Models.

Validierungsstudie 1: HMM vs. I-VT für einen bildschirmbasierten Eye-Tracker

Eine interne Validierungsstudie zeigte eine sehr hohe Übereinstimmung zwischen der Fixierungsklassifizierung von Hidden Markov Models und dem Goldstandard-Geschwindigkeitsschwellenwertklassifikator für Daten, die mit standardmäßigen bildschirmbasierten Eye-Trackern aufgezeichnet wurden. Dies wurde konsistent bei insgesamt 24 Befragten festgestellt, die bildschirmbasierte Eye-Tracker mit 60 bis 600 Hz verwendeten.

Die Interklassenkorrelation der Fixierungsanzahl über 6×6 gerasterte AOIs lag bei allen Studien über 0,99, was auf eine ausgezeichnete Zuverlässigkeit hinweist. Eine Vorhersage der beiden Klassifikatoren anhand von Verwechslungsmatrizen ergab eine ausgezeichnete Genauigkeit von über 0,94 und Kappa-Werte von über 0,8 für alle Befragten.

Validierungsstudie 2: HMM vs. I-VT für webcam-basiertes Eye-Tracking

Zwei interne Studien mit jeweils 5 Teilnehmern, die mit dem webkamerabasierten Eye-Tracking-Algorithmus von iMotions aufgezeichnet wurden, ergaben eine mittlere Übereinstimmung zwischen Hidden Markov Models und dem geschwindigkeitsbasierten Filter.

Die Fixationsanzahl über 6×6 gerasterte AOIs zeigte eine gute Zuverlässigkeit mit Interklassenkorrelationswerten von 0,87 oder höher, aber die Vorhersage von I-HMM-Daten aus I-VT hatte eine Genauigkeit von mindestens 0,73 mit Kappa-Werten zwischen 0,3 und 0,8 über alle Befragten hinweg. Die visuelle Überprüfung der Daten ergab, dass Hidden Markov Models die Fixationen aus den Eye-Tracking-Daten der Webkamera besser klassifizierten.

Was HMM kann und was nicht

Es ist wichtig zu beachten, dass der Fixierungsfilter oder Klassifikator die von einer Webkamera erhaltenen Daten nicht korrigieren kann. Die geringe Genauigkeit und Präzision, die mit dem Fehlen eines dedizierten Trackers verbunden ist, kann durch keinen Fixierungsklassifikationsfilter korrigiert werden. HMM erwies sich jedoch als besser geeignet, um das echte Signal aus dem Rauschen auf individueller Ebene herauszufiltern.

Schlussfolgerung

Da Eye Tracking mittlerweile nicht mehr nur in kontrollierten Laborumgebungen, sondern auch in natürlicheren, skalierbaren und entfernten Umgebungen eingesetzt wird, wird der Umgang mit Störsignalen auf individueller Ebene zu einer zentralen Herausforderung. Herkömmliche Fixationsklassifikatoren, die auf festen Schwellenwerten basieren, funktionieren gut, wenn die Signalqualität hoch und konsistent ist, aber ihre Leistung verschlechtert sich mit zunehmender Variabilität, was bei webbasiertem Eye Tracking häufig der Fall ist.

Versteckte Markov-Modelle bieten einen flexibleren und prinzipielleren Ansatz, indem sie Augenbewegungen als latenten, sequenziellen Prozess behandeln und Unsicherheiten explizit modellieren. Anstatt alle Daten in einen einzigen starren Rahmen zu pressen, passen HMMs die Klassifizierung von Fixationen und Sakkaden an das individuelle Verhalten und die Rauschcharakteristika an. Zwar können sie die grundlegenden Einschränkungen der Webcam-Hardware nicht überwinden, doch eignen sie sich besser, um aussagekräftige Signale von Rauschen zu trennen, was eine zuverlässigere Ableitung der visuellen Aufmerksamkeit in ökologisch validen und ferngesteuerten Eye-Tracking-Studien ermöglicht.

Häufig gestellte Fragen

1. Warum ist die Fixierungsklassifizierung bei der Webcam-basierten Eye-Tracking-Technik schwieriger?

Webcam-basiertes Eye-Tracking weist in der Regel eine geringere räumliche Genauigkeit und eine höhere Variabilität auf als spezielle Eye-Tracker. Unterschiede in der Beleuchtung, den Kopfbewegungen, der Kameraqualität und dem Verhalten der Teilnehmer führen zu individuellen Störsignalen, wodurch Klassifikatoren mit festen Schwellenwerten eher dazu neigen, Störsignale fälschlicherweise als Fixationen oder Sakkaden zu klassifizieren.

2. Wie unterscheiden sich Hidden Markov Models von geschwindigkeitsbasierten Fixationsklassifikatoren?

Geschwindigkeitsbasierte Klassifikatoren stützen sich auf harte Grenzwerte, um Fixationen und Sakkaden zu trennen, wobei sie von einer konsistenten Signalqualität ausgehen. Hidden Markov Models behandeln Augenbewegungen hingegen als versteckte Zustände, die verrauschte Beobachtungen erzeugen, sodass die Klassifizierung probabilistisch abgeleitet und an Variationen innerhalb jedes einzelnen Datensatzes angepasst werden kann.

3. Korrigieren Hidden Markov Models minderwertige Eye-Tracking-Daten?

Nein. HMMs verbessern nicht die zugrunde liegende Genauigkeit oder Präzision der Webcam-basierten Blickverfolgung. Sie können keine Informationen wiederherstellen, die nie erfasst wurden. Ihre Stärke liegt darin, dass sie angesichts der Beschränkungen der Daten aussagekräftige Signale besser von Störsignalen trennen können.

4. Warum eignen sich HMMs gut für die Analyse von Augenbewegungen auf individueller Ebene?

HMMs werden auf individueller Ebene trainiert und angewendet, sodass Übergangswahrscheinlichkeiten und Zustandsdefinitionen an die Augenbewegungsmuster und Rauschcharakteristika jedes Teilnehmers angepasst werden können. Dies macht sie besonders nützlich für Studien mit heterogenen Teilnehmern und Aufnahmebedingungen.

5. Wann sollten Forscher Hidden Markov Models gegenüber herkömmlichen Klassifikatoren bevorzugen?

HMMs sind besonders vorteilhaft bei Fern-, Online- oder ökologisch validen Eye-Tracking-Studien, bei denen die Signalqualität je nach Teilnehmer variiert. Bei hochwertigen Laboraufzeichnungen mit spezieller Hardware erzielen herkömmliche Klassifikatoren möglicherweise ähnliche Ergebnisse, aber HMMs bieten eine größere Robustheit, wenn die Konsistenz nicht garantiert werden kann.

Wie Hidden Markov Models zur Verbesserung der Eye-Tracking-Funktion von Webcams eingesetzt werden

Table of Contents