Die 10 meistverwendeten Eye Tracking Metriken und Begriffe delves into the top 10 widely used eye-tracking metrics and terms. It provides a formal overview of essential concepts in the field, offering concise insights into key measurements and terminologies commonly employed in eye-tracking research.
Table of Contents
Eye Tracking Metriken
Wenn man messen will, wohin jemand schaut oder wie er seine Umgebung visuell abtastet, ist Eye Tracking die beste Methode der Wahl. Da der Blickvorgang so automatisch abläuft, ist diese Messung ein attraktives Instrument sowohl für die qualitative als auch für die quantitative Forschung, da sie es den Forschern ermöglicht, unbewusste Prozesse anzuzapfen, die von unseren Voreingenommenheiten und Vorlieben gesteuert werden.
Diese Daten können für ein breites Spektrum von Forschungsarbeiten aufschlussreich sein, z. B. für psychologische oder Wahrnehmungsstudien, Web-Design, Produktpräferenzen und vieles mehr. Eye Tracking ist in vielerlei Hinsicht eine relativ einfache Maßnahme – der knifflige Teil besteht darin, zu wissen, was man mit den gelieferten Daten anfangen soll.
Im Folgenden gehen wir auf 10 der gängigsten Eye-Tracking-Metriken ein, beschreiben, wie sie erstellt werden, und fassen zusammen, was sie Ihnen sagen können.
1. Fixierungen und Blickpunkte
Wenn wir über Eye Tracking sprechen, sind Fixationen und Blickpunkte die grundlegenden Output-Maße von Interesse und häufig die am häufigsten verwendeten Begriffe.
Blickpunkte zeigen an, wohin die Augen blicken. Wenn Ihr Eye-Tracker Daten mit einer Abtastrate von 60 Hz sammelt, erhalten Sie 60 einzelne Blickpunkte pro Sekunde.
Wenn eine Reihe von Blickpunkten zeitlich und/oder räumlich sehr nahe beieinander liegt, stellt diese Blickansammlung eine Fixation dar, d. h. einen Zeitraum, in dem die Augen auf ein Objekt gerichtet sind. Fixationen sind ein hervorragendes Maß für die visuelle Aufmerksamkeit, und die Forschung auf diesem Gebiet hat sich ständig weiterentwickelt.

Die Augenbewegungen zwischen den Fixierungen werden allgemein als Sakkaden bezeichnet. Wenn wir zum Beispiel lesen, bewegen sich unsere Augen nicht gleichmäßig. Wir fixieren unsere Augen alle 7-9 Buchstaben(wobei dies natürlich von der Art und Größe der Schrift abhängt). Der Begriff „Sehspanne“ bezieht sich darauf, wie viele Wörter wir vor und nach dem aktuell fixierten Wort lesen können. Geübte Leser haben eine größere Sehspanne, so dass sie mehr Text mit weniger Fixierungen erfassen können.
Wenn wir dagegen ein weit entferntes Auto vorbeifahren sehen, sind unsere Augenbewegungen ganz anders. Hier verfolgen wir das Objekt gleichmäßig, ohne Sakkaden. Allerdings kann es zu Nachholsakkaden kommen, wenn sich das Objekt zu schnell bewegt oder zu unvorhersehbar ist.
Lesen Sie hier: Gaze Mapping in der fortgeschrittenen Eye Tracking Forschung
Die Anzahl der Fixierungen oder Blickpunkte, die auf einen bestimmten Teil eines Bildes gerichtet sind (im Vergleich zu anderen Teilen), zeigt, dass die visuelle Aufmerksamkeit stärker auf diesen Teil gerichtet ist. Die Gründe, warum dies der Fall ist, können schwieriger zu entschlüsseln sein, aber sie bieten einen Ausgangspunkt für das Verständnis, welche Aspekte einer Szene diese Aufmerksamkeit am besten einfangen und aufrechterhalten.
2. Heatmaps
Heatmaps sind Visualisierungen, die die allgemeine Verteilung von Blickpunkten zeigen. Sie werden in der Regel als Farbverlaufs-Overlay auf dem präsentierten Bild oder Stimulus angezeigt. Die roten, gelben und grünen Farben repräsentieren in absteigender Reihenfolge die Anzahl der Blickpunkte, die auf Teile des Bildes gerichtet waren.

Die Verwendung einer Heatmap ist eine unkomplizierte Methode, um schnell zu visualisieren, welche Elemente mehr Aufmerksamkeit als andere auf sich ziehen. Heatmaps können sowohl mit einzelnen Befragten als auch mit Gruppen von Teilnehmern verglichen werden, was hilfreich sein kann, um zu verstehen, wie verschiedene Bevölkerungsgruppen einen Stimulus auf unterschiedliche Weise betrachten.
Die iMotions-Software ermöglicht es sogar, eine Heatmap für die ersten 500 Millisekunden zu zeichnen, die dann die unbewusste Verarbeitung der Aufmerksamkeit visualisiert.
3. Bereiche von Interesse (AOI)
Ein Area of Interest (AOI) ist ein Werkzeug zur Auswahl von Regionen eines angezeigten Stimulus und zur Extraktion von Metriken speziell für diese Regionen. Auch wenn es sich nicht um eine eigenständige Metrik handelt, definiert sie den Bereich, für den andere Metriken berechnet werden.
Wenn Sie zum Beispiel ein Bild einer Person zeigen, können Sie separate AOIs um den Körper und das Gesicht herum zeichnen. Sie können dann Metriken für jede Region separat anzeigen, z. B. wie viel Zeit vom Beginn des Stimulus bis zum Blick der Teilnehmer auf die Region verging, wie viel Zeit die Befragten in der Region verbrachten, wie viele Fixationen gezählt wurden, wie viele Personen weg- und zurückschauten.
Diese Metriken sind sehr nützlich, wenn es darum geht, die Leistung von zwei oder mehr Bereichen in einem Video, Bild, einer Website oder einer Programmoberfläche zu bewerten.

4. Zeit bis zur ersten Fixierung
Die Zeit bis zur ersten Fixierung (Time to First Fixation, TTFF ) gibt die Zeit an, die ein Proband (oder alle Probanden im Durchschnitt) benötigt, um einen bestimmten AOI ab dem Beginn des Stimulus zu betrachten.
TTFF kann sowohl Bottom-up-Suchanregungen (z. B. ein auffälliges Firmenetikett) als auch Top-down-Aufmerksamkeitssuchanregungen (z. B. wenn die Befragten aktiv beschließen, sich auf bestimmte Elemente oder Aspekte auf einer Website oder einem Bild zu konzentrieren) anzeigen. TTFF ist eine grundlegende, aber sehr wertvolle Metrik in der Augenbeobachtung, da sie Informationen darüber liefern kann, wie bestimmte Aspekte einer visuellen Szene priorisiert werden.
5. Verweilzeit (Dwell Time)
Die Verweildauer gibt an, wie viel Zeit die Befragten mit der Betrachtung eines bestimmten AOI verbracht haben. In einigen Fällen könnte ein relativer Anstieg der Zeit, die auf einen bestimmten Teil eines Bildes verwendet wird, mit Motivation und Top-Down-Aufmerksamkeit in Verbindung gebracht werden, da die Befragten davon absehen, andere Stimuli in der visuellen Peripherie zu betrachten, die ebenso interessant sein könnten.
Eine lange Betrachtungsdauer einer bestimmten Region kann auf ein hohes Interesse hinweisen, während kürzere Betrachtungsdauern darauf hindeuten können, dass andere Bereiche auf dem Bildschirm oder in der Umgebung interessanter sein könnten. Schlussfolgerungen hinsichtlich der emotionalen Reaktion auf die visuelle Szene können jedoch nicht allein mit der Blickverfolgung gezogen werden (andere Maßnahmen, wie die Analyse des Gesichtsausdrucks oder das EEG, können helfen, die Lücken zu füllen).
6. Verhältnis
Das Verhältnis gibt Aufschluss darüber, wie viele Ihrer Befragten ihren Blick tatsächlich auf einen bestimmten AOI gerichtet haben. In der Marktforschung kann es relevant sein, eine Anzeige so zu optimieren, dass mehr Menschen zu einem bestimmten Bereich in einem Bild oder einer Anzeige „hingezogen“ werden (z. B. das Logo oder relevante Produktinformationen).

Diese Metrik zeigt, welche Bereiche eines Bildes die meiste oder die geringste Aufmerksamkeit auf sich ziehen und welche Bereiche überhaupt nicht beachtet wurden. Das Sammeln von Daten über das Verhältnis der Blicke zwischen den Gruppen könnte zeigen, welche Teile des Bildes für die verschiedenen Teilnehmer attraktiver waren.
7. Fixierungssequenzen
Die Fixationssequenzen basieren sowohl auf räumlichen als auch auf zeitlichen Informationen – wann und wohin ein Teilnehmer geschaut hat. Auf diese Weise kann man sich ein Bild davon machen, was ein Teilnehmer beim Betrachten einer visuellen Szene vorrangig betrachtet. Aufgrund des zentralen Fixationsbias beginnt dies oft in der Mitte des Bildes, aber die folgenden betrachteten Komponenten sind repräsentativ für das, was die Teilnehmer am meisten motiviert, sich die Szene anzusehen.

Die Reihenfolge der Aufmerksamkeit ist ein häufig verwendeter Marker in der Eye-Tracking-Forschung, da er das Interesse einer Person sowie hervorstechende Elemente auf dem Bildschirm oder in der Umgebung widerspiegelt (d. h. Elemente, die in Bezug auf Helligkeit, Farbton, Sättigung usw. hervorstechen).
Es hat sich herausgestellt, dass die letzte Fixierung bei finanziellen Entscheidungsaufgaben (Wahl von Option A gegenüber Option B/C/etc.) eine bessere Vorhersagekraft für die Wahl hat [1] .
Der Vorbehalt, dass die letzte Fixierung die Wahl besser vorhersagt, hängt damit zusammen, dass die Versuchspersonen wissen, dass das Lesen von links/rechts und oben/unten verzerrt ist. Die meisten Sprachen werden tendenziell von links oben nach rechts unten gelesen.
Wenn also Elemente in den visuellen Feldern oft über wiederholte Versuche hinweg randomisiert werden, sind die ersten Fixierungen nicht wirklich vorhersagend für das Verhalten (aufgrund dieser Manipulation). In der realen Welt scheint es eher so zu sein, dass gute Vermarkter/Designer sich dieser visuellen Verzerrungen bewusst sind, so dass sie potenziell Dinge so manipulieren können, dass die erste Fixierung wichtig ist.
Lesen Sie: Wie wir lesen – Was uns die Blickaufzeichnung verraten kann
8. Besucht
Die Anzahl der Wiederholungen gibt Aufschluss darüber, wie oft ein Teilnehmer seinen Blick auf eine bestimmte, durch einen AOI definierte Stelle gerichtet hat. Auf diese Weise kann der Forscher untersuchen, welche Bereiche den Teilnehmer wiederholt angezogen haben (im Guten wie im Schlechten) und welche zwar gesehen wurden, dann aber wieder verlassen wurden.
Der Teilnehmer kann sich zu einem bestimmten Bereich eines Bildes hingezogen fühlen, weil er ihm gefällt, weil er verwirrend ist oder sogar weil er frustrierend ist. Eye Tracking kann Ihnen zwar nicht sagen, wie sich jemand beim Betrachten von etwas gefühlt hat, aber es kann Ihnen Daten darüber liefern, was weiter untersucht werden sollte.

9. Erste Fixierungsdauer
Wenn wir eine visuelle Szene mit unseren Augen erkunden, bewegen wir uns durch Sakkaden, bevor wir uns auf einen Teil des Bildes fixieren. Die Dauer der ersten Fixation liefert Daten darüber, wie lange diese erste Fixation gedauert hat.
Dies kann besonders wertvoll sein, wenn es zusammen mit der TTFF als Indikator dafür verwendet wird, wie sehr ein Aspekt der Szene zunächst die Aufmerksamkeit auf sich zieht. Wenn ein Teilnehmer eine kurze TTFF und eine lange erste Fixationsdauer hat, ist der Bereich höchstwahrscheinlich sehr auffällig.
Dies ist auch bei einem AOI nützlich, da es Informationen darüber liefert, wie lange die erste Fixierung in einer bestimmten Region gedauert hat, was mit anderen Regionen verglichen werden kann. Dies kann bei der Bestimmung der ersten Eindrücke von AOIs nützlich sein.
10. Durchschnittliche Fixierungsdauer
Die durchschnittliche Fixationsdauer gibt an, wie lange die durchschnittliche Fixation gedauert hat, und kann entweder für Einzelpersonen oder für Gruppen ermittelt werden. Dies kann in beiden Fällen als Basismessung hilfreich sein, ist aber auch für die Betrachtung verschiedener Stimuli interessant.
Wenn ein Bild zu einer viel höheren durchschnittlichen Fixationsdauer führt als ein anderes, könnte es sich lohnen, die Gründe dafür zu untersuchen. Außerdem können Sie durch Vergleiche zwischen den AOIs feststellen, welche Bereiche tatsächlich stärker fokussiert wurden als andere. Wenn Sie versuchen, eine Botschaft zu vermitteln, ist es sehr wahrscheinlich, dass Sie wollen, dass die durchschnittliche Fixationsdauer in den Bereichen, die diese Botschaft enthalten, höher ist als in anderen Bereichen.
Alle oben genannten Metriken werden von iMotions standardmäßig berechnet und bereitgestellt, wenn die Eye-Tracking-Daten mit einem der über 30 Eye-Tracker, mit denen iMotions integriert ist, analysiert werden. Wenn Sie mehr über diese Metriken erfahren möchten, laden Sie unseren 32-seitigen Leitfaden unten herunter.
Hinweis: Dies ist eine aktualisierte Version eines Artikels (der ursprünglich am 9. Juli 2015 veröffentlicht wurde), in dem zuvor sieben Eye-Tracking-Metriken vorgestellt wurden.
Referenzen
[1] Ian Krajbich, Carrie Armel & Antonio Rangel. Nature Neuroscience Band 13, 1292-1298 (2010); online veröffentlicht am 12. September 2010; korrigiert nach Drucklegung am 10. Februar 2011