Unser umfassendes Handbuch zum Thema Versuchsplanung bietet Ihnen Hilfestellung dabei, häufige Fehler und Fallstricke bei der Konzeption des optimalen Experiments für Ihre Forschung zu vermeiden.

Einführung in experimentelle Methoden

Der Mensch ist eine äußerst neugierige Spezies. Wir erschließen Neuland, verbessern Produkte und Dienstleistungen, finden schnellere und sicherere Wege zur Herstellung oder zum Transport von Gütern und lüften die Geheimnisse weltweiter Krankheiten. All diese Aktivitäten basieren darauf, die richtigen Fragen zu stellen, an den richtigen Stellen nach Antworten zu suchen und angemessene Entscheidungen zu treffen. Die akademische und die angewandte Forschung haben dieses Streben nach Wissen und Erkenntnissen über uns selbst und die uns umgebende Welt professionalisiert.

Jeden Tag erforschen Forschungseinrichtungen auf der ganzen Welt mithilfe von Experimenten die inneren Zusammenhänge unseres Universums – von der zellulären Ebene unserer Synapsen und Neuronen bis hin zur makroskopischen Ebene von Planeten und Sonnensystemen. Einfach ausgedrückt: Experimente sind der professionelle Weg, um Fragen zu beantworten, Ursache und Wirkung zu identifizieren oder Prädiktoren und Ergebnisse zu bestimmen. Diese Erkenntnisse helfen uns zu verstehen, wie und warum die Dinge so sind, wie sie sind, und können letztendlich dazu genutzt werden, die Welt zu verändern, indem wir das Gute verbessern und das Schlechte überwinden.

Hinweis: Dieser Beitrag ist ein Auszug aus unserem Leitfaden zum experimentellen Design. Unten können Sie sich Ihr kostenloses Exemplar herunterladen und noch mehr Einblicke in die Welt des experimentellen Designs gewinnen.

Im Gegensatz zu den Anfängen der wissenschaftlichen Forschung sind Experimente der heutigen Zeit nicht mehr nur das Ergebnis von Wissenschaftlern, die willkürlich Hypothesen überprüfen, verbunden mit dem reinen Glück, zur richtigen Zeit am richtigen Ort zu sein und die Ergebnisse zu beobachten.

Die heutigen wissenschaftlichen Erkenntnisse sind das Ergebnis sorgfältiger Überlegungen und experimenteller Planung, einer ordnungsgemäßen Datenerhebung sowie der Ableitung entsprechender Schlussfolgerungen.

Beispiel für einen Versuchsplan

Forscher führen Experimente durch, um Neues über die Welt zu erfahren, Fragen zu beantworten oder theoretische Annahmen zu überprüfen.

Typische Beispiele für Forschungsfragen in der kognitiven Verhaltensforschung beim Menschen sind:

• Wie wirkt sich sensorische Stimulation auf die menschliche Aufmerksamkeit aus? Wie verändern beispielsweise bewegte Punktmuster, Geräusche oder elektrische Stimulation unsere Wahrnehmung der Welt?

• Welche Veränderungen treten in der menschlichen Physiologie während der Informationsaufnahme auf? Wie verändern sich beispielsweise die Herzfrequenz und die galvanische Hautreaktion, wenn wir uns an richtige oder falsche Informationen erinnern?

• Inwiefern wirkt sich die virtuelle Realität im Vergleich zu realen physischen Umgebungen auf das menschliche Verhalten aus? Lernen Menschen in der realen Welt schneller als in der VR?

• Wie wirkt sich Stress auf die Zusammenarbeit mit anderen Kollegen oder den Umgang mit Maschinen am Arbeitsplatz aus?

• Wie wirkt sich die Verpackung eines Produkts auf den Frustrationsgrad der Käufer aus? Lässt sich die neue Verpackung intuitiv öffnen, und wenn nicht, wie wirkt sich das auf das Verhalten der Person aus?

• Wie wirkt sich der neue Fernsehspot auf emotionale Reaktionen und die Markenerinnerung aus? Hat das Geschlecht einen Einfluss auf Kaufentscheidungen nach dem Ansehen des Spots?

• Wie wirkt sich eine Website auf den Stresspegel der Nutzer aus, gemessen anhand der galvanischen Hautreaktion, des EKGs und der Mimik?

• Welche Kreuzungen in der Stadt bereiten Radfahrern die größten Probleme?

• Welche Aspekte einer Wahlkampfrede des Präsidentschaftskandidaten beeinflussen die Entscheidung der Wähler?

Wie Sie sehen, können Forschungsfragen recht allgemein gehalten sein. Experimente sollen diese Fragen in einem standardisierten Rahmen klären. Dazu sind mehrere Schritte erforderlich, um die Forschungsfrage in eine besser überprüfbare Form zu bringen:

Schritt 1: Formulieren Sie eine Hypothese

Zunächst wird die allgemeine Forschungsfrage in eine überprüfbare Hypothese oder mehrere Hypothesen unterteilt. Hypothesen sind explizite Aussagen über Ursache und Wirkung und befassen sich damit, welche Ergebnisse eintreten, wenn bestimmte Faktoren manipuliert werden:

Hypothesen beschreiben einen Zusammenhang zwischen einer oder mehreren unabhängigen Variablen und einer oder mehreren abhängigen Variablen:

•Unabhängige Variable

Die unabhängige Variable (IV) wird vom Versuchsleiter gezielt verändert oder manipuliert. Unabhängige Variablen werden auch als Faktoren bezeichnet.

• Abhängige Variable (DV)

Die abhängige Variable (DV) wird vom Versuchsleiter gemessen. Experimente mit einer abhängigen Variable werden als univariat bezeichnet, Experimente mit zwei oder mehr abhängigen Variablen als multivariat.

Die allgemeine Forschungsfrage „Wie wirkt sich Stress auf die Interaktion mit anderen aus?“ könnte zu folgenden Hypothesen darüber führen, wie Stress (unabhängige Variable) die Interaktion mit anderen (abhängige Variable) beeinflusst:

1) „Wenn man stündlich 100 oder mehr eingehende E-Mails beantworten muss, führt dies zu weniger persönlichem Austausch mit den Kollegen.“

Unabhängige Variable: Anzahl der E-Mails pro Stunde
Abhängige Variable: Anzahl der mündlichen Interaktionen mit Kollegen pro Stunde

2) „Wer pro Nacht acht Stunden oder mehr schläft, treibt häufiger
mit Kollegen Sport.“

Unabhängige Variable: Schlafdauer pro Nacht
Abhängige Variable: Anzahl der Sporttreffen mit Kollegen pro Woche

3) „Regelmäßige körperliche Betätigung am Abend führt dazu, dass man bei Gesprächen mit anderen in Geschäftstreffen häufiger
lächelt.“

Unabhängige Variable: Anzahl der abendlichen Sportaktivitäten pro Woche
Abhängige Variable: Häufigkeit des Lächelns im Gespräch mit anderen

Hypothesen verdeutlichen die Forschungsfrage, indem sie einen beobachtbaren Zusammenhang zwischen Ursache und Wirkung darlegen. Hypothesen legen zudem fest, welche Reize verwendet werden und welchen Reizen die Befragten ausgesetzt sind.

Ein Reiz muss nicht unbedingt aus Bildern oder Tönen bestehen; es gibt noch viel mehr, was einen Reiz ausmacht, zum Beispiel Fragebögen, Websites, Videos, Sprache und Gespräche mit anderen, visuelle und propriozeptive Reize beim Autofahren und vieles mehr. Wir werden im Folgenden näher auf Reize eingehen.

Schritt 2: Stichprobengruppen

Stichprobengruppen definieren

Nachdem Sie die Hypothese formuliert haben, müssen Sie die Merkmale der Befragtengruppe für Ihr Experiment festlegen. Dieser Schritt ist notwendig, um Nebeneffekte auszuschließen, die die Ergebnisse Ihrer experimentellen Datenerhebung verfälschen könnten. Stellen Sie sicher, dass demografische Merkmale wie Alter, Geschlecht, Bildungsniveau, Einkommen, Familienstand, Beruf usw. innerhalb der Befragtengruppe einheitlich sind. Individuelle Merkmale wie der Gesundheitszustand oder die Erfahrung bestimmter Lebensereignisse sollten berücksichtigt werden, da sie die Versuchsergebnisse beeinflussen könnten. Beispielsweise könnten Mütter anders auf eine Fernsehwerbung für Babyspielzeug reagieren als Frauen ohne Kinder. Soldaten, die an einer posttraumatischen Belastungsstörung (PTBS) leiden, könnten anders auf stressauslösende Reize reagieren als Softwareentwickler.

Schritt 3: Fächer den Gruppen zuweisen

In diesem Schritt ordnen Sie die Probanden nach dem Zufallsprinzip den verschiedenen Versuchsbedingungen zu. Für Ihre Studie zum Thema Stress am Arbeitsplatz könnten Sie beispielsweise zwei Versuchsgruppen bilden, wobei Gruppe eins 10 E-Mails pro Stunde und Gruppe zwei 100 E-Mails pro Stunde erhält. Sie könnten nun analysieren, wie sich die beiden Gruppen in ihrer sozialen Interaktion mit anderen innerhalb der nächsten 6 Stunden unterscheiden. Idealerweise erfolgt die Zuordnung zu den Versuchsgruppen nach dem Zufallsprinzip, sodass alle Befragten die gleiche Wahrscheinlichkeit haben, in eine der verfügbaren Versuchsgruppen zu gelangen. Es sollte keine Verzerrung geben, bestimmte Befragte einer bestimmten Gruppe zuzuordnen.

Schritt 4: Bestimme die Abtastfrequenz.

Wie oft möchten Sie die Befragten befragen? Bei klinischen Studien wird der Gesundheitszustand der Patienten in der Regel einmal im Monat über einen Zeitraum von mehreren Monaten oder Jahren erfasst. Bei Usability-Studien stellen Sie den Befragten möglicherweise am Ende der Sitzung einmalig mehrere Fragen, entweder mündlich oder mittels Umfragen und Fragebögen.

Wenn Sie jedoch kognitiv-verhaltensbezogene Daten über EEG, EMG, EKG, GSR oder andere Biosensoren erfassen, während die Probanden eine bestimmte Aufgabe ausführen, sammeln Sie Dutzende bis Hunderte von Datenpunkten pro Sekunde – auch wenn all diese unter einer Sekunde liegenden Messwerte möglicherweise zur Berechnung eines Gesamtwerts verwendet werden, der einen bestimmten kognitiven oder affektiven Zustand widerspiegelt. Wir werden später in diesem Leitfaden darauf eingehen, welche Sensoren sich ideal für die Erfassung spezifischer kognitiv-verhaltensbezogener Messgrößen eignen.

Schritt 5: Führen Sie das Experiment durch und sammeln Sie Daten.

In diesem Schritt führen Sie das Versuchsdesign gemäß den ausgewählten Methoden durch. Achten Sie darauf, alle wichtigen Momente während der Datenerhebung zu beobachten, zu überwachen und zu dokumentieren. Führen Sie vor der Durchführung des Experiments einen Pilotversuch durch, um mögliche Probleme auszuschließen, die während der Datenerhebung auftreten könnten (falsche Stimuluslänge, nicht randomisiert, nicht optimal usw.).

Lesen Sie auch: 7 Tipps und Tricks für einen reibungslosen Ablauf im Labor

Schritt 6: Daten vorverarbeiten und Kennzahlen analysieren.

In der kognitiven Verhaltensforschung können Rohdaten aus Selbstauskünften oder Daten von Biosensoren bestehen. Natürlich stellen auch Videoaufnahmen von Versuchssitzungen wie Fokusgruppen und Interviews Rohdaten dar und müssen mithilfe von Kodierungsschemata analysiert werden. Aufgrund der großen Bandbreite an statistischen Methoden zur Analyse von Rohdaten und Metriken werden wir diesen Schritt im vorliegenden Leitfaden nicht behandeln. Ein entscheidender Aspekt sollte hier jedoch erwähnt werden: Die Auswahl einer bestimmten statistischen Methode für die Datenanalyse sollte stets von der ursprünglichen Hypothese und den erhobenen Daten geleitet werden.

Natürlich erfordern nicht alle Experimente die genaue Festlegung all dieser Schritte. Manchmal haben Sie als Forscher keinen Einfluss auf bestimmte Faktoren oder keinen Zugang zu bestimmten Befragtengruppen. Je nachdem, inwieweit Sie die Beziehung zwischen Ursache und Wirkung kontrollieren können, lassen sich folgende Arten von Experimenten unterscheiden:

Arten von Versuchsplänen

1. Laborversuche

Wenn wir ganz allgemein von Experimenten sprechen, kommen uns vielleicht Laborversuche in den Sinn, bei denen Forscher in weißen Laborkitteln andere hinter Einwegspiegeln beobachten und detaillierte Notizen über die Leistung und das Verhalten menschlicher Probanden machen, die vor etwas unberechenbaren Maschinen Tastenaufgaben ausführen. Tatsächlich hat die kognitiv-verhaltenstherapeutische Forschung genau so begonnen (siehe das Milgram-Experiment).

Glücklicherweise sind die Zeiten steriler Laborumgebungen längst vorbei, und Sie können Ihre Studie in Ihrem Lieblingspullover durchführen. Ein zentraler Aspekt bleibt jedoch bestehen: die Möglichkeit, alle Faktoren und Bedingungen zu kontrollieren, die einen Einfluss haben könnten. So können Sie beispielsweise bei Laborexperimenten bestimmte Teilnehmergruppen auswählen und ihnen unterschiedliche Versuchsbedingungen zuweisen, den genauen Zeitpunkt und die Gestaltung aller Reize festlegen und problematische Nebeneffekte ausschließen.

Was Sie über Laborexperimente wissen sollten…

Stärken.

Präzise Kontrolle aller externen und internen Faktoren, die die Versuchsergebnisse beeinflussen könnten.
Zufällige Zuordnung der Befragten zu den Versuchsgruppen, idealerweise mittels Randomisierung.
Ermöglicht die Ermittlung von Ursache-Wirkungs-Zusammenhängen mit höchster Genauigkeit.
Da alles standardisiert ist, können andere Ihre Studie nachstellen, was Ihre Studie im Vergleich zu nicht standardisierten Szenarien „glaubwürdiger“ macht.

Einschränkungen.

Kontrollierte Experimente spiegeln nicht die Realität wider. Die Befragten verhalten sich möglicherweise nicht natürlich, da das Labor nicht die natürliche Umgebung widerspiegelt. Fachlich ausgedrückt mangelt es Laborexperimenten an ökologischer Validität.
Beobachtereffekte können das Verhalten der Befragten beeinflussen. Ein Versuchsleiter, der direkt neben einem Befragten sitzt oder ihn über eine Webcam beobachtet, kann die Versuchsergebnisse verfälschen (lesen Sie mehr zum Hawthorne-Effekt).

2. Feldversuche

Im Gegensatz zu Laborexperimenten finden Feldexperimente in der natürlichen Umgebung der Probanden statt. Während der Versuchsleiter den „Ursachen“-Aspekt manipuliert, lässt sich nicht kontrollieren, welche anderen Faktoren die Auswirkungen und Ergebnisse möglicherweise beeinflussen könnten (wie beispielsweise beim Hofling-Krankenhaus-Experiment, das auf Milgrams Arbeit basiert).

Häufig führen Ingenieure auch Feldtests mit Software- und Hardware-Prototypen durch, um frühere Labortests zu validieren und umfassenderes Feedback von Testpersonen unter realen Bedingungen zu erhalten.

Was Sie über Feldversuche wissen sollten…

>> Stärken.

Feldversuche spiegeln reale Situationen besser wider als Laborversuche. Sie weisen eine höhere ökologische Validität auf
Wenn Experimente verdeckt durchgeführt werden und die Probanden sich nicht beobachtet fühlen, entspricht das beobachtete Verhalten viel stärker dem realen Leben als in Laborumgebungen.

>> Einschränkungen.

Es besteht keine Kontrolle über externe Faktoren, die die Ergebnisse potenziell beeinflussen könnten. Die Ergebnisse fallen daher sehr viel unterschiedlicher aus. Um diese Schwankungen auszugleichen, sind daher mehr Befragte erforderlich.
Von anderen nur schwer nachzumachen.
Eingeschränkte Möglichkeit, eine Einwilligung nach Aufklärung von den Befragten einzuholen.

3. Natürliche Experimente.

Natürliche Experimente sind reine Beobachtungsstudien in dem Sinne, dass der Experimentator keinerlei Einfluss darauf hat. Die Gruppen der Befragten werden so beobachtet, wie sie sind, und nicht strategisch verschiedenen Versuchsbedingungen zugeordnet.

Vielleicht möchten Sie bestehende iPhone- und Android-Nutzer, Menschen, die in der Nähe von Tschernobyl leben, und Menschen, die anderswo leben, oder Krebspatienten und die gesunde Bevölkerung miteinander vergleichen. In diesem Fall existieren die Gruppen, die Sie vergleichen möchten, von Natur aus bereits – Sie müssen sie nicht erst erstellen.

Was Sie über natürliche Experimente wissen sollten…

Stärken.

Das Verhalten in natürlichen Experimenten spiegelt eher die Realität wider.
Ideal in Situationen, in denen es ethisch nicht vertretbar wäre, die Gruppenzuordnung zu manipulieren (z. B. die Befragten Strahlung auszusetzen).

Einschränkungen.

Teurer und zeitaufwendiger als Laborexperimente.
Keine Kontrolle über irgendwelche Faktoren bedeutet, dass eine Nachahmung durch andere nahezu unmöglich ist.

Wie kann ich menschliches Verhalten messen?

Labor-, Feld- und Naturversuche haben alle eines gemeinsam: Erkenntnisse werden empirisch gewonnen. „Empirisch“ bedeutet, dass Forschungsfragen und Hypothesen nicht allein durch Reflexion oder Gedankenexperimente beantwortet werden.

Anstatt sich in einem Sessel zurückzulehnen und über die möglichen Ergebnisse eines Gedankenexperiments zu grübeln, führen Forscher der kognitiven Verhaltensforschung ihre Arbeit durch aktive Beobachtung und Erkundung der Umgebung durch, um die zugrunde liegenden Prozesse sowie die eigentlichen „Triebkräfte“ des menschlichen Verhaltens zu ermitteln.

In den letzten Jahrzehnten haben Forscher komplexe experimentelle Techniken und Verfahren entwickelt, die auch in der kommerziellen Untersuchung emotionaler, kognitiver und aufmerksamkeitsbezogener Auswirkungen neuer Produkte und Dienstleistungen Anwendung finden, oder um zu ermitteln, wie sich Persönlichkeitsmerkmale und Problemlösungsstrategien auf die Sympathie für eine Marke und die Präferenzen der Verbraucher auswirken.

Zwei Ansätze zur Erforschung des menschlichen Verhaltens

Qualitative Studien zum menschlichen Verhalten

Qualitative Studien liefern Erkenntnisse aus Beobachtungen. Beispiele hierfür sind die Auswertung von Tagebucheinträgen, offene Fragebögen, unstrukturierte Interviews oder Beobachtungen. Da nichts gezählt oder quantifiziert wird und jede Beobachtung unverfälscht beschrieben wird, werden qualitative Daten auch als deskriptiv bezeichnet.

Bei qualitativen Feldstudien oder Usability-Studien beobachten Forscher beispielsweise direkt, wie die Befragten die Technologie nutzen, sodass sie direkt Fragen stellen, das Verhalten näher untersuchen oder das Versuchsprotokoll unter Umständen sogar anpassen können, um das individuelle Verhalten der Befragten zu berücksichtigen. Der Schwerpunkt qualitativer Studien liegt in erster Linie darauf, zu verstehen, wie die Befragten die Welt sehen und warum sie auf eine bestimmte Weise reagieren.

Was Sie über qualitative Studien wissen sollten…

Stärken.

Ideal, um Fragen wie „Warum?“ und „Wie lässt sich das Problem beheben?“ zu beantworten.
Konzentrieren Sie sich auf die persönlichen Erfahrungen des Befragten.
Es sind nur kleine Stichproben erforderlich.

Einschränkungen.

Die im Rahmen dieser Studie gewonnenen Erkenntnisse lassen sich möglicherweise nicht auf andere Gruppen übertragen.
Die Datenerhebung kann pro Befragten länger dauern.
Das Risiko, dass die Ergebnisse durch die Vorurteile und Präferenzen der Forscher beeinflusst werden.

Typische Anwendungsfälle.

UX-, Web- und Software-Usability-Tests (Beschreibung der User Journeys).
Offene Interviews und Umfragen zu biografischen Ereignissen.
Fokusgruppen mit bzw. ohne Anwesenheit des Moderators.

Lesen Sie mehr: Wie man mit Emotionserkennung eine bessere Benutzererfahrung schafft

Quantitative Studien

Quantitative Studien hingegen zeichnen sich durch die systematische empirische Untersuchung beobachtbarer Phänomene mittels statistischer, mathematischer oder computergestützter Methoden aus. Mit anderen Worten: Quantitative Studien nutzen Zahlen, um menschliches Verhalten zu beschreiben und zu charakterisieren.

Beispiele für quantitative Methoden sind strukturierte Fragebögen und Interviews, Beobachtungen mit speziellen Kodierungsschemata (z. B. das Zählen der Anzahl der pro Tag gerauchten Zigaretten) oder physiologische Messungen mittels EEG, EMG, EKG, GSR und anderer Sensoren, die numerische Werte liefern. Wenn Forscher quantitative Methoden anwenden, wandeln sie Verhaltensbeobachtungen in zählbare Zahlen und statistische Ergebnisse um. All dies geschieht, um eine maximale experimentelle Kontrolle zu gewährleisten.

Was Sie über quantitative Studien wissen sollten…

Stärken.

Ideal, um Fragen nach der Anzahl und der Menge zu beantworten.
Nützlich für die Analyse großer Befragtengruppen, mit Fokus auf die Gesamtbevölkerung.
Aufgrund des hohen Standardisierungsgrades ist der Zeitaufwand geringer als bei qualitativen Studien.
Liefert numerische Werte, die statistisch ausgewertet werden können.

Einschränkungen.

Dem Experimentator könnten Phänomene entgehen, weil das Messinstrument zu eng gefasst ist.
Kontextuelle Faktoren werden oft ignoriert oder fehlen.
Ein Studium ist teuer und zeitaufwendig.

Typische Anwendungsfälle.

Verhaltensbeobachtung unter Verwendung von Kodierungsschemata (z. B. hinsichtlich Gesichtsausdrücken oder Handlungsereignissen innerhalb eines bestimmten Zeitraums)
Strukturierte Interviews und Umfragen, die Single- oder Multiple-Choice-Fragen sowie Bewertungsskalen enthalten.
Physiologische Messungen von Körperfunktionen (EEG, EMG, GSR usw.)

Lesen Sie dazu: Qualitative vs. quantitative Forschung

Welche Zahlen könnte die kognitive Verhaltensforschung potenziell heranziehen, um unsere komplexen inneren Abläufe, unsere Intelligenz, Persönlichkeitsmerkmale oder Fähigkeiten zu beschreiben? Was sind beispielsweise messbare Indikatoren dafür, dass jemand ein Kaufsüchtiger ist?

Als messbare Indikatoren könnten beispielsweise die durchschnittliche Verweildauer in Kaufhäusern pro Woche, die Gesamtsumme der Ausgaben für bestimmte Lifestyle-Produkte oder die Anzahl der Schuhkartons dienen, die den Schrank unter der Treppe füllen (siehe dazu unseren Lesetipp zum Thema „Messung und Zuordnung von Zahlen oder Ereignissen“).

Das Grundprinzip besteht darin, dass verborgene Aspekte unserer Persönlichkeit sichtbar (und damit messbar) gemacht werden können, indem man sie in handhabbare und greifbare, erfassbare und beobachtbare Einheiten zerlegt, die sich numerisch erfassen lassen. Dieses „Sichtbarmachen“ latenter Konstrukte unserer Persönlichkeit und Identität wird als Operationalisierung bezeichnet.

Während manche Messgrößen besser geeignet sind, ein zugrunde liegendes latentes Merkmal zu erfassen, können andere daran scheitern. Die Frage lautet also: Was macht eigentlich eine geeignete Messgröße aus?

Maßnahmen zur Vermeidung von Verzerrungen

Dies wird im Allgemeinen anhand der folgenden Kriterien beschrieben:

Objektivität

Objektivität ist die allgemeinste Anforderung und spiegelt die Tatsache wider, dass Messungen unabhängig davon, wer sie anwendet, zum gleichen Ergebnis führen sollten. Zudem sollten sie unabhängig von äußeren Einflüssen zu denselben Ergebnissen führen. Beispielsweise ist ein Multiple-Choice-Persönlichkeitsfragebogen oder eine Umfrage objektiv, wenn sie dieselbe Punktzahl ergibt, unabhängig davon, ob der Teilnehmer mündlich oder schriftlich antwortet. Darüber hinaus sollte das Ergebnis unabhängig vom Wissen oder der Einstellung des Experimentators sein, sodass die Ergebnisse ausschließlich von der Leistung des Befragten bestimmt werden.

Zuverlässigkeit

Ein Messinstrument gilt als hochgradig zuverlässig, wenn es unter gleichbleibenden Bedingungen denselben Wert liefert. Es gibt verschiedene Unterkategorien der Reliabilität. So beschreibt beispielsweise die „Wiederholungsreliabilität“ die Stabilität eines Messinstruments über einen längeren Zeitraum hinweg, die „Interrater-Reliabilität“ gibt an, inwieweit verschiedene Experimentatoren ein und dasselbe Verhalten konsistent einschätzen, während bei der „Split-Half-Reliabilität“ ein Test in zwei Hälften geteilt wird, um zu untersuchen, inwieweit die beiden Hälften identische Ergebnisse liefern.

Gültigkeit

Dies ist das letzte und wichtigste Kriterium. Es gibt an, inwieweit eine Messgröße das erfasst, was sie eigentlich erfassen soll. Stellen Sie sich ein Experiment vor, bei dem die Körpergröße erfasst wird, um deren Zusammenhang mit dem Glück zu messen. Offensichtlich ist diese Messgröße sowohl objektiv als auch zuverlässig (Körpergrößenmessungen sind unabhängig von der Person, die die Messung vornimmt, recht konsistent), doch hinsichtlich ihrer Konstruktvalidität (d. h. ihrer Fähigkeit, die zugrunde liegende Variable tatsächlich zu erfassen) ist sie für das Glück eine wirklich schlechte Messgröße.

Sobald Sie Messverfahren identifiziert haben, die gleichzeitig die Kriterien der Objektivität, Reliabilität und Validität erfüllen, sind Sie auf dem richtigen Weg, um experimentelle Ergebnisse zu erzielen, die die Grenzen unseres derzeitigen Wissens erweitern werden.

Umfrageverwaltung

Während es in Island Forschungsprogramme gibt, bei denen Experimente auf die gesamte Bevölkerung angewendet werden, ist es in anderen Ländern und Situationen nicht möglich, alle Menschen zu untersuchen. Natürlich würde dies maximale Einblicke in Ihre Forschungsfrage gewähren, doch aufgrund zeitlicher und ressourcenbezogener Einschränkungen werden Studien und Experimente in der Regel an Befragtengruppen statt an der gesamten Bevölkerung durchgeführt.

Die größte Herausforderung besteht darin, Befragte zu finden, die die Gesamtzielgruppe wirklich repräsentieren, sodass Sie die Ergebnisse Ihrer Stichprobe auf die Gesamtbevölkerung verallgemeinern oder auf diese übertragen können. Vielleicht haben Sie den Begriff „repräsentative Stichprobe“ schon einmal gehört. Damit sind Gruppen von Befragten gemeint, bei denen jedes einzelne Mitglied der Grundgesamtheit die gleiche Chance hat, für Ihr Experiment ausgewählt zu werden. Grundgesamtheiten müssen nicht unbedingt ganze Länder umfassen – der Begriff bezieht sich einfach auf „alle Menschen, die bestimmte Merkmale“ (Größe, Gewicht, BMI, Hämoglobinwerte, Erfahrung, Einkommen, Nationalität usw.) aufweisen, die für Ihr Experiment als relevant angesehen werden.

Beispielhafte Populationen sind:

Weibliche Akademikerinnen in den USA im Alter zwischen 30 und 40 Jahren mit einem durchschnittlichen Jahreseinkommen von 50.000 Dollar
Softwareentwickler mit mehr als 5 Jahren Erfahrung in C#
Hundebesitzer
Patienten mit sekundär progredienter Multipler Sklerose
Käufer nach Feierabend jeden Alters und jeden Geschlechts
Dänische Mütter bis zum Alter von 50 Jahren
Menschen, die eine Brille tragen
Dänische Mütter bis zum Alter von 50 Jahren
Menschen, die eine Brille tragen

Eine Stichprobe kann beispielsweise aus einer Gruppe von 100 Multiple-Sklerose-Patienten oder aus 20 Hundebesitzern bestehen. Die Suche nach „repräsentativen Stichproben“ ist nicht ganz einfach, da fast alle Studien eine gewisse Verzerrung aufweisen. Stichproben lassen sich wie folgt finden:

Nicht-zufällige Stichprobenauswahl

Eine nicht-zufällige Stichprobenziehung kann in den ersten Vorauswahlphasen erfolgen, in denen die Verallgemeinerbarkeit keine Rolle spielt. In diesem Fall gelten die Versuchsergebnisse nur für die getestete Befragtengruppe.
Die Stichprobenziehung erfolgt wie folgt:

Freiwillige. Man spricht Leute auf der Straße an, und wer sich zur Teilnahme bereit erklärt, wird getestet.
Schneeballstichprobe. Ein Fall identifiziert andere seiner Art (z. B. HSE-Kunden).
Zufallsstichprobe. Sie befragen Ihre Mitarbeiter und Kollegen oder andere leicht erreichbare Gruppen.
Quotenstichprobe. Willkürliche Auswahl einer festgelegten Anzahl aus mehreren Gruppen (z. B. 30 männliche und 30 weibliche Befragte).

Zufällige Auswahl der Befragten.

Bei einer Zufallsstichprobe erhält jeder aus der Grundgesamtheit die gleiche Chance, in Ihr Experiment einbezogen zu werden. Der Vorteil, dass Sie aus den Forschungsergebnissen, die Sie von mehreren Befragten aus der breiten Öffentlichkeit erhalten haben, allgemeine Schlussfolgerungen ziehen können, ist jedoch mit einem hohen Zeit- und Ressourcenaufwand verbunden.
Es gibt folgende Strategien für Zufallsstichproben:

Einfache Zufallsstichprobe

Bei Zufallsstichproben sind die Chancen für jeden gleich, in die Untersuchung einbezogen zu werden. Das bedeutet, dass man beispielsweise alle weiblichen Akademikerinnen in den USA im Alter zwischen 30 und 40 Jahren mit einem durchschnittlichen Jahreseinkommen von 50.000 Dollar oder alle Hundebesitzer identifizieren musste. Anschließend zieht man Zufallsstichproben und kontaktiert nur diese Personen. Die Zufallsstichprobe verhindert
jegliche Verzerrung der Auswahl aufgrund von Freiwilligkeit oder Kooperationsbereitschaft.

Systematische Stichprobenziehung

Anstelle einer rein zufälligen Auswahl wählen Sie systematisch jede n-te Person aus einer bestehenden Liste aus, die beispielsweise nach Alter der Befragten, Krankheitsdauer, Mitgliedschaft, Entfernung usw. sortiert ist.

Mehrstufige Stichprobenziehung

Die Stichprobenziehung kann in mehreren Schritten erfolgen. Um beispielsweise repräsentative Schüler für die Untersuchung zu finden, können Sie zunächst eine zufällige Auswahl von Landkreisen treffen und anschließend mit der zufälligen Auswahl von Städten, Schulen und Klassen fortfahren. Schließlich wählen Sie nach dem Zufallsprinzip Schüler für die Beobachtung und Erfassung aus.

Cluster-Stichprobenverfahren

Insbesondere bei Selbstauskünften werden Studien an großen und geografisch verstreuten Bevölkerungsgruppen durchgeführt. Um die für die Tests erforderliche Anzahl an Befragten zu erreichen, können Cluster identifiziert und nach dem Zufallsprinzip ausgewählt werden. Anschließend werden alle Mitglieder der ausgewählten Stichproben getestet. Die Clusterbildung
kann beispielsweise anhand von Haushalten erfolgen – in diesem Fall werden alle Haushaltsmitglieder getestet, was den Zeit- und Ressourcenaufwand für die Tests erheblich reduziert.

Welche Stichprobenmethode Sie verwenden, hängt in der Regel von der zeitlichen und ressourcenmäßigen Durchführbarkeit ab. Es kann oft schwierig sein, wirklich zufällige Stichproben zu erhalten, insbesondere in der Feldforschung. Weitere Einzelheiten zu empfohlenen Verfahren für repräsentative Stichproben finden Sie bei Banerjee und Kollegen (2007; 2010).

Wie viele Teilnehmer brauche ich?

Die Stichprobenstrategien hängen eng mit der Stichprobengröße Ihres Experiments zusammen. Wenn Sie eine Einzelfallstudie durchführen möchten, benötigen Sie natürlich nur einen Befragten. In diesem Fall können Sie die Ergebnisse jedoch nicht auf die Gesamtpopulation verallgemeinern. Andererseits ist eine Stichprobenziehung aus der gesamten Population nicht möglich. Die Frage ist: Wie viele Befragte sind für Ihr Experiment geeignet? Wie groß sollte die ideale Stichprobe sein?

Martinez und Kollegen (2014) sowie Niles (2011) geben Empfehlungen. Ohne zu sehr ins statistische Detail zu gehen, lautet die Kernaussage: Beziehen Sie immer so viele Probanden ein, wie nötig. Für quantitative Usability-Tests mögen 20 Probanden ausreichend sein, doch sollten mehr Probanden getestet werden, wenn die erwarteten Effekte geringer ausfallen, beispielsweise wenn es nur geringfügige Unterschiede zwischen den verschiedenen Stimulusbedingungen gibt.

Aus diesem Grund führen wissenschaftliche Forscher Studien mit Dutzenden, Hunderten oder sogar Tausenden von Befragten durch. Durch eine größere Teilnehmerzahl verringert man die Unklarheiten, die durch individuelle Unterschiede entstehen und die Versuchsergebnisse hätten beeinflussen können.Zum Seitenanfang

Selbstvertrauen

Die Sicherheit Ihrer Ergebnisse wird in der Regel anhand des Konfidenzniveaus ausgedrückt, das sich grob mit der folgenden Formel berechnen lässt:

N ist die Stichprobengröße. Wie Sie sehen können, führt eine größere Stichprobe zu einem geringeren Konfidenzintervall (was das gewünschte Ergebnis ist). Mit anderen Worten: Je mehr Personen befragt werden, desto genauer sind die Ergebnisse.

Wenn Sie beispielsweise die Akzeptanz eines neuen Produkts bei 10 von 10.000 Befragten getestet haben, liegt die Konfidenz bei 32 %. Wenn 7 von 10 Befragten (70 %) das neue Produkt mochten, könnte der tatsächliche Anteil in der Grundgesamtheit zwischen 48 % (70 – 32) und 100 % (70 + 32, da der Wert nicht über 100 liegen kann) liegen. Bei einer Schwankungsbreite von 48 % bis 100 % ist Ihr Test möglicherweise nicht besonders aussagekräftig.

Wenn Sie die Stichprobengröße auf 100 von 10.000 Befragten erhöhen, liegt das Konfidenzniveau bei 10 %. Da 70 von 100 Befragten das Produkt mögen, liegt der tatsächliche Wert in der Grundgesamtheit irgendwo zwischen 60 % und 80 %. Damit kommen Sie dem Ergebnis schon viel näher!

Wenn Sie das Konfidenzniveau weiter auf 5 % senken möchten, müssen Sie mindestens 500 zufällig ausgewählte Befragte befragen. Unterm Strich müssen Sie also eine große Anzahl von Befragten befragen, bevor Sie Schlussfolgerungen ziehen können. Weitere Informationen finden Sie auf der Website von Creative Research Systems, wo Sie eine genauere Formel sowie einen Rechner zur Ermittlung der Stichprobengröße finden.

Querschnitts- vs. Längsschnittdesigns

Das Versuchsdesign und die Art und Weise, wie Ihre Studie durchgeführt wird, hängen von der Art Ihrer Forschungsfrage ab. Wenn Sie daran interessiert sind, wie eine neue Fernsehwerbung von der breiten Öffentlichkeit in Bezug auf Aufmerksamkeit, Kognition und Affekt wahrgenommen wird, gibt es mehrere Möglichkeiten, Ihre Studie zu konzipieren. Möchten Sie die kognitiven und verhaltensbezogenen Auswirkungen der Werbung bei verschiedenen Bevölkerungsgruppen aus Haushalten mit niedrigem und hohem Einkommen zum gleichen Zeitpunkt vergleichen? Oder möchten Sie die Auswirkungen der Fernsehwerbung in einer einzigen Bevölkerungsgruppe (z. B. männliche Käufer mit hohem Einkommen und bestimmten demografischen Merkmalen) über einen längeren Zeitraum messen? Der erstgenannte Ansatz wird im Allgemeinen als Querschnittsdesign bezeichnet. Der zweitgenannte Ansatz wird als Längsschnittdesign bezeichnet. Beide Ansätze können zudem kombiniert werden (gemischtes Design).

Querschnittsdesign

In Querschnittsstudien werden zwei oder mehr Gruppen zu einem bestimmten Zeitpunkt miteinander verglichen. Ähnlich wie bei einer Momentaufnahme wird jeder Befragte nur einmal eingeladen und befragt. In unserem Beispiel würden Sie die neue Fernsehwerbung Befragten aus Haushalten mit niedrigem und hohem Einkommen zeigen. Sie würden sie jedoch nicht eine Woche später erneut einladen und ihnen die Fernsehwerbung noch einmal zeigen.

Weitere Beispiele für Querschnittsstudien sind:

Gaming. Vergleich der Auswirkungen von Videospielen auf die emotionale Reaktionsfähigkeit bei gesunden Kindern und Kindern mit ADHS.
Webtests. Vergleich der Bewertung der Benutzerfreundlichkeit von Websites durch junge, mittelalte und ältere Käufer.
Psychologie. Vergleich der Bewertung des Erziehungsstils von Müttern und Vätern.

Der Hauptvorteil eines Querschnittsexperiments besteht darin, dass es Ihnen ermöglicht, viele verschiedene Variablen gleichzeitig zu vergleichen. Sie könnten beispielsweise die Auswirkungen von Alter, Geschlecht, Erfahrung oder Bildungsniveau auf die kognitiv-emotionale Bewertung der Fernsehwerbung durch die Befragten untersuchen, und das mit geringem oder gar keinem zusätzlichen Aufwand. Sie müssen lediglich die Daten erheben (beispielsweise durch Interviews oder Umfragen).

Längsschnittdesign

In einer Längsschnittstudie führen Sie über einen Zeitraum von Stunden, Tagen, Monaten oder sogar vielen Jahren hinweg mehrere Beobachtungen derselben Befragtengruppe durch. Auf diese Weise stellen Sie einen zeitlichen Ablauf her und minimieren Störfaktoren, die einzelne Messungen beeinträchtigen könnten. Mit anderen Worten: Sie sorgen dafür, dass die Ergebnisse weniger anfällig für mögliche Nebeneffekte sind.

Sie könnten beispielsweise Ihrer Zielgruppe (männliche Käufer mit hohem Einkommen) einen Fernsehspot mehrmals zeigen und beobachten, wie sich deren Präferenz für den Spot im Laufe der Zeit verändert.

Weitere Beispiele für Längsschnittstudien sind:

Medien-/Pakettests. Einer Gruppe von Befragten werden nacheinander zwei oder mehr Medien-Trailer oder -Pakete gezeigt, und sie bewerten, wie gut ihnen die einzelnen vorgestellten Elemente gefallen.
Lebensmittel- und Geschmackstests. Den Befragten werden nacheinander zwei oder mehr Geschmacksrichtungen vorgelegt, und sie werden um ihre Meinung gebeten.
UI- und UX-Tests. Die Teilnehmer navigieren durch zwei oder mehr Websites und werden zu Fragen der Benutzerfreundlichkeit befragt.
Psychologie und Fortbildung. Eine Gruppe von Teilnehmern einer Fortbildungsveranstaltung füllt vor, während und nach der Fortbildung einen Fragebogen zum emotionalen Wohlbefinden aus.
Physiologie. Sie erfassen EEG-, GSR- und EMG-Daten sowie Gesichtsausdrücke usw., während die Probanden Bildern, Tönen oder Videostimuli ausgesetzt sind.

Der Hauptvorteil von Längsschnittstudien besteht darin, dass man einen zeitlichen Verlauf der Werte innerhalb einer Befragtengruppe erhält. Selbst wenn man lediglich kognitiv-affektive Testergebnisse vor und nach der experimentellen Intervention erfasst, lässt sich die Auswirkung der Intervention auf bereits vorhandene Niveaus von Aufmerksamkeit, Kognition oder Affekt besser nachvollziehen. Daher lassen Längsschnittstudien eher auf Ursache-Wirkungs-Zusammenhänge schließen als Querschnittsstudien.

Gemischte Versuchsanordnung

Gemischte Versuchsdesigns vereinen das Beste aus zwei Welten, da sie es ermöglichen, Längsschnittdaten über mehrere Gruppen hinweg zu erheben. Streng genommen liegt ein gemischtes Versuchsdesign immer dann vor, wenn physiologische Daten (wie EEG, GSR, EMG, EKG, Mimik usw.) von mehreren Gruppen von Probanden erhoben werden, um verschiedene Populationen miteinander zu vergleichen. Die Daten selbst sind Längsschnittdaten (mehrere Erhebungen im Zeitverlauf), während der Gruppenvergleich Querschnittsaspekte aufweist.

Typische Beispiele für gemischte Versuchspläne sind:

Produkt-/Medientests. Zwei oder mehr Versionen eines Produkts oder einer Dienstleistung werden hinsichtlich der kognitiven und verhaltensbezogenen Ergebnisse von zwei oder mehr Gruppen (z. B. Anfänger und Experten, Männer und Frauen, junge und ältere Menschen) miteinander verglichen.
A/B-Test. Zwei Versionen einer Website oder App werden hinsichtlich der kognitiven und verhaltensbezogenen Ergebnisse von zwei oder mehr Gruppen verglichen.

Experimente mit gemischtem Design eignen sich ideal für die Erfassung von Zeitverläufen über mehrere Zielgruppen hinweg und ermöglichen es Ihnen, die treibenden Kräfte des menschlichen Verhaltens detaillierter zu untersuchen, als dies mit Querschnitts- oder Längsschnittdesigns allein möglich wäre.

Letztendlich hängt die Wahl des Forschungsdesigns in erster Linie von Ihrer Forschungsfrage ab. Natürlich können Sie zunächst eine Querschnittsstudie durchführen, um sich einen Überblick über die potenziellen Faktoren zu verschaffen, die die Ergebnisse beeinflussen, und anschließend eine detailliertere Längsschnittstudie durchführen, um Ursache und Wirkung genauer zu untersuchen.

Im nächsten Abschnitt werden wir näher erläutern, wie die Reize angeordnet werden sollten und welche Sensoren dabei eine Rolle spielen.

Auswahl und Anordnung von Reizen

Experimente in der kognitiven Verhaltensforschung am Menschen beinhalten in der Regel eine Art von Stimulus, der dazu dient, eine Reaktion bei den Probanden hervorzurufen. Die beiden wichtigsten Fragen im Zusammenhang mit den Stimuli lauten: Welche Stimuli benötige ich? In welcher Reihenfolge soll ich die Stimuli präsentieren?

Arten von Reizen

Reize gibt es in verschiedenen Formen, darunter akustische, visuelle, haptische, olfaktorische usw. Multimodale Reize kombinieren mehrere dieser Formen. Die folgenden Reize werden in wissenschaftlichen und kommerziellen Forschungsstudien zum menschlichen Verhalten verwendet:

Bilder
Video
Websites
Software-Schnittstellen
Geräte (Autoinnenraum, Flugzeugcockpit, Milchshake-Maschine usw.)
Kommunikation mit anderen per Telefon, über das Internet oder von Angesicht zu Angesicht
Komplexe Szenen (VR, reale Umgebungen)
Ton (Sinuswellen, komplexe Klänge, gesprochene Sprache, Musik)
Geruchssinn (Geschmacksrichtungen, Gerüche)
Haptische Reize (Erkundung von Objekten durch Berührung, Druckplatten, vibrierende Sensoren, haptische Roboter)
Fragebögen und Umfragen (webbasiert oder softwaregestützt, in Papierform)

Stimulussequenz

Reize werden den Probanden in der Regel in einer bestimmten Reihenfolge präsentiert. Welche Reihenfolgen werden typischerweise in der kognitiven Verhaltensforschung am Menschen verwendet?

Feste Reizsequenz

Feste Abläufe sind immer dann erforderlich, wenn zufällige Abläufe nicht sinnvoll sind oder nicht angewendet werden können. Wenn beispielsweise ein Website-Test mit einem Interview zum Thema Website kombiniert wird, ist es nicht sinnvoll, zuerst Fragen zur Website zu stellen und den Befragten erst danach aufzufordern, die Website tatsächlich zu nutzen.

Hier ist die einzig sinnvolle Reihenfolge, zuerst die Website zu erkunden und erst danach den Fragebogen auszufüllen. Wenn es darum geht, verschiedene Versionen eines Stimulus zu vergleichen, zum Beispiel die Websites A und B, können ebenfalls festgelegte Reihenfolgen verwendet werden.

Zufällige Reizfolge

Wie Sie bereits gelernt haben, birgt die Präsentation von Reizen in derselben Reihenfolge bei allen Befragten das Risiko von Reihenfolgeeffekten. Die Befragten könnten den ersten Reiz stets höher bewerten, da sie zu diesem Zeitpunkt noch motiviert, engagiert und neugierig sind.

Nach zwei langen Stunden im Labor kann die Erschöpfung überhandnehmen, sodass die Bewertungen möglicherweise niedrig ausfallen, selbst wenn das getestete Produkt oder die Dienstleistung alle bisherigen Erwartungen übertrifft. Dies lässt sich vermeiden, indem die Reize in zufälliger Reihenfolge präsentiert werden.

Ausgleichssequenz

Um die Probleme einer vollständigen Randomisierung zu vermeiden, zielen ausgeglichene Versuchspläne darauf ab, eine gleichmäßige Verteilung der Bedingungen auf die Stimulus-Slots des Experiments zu erreichen. Im folgenden Beispiel werden die beiden Stimulusbedingungen A und B auf sechs Probanden ausgeglichen verteilt, sodass drei Probanden zuerst Stimulus A und die anderen drei Probanden zuerst Stimulus B präsentiert bekommen.

Blockbauweise

Manchmal ist es nicht sinnvoll, die gesamte Stimulusliste zu randomisieren, da sie möglicherweise einer internen Logik und Reihenfolge folgt. Nehmen wir an, Sie möchten das Verhalten der Befragten beim Auspacken verschiedener Lebensmittelverpackungen untersuchen.

Für jede Verpackung gibt es ein festgelegtes Bewertungsprotokoll, bei dem (a) die Verpackung enthüllt wird und (b) die Befragten gebeten werden, ihre Assoziationen mündlich zu beschreiben. Anschließend (c) sollen sie die Verpackung in die Hand nehmen und öffnen und (d) ihre Erfahrungen beschreiben. Diese Abfolge von Schritt (a) bis (d) kann auch als experimenteller „Block“ bezeichnet werden, der für alle getesteten Verpackungen wiederholt werden soll.

Die Reihenfolge, in der die Pakete präsentiert werden, ist zwar zufällig, der Inhalt der einzelnen Blöcke bleibt jedoch unverändert.

Wiederkehrendes Motiv

Bei EEG- und anderen physiologischen Aufzeichnungen ist es manchmal erforderlich, denselben Reiz mehrmals zu präsentieren. Dies ist notwendig, da die durch den Reiz ausgelösten Veränderungen der Gehirnaktivität im Vergleich zur Grundaktivität sehr gering sind. Durch die mehrmalige Präsentation desselben Reizes wird sichergestellt, dass genügend Daten vorliegen, um valide Schlussfolgerungen zu ziehen.

Die Wiederholung von Reizen ist jedoch auch bei Eye-Tracking-Studien möglich. In diesem Fall gelten ebenfalls die oben aufgeführten Randomisierungsverfahren.

Vielleicht interessiert Sie, wie viele Wiederholungen erforderlich sind, um Ergebnisse zu erzielen. Leider lässt sich diese Frage nicht pauschal beantworten, da dies von verschiedenen Faktoren abhängt, wie beispielsweise der Stärke des erwarteten Effekts bzw. des Unterschieds zwischen zwei Bedingungen, der Reizmodalität, dem physiologischen Effekt, der untersucht werden soll, sowie weiteren Faktoren, die die Versuchsergebnisse beeinflussen.

Zudem gibt es wichtige statistische Aspekte, die den Rahmen dieser allgemeinen Einführung sprengen würden.

Messverfahren und Sensoren

Wenn Sie Experimente für die kognitiv-verhaltensbezogene Forschung am Menschen entwerfen, sollten Sie auf jeden Fall berücksichtigen, von welchen Biosensoren Sie Daten erfassen. Menschliches Verhalten ist ein komplexes Zusammenspiel einer Vielzahl unterschiedlicher Prozesse, das von völlig unbewussten Modulationen emotionaler Reaktionen bis hin zu Entscheidungsfindungen reicht, die auf bewussten Gedanken und kognitiven Prozessen basieren. Tatsächlich wird jede unserer emotionalen und kognitiven Reaktionen von Faktoren wie Erregung, Arbeitsbelastung und Umgebungsbedingungen bestimmt, die unser Wohlbefinden in genau diesem Moment beeinflussen.

All diese Aspekte des menschlichen Verhaltens lassen sich durch Selbstauskünfte (in Form von Interviews oder Umfragen), spezielle Geräte (wie Eye-Tracker, EEG-Systeme, GSR- und EKG-Sensoren) oder kamerabasierte Gesichtsausdrucksanalysen erfassen.

Eye-Tracking

Fernsehwerbung, Videospiele, Filme, Websites, Geräte sowie Interaktionspartner im Privatleben und am Arbeitsplatz – ohne unser Sehvermögen könnten wir all dies nicht verarbeiten. Das menschliche Gehirn ist perfekt auf visuelle Reize und die Steuerung der Augenbewegungen abgestimmt. Daher ist es naheliegend, Informationen über die Blickposition und die Pupillenerweiterung mittels Eye-Tracking zu erfassen. Wenn Sie visuelle Reize auf dem Bildschirm präsentieren, sollten Sie stets Eye-Tracking-Daten erfassen, um absolut sicher zu sein, wohin die Befragten ihren Blick richten und wie sich dies auf die kognitive Verarbeitung auswirkt. Zweitens kann die Überwachung der Pupillenerweiterung wertvolle Einblicke in den Erregungs- und Stresspegel eines Befragten liefern. Da die Pupillenerweiterung ein autonomer Prozess ist, kann sie nicht bewusst gesteuert werden. Eye-Tracking-Aufzeichnungen ermöglichen es Ihnen, sowohl das Engagement und die Motivation der Befragten als auch deren Erregungsniveau während der Konfrontation mit emotionalen oder kognitiv anspruchsvollen Reizen zu überwachen.

GSR/EDA

Die galvanische Hautreaktion (GSR) oder elektrodermale Aktivität (EDA) spiegelt die Menge an Schweiß wider, die von den Schweißdrüsen unserer Haut abgesondert wird. Verstärktes Schwitzen führt zu einer höheren Hautleitfähigkeit. Wenn wir emotionalen Inhalten ausgesetzt sind, schwitzen wir emotional. GSR-Aufzeichnungen in Verbindung mit EEG sind äußerst aussagekräftig, da die Hautleitfähigkeit unbewusst gesteuert wird, d. h. durch tiefere und ältere Hirnstrukturen als die kognitiven Prozesse, die durch das EEG überwacht werden. Daher bietet die Einbeziehung der GSR enorme Einblicke in die ungefilterte, unverfälschte emotionale Erregung eines Probanden.

Analyse des Gesichtsausdrucks

Mithilfe der Gesichtsausdrucksanalyse können Sie beurteilen, ob die Befragten ihre positive Einstellung tatsächlich durch beobachtbares Verhalten zum Ausdruck bringen. Die Gesichtsausdrucksanalyse ist eine unaufdringliche Methode zur Erfassung der Kopfposition und -ausrichtung (sodass Sie stets wissen, wo sich Ihre Befragten relativ zum Stimulus befinden), von Ausdrucksformen (wie das Anheben der Augenbrauen oder das Öffnen des Mundes) sowie der allgemeinen Gesichtsausdrücke grundlegender Emotionen (Freude, Wut, Überraschung usw.) mithilfe einer vor dem Befragten platzierten Webcam. Gesichtsdaten sind äußerst hilfreich, um Engagement, Frustration oder Schläfrigkeit zu überwachen.

(Gesichts-)EMG

Elektromyografische Sensoren erfassen die durch Körperbewegungen erzeugte elektrische Energie. EMG-Sensoren können eingesetzt werden, um Muskelreaktionen im Gesicht, an den Händen oder Fingern als Reaktion auf beliebige Reize zu überwachen. Selbst subtile Aktivierungsmuster, die mit bewusst gesteuerten Hand- und Fingerbewegungen verbunden sind (Schreckreflex), lassen sich mit EMG erfassen. Die Erfassung synchronisierter EMG-Daten ist für alle relevant, die sich dafür interessieren, wie Bewegungen der Augen und Gliedmaßen vorbereitet und ausgeführt werden, aber auch, wie Bewegungen verhindert und Handlungen gehemmt werden.

EKG/PPG

Durch die Überwachung der Herzaktivität mithilfe von an der Brust angebrachten EKG-Elektroden oder an den Fingerspitzen befestigten optischen Herzfrequenzsensoren können Sie den körperlichen Zustand der Befragten, ihr Angst- und Stressniveau (Erregungszustand) sowie den Zusammenhang zwischen Veränderungen ihres physiologischen Zustands und ihren Handlungen und Entscheidungen verfolgen. Die Erfassung der körperlichen Erschöpfung der Befragten mittels EKG-Sensoren kann hilfreiche Einblicke in kognitiv-affektive Prozesse bei körperlich anstrengenden Aktivitäten liefern.

EEG

Die Elektroenzephalographie (EEG) ist ein bildgebendes Verfahren, bei dem die vom Gehirn erzeugte elektrische Aktivität mithilfe tragbarer Sensoren und Verstärkersysteme an der Kopfhautoberfläche gemessen wird. Sie ist zweifellos das Verfahren der Wahl, wenn es darum geht, die Gehirnaktivität im Zusammenhang mit Wahrnehmung, kognitivem Verhalten und emotionalen Prozessen zu untersuchen. Das EEG liefert wichtige Einblicke in die subsekundäre Dynamik des Gehirns bei Engagement, Motivation, Frustration und kognitiver Belastung sowie in weitere Kennzahlen im Zusammenhang mit der Reizverarbeitung, der Handlungsvorbereitung und der Handlungsausführung. Einfach ausgedrückt: Das EEG zeigt eindrucksvoll, welche Teile des Gehirns aktiv sind, während wir eine Aufgabe ausführen oder bestimmten Reizen ausgesetzt sind.

Selbstauskünfte

Jedes Experiment sollte Phasen zur Erhebung selbstberichteter Daten beinhalten, beispielsweise zu Beginn der Sitzung, während der Datenerhebung und ganz am Ende. Die Erfassung demografischer Daten (Geschlecht, Alter, sozioökonomischer Status usw.) trägt dazu bei, die Gruppe der Befragten detaillierter zu beschreiben. Zudem tragen selbstberichtete Daten aus Interviews und Umfragen wesentlich dazu bei, Einblicke in die subjektive Welt der Befragten zu gewinnen – ihre selbstwahrgenommene Aufmerksamkeit, Motivation und ihr Engagement –, die über die von Biosensoren gemeldeten quantitativen Werte hinausgehen. Natürlich können Umfrageergebnisse genutzt werden, um Ihre Befragten für die Analyse in bestimmte Gruppen zu segmentieren (z. B. jung vs. alt; männlich vs. weiblich; Anfänger vs. erfahrene Nutzer).

Versuchsplanung richtig gemacht mit iMotions

Gut konzipierte Experimente ermöglichen Ihnen tiefe Einblicke in die Aufmerksamkeit, die kognitiven Prozesse und die emotionale Verarbeitung Ihrer Zielgruppe, wenn diese mit physischen Objekten oder Reizen konfrontiert wird. Die experimentelle Forschung hat konkrete Empfehlungen dazu entwickelt, wie sich Verzerrungen durch den Experimentator oder durch Segmentierung vermeiden lassen – Randomisierungsstrategien für die Auswahl der Befragten und der Reize sind dabei ein hervorragender Ausgangspunkt.

Bevor Sie mit der Konzeption Ihres nächsten kognitiv-verhaltensorientierten Experiments beginnen, sollten Sie sich sicherlich Gedanken darüber machen, wie Sie die Reize gestalten, wie Sie die Probanden auswählen und welche Biosensoren Sie einsetzen, um möglichst viele Erkenntnisse zu gewinnen.

Was wäre, wenn es eine multimodale Softwarelösung gäbe, mit der sich beliebige Reize laden und anordnen lassen – beispielsweise in festen oder zufälligen Abfolgen –, während gleichzeitig Daten aus EEG, Eye-Tracking, Gesichtsausdrucksanalyse und anderen Biosensoren (wie GSR, EKG, EMG) aufgezeichnet werden, ohne dass man alles manuell zusammenfügen muss?

Die iMotions-Plattform

Die iMotions-Plattform ist eine benutzerfreundliche Softwarelösung für Studiendesign, Multisensor-Kalibrierung, Datenerfassung und -analyse.

iMotions unterstützt standardmäßig über 50 führende Biosensoren, darunter Gesichtsausdrucksanalyse, GSR, Eye-Tracking, EEG, EKG und EMG sowie Umfragen für die multimodale Verhaltensforschung.

Literaturverzeichnis

Banerjee, Chaudhury u. a. (2007). Statistik ohne Tränen – Grundlagen für die Berechnung des Stichprobenumfangs. Indian Psychiatry Journal, 16, 150–152.
Banerjee & Chaudhury (2010). Statistik ohne Tränen: Grundgesamtheiten und Stichproben. Industrial Psychiatry Journal, 19(1), 60–65.
Creative Research Systems (2003). Rechner zur Berechnung der Stichprobengröße. Abgerufen unter https://www.surveysystem.com/sscalc.htm am 06.08.2016.
Cooper, Camic et al. (2012). APA-Handbuch der Forschungsmethoden in der Psychologie, Band 1: Grundlagen, Planung, Messverfahren und Psychometrie.
Cooper, Camic et al. (2012). APA-Handbuch der Forschungsmethoden in der Psychologie, Band 2: Forschungsdesigns: Quantitativ, qualitativ, neuropsychologisch und biologisch.
Farrington (1991). Strategien der Längsschnittforschung: Vorteile, Probleme und Perspektiven. Journal of the American Academy of Child and Adolescent Psychiatry, 30(3), 369–374.
Hofling et al. (1966). „Eine experimentelle Untersuchung der Beziehungen zwischen Pflegekräften und Ärzten“. Journal of Nervous and Mental Disease, 143, S. 171–180.
McLeod (2007). Das Milgram-Experiment. Abgerufen unter www.simplypsychology.org/milgram.html am 31.07.2016.
Martinez-Mesa, Gonzalez-Chica et al. (2014). Stichprobengröße: Wie viele Teilnehmer benötige ich für meine Studie? Anais Brasileiros de Dermatologia, 89(4), 609–615.
Monahan & Fisher (2010). Vorteile von Beobachtereffekten: Erkenntnisse aus der Praxis. Qualitative Research, 10(1), S. 357–376.
Niles (2014). Stichprobengröße: Wie viele Umfrageteilnehmer benötige ich? Abgerufen unter https://www.sciencebuddies.org/science-fair-projects/project_ideas/Soc_participants.shtml am 06.08.2016
Ryan (2006). Modern Experimental Design (2. Auflage). New York: Wiley Interscience.

Versuchsaufbau: Der vollständige Taschenführer

Table of Contents

Einführung in experimentelle Methoden

Beispiel für einen Versuchsplan

Schritt 1: Formulieren Sie eine Hypothese

•Unabhängige Variable

• Abhängige Variable (DV)

Schritt 2: Stichprobengruppen

Stichprobengruppen definieren

Schritt 3: Fächer den Gruppen zuweisen

Schritt 4: Bestimme die Abtastfrequenz.

Schritt 5: Führen Sie das Experiment durch und sammeln Sie Daten.

Schritt 6: Daten vorverarbeiten und Kennzahlen analysieren.

Arten von Versuchsplänen

1. Laborversuche

Was Sie über Laborexperimente wissen sollten…

Stärken.

Einschränkungen.

2. Feldversuche

Was Sie über Feldversuche wissen sollten…

>> Stärken.

>> Einschränkungen.

3. Natürliche Experimente.

Was Sie über natürliche Experimente wissen sollten…

Stärken.

Einschränkungen.

Wie kann ich menschliches Verhalten messen?

Zwei Ansätze zur Erforschung des menschlichen Verhaltens

Qualitative Studien zum menschlichen Verhalten

Was Sie über qualitative Studien wissen sollten…

Stärken.

Einschränkungen.

Typische Anwendungsfälle.

Quantitative Studien

Was Sie über quantitative Studien wissen sollten…

Stärken.

Einschränkungen.

Typische Anwendungsfälle.

Maßnahmen zur Vermeidung von Verzerrungen

Objektivität

Zuverlässigkeit

Gültigkeit

Umfrageverwaltung

Nicht-zufällige Stichprobenauswahl

Zufällige Auswahl der Befragten.

Einfache Zufallsstichprobe

Systematische Stichprobenziehung

Mehrstufige Stichprobenziehung

Cluster-Stichprobenverfahren

Wie viele Teilnehmer brauche ich?

Selbstvertrauen

Querschnitts- vs. Längsschnittdesigns

Querschnittsdesign

Längsschnittdesign

Gemischte Versuchsanordnung

Auswahl und Anordnung von Reizen

Arten von Reizen

Stimulussequenz

Feste Reizsequenz

Zufällige Reizfolge

Ausgleichssequenz

Blockbauweise

Wiederkehrendes Motiv

Messverfahren und Sensoren

Eye-Tracking

GSR/EDA

Analyse des Gesichtsausdrucks

(Gesichts-)EMG

EKG/PPG

EEG

Selbstauskünfte

Versuchsplanung richtig gemacht mit iMotions

Die iMotions-Plattform

Literaturverzeichnis

5 Wege, wie uns die Neuroarchitektur zeigt, wie wir auf Gebäude reagieren

Die Zukunft der VR-Expositionstherapie

Die Iowa-Glücksspielaufgabe – Was sagt sie uns über das Gehirn?

Was ist mentale Belastung? [Und wie lässt sie sich messen?]

Wie Hidden Markov Models zur Verbesserung der Eye-Tracking-Funktion von Webcams eingesetzt werden

Der Implizite Assoziationstest (IAT)