隠れマルコフモデルがウェブカメラによる視線追跡の精度向上にどのように活用されているか

隠れマルコフモデルが、視覚的注意や視線パターンを分析することで、アイトラッキング技術をどのように向上させるかをご紹介します。本稿では、心理学、マーケティング、ユーザーエクスペリエンス研究などの分野における同モデルの応用について概説します。

アイトラッキングは、人がどこを見ているかを明らかにしますが、専門的な分析とは、雑音や現実世界の環境下において、時間の経過とともに注意がどのように変化していくかを理解することです。視線データは本質的に不完全であり、ハードウェアの品質、記録環境、頭部の動き、参加者間の個人差などの要因の影響を受けます。 

ウェブカメラの利用など、生態学的妥当性が高く多様なアイトラッキング技術が進歩するにつれ、個人レベルのノイズへの対処がますます重要になってきています。アイトラッキングデータを収集するための専用ハードウェアや制御された環境が参加者に整っていないため、信号対雑音比は研究レベルというよりも個人レベルで変動しやすく、影響を受けやすくなっています。

ウェブカメラを用いたアイトラッキングで注視点を分類する際の問題点: 

個人レベルのノイズが存在する場合、視線固定の分類においてノイズにどう対処するかは、重要な課題である。現在の視線固定分類におけるゴールドスタンダードでは、視線の速度や、視線データの時空間的な近接性に基づいて、明確な閾値を設定している。

このような分類器を使用した場合、研究者はノイズを偽陽性のサッカードや固定視と誤分類してしまうリスクを負うことになる。分類器を使用しない場合、研究者は信号に含まれるノイズを含め、すべてのデータポイントに対処せざるを得ず、被験者がどこで固定視によって積極的に情報を受け取っていたのか、どこでサッカードを用いて視線を走らせていたのかを知るという利点も得られない。

隠れマルコフモデルがウェブカメラを用いた視線追跡にどのように役立つか:

まさにこの理由から、隠れマルコフモデル(HMM)は現代のアイトラッキングにおいて極めて重要な役割を果たしており、世界中のプラットフォームで実装されているマルコフモデルに基づく主要な手法となっているのです。 

HMMは、眼球運動を明確で容易に分離可能な事象として扱うのではなく、不確実性を考慮に入れます。HMMは、直接観察できない要素をモデル化し、ノイズの多い信号から確率的に推論します。このため、HMMはアイトラッキングに特に適しています。

アイトラッキングにおいて隠れマルコフモデルがどのように実装されているかを可視化すると、次のような図になるでしょう:

アイトラッキングのための隠れマルコフモデル

隠れマルコフモデル――その概要

隠れマルコフモデル(HMM)とは、時間の経過とともに観測不可能な(隠れた)状態の列を経て変化するシステムを記述するものであり、そのシステムは、それらの状態と確率的に関連付けられた観測可能な信号を生成する。マルコフ性として知られるこのモデルの根本的な仮定は、次の隠れた状態の確率が、過去の状態の全列ではなく、現在の状態のみに依存するというものである。

文章の一行を読むことを考えてみてください。新しい単語に出会うたびにページの先頭に戻ることはなく、直前に読んだ箇所さえ分かっていれば、その先を読むことができるという順序で読み進めていくのです。 

隠れマルコフモデル

これはアイトラッキングにおいて極めて重要な区別である。注視、サッカード、まばたきといった眼球運動の状態は、直接観測されるものではない。その代わりに、位置、速度、信号の安定性といったノイズの多い視線信号から推論しなければならない。HMM(隠れマルコフモデル)は、現在の観測値に関する情報と、眼球運動が時間とともにどのように変化するかという現実的な制約を組み合わせることで、この推論を行うための体系的な手法を提供する。

視線追跡分類のための隠れマルコフモデル

隠れマルコフモデルは、時系列データのための統計モデルであり、各サンプルが、その確率は観測不可能(隠れている)である一連の可能な状態のうちの1つを観察したものと仮定する。

 注視分類のシナリオでは、すべてのアイトラッキングサンプルは、注視中またはサッカード中に収集されたデータポイントのいずれかを表すと仮定され、眼球運動パターンは観測不可能なマルコフ過程であると見なされる。ある状態(注視)から別の状態(サッカード)への遷移には一定の確率があり、この確率は未知であるため、アルゴリズムが記録されたデータから学習する必要がある。

この計算は、回答者ごとに他の回答者とは独立して実行されるため、アルゴリズムは個々の眼球運動パターンやデータのノイズレベルに適応することができます。

隠れマルコフモデルはどのように機能するのか:

モデルは、新しいデータセットに遭遇する前に、一定量の情報を与えられます。例えば、注視やサッカードがどのようなものかという基準が与えられます。また、モデルは、特定の状態にとどまる確率や、その状態から離れる確率も想定しています。 

新しいデータセットが与えられると、モデルは既知の定義と確率に基づいて、分類に含めるべき未知のパラメータを持つマルコフモデルを特定します。これがモデルが個々のデータセットレベルで適応を行う仕組みであり、個々のデータセットにおけるノイズの問題に対処することを可能にします。

iMotionsにおけるHMMと他の分類器の比較

iMotionsにおけるウェブカメラベースのアイトラッキングデータのデフォルトの分類器は、隠れマルコフモデルです。 

検証研究1:スクリーン型アイトラッカーにおけるHMMとI-VTの比較

内部検証研究によると、標準的な画面型アイトラッカーで記録されたデータについて、隠れマルコフモデルによる注視分類と、ゴールドスタンダードである速度閾値分類器との間には、極めて高い一致性が認められた。この結果は、画面型アイトラッカーを60Hzから最大600Hzで動作させた合計24名の被験者において、一貫して確認された。 

6×6グリッドのAOIにおける注視回数のクラス間相関係数は、すべての研究で0.99を超えており、信頼性が極めて高いことが示された。混同行列を用いた2つの分類器の予測結果からは、すべての被験者において0.94を超える優れた精度と、0.8を超えるカッパ値が確認された。

検証研究2:ウェブカメラを用いた視線追跡におけるHMMとI-VTの比較

iMotionsのウェブカメラベースのアイトラッキングアルゴリズムを用いて記録された、参加者各5名による2つの社内調査では、隠れマルコフモデルと速度ベースのフィルタとの間に中程度の一致が見られた。 

6×6のグリッド状に設定されたAOIにおける注視回数の集計結果は、クラス間相関係数が0.87以上と高い信頼性を示したが、I-VTデータからI-HMMデータを予測した場合の精度は少なくとも0.73であり、回答者間でカッパ係数は0.3~0.8の範囲であった。データを目視で確認したところ、ウェブカメラを用いたアイトラッキングデータからの注視位置の分類においては、隠れマルコフモデルの方が優れた性能を示した。 

HMMでできること、できないこと

留意すべき点は、視線固定フィルターや分類器では、ウェブカメラから得られたデータを補正することはできないということです。専用のトラッカーがないことに起因する精度や正確性の低さは、いかなる視線固定分類フィルターによっても補正されることはありません。しかし、HMMは、個々のノイズから真の信号を抽出する点において、より優れた性能を発揮することが実証されています。

結論

アイトラッキングが、管理された実験室環境から、より自然で、拡張性が高く、遠隔環境へと移行するにつれ、個人レベルでのノイズ処理が重要な課題となっています。固定閾値に基づく従来型の注視点分類器は、信号品質が高く安定している場合には良好に機能しますが、変動性が高まると性能が低下します。これは、ウェブカメラを用いたアイトラッキングではよくあることです。

隠れマルコフモデル(HMM)は、眼球運動を潜在的な逐次プロセスとして扱い、不確実性を明示的にモデル化することで、より柔軟かつ原理に基づいたアプローチを提供する。 HMMは、すべてのデータを単一の硬直した枠組みに無理やり当てはめるのではなく、注視とサッカードの分類を個々の行動やノイズの特性に合わせて適応させる。ウェブカメラのハードウェアが持つ根本的な限界を克服することはできないものの、ノイズから有意義な信号を分離するのに適しており、生態学的妥当性のある遠隔アイトラッキング研究において、視覚的注意のより信頼性の高い推論を可能にする。

よくある質問

1. ウェブカメラを用いたアイトラッキングでは、なぜ注視点の分類がより困難なのでしょうか?

ウェブカメラを用いた視線追跡は、通常、専用の視線追跡装置に比べて空間的な精度が低く、ばらつきが大きい。照明条件、頭部の動き、カメラの画質、被験者の行動の違いなどが個人レベルのノイズを引き起こし、固定閾値を用いた分類器では、ノイズを注視やサッカードと誤分類しやすくなる。

2. 隠れマルコフモデルは、速度ベースの注視分類法とどのように異なるのでしょうか?

速度ベースの分類器は、信号品質が一定であることを前提として、固定視とサッカードを区別するために明確な閾値を用います。一方、隠れマルコフモデルは、眼球運動をノイズを含む観測値を生成する隠れ状態として扱うため、確率論的に分類を推定することができ、個々のデータセット内の変動に適応することが可能です。

3. 隠れマルコフモデルは、質の低いアイトラッキングデータを補正できるか?

いいえ。HMMは、ウェブカメラを用いたアイトラッキングの根本的な精度や正確性を向上させるものではありません。そもそも取得されていない情報を復元することはできません。その強みは、データの限界がある中で、ノイズから有意義な信号をより的確に分離できる点にあります。

4. なぜHMMは個人レベルの眼球運動解析に適しているのか?

HMMは個人レベルで学習・適用されるため、遷移確率や状態の定義を各被験者の眼球運動パターンやノイズ特性に合わせて調整することが可能です。このため、被験者や記録条件が異質な研究において特に有用です。

5. 研究者はどのような場合に、従来の分類器よりも隠れマルコフモデルを優先すべきか?

HMMは、参加者によって信号の質が異なる遠隔、オンライン、あるいは生態学的妥当性のあるアイトラッキング研究において、特に有用である。専用のハードウェアを用いた高品質な実験室での記録では、従来の分類器と同等の性能を示す場合もあるが、一貫性が保証できない状況においては、HMMの方がより高い頑健性を発揮する。