脳が単純な線を意味のある情景へと変換する仕組みを探ってみましょう。「良好な連続性」といったゲシュタルトの原理を通じて、私たちは形をまとまりのある全体として認識します。初期の視覚処理(V1)は線の方向を検知し、ガボールパッチなどの手法は、ノイズの中でも輪郭をどのように知覚しているかを明らかにし、それが私たちの世界の解釈の仕方を形作っています。
Table of Contents
丘の上にある家の風景写真を思い浮かべてみてください。何か思い浮かびますか?
では、コントラストや色さえ変えても、その写真に何が写っているかを判断し、理解することはできるでしょう。丘の上の家は、依然として丘の上の家のように見えます。しかし、同じ画像を使って、物体の形状や互いの位置関係を変化させると、そこに見えているものは根本的に変わってしまいます。 私たちは視覚的な情景を、色や照明の観点から捉えがちですが、実際には、物体同士の関係やその輪郭こそが、より重要な要素なのです。
幸いなことに、人間の視覚系は、物体の形状や他の物体との相互関係(すなわち、物体が互いにどのような位置関係にあるか)を捉えることで、世界の一貫した全体像を構築している。1935年、クルト・コフカは、個別に配置された要素が一直線上に整列したり、配置されたりしている場合、私たちの視覚系はこれらの別々の要素を一体のものとして知覚すると述べた[1]。
ゲシュタルト心理学
コフカが説明したのは、いわゆる「良好な連続性」と呼ばれる現象である。これは、共通の特徴を持つ個々の要素を、視覚系がひとつのグループとして認識する現象を指す。こうした視覚知覚の指針、すなわち「法則」は、ゲシュタルト心理学と呼ばれる研究分野の基礎となっている。
ゲシュタルト研究者は、画像の断片がどのようにして全体を構成するのかに関心を持っています。これらの科学者は、場面の一部だけでなく、線やエッジ、対称性についても研究しています。 信じられないかもしれませんが、1890年代以来、研究者たちはゲシュタルトの観点から人間の知覚を理解しようと多大な努力を重ねてきました。ゲシュタルトの原理や、私たちが輪郭をどのように解釈し、認識するかを解明するために、数多くの研究や文献が存在します。ゲシュタルトの原理は、図1の画像に見ることができます。

図1(a)。ゲシュタルト心理学の原則の例。

図1(b)。ゲシュタルト心理学の原則の例。
図1の画像を一瞥するだけで、私たちの脳は自動的に「閉鎖」の例(a)の欠けている部分を補完し、(b)の図形と背景を区別することができます。人間の視覚系は、私たちが意識的に考える必要さえなく、素早く画像をグループ化します。
脳の研究 / V1
脳は、ゲシュタルトの原理に従うように、この情報をどのように処理しているのでしょうか?
まず、視覚の仕組みについて見ていきましょう。光は目を通って、まず角膜を通り抜け、水晶体を越えて網膜に到達します。そこで、眼の奥にある受容体が光を電気信号に変換します。その後、視神経がこの電気信号を視覚野へと伝達します。
視覚野(後頭葉とも呼ばれる)は頭の後ろに位置し、視覚処理に関与するいくつかの領域から構成されています。視覚処理の最初の段階を担うのはV1と呼ばれる領域で、ここでは、線の向きが極めて特定の向きである場合にのみ信号を送る特殊なニューロンが存在します。
ヒューベルとウィーゼル[2, 3](後にノーベル賞を受賞)は、(ネコを用いた)単一細胞記録の実験を通じて、この事実を初めて報告した。彼らは、特定の線の方向が目に提示された場合にのみ、単一のニューロンが信号を送ることを発見した。線の方向がわずかに異なると、そのニューロンは反応しなかった。 こうした方向性に敏感な、あるいは「同調した」ニューロン同士が相互に通信することで、私たちは一貫性のある世界という視覚的知覚を構築できるようになる。異なる線に対する信号が合わさることで、私たちが目にしている完全な画像が形成されるのである。
ガボール・パッチ
輪郭――すなわち、私たちの視覚系が知覚する線そのもの――の研究には、さまざまな研究手法が用いられてきた。

図2. 単一のガボールパッチの例。https://www.cogsci.nl/gabor-generator から生成。
上の画像に示されているようなガボールパッチの輪郭は、V1の向きに敏感な細胞が反応する対象のおおよその目安と考えられているため、視覚科学において刺激としてよく用いられる(図2参照)。ガボールパッチの画像は、図3に示すように正弦波から作成されるが、線は正規化されている。

図3. 正弦波の図。
ガボール・パッチは白黒の斑点のように見えますが、実際には研究において有用です。なぜなら、視覚系がどのように反応するかを調べるために、任意の方向に向けたり、大きさを変えたり、さらにはコントラストを変化させたりすることができるからです。
ガボール・パッチは定量化が可能であり、単一の刺激として提示したり、視覚的ノイズの中に隠された輪郭として提示して発見を困難にしたりするなど、実験の要件に応じて調整することができます(図3参照)。
ここでこそ、心理物理学的研究が真価を発揮し、人間の視覚的知覚の限界がどこにあるのかを理解し始めることができる。研究者たちは、さまざまな課題を用いて、線に対する視覚的処理についてだけでなく、ノイズの中で輪郭をどの程度正確に知覚できるかについても探求してきた。
人々が「ノイズ」の中から輪郭を見つけられるかどうかを判断する簡単な方法の一つは、指で輪郭をなぞらせる(例:[4])か、あるいは閉じた輪郭と開いた輪郭のどちらであるかを選ばせることである[5]。 乳児期におけるこの視覚能力の発達過程の解明は、被験者が輪郭の位置を判断しなければならない強制選択パラダイムを用いて行われてきた[6, 7]。

図4. ノイズ中のガボールパッチの輪郭。Baker et al. (2008) より。
「だから何だ?」と疑問に思うかもしれません。だって、目を開ければ誰でも問題なく輪郭や線、エッジを見分けられるからです。しかし、輪郭認識の重要性を実際に理解できるのは、動物実験で明らかになったように[8]、輪郭認識が発達しなかった場合に何が起こるかを理解したときです。視覚系がどのように機能するかを理解することで、科学者はそれが機能しない際に生じる問題に対する解決策を考案することができるのです。
結論として、私たちの視覚系は、輪郭やその向きを認識するのに十分に備わっている。ゲシュタルトの原理を通じて、科学者たちは、人間の視覚系が世界をまとまりのある画像として捉えるために、物事を自動的にグループ化していることを指摘している。輪郭やガボール・パッチなどを用いて視覚的場面の基礎要素を分解することで、私たちは視覚の神経科学を解明し、丘の上の美しい家という風景を私たちがどのように認識できるのかを理解することができる。
視覚知覚の仕組みについて、お読みいただきありがとうございました。視覚処理の研究で用いられる主要な手法についてさらに詳しく知りたい方は、以下のリンクから無料の「アイトラッキングガイド」をダウンロードしてください。
参考文献
[1] コフカ, K. (1935). 『ゲシュタルト心理学の原理』. ロンドン:ラウトランド・アンド・キーガン・ポール.
[2] Hubel, D. H., & Wiesel, T. N. (1959). ネコ線条皮質における単一ニューロンの受容野. Journal of Physiology, 148, 574–591.
[3] Hubel, D. H., & Wiesel, T. N. (1962). ネコ視覚皮質における受容野、両眼間の相互作用および機能的構造. The Journal of Neuroscience, 160, 106–154.
[4] Jolicoeur, P., Ullman, S., & Mackay, M. (1991). 視覚的曲線追跡の特性. Journal of Experimental Psychology: Human Perception and Performance, 17(4), 997.
[5] Kovacs, I., & Julesz, B. (1993). 「閉曲線は単なる不完全な曲線以上のもの:図地分離における閉包性の影響」。『米国科学アカデミー紀要』, 90(16), 7495-7497.
[6] Gerhardstein, P., Kovacs, I., Ditre, J., & Feher, A. (2004). 生後3ヶ月児における輪郭の連続性と閉鎖性の検出. Vision Research, 44, 2981–2988.
[7] Baker, T. J., Tse, J., Gerhardstein, P., & Adler, S. A. (2008). 生後6ヶ月児による輪郭の統合:異なる輪郭形状の識別. Vision research, 48(1), 136-148.
[8] Blakemore, C., & Cooper, G. F. (1970). 脳の発達は視覚環境に依存する。Nature, 228(5270), 477.
