← Back to Blog Neuroscience

脳は人混みの中でどうやって顔を見分けているのか

June 5, 2026 · 9 min

時は1996年ごろ、夜遅く、MITのマクガヴァン脳科学研究所。ナンシー・カンウィッシャーがワークステーションの前に座り、ある一人の被験者から得られた、初めて解析された機能的MRIスキャンを見直している。そして、ジョシュ・マクダーモットとマーヴィン・チャンが彼女のそばに身を寄せ合い、画面上で輝くレンダリングされた大脳皮質表面をのぞき込んでいる。右半球の下面にある紡錘状回の小さな一画、およそ1平方センチメートルが、物体や手や家やスクランブルした顔の写真に対してよりも、顔の写真に対しておよそ2倍の強さで光っている。その信号はあまりにも明瞭で、見えるようにするために多くの人で平均を取る必要すらない。それは一つの脳の中に、一つの画面の上に、確かにそこにあった。

その論文は翌年に「紡錘状顔領域(the fusiform face area)」というタイトルでJournal of Neuroscience誌に届くことになり、その一画はFFAという名前を得て、30年経った今もこの分野で使われ続けている。その一つの輝点こそが、この記事が扱う問いを投げかける。目に流れ込んでくる視覚世界の全体から、脳はどうやって顔をすくい上げ、それをこれまで出会ったあらゆる顔から区別し、しかもそれを一瞬のうちに、人混みの中で、暗い光の下で、奇妙な角度から成し遂げているのか。その答えには、大脳皮質領域の特定の組み立てライン、専用に用意された一群の顔検出器、そしてこのシステム全体が何のためにあるのかを明らかにするある稀な障害が関わっていることが分かってくる。

物体を組み立てる視覚の組み立てライン

視覚で何かを認識することは、脳の底部に沿って走る腹側皮質視覚路と呼ばれる長い処理連鎖から始まる。それは頭の最も後ろにある一次視覚野(V1)から始まり、その後V2、V4の各領野を前方へと通過し、最終的に下側頭皮質、通常はITと略される領域へと至る。途中の各駅がそれぞれ複雑さの層を一つずつ加えていき、網膜上の明暗の生のパターンが、顔やカップや木を意味する何かへと徐々に変換されていく。

V1は最も基本的な材料、つまりあらゆる画像を構成する局所的な輪郭と方向づけられたコントラストの断片を扱う。V2はそれらの断片を受け取り、より複雑な輪郭を組み立てる。これには錯覚輪郭(物理的にはどこにも輪郭が存在しない場所にも知覚される縁)や、図と背景の分離が含まれる。V4は形態処理と色に対する選択性とを組み合わせる。信号が下側頭皮質に届くころには、個々のニューロンは大きな受容野を持ち、複雑な物体まるごとに反応するようになる。しかもしばしば不変性(インヴァリアンス)と呼ばれる有用な種類の安定性を備えている。これは、同じニューロンが、対象の位置がずれたり大きさが変わったりしても、同じ対象に反応し続けることを意味する。ITは脳が学習されたカテゴリーに対する選択性を蓄える場所であり、顔のための機構が宿っているのも、ここ、側頭葉の奥である。

この分業は決して自明なものではなかった。今では古典となった1982年の「二つの皮質視覚系(Two cortical visual systems)」と題された章で、国立精神衛生研究所で研究していたモーティマー・ミシュキンとレズリー・アンガーライダーは、サルにおける選択的損傷実験に基づいて、視覚はV1を越えた先で二つの並行する流れに分かれると論じた。V2、V4、ITを通る腹側の何(what)の流れは、物体の同一性、つまりそれが何であるかを運ぶ。一方、V2とV5/MTを通り後頭頂皮質へと上がっていく別個の背側のどこ(where)の流れは、空間的な位置を運び、行動を導く。つまり、それがどこにあって、どうやってそれに手を伸ばすかを運ぶ。顔の認識は、まさにこの何の流れの仕事である。

顔を気にかけた最初のニューロンたち

生きた人間の脳をスキャンできるようになるよりずっと前に、皮質がカテゴリーの専門家を含んでいるという最初の手がかりは、一つの研究室と、深く懐疑的な反応からもたらされた。1960年代後半からプリンストンで研究していたチャールズ・グロスは、マカクザルの下側頭皮質に微小電極を下ろし、個々のニューロンから一つずつ記録を取った。それらのニューロンのいくつかが、手の画像や顔の画像に対して強く特異的に反応し、他の刺激にはほとんど反応しないことを彼は見いだした。

1970年代初頭に最初の論文が現れたとき、この分野はそれを信じなかった。少なくとも、それをどう受け止めればよいのか分からなかった。当時の主流の前提は、皮質には顔のように具体的で高次なものに同調したニューロンなど含まれていない、というものであり、そこまで驚くべき結果は、それがアーティファクトではないかという疑念を招いた。この発見が正典として認められるようになったのはゆっくりとしたことで、他の研究室がそれを再現し、そして決定的なことに、人間の同等物の位置を特定できる画像化ツールがついに登場したあとのことだった。グロスは正しかったのだが、その決着がつくまでには一世代と新しい技術を要した。

2倍明るく光った一画

その新しい技術が機能的MRIであり、それこそが1990年代半ばに、カンウィッシャー、マクダーモット、チャンをあのワークステーションの前に座らせたものだった。彼らの1997年の論文「紡錘状顔領域:顔知覚に特化したヒト線条体外皮質のモジュール(The fusiform face area: a module in human extrastriate cortex specialized for face perception)」は、右下紡錘状回上のおよそ1平方センチメートルの一画が、多種多様な対照画像に対してよりも、顔の写真に対しておよそ2倍の強さで反応すると報告した。その効果は人から人へと信頼できる形で右半球を優位とし、紡錘状顔領域はやがて、ヒトの脳の中で最もよく研究されたカテゴリー選択的領域となった。

FFAは単独で存在しているわけではない。腹側の流れの近くには、他の種類のものに同調した別の一画があり、最も顕著なのは海馬傍場所領域、すなわちPPAである。これは顔よりも、情景や場所に対して優先的に反応する。こうして浮かび上がってきた図式は、なんでもこなす一つの物体認識装置ではなく、専門家たちの小さな群島であった。それぞれが特定のカテゴリーの刺激を優先的に処理し、すべてが同じ腹側経路に乗っている。顔はたまたま、その中で最も目立ち、最もよく特徴づけられた島であるにすぎない。

それからほぼ10年後、マカクザルとヒトの発見が単一細胞のレベルで縫い合わされた。ドリス・ツァオとウィンリッヒ・フライヴァルトは、ハーバードでマーガレット・リヴィングストンと共に研究し、まず覚醒したマカクザルでfMRIを用いて下側頭皮質内の個別の顔パッチの位置を特定し、次に各パッチにタングステン微小電極を下ろして個々のニューロンから記録を取った。2006年のScience誌での彼らの報告は、驚くべきことを見いだした。それは、顔パッチ内で記録したほぼすべてのニューロンが顔選択的だったということである。これはグロスの発見を、もはやばらばらに散らばった細胞ではなく、密で専用のクラスターとして、より大きく、より組織立った形で示したものだった。後年のツァオとフライヴァルトの研究室による研究は、これらのパッチを横断して走る階層構造を記述した。後方のパッチは顔を視点依存的な形で、つまり特定の角度に結びついた形で表現し、より前方のパッチは視点不変な同一性の表現、すなわち頭がどう向けられていようと同一人物だと認識する表現へと組み上げていくのである。

システムがダウンするとき

ある脳領域が何をしているのかを知る最も強力な方法の一つは、それが働かなくなったときに何が起こるかを研究することであり、顔認識についてはその臨床的な特徴に名前と長い歴史がある。1947年、テュービンゲン神経学クリニックのドイツ人神経学者ヨアヒム・ボダマーは、脳の後頭側頭領域への損傷の後に顔を認識する能力を失った3人の患者の症例集を発表した。彼はギリシャ語で顔を意味するprosoponと、知らないことを意味するagnosiaから、**相貌失認(プロソパグノシア)**という用語を作った。顔を知らないこと、という意味である。

これらの症例をこれほど重要にしたのは、その選択性だった。患者たちはなお完璧によく見えており、なお物体を認識でき、しばしば声や歩き方や特徴的な帽子から人を特定することもできたのに、顔そのものは、同一性への経路としては、ただ利用できなくなっていた。見慣れた顔は、たとえそれが配偶者のものであっても、顔としては登録されるが、特定の誰かとしては登録されなかった。これは、顔認識がそれ単独で失われ得る一方で、視覚の残りの部分はそのまま無傷でいられるという、初めての臨床的証拠だった。これはまさに、脳が顔を他のどんな物体とも同じように扱うのではなく、顔に専用の機構を割り当てているのなら予想されるとおりのことである。

相貌失認には二つの形がある。後天性の形は、右紡錘状回とそれを取り囲む下後頭側頭皮質への損傷、通常は脳卒中、頭部外傷、あるいは組織の外科的切除の後に生じ、比較的稀である。発達性の形はそれとは異なり、正常な視力、正常な知能を持ち、検出可能な脳病変もない人々における、生涯にわたる顔認識の困難である。これはほとんどの人が思っているよりもはるかに一般的で、有病率は人口のおよそ2パーセントと推定されている。これはつまり、あなたの知り合いの誰かが顔をめぐってひそかに苦しみ、ただそれを補う術を学んできただけ、ということがおそらくあるということだ。ブラッド・デュシェーンとケン・ナカヤマは、2000年代の間にこの発達性の形の診断基準を体系化し、研究者がそれを信頼できる形で特定し研究するための方法を与えた。

顔から名前へと至るステップの地図

神経科学は機構がどこにあるのかを教えてくれるが、心理学は、顔を見てからそれが誰のものか分かるまでに心がたどるステップについて、それを補う地図を提供する。その標準的な足場は、ヴィッキー・ブルースとアンディ・ヤングからもたらされた。1986年のBritish Journal of Psychology誌での彼らの論文「顔認識の理解(Understanding face recognition)」は、今なおこの分野を整理し続けている一連の認知段階を提案した。

彼らのモデルでは、認識は構造的符号化から始まる。これは、あなたが見ている顔について、特定の角度や照明から抽象化された、視点に依存しない記述を組み立てる。その記述は次に、顔認識ユニット、すなわち見慣れた顔ごとに蓄えられたテンプレートと照合され、あなたが以前にこの人物を見たことがあるかどうかを判定する。一致が見つかれば、人物同一性ノードが、認識された顔を、その人物について自分が知っているすべてのこと、その仕事、どこで会ったか、その人が自分に借金していること、などと結びつける。そして最終段階に至って初めて、名前検索が実際の名前を読み出す。この段階的なアーキテクチャは、もどかしい日常の経験をきれいに説明してくれる。それは、顔を認識し、その人が誰なのか正確に思い出せるのに、その名前だけは呼び起こせない、あの瞬間だ。ブルースとヤングのモデルでは、それは最後のステップでの明確な機能不全であり、同一性は回復されたのに、名前の段階が発火しそこねているのである。

顔領域は顔のために作られているのか、それとも熟達のためなのか

良い科学的発見は良い論争を生む。そしてFFAは、1997年の論文が世に出て以来ずっと続いている論争を一つ生み出した。その問いは見かけ上は単純だ。紡錘状顔領域は本当に顔のモジュールなのか、それとも、顔こそが私たちみなが最も練習するものであるがゆえに、たまたま顔がとても得意になっただけの領域なのか。

モジュール説は、カンウィッシャーと彼女の同僚たちによって擁護されており、FFAは顔に特化した皮質モジュールであり、顔という特定の刺激クラスのために進化によって、あるいは経験によって形作られた専門化の産物であるとする。この見方では、顔は特別であり、脳は専用のハードウェアでそれをそのように扱う。これと競合する熟達説は、ヴァンダービルトのイザベル・ゴーティエと同僚たちによって擁護されており、その代わりに、FFAは、あなたが十分に練習して専門家になったどんなカテゴリーの中でも、きめ細かな弁別、すなわちほとんど同一のものをもう一つから区別することに特化しているのだと提案する。この見方では、顔とはただ普遍的な熟達分野、つまり目の見えるあらゆる人間が乳児期から集中的に練習する唯一のカテゴリーであるにすぎず、だからこそこの領域は顔選択的に見えるのである。なぜなら、顔こそが誰もが習得している弁別問題だからだ。この論争はきれいに決着がついてはおらず、誠実な立場は、どちらの説も、同時に信頼できる形で顔を好み、かつ明らかに経験によって形作られている一つの領域について、何か本物のことを捉えている、というものである。その本物の、今も続く緊張それ自体が、FFAが決着のついた事案ではなく、いまだ活発な研究課題であり続けていることの証なのである。

重要なポイント

顔を認識することは、腹側の何の流れに依拠している。これは一次視覚野(V1)からV2、V4を経て下側頭皮質へと走る処理連鎖であり、各段階が複雑さを加えていき、ついには物体まるごとや学習されたカテゴリーが表現されるようになる。ミシュキンとアンガーライダーは1982年に、この何の流れを背側のどこの流れと区別した。チャールズ・グロスは1970年代初頭、マカクザルの下側頭皮質で最初の顔選択的ニューロンを、懐疑的な反応の中で記録した。この発見は、カンウィッシャー、マクダーモット、チャンが1997年にfMRIでヒトの紡錘状顔領域を、すなわち他の画像に対してよりもおよそ2倍の強さで顔に発火する右半球の一画を位置づけたときに正しさが証明され、さらにツァオとフライヴァルトが2006年に、マカクザルの顔パッチ内のほぼすべてのニューロンが顔選択的であること、そして視点依存的なものから視点不変な同一性へと至る階層構造があることを示したときに、再び裏づけられた。相貌失認は、1947年にボダマーによって名づけられ、稀な後天性の形と、人口のおよそ2パーセントに影響する発達性の形とに分けられるが、これは、視覚の残りの部分が生き残っている一方で顔認識が崩壊し得ることを実証している。そして1986年のブルースとヤングのモデルは、構造的符号化から名前検索までの認知ステップを地図化しており、一方でカンウィッシャーのモジュール説とゴーティエの熟達説との未解決の論争が、この領域がなぜ存在するのかという問いを真に開かれたままにしているのである。

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free