Was der IQ wirklich misst

Wenn Sie heute einen IQ-Test machen würden und ein im Jahr 1920 geborener Fremder denselben Test ablegte, gemessen an denselben Normen, dann läge dieser Fremde im Durchschnitt etwa dreißig Punkte unter Ihnen. Dreißig Punkte sind enorm. Es ist die Kluft, die den statistisch durchschnittlichen Menschen von jemandem in den untersten wenigen Prozent trennt. Nimmt man das wörtlich, dann wirken unsere Urgroßeltern, als hätten sie am Rande einer Behinderung gestanden, was absurd ist, denn sie bauten Stromnetze, gewannen Kriege, schrieben Sinfonien und spalteten das Atom. An der wörtlichen Lesart stimmt offensichtlich etwas nicht, und das Rätsel, was daran nicht stimmt, entpuppt sich als eine der aufschlussreichsten Fragen der gesamten Psychologie.

Das Muster ist real und es ist hartnäckig. Trägt man den Mittelwert in Intelligenztests über das zwanzigste Jahrhundert hinweg in irgendeinem Industrieland auf, so steigt die Linie um etwa drei Punkte pro Jahrzehnt, ohne Anzeichen einer Verlangsamung über den größten Teil dieses Zeitraums. Die Werte gingen hinauf; die Menschen veränderten sich nicht offensichtlich. Um zu verstehen, warum das so ist, und um zu verstehen, was ein IQ-Wert eigentlich aussagt, müssen wir genau hinsehen, was diese Tests messen, was diese Messung vorhersagt und welche lange Liste von Dingen sie stillschweigend außen vor lässt.

Eine Zahl, gebaut aus einem statistischen Zufall

Psychologen haben sich nie auf eine saubere Definition von Intelligenz geeinigt. Fragt man zehn Fachleute, erhält man Antworten, die von „der Fähigkeit, abstrakt zu denken" bis zu „der Fähigkeit, sich an seine Umwelt anzupassen" reichen, von denen keine ganz befriedigt. Statt darauf zu warten, dass die Philosophen die Sache klären, schlug die kognitive Psychologie einen pragmatischen Weg ein und entschied sich, Intelligenz zu operationalisieren: sie, für praktische Zwecke, als das zu definieren, was ein gut konstruierter Test geistiger Leistungsfähigkeit zuverlässig misst. Dieser Schritt klingt wie ein Ausweichmanöver, und teilweise ist er das auch, doch er beruht auf einer echten und überraschenden empirischen Entdeckung.

Im Jahr 1904 bemerkte der britische Psychologe Charles Spearman etwas, das gar nicht so hätte sein müssen. Wenn er Menschen eine Reihe unzusammenhängender geistiger Aufgaben vorlegte, Wortschatz, Rechnen, Mustervervollständigung, Gedächtnis, dann korrelierten die Ergebnisse alle tendenziell positiv. Wer bei einer Aufgabe gut abschnitt, schnitt tendenziell auch bei den anderen gut ab, und wer sich bei einer schwertat, hatte über die ganze Bandbreite hinweg Mühe. Es gab keinen offensichtlichen Grund, warum ein Gespür für Wortdefinitionen mit einem Gespür für das Erkennen visueller Muster einhergehen sollte, und doch war es so. Spearman vermutete, dass ein einziger zugrunde liegender Faktor in jede Aufgabe hineinsickerte, und er nannte ihn g, für allgemeine Intelligenz. Die Entdeckung von g wurde zum Arbeitspferd des gesamten Fachgebiets, und sie bleibt das am häufigsten replizierte Ergebnis in der Erforschung der menschlichen Kognition.

Die schichtweise Architektur geistiger Fähigkeit

Die moderne Intelligenzforschung behandelt g nicht als die ganze Geschichte, denn das würde eine Struktur einebnen, die offenkundig geschichtet ist. Stattdessen ist das vorherrschende Bild hierarchisch. An der Spitze sitzt g, der allgemeine Faktor, der alles berührt. Darunter liegt eine kleine Zahl breiter Fähigkeiten, wobei die wichtigste Unterscheidung die zwischen fluider und kristalliner Intelligenz ist. Fluide Intelligenz ist die Fähigkeit, zu schlussfolgern, neuartige Muster zu erkennen und unvertraute Probleme zu lösen, ohne sich auf Vorwissen zu stützen; sie ist das, worauf ein Rätsel zum abstrakten Denken abzielt. Kristalline Intelligenz ist der angesammelte Bestand an Wissen, Wortschatz und erlernten Verfahren, den ein Leben in einer Kultur in einem ablagert. Unter diesen breiten Faktoren liegen spezifischere Fähigkeiten, verbal, räumlich, mathematisch und Verarbeitungsgeschwindigkeit, jede für sich messbar.

Die beiden breiten Faktoren altern sehr unterschiedlich, und der Kontrast ist eines der menschenfreundlicheren Ergebnisse des Fachgebiets. Die fluide Intelligenz erreicht ihren Höhepunkt tendenziell im jungen Erwachsenenalter und gleitet dann über die Jahrzehnte hinweg sanft nach unten, weshalb sich die reine Problemlösungsgeschwindigkeit oft in den Zwanzigern am schärfsten anfühlt. Die kristalline Intelligenz tut das Gegenteil und wächst bis weit ins spätere Leben hinein weiter, während sich Wissen und Erfahrung anhäufen. Der ältere Experte, der ein Problem langsamer, aber weiser löst als ein flinker junger Rivale, ist kein sentimentales Klischee; es ist ungefähr das, was die Struktur des kognitiven Alterns vorhersagt.

Einen Wert an die Bevölkerung anheften

Eine IQ-Zahl bedeutet für sich genommen nichts, denn sie ist keine Anzahl von irgendetwas. Sie ist eine Position. Moderne Tests werden an Bevölkerungsnormen standardisiert, das heißt, eine große repräsentative Stichprobe wird zuerst getestet, und die Rohleistung einer Person wird anschließend dahingehend übersetzt, wo sie innerhalb dieser Verteilung liegt. Die Konvention setzt den Bevölkerungsmittelwert auf 100 und die Standardabweichung, die typische Streuung der Werte um diesen Mittelwert, auf 15. Per Konstruktion erzielt also die Durchschnittsperson 100 Punkte, und die meisten Erwachsenen, etwa zwei Drittel von ihnen, liegen zwischen 85 und 115, innerhalb einer Standardabweichung vom Zentrum.

Je weiter man hinausgeht, desto seltener werden die Werte, und das sehr schnell. Ein Wert über 145 oder unter 55 liegt drei Standardabweichungen vom Mittelwert entfernt und ist äußerst selten, zu finden bei nur einem Bruchteil eines Prozents der Bevölkerung. Das lohnt sich im Hinterkopf zu behalten, wann immer jemand einen dramatischen dreistelligen IQ zitiert, denn die Glockenkurve macht extreme Werte weitaus rarer, als das beiläufige Gespräch nahelegt. Der Wert ist tatsächlich eine Rangordnung gegenüber allen anderen, und genau deshalb müssen die Normen regelmäßig neu standardisiert werden, und genau dadurch wird das Rätsel des zwanzigsten Jahrhunderts überhaupt erst sichtbar.

Warum die Werte immer weiter stiegen

Kehren wir nun zu den dreißig Punkten zurück. Weil die Werte jeder Generation vor der Neutestung an die vorherigen Normen verankert werden, konnten Forscher etwas Außergewöhnliches erkennen: Über den größten Teil des zwanzigsten Jahrhunderts hinweg stiegen die Mittelwerte um etwa drei Punkte pro Jahrzehnt, ein Trend, der heute nach dem Politikwissenschaftler James Flynn, der ihn am gründlichsten dokumentierte, Flynn-Effekt genannt wird. Die Zuwächse waren nicht einheitlich. Sie waren am stärksten bei Tests zum abstrakten Denken, den Rätseln zur fluiden Intelligenz, die einen auffordern, Muster in Formen zu finden, die man nie zuvor gesehen hat, und schwächer bei Tests zum angesammelten Wissen wie Wortschatz und Rechnen.

Dieses ungleichmäßige Muster ist der Schlüssel, um die Absurdität aufzulösen. Unsere Urgroßeltern waren nicht kognitiv beeinträchtigt; sie lebten schlicht in einer Welt, die weit weniger von jenem abstrakten, alles-in-Kategorien-einordnenden Denkstil verlangte, den diese Tests belohnen. Die Erklärungen bleiben wirklich umstritten, und Ehrlichkeit verlangt zuzugeben, dass keine einzelne Ursache sich durchgesetzt hat. Zu den Kandidaten gehören bessere Ernährung in der Kindheit, dramatisch ausgeweitete Schulbildung, die Verbreitung kognitiv anspruchsvoller Arbeit, kleinere Familien mit mehr Aufmerksamkeit der Erwachsenen pro Kind und eine moderne Umwelt, gesättigt mit abstrakten Symbolen und rätselartigen Medien. Flynn selbst argumentierte, das moderne Leben habe die Menschen darauf trainiert, das aufzusetzen, was er die wissenschaftliche Brille nannte, die Welt in abstrakten Kategorien und Hypothesen zu betrachten, genau die Gewohnheit, die jene Tests belohnen. Der Effekt ist eine eindringliche Erinnerung daran, dass sich der Durchschnitt einer Bevölkerung innerhalb weniger Generationen enorm verschieben kann, ohne dass sich an den zugrunde liegenden Genen etwas ändert.

Die Rivalen, und warum g immer wieder gewinnt

Das hierarchische, auf g zentrierte Modell hat prominente Herausforderer, und sie verdienen es, ernst genommen zu werden, wenn es sich auch lohnt, sie ehrlich abzuwägen. Howard Gardners Theorie der multiplen Intelligenzen, die behauptet, es gebe getrennte und weitgehend unabhängige Intelligenzen, musikalische, körperlich-kinästhetische, interpersonale und mehrere weitere, war im Bildungswesen enorm beliebt, wo sie die ansprechende Botschaft anbietet, dass jeder auf seine eigene Weise klug ist. Ihre empirische Stützung ist jedoch schwach. Wenn Forscher diese vermeintlich unabhängigen Fähigkeiten tatsächlich messen und die Zahlen durchrechnen, finden Faktorenanalysen immer wieder denselben starken allgemeinen Faktor, der sich von Neuem behauptet; die Fähigkeiten korrelieren, statt für sich zu stehen. Gardners Rahmen funktioniert besser als menschenfreundliche Lehrphilosophie denn als validiertes Modell der geistigen Struktur.

Robert Sternbergs triarchische Theorie hat sich etwas besser geschlagen. Sie unterscheidet die analytische Intelligenz, die Art, die akademische Tests messen, von der praktischen Intelligenz, der lebensklugen Fähigkeit, sich in realen Problemen zurechtzufinden, und der kreativen Intelligenz. Die Unterscheidung zwischen praktischer und analytischer Fähigkeit hat deutlich mehr empirische Rückendeckung angesammelt als Gardners Schema und erfasst etwas Reales an Menschen, die auf dem Papier schlecht schlussfolgern, in unübersichtlichen Situationen aber aufblühen, oder umgekehrt. Dennoch hat kein Rivale g verdrängt, denn die hartnäckigen positiven Korrelationen, die Spearman 1904 fand, tauchen immer wieder auf, egal wie man die Tests zerlegt.

Was Erblichkeit uns sagt und was nicht

Wenige Statistiken in der Psychologie werden so routinemäßig missverstanden wie die Erblichkeit des IQ, deshalb lohnt es sich, langsamer zu machen. Verhaltensgenetische Studien, die sich auf Zwillinge, Adoptierte und Familien stützen, schätzen die Erblichkeit des IQ bei Erwachsenen auf irgendwo zwischen 50 und 80 Prozent, und merklich niedriger bei kleinen Kindern, wo die gemeinsame familiäre Umgebung mehr ins Gewicht fällt. Dass die Zahl mit dem Alter steigt, widersinnig wie es klingt, spiegelt wider, dass Menschen im Heranwachsen zunehmend Umgebungen auswählen und formen, die zu ihren Veranlagungen passen.

Hier kommt der entscheidende Teil. Erblichkeit ist eine Statistik auf Bevölkerungsebene über die Quellen der Varianz, das heißt darüber, warum sich Menschen innerhalb einer Gruppe voneinander unterscheiden. Sie ist keine Aussage auf individueller Ebene darüber, was die Intelligenz einer einzelnen Person verursacht hat, und sie trägt keine feste Implikation, dass ein Merkmal unveränderlich sei. Eine Erblichkeit von 70 Prozent bedeutet nicht, dass 70 Prozent Ihrer Intelligenz von Ihren Genen kamen und 30 Prozent von Ihrer Erziehung; dieser Satz ist sinnlos. Er bedeutet, dass innerhalb der untersuchten Bevölkerung und ihrer besonderen Spannbreite an Umgebungen etwa 70 Prozent der Unterschiede zwischen den Menschen auf genetische Unterschiede zurückgehen.

Der Missbrauch, der am meisten zählt, betrifft Unterschiede zwischen Bevölkerungen, und die Logik ist hier zwingend. Ein Merkmal kann innerhalb jeder von zwei Gruppen hoch erblich sein, während die durchschnittliche Kluft zwischen diesen Gruppen vollständig umweltbedingt ist. Der Genetiker Richard Lewontin machte den Punkt 1970 mit einem Gedankenexperiment unvergesslich: Man nehme genetisch vielfältige Samen, teile sie und ziehe eine Charge in reichem Boden und die andere in armem Boden heran. Innerhalb jedes Topfes sind die Höhenunterschiede rein genetisch, die Erblichkeit beträgt also 100 Prozent, und doch wird der durchschnittliche Unterschied zwischen den beiden Töpfen vollständig durch den Boden verursacht. Die Statistik innerhalb der Gruppe erlaubt schlicht keinen Schluss über Gruppen hinweg. Auf die menschliche Intelligenz angewandt, sagt uns die hohe Erblichkeit des IQ innerhalb von Bevölkerungen nichts über die Ursachen durchschnittlicher Unterschiede zwischen Bevölkerungen, und die zeitgenössische Forschung zu rassebezogenen Lücken bei Testwerten weist entschieden auf umweltbedingte statt auf genetische Erklärungen.

Ein echter Prädiktor mit echten Grenzen

Nichts davon wäre von Bedeutung, wenn IQ-Werte nichts vorhersagten, doch das tun sie, was mit ein Grund ist, warum das Konstrukt ein Jahrhundert der Kritik überlebt hat. Der IQ korreliert mäßig mit schulischer Leistung, mit der Performanz über eine breite Palette von Berufen hinweg und sogar mit mehreren Ergebnissen bei Gesundheit und Langlebigkeit. An den schmucklosen Maßstäben der Sozialwissenschaft gemessen, ist er eines der vorhersagekräftigsten Maße, das die Psychologie je hervorgebracht hat, und etwas anderes zu behaupten ist eine Form der Verleugnung.

Mäßig ist allerdings das entscheidende Wort, und die ehrliche Einordnung lautet, dass der IQ ein starker Prädiktor unter mehreren ist und kein Urteil über ein Leben. Gewissenhaftigkeit, die Neigung, diszipliniert und verlässlich zu sein, sagt langfristigen Erfolg in vielen Bereichen mindestens ebenso gut voraus. Soziale Kompetenz, Motivation, schiere Gelegenheit und Glück tragen alle echtes Gewicht, und keines davon taucht in einem Denktest auf. Es geht nicht darum, den IQ abzutun, sondern ihn einzuordnen: Er erfasst etwas Wichtiges und Stabiles an der kognitiven Kapazität eines Menschen, und er lässt weites und folgenreiches Terrain ungemessen.

Zu diesem ungemessenen Terrain gehören einige der Fähigkeiten, die wir am meisten bewundern. Kreativität, die stark auf divergentem Denken beruht, der Erzeugung vieler vielfältiger und origineller Möglichkeiten, ist nur teilweise an den IQ gebunden; jenseits einer mäßigen Schwelle gehen die beiden getrennte Wege. Expertise ist wieder etwas anderes, weniger aufgebaut durch rohe Begabung als durch angesammelte Anstrengung, die lange Lehrzeit des bewussten Übens, die der Psychologe Anders Ericsson untersuchte und die populäre Schriften zu der groben Parole von zehntausend Stunden verdichteten. Und Weisheit, die Fähigkeit, Wissen, Erfahrung und ausgewogenes Urteil darüber, wie man leben soll, zu vereinen, liegt weitgehend außerhalb der Reichweite jedes Denktests. Ein Wert kann einem etwas Wahres darüber sagen, wie schnell und abstrakt ein Geist unter Zeitbedingungen schlussfolgert, aber er kann einem nicht sagen, ob dieser Geist kreativ, sachkundig oder weise ist, und dafür wurde er auch nie gebaut.

Die wichtigsten Erkenntnisse

Intelligenz widersetzt sich einer sauberen Definition, weshalb die Psychologie sie über standardisierte Tests operationalisiert, die um Spearmans Entdeckung von 1904 herum gebaut sind, dass vielfältige geistige Aufgaben positiv korrelieren und einen allgemeinen Faktor namens g offenbaren; das moderne Bild ist hierarchisch, mit g an der Spitze über breiten fluiden und kristallinen Fähigkeiten (erstere erreicht früh ihren Höhepunkt, letztere wächst über das ganze Leben) und darunter spezifischen verbalen, räumlichen, mathematischen und Geschwindigkeitsfaktoren, alle gemessen an Bevölkerungsnormen, die auf einen Mittelwert von 100 und eine Standardabweichung von 15 gesetzt sind, wobei die meisten Erwachsenen zwischen 85 und 115 liegen und Werte jenseits von 55 oder 145 äußerst selten sind. Der Flynn-Effekt von etwa drei Punkten pro Jahrzehnt, am stärksten beim abstrakten Denken, zeigt, dass Werte umweltempfindlich sind, auch wenn Gene einen Großteil der Varianz innerhalb einer Bevölkerung antreiben, mit einer auf 50 bis 80 Prozent geschätzten Erblichkeit bei Erwachsenen; entscheidend ist, dass Erblichkeit die Varianz innerhalb einer Gruppe beschreibt, nicht die individuelle Verursachung, und Lewontins Logik zeigt, dass sie nichts über Lücken zwischen Bevölkerungen aussagt, die die Evidenz der Umwelt zuschreibt. Rivalen wie Gardners multiple Intelligenzen haben schwache Stützung gegenüber dem hartnäckigen allgemeinen Faktor, während Sternbergs Unterscheidung zwischen praktisch und analytisch sich besser schlägt, und obwohl der IQ zu den vorhersagekräftigsten Konstrukten der Psychologie gehört, ist er nur ein mäßiger, teilweiser Prädiktor, der Gewissenhaftigkeit, Gelegenheit, Glück, Kreativität, Expertise und Weisheit weitgehend jenseits seines Maßes lässt.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free