← Back to Blog Psychology

Ce que le QI mesure réellement

June 5, 2026 · 9 min

Si vous passiez un test de QI aujourd'hui et qu'un inconnu né en 1920 passait le même test, évalué selon les mêmes normes, cet inconnu se situerait en moyenne environ trente points en dessous de vous. Trente points, c'est énorme. C'est l'écart qui sépare la personne statistiquement moyenne de quelqu'un appartenant aux quelques pour cent les plus bas. Pris au pied de la lettre, nos arrière-grands-parents auraient donc semblé à la limite du handicap, ce qui est absurde, car ils ont construit des réseaux électriques, gagné des guerres, écrit des symphonies et fissionné l'atome. Quelque chose cloche manifestement dans cette lecture littérale, et le problème de savoir ce qui cloche se révèle être l'une des questions les plus éclairantes de toute la psychologie.

La tendance est réelle et elle est tenace. Tracez le score moyen aux tests d'intelligence à travers le vingtième siècle dans n'importe quel pays industrialisé, et la courbe grimpe d'environ trois points par décennie, sans signe de ralentissement pendant la majeure partie de cette période. Les scores ont augmenté ; les gens, eux, n'ont visiblement pas changé. Pour comprendre pourquoi, et pour comprendre ce qu'un score de QI vous dit réellement, il faut examiner attentivement ce que ces tests mesurent, ce que cette mesure prédit, et la longue liste de choses qu'elle laisse discrètement de côté.

Un nombre issu d'une coïncidence statistique

Les psychologues ne se sont jamais entendus sur une définition claire de l'intelligence. Interrogez dix experts et vous obtiendrez des réponses allant de « la capacité à raisonner de façon abstraite » à « la capacité à s'adapter à son environnement », aucune n'étant pleinement satisfaisante. Plutôt que d'attendre que les philosophes tranchent la question, la psychologie cognitive a emprunté une voie pragmatique et a choisi d'opérationnaliser l'intelligence : de la définir, à des fins pratiques, comme tout ce qu'un test bien conçu d'aptitude mentale mesure de manière fiable. Cette démarche ressemble à une esquive, et elle en est en partie une, mais elle repose sur une découverte empirique authentique et surprenante.

En 1904, le psychologue britannique Charles Spearman remarqua quelque chose qui n'avait rien d'inévitable. Lorsqu'il soumettait des personnes à une batterie de tâches mentales sans rapport entre elles, vocabulaire, calcul, complétion de motifs, mémoire, les scores avaient tous tendance à corréler positivement. Ceux qui réussissaient bien à l'une réussissaient généralement bien aux autres, et ceux qui peinaient sur l'une peinaient sur l'ensemble. Il n'y avait aucune raison évidente pour qu'une aptitude à définir des mots aille de pair avec une aptitude à repérer des motifs visuels, et pourtant c'était le cas. Spearman proposa qu'un unique facteur sous-jacent transparaissait dans chaque tâche, et il le baptisa g, pour intelligence générale. La découverte de g devint le cheval de bataille de toute la discipline, et elle demeure le résultat le plus répliqué de l'étude de la cognition humaine.

L'architecture en couches de l'aptitude mentale

La recherche moderne sur l'intelligence ne réduit pas tout à g, car ce serait aplatir une structure qui est de toute évidence stratifiée. Le tableau dominant est au contraire hiérarchique. Au sommet trône g, le facteur général qui touche à tout. En dessous se trouvent un petit nombre d'aptitudes larges, la distinction la plus importante étant celle entre intelligence fluide et intelligence cristallisée. L'intelligence fluide est la capacité à raisonner, à percevoir des motifs nouveaux et à résoudre des problèmes inédits sans s'appuyer sur des connaissances antérieures ; c'est ce qu'une énigme de raisonnement abstrait est conçue pour solliciter. L'intelligence cristallisée est le stock accumulé de connaissances, de vocabulaire et de procédures apprises qu'une vie passée dans une culture dépose en vous. Sous ces facteurs larges se trouvent des aptitudes plus spécifiques, verbale, spatiale, mathématique, et la vitesse de traitement, chacune mesurable séparément.

Les deux facteurs larges vieillissent très différemment, et ce contraste constitue l'un des résultats les plus humains du domaine. L'intelligence fluide tend à atteindre son apogée au début de l'âge adulte puis décline doucement au fil des décennies, ce qui explique pourquoi la pure vitesse de résolution de problèmes semble souvent la plus vive dans la vingtaine. L'intelligence cristallisée fait l'inverse, continuant de croître jusque tard dans la vie à mesure que s'accumulent connaissances et expérience. L'expert âgé qui résout un problème plus lentement mais plus sagement qu'un jeune rival vif n'est pas un cliché sentimental ; c'est à peu près ce que prédit la structure du vieillissement cognitif.

Ancrer un score à la population

Un nombre de QI ne signifie rien isolément, car il ne dénombre rien. C'est une position. Les tests modernes sont étalonnés par rapport à des normes de population, ce qui signifie qu'un large échantillon représentatif est testé d'abord, puis la performance brute d'un individu est traduite en sa place au sein de cette distribution. La convention fixe la moyenne de la population à 100 et l'écart-type, la dispersion typique des scores autour de cette moyenne, à 15. Par construction, donc, la personne moyenne obtient 100, et la plupart des adultes, environ deux tiers d'entre eux, se situent entre 85 et 115, soit à un écart-type du centre.

Plus on s'éloigne, plus les scores deviennent rares, et très vite. Un score supérieur à 145 ou inférieur à 55 se situe à trois écarts-types de la moyenne et est extrêmement rare, présent chez seulement une fraction de pour cent de la population. Il vaut la peine de garder cela à l'esprit chaque fois que quelqu'un cite un QI spectaculaire à trois chiffres, car la courbe en cloche rend les scores extrêmes bien plus rares que ne le laisse entendre la conversation ordinaire. Le score est véritablement un classement par rapport à tous les autres, ce qui explique précisément pourquoi les normes doivent être périodiquement réétalonnées, et c'est précisément ainsi que l'énigme du vingtième siècle devient visible.

Pourquoi les scores n'ont cessé de grimper

Revenons maintenant aux trente points. Comme les scores de chaque génération sont ancrés aux normes précédentes avant un nouvel étalonnage, les chercheurs ont pu observer quelque chose d'extraordinaire : sur la majeure partie du vingtième siècle, les scores moyens ont augmenté d'environ trois points par décennie, une tendance désormais nommée effet Flynn d'après le politologue James Flynn, qui l'a documentée le plus minutieusement. Les gains n'étaient pas uniformes. Ils étaient les plus marqués aux tests de raisonnement abstrait, les énigmes d'intelligence fluide qui vous demandent de trouver des motifs dans des formes que vous n'avez jamais vues, et plus faibles aux tests de connaissances accumulées comme le vocabulaire et le calcul.

Ce schéma inégal est la clé pour dissiper l'absurdité. Nos arrière-grands-parents n'étaient pas atteints de déficience cognitive ; ils vivaient simplement dans un monde qui exigeait bien moins du style de pensée abstrait, du tout-classer-en-catégories que ces tests récompensent. Les explications restent réellement débattues, et l'honnêteté impose de reconnaître qu'aucune cause unique ne l'a emporté. Parmi les candidates figurent une meilleure nutrition durant l'enfance, une scolarisation considérablement élargie, la diffusion d'un travail cognitivement exigeant, des familles plus petites offrant davantage d'attention adulte par enfant, et un environnement moderne saturé de symboles abstraits et de médias façon énigme. Flynn lui-même soutenait que la vie moderne avait entraîné les gens à chausser ce qu'il appelait des lunettes scientifiques, à appréhender le monde en termes de catégories abstraites et d'hypothèses, exactement l'habitude que ces tests récompensent. L'effet est un puissant rappel qu'une moyenne de population peut bouger énormément en quelques générations sans aucun changement dans les gènes sous-jacents.

Les rivaux, et pourquoi g continue de l'emporter

Le modèle hiérarchique centré sur g a des concurrents de poids, et ils méritent d'être pris au sérieux, mais aussi d'être soupesés honnêtement. La théorie des intelligences multiples de Howard Gardner, qui postule l'existence d'intelligences distinctes et largement indépendantes, musicale, corporelle-kinesthésique, interpersonnelle, et plusieurs autres, a connu un immense succès dans l'éducation, où elle offre le message séduisant que chacun est intelligent à sa manière. Son soutien empirique est toutefois faible. Lorsque les chercheurs mesurent réellement ces prétendues aptitudes indépendantes et font les calculs, les analyses factorielles retrouvent sans cesse le même facteur général puissant qui se réaffirme ; les aptitudes corrèlent au lieu de rester séparées. Le cadre de Gardner fonctionne mieux comme une philosophie pédagogique humaine que comme un modèle validé de la structure mentale.

La théorie triarchique de Robert Sternberg s'en est un peu mieux tirée. Elle distingue l'intelligence analytique, celle que mesurent les tests académiques, de l'intelligence pratique, la capacité débrouillarde à se mouvoir dans les problèmes du monde réel, et de l'intelligence créative. La distinction entre aptitude pratique et aptitude analytique a accumulé un soutien empirique nettement plus consistant que le schéma de Gardner, captant quelque chose de réel à propos des gens qui raisonnent mal sur le papier mais s'épanouissent dans les situations confuses, ou l'inverse. Malgré cela, aucun rival n'a détrôné g, car les tenaces corrélations positives que Spearman a découvertes en 1904 réapparaissent quelle que soit la façon dont on découpe les tests.

Ce que l'héritabilité nous dit, et ce qu'elle ne nous dit pas

Peu de statistiques en psychologie sont aussi systématiquement mal comprises que l'héritabilité du QI, il vaut donc la peine de ralentir. Les études de génétique comportementale, s'appuyant sur des jumeaux, des enfants adoptés et des familles, estiment l'héritabilité du QI quelque part entre 50 et 80 pour cent chez les adultes, et nettement plus bas chez les jeunes enfants, où l'environnement familial partagé compte davantage. Ce nombre qui s'élève avec l'âge, de façon contre-intuitive, reflète le fait que les gens sélectionnent et façonnent de plus en plus des environnements correspondant à leurs dispositions à mesure qu'ils grandissent.

Voici le point crucial. L'héritabilité est une statistique au niveau de la population concernant les sources de variance, c'est-à-dire les raisons pour lesquelles les individus d'un groupe diffèrent les uns des autres. Ce n'est pas un énoncé au niveau individuel sur ce qui a causé l'intelligence d'une personne en particulier, et elle n'implique nullement qu'un trait soit immuable. Une héritabilité de 70 pour cent ne signifie pas que 70 pour cent de votre intelligence provient de vos gènes et 30 pour cent de votre éducation ; cette phrase n'a aucun sens. Elle signifie que, au sein de la population étudiée et de son éventail particulier d'environnements, environ 70 pour cent des différences entre les individus se rattachent à des différences génétiques.

L'usage abusif qui importe le plus concerne les différences entre populations, et la logique est ici décisive. Un trait peut être hautement héritable au sein de chacun de deux groupes alors que l'écart moyen entre ces groupes est entièrement environnemental. Le généticien Richard Lewontin a rendu ce point inoubliable en 1970 grâce à une expérience de pensée : prenez des graines génétiquement variées, séparez-les, et faites pousser un lot dans une terre riche et l'autre dans une terre pauvre. Au sein de chaque pot, les différences de hauteur sont purement génétiques, l'héritabilité y est donc de 100 pour cent, et pourtant la différence moyenne entre les deux pots est entièrement causée par le sol. La statistique intragroupe n'autorise tout simplement aucune conclusion d'un groupe à l'autre. Appliquée à l'intelligence humaine, la forte héritabilité du QI à l'intérieur des populations ne nous dit rien des causes des différences moyennes entre populations, et la recherche contemporaine sur les écarts de scores liés à la race penche fermement vers des explications environnementales plutôt que génétiques.

Un véritable prédicteur, avec de véritables limites

Rien de tout cela n'aurait d'importance si les scores de QI ne prédisaient rien, mais ils prédisent quelque chose, ce qui fait partie des raisons pour lesquelles ce construit a survécu à un siècle de critiques. Le QI corrèle modérément avec la réussite scolaire, avec la performance dans un large éventail de professions, et même avec plusieurs indicateurs de santé et de longevité. Selon les standards peu glorieux des sciences sociales, c'est l'une des mesures les plus valides sur le plan prédictif que la psychologie ait jamais produites, et prétendre le contraire est une forme de déni.

Modérément, cependant, est le mot qui compte, et le cadrage honnête est que le QI est un prédicteur fort parmi plusieurs plutôt qu'un verdict sur une vie. La conscienciosité, la tendance à être discipliné et fiable, prédit la réussite à long terme au moins aussi bien dans de nombreux domaines. L'aptitude sociale, la motivation, la simple opportunité et la chance pèsent toutes réellement, et aucune n'apparaît dans un test de raisonnement. Le but n'est pas d'écarter le QI mais de le situer : il capture quelque chose d'important et de stable sur la capacité cognitive d'une personne, et il laisse non mesuré un territoire vaste et lourd de conséquences.

Ce territoire non mesuré comprend certaines des aptitudes que nous admirons le plus. La créativité, qui s'appuie fortement sur la pensée divergente, la production de nombreuses possibilités variées et originales, n'est que partiellement liée au QI ; au-delà d'un seuil modéré, les deux suivent des chemins séparés. L'expertise est encore tout autre chose, bâtie moins par l'aptitude brute que par l'effort accumulé, le long apprentissage de la pratique délibérée qu'a étudié le psychologue Anders Ericsson et que les ouvrages grand public ont condensé dans le slogan approximatif des dix mille heures. Et la sagesse, la capacité à intégrer connaissances, expérience et jugement équilibré sur la manière de vivre, se situe largement hors de portée de tout test de raisonnement. Un score peut vous dire quelque chose de vrai sur la vitesse et le degré d'abstraction avec lesquels un esprit raisonne en conditions chronométrées, mais il ne peut pas vous dire si cet esprit est créatif, expert ou sage, et il n'a jamais été conçu pour cela.

Points clés à retenir

L'intelligence résiste à toute définition claire, aussi la psychologie l'opérationnalise-t-elle à travers des tests standardisés bâtis autour de la découverte par Spearman en 1904 que des tâches mentales variées corrèlent positivement, révélant un facteur général appelé g ; le tableau moderne est hiérarchique, avec g au sommet, surplombant les aptitudes larges fluide et cristallisée (la première culminant tôt, la seconde croissant tout au long de la vie) et, en dessous, les facteurs spécifiques verbal, spatial, mathématique et de vitesse, le tout évalué par rapport à des normes de population fixées à une moyenne de 100 et un écart-type de 15, où la plupart des adultes se situent entre 85 et 115 et où les scores au-delà de 55 ou 145 sont extrêmement rares. L'effet Flynn, d'environ trois points par décennie et le plus marqué sur le raisonnement abstrait, montre que les scores sont sensibles à l'environnement, alors même que les gènes expliquent une bonne part de la variance intrapopulation, l'héritabilité étant estimée entre 50 et 80 pour cent chez les adultes ; surtout, l'héritabilité décrit la variance au sein d'un groupe, et non la causalité individuelle, et la logique de Lewontin montre qu'elle ne dit rien des écarts entre populations, que les données attribuent à l'environnement. Des rivaux comme les intelligences multiples de Gardner bénéficient d'un faible soutien face au tenace facteur général, tandis que la distinction de Sternberg entre pratique et analytique s'en sort mieux, et bien que le QI compte parmi les construits les plus valides sur le plan prédictif de la psychologie, il n'est qu'un prédicteur modéré et partiel, laissant la conscienciosité, l'opportunité, la chance, la créativité, l'expertise et la sagesse largement hors de sa mesure.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free