← Back to Blog Psychology

Qué mide realmente el coeficiente intelectual

June 5, 2026 · 9 min

Si hicieras hoy un test de CI y un desconocido nacido en 1920 hiciera el mismo test, evaluado con las mismas normas, ese desconocido obtendría en promedio unos treinta puntos por debajo de ti. Treinta puntos es una barbaridad. Es la distancia que separa a la persona estadísticamente media de alguien situado en el pequeño porcentaje inferior. Tomado al pie de la letra, nuestros bisabuelos parecerían haber estado luchando al borde de la discapacidad, lo cual es absurdo, porque construyeron redes eléctricas, ganaron guerras, escribieron sinfonías y dividieron el átomo. Algo falla claramente en la lectura literal, y el enigma de qué es lo que falla resulta ser una de las preguntas más reveladoras de toda la psicología.

El patrón es real y es tozudo. Si trazas la puntuación media de los tests de inteligencia a lo largo del siglo XX en cualquier país industrializado, la línea sube unos tres puntos por década, sin señales de frenarse durante la mayor parte de ese periodo. Las puntuaciones subieron; las personas no cambiaron de forma evidente. Para entender por qué, y para entender qué te está diciendo realmente una puntuación de CI, hay que mirar con cuidado qué miden estos tests, qué predice esa medición y la larga lista de cosas que dejan en silencio fuera del foco.

Un número construido a partir de una coincidencia estadística

Los psicólogos nunca se han puesto de acuerdo sobre una definición limpia de la inteligencia. Pregunta a diez expertos y obtendrás respuestas que van desde "la capacidad de razonar de forma abstracta" hasta "la capacidad de adaptarse al propio entorno", ninguna del todo satisfactoria. En lugar de esperar a que los filósofos zanjaran el asunto, la psicología cognitiva tomó una vía pragmática y eligió operacionalizar la inteligencia: definirla, a efectos prácticos, como aquello que un test de capacidad mental bien construido mide de forma fiable. Esa jugada suena a evasiva, y en parte lo es, pero se apoya en un descubrimiento empírico genuino y sorprendente.

En 1904, el psicólogo británico Charles Spearman se dio cuenta de algo que no tenía por qué ser cierto. Cuando administraba a las personas una batería de tareas mentales sin relación entre sí, vocabulario, aritmética, completado de patrones, memoria, todas las puntuaciones tendían a correlacionar de forma positiva. Quienes lo hacían bien en una tendían a hacerlo bien en las demás, y quienes tenían dificultades en una tendían a tenerlas en todas. No había ninguna razón evidente para que la destreza con las definiciones de palabras fuera de la mano con la destreza para detectar patrones visuales y, sin embargo, así era. Spearman propuso que un único factor subyacente se filtraba en cada tarea, y lo llamó g, por inteligencia general. El descubrimiento de g se convirtió en el caballo de batalla de todo el campo, y sigue siendo el hallazgo más replicado en el estudio de la cognición humana.

La arquitectura por capas de la capacidad mental

La investigación moderna sobre la inteligencia no trata a g como toda la historia, porque eso aplanaría una estructura que está claramente formada por capas. En cambio, la imagen dominante es jerárquica. En la cúspide se sienta g, el factor general que toca todo. Por debajo se sitúan un pequeño número de capacidades amplias, siendo la distinción más importante la que hay entre inteligencia fluida y cristalizada. La inteligencia fluida es la capacidad de razonar, de ver patrones nuevos y de resolver problemas desconocidos sin apoyarse en conocimientos previos; es lo que un acertijo de razonamiento abstracto está diseñado para activar. La inteligencia cristalizada es el caudal acumulado de conocimientos, vocabulario y procedimientos aprendidos que una vida dentro de una cultura deposita en ti. Por debajo de estos factores amplios se encuentran capacidades más específicas, verbal, espacial, matemática y velocidad de procesamiento, cada una medible por su cuenta.

Los dos factores amplios envejecen de forma muy distinta, y el contraste es uno de los hallazgos más humanos del campo. La inteligencia fluida tiende a alcanzar su pico en la primera adultez y luego deriva suavemente a la baja a lo largo de las décadas, razón por la cual la velocidad bruta de resolución de problemas suele sentirse más aguda en la veintena. La inteligencia cristalizada hace lo contrario, y sigue creciendo hasta bien entrada la madurez a medida que se acumulan conocimiento y experiencia. El experto mayor que resuelve un problema más despacio pero con más sabiduría que un rival joven y rápido no es un cliché sentimental; es más o menos lo que predice la estructura del envejecimiento cognitivo.

Anclar una puntuación a la población

Un número de CI no significa nada de forma aislada, porque no es el recuento de nada. Es una posición. Los tests modernos se estandarizan frente a normas poblacionales, lo que significa que primero se examina a una muestra amplia y representativa, y el rendimiento bruto de un individuo se traduce luego en el lugar que ocupa dentro de esa distribución. La convención fija la media poblacional en 100 y la desviación típica, la dispersión habitual de las puntuaciones en torno a esa media, en 15. Por construcción, entonces, la persona media obtiene 100, y la mayoría de los adultos, alrededor de dos tercios, caen entre 85 y 115, dentro de una desviación típica del centro.

Cuanto más te alejas, más raras se vuelven las puntuaciones, y muy deprisa. Una puntuación por encima de 145 o por debajo de 55 se sitúa a tres desviaciones típicas de la media y es extremadamente rara, presente solo en una fracción de un por ciento de la población. Conviene tenerlo en cuenta cada vez que alguien cita un CI dramático de tres cifras, porque la campana de Gauss hace que las puntuaciones extremas sean mucho más escasas de lo que la conversación informal sugiere. La puntuación es genuinamente una clasificación frente a todos los demás, que es precisamente por lo que las normas tienen que reestandarizarse de forma periódica, y precisamente cómo el enigma del siglo XX llega a hacerse visible.

Por qué las puntuaciones siguieron subiendo

Volvamos ahora a los treinta puntos. Como las puntuaciones de cada generación se anclan a las normas previas antes de volver a evaluar, los investigadores pudieron ver algo extraordinario: durante la mayor parte del siglo XX, las puntuaciones medias subieron unos tres puntos por década, una tendencia ahora llamada efecto Flynn, en honor al politólogo James Flynn, que la documentó con más rigor. Las ganancias no fueron uniformes. Fueron más fuertes en los tests de razonamiento abstracto, los acertijos de inteligencia fluida que te piden encontrar patrones en formas que nunca has visto, y más débiles en los tests de conocimiento acumulado como vocabulario y aritmética.

Ese patrón desigual es la clave para disolver el absurdo. Nuestros bisabuelos no estaban cognitivamente mermados; simplemente vivían en un mundo que exigía mucho menos del estilo de pensamiento abstracto, de clasificarlo todo en categorías, que estos tests recompensan. Las explicaciones siguen siendo genuinamente discutidas, y la honestidad exige admitir que ninguna causa única ha ganado. Entre las candidatas figuran una mejor nutrición infantil, una escolarización drásticamente ampliada, la expansión del trabajo cognitivamente exigente, familias más pequeñas con más atención adulta por hijo y un entorno moderno saturado de símbolos abstractos y de medios con forma de acertijo. El propio Flynn sostuvo que la vida moderna entrenó a las personas para ponerse lo que él llamaba gafas científicas, para tratar el mundo en términos de categorías abstractas e hipótesis, exactamente el hábito que esos tests recompensan. El efecto es un poderoso recordatorio de que la media de una población puede moverse enormemente en unas pocas generaciones sin que cambien los genes subyacentes.

Los rivales, y por qué g sigue ganando

El modelo jerárquico centrado en g tiene retadores destacados, y vale la pena tomarlos en serio, aunque también vale la pena sopesarlos con honestidad. La teoría de las inteligencias múltiples de Howard Gardner, que propone que existen inteligencias separadas y en buena medida independientes, musical, corporal-cinestésica, interpersonal y varias más, ha sido enormemente popular en educación, donde ofrece el mensaje atractivo de que todo el mundo es inteligente a su manera. Su respaldo empírico, sin embargo, es débil. Cuando los investigadores miden de verdad estas supuestas capacidades independientes y hacen los números, los análisis factoriales siguen encontrando que el mismo factor general fuerte vuelve a imponerse; las capacidades correlacionan en lugar de mantenerse aparte. El marco de Gardner funciona mejor como una filosofía pedagógica humana que como un modelo validado de la estructura mental.

La teoría triárquica de Robert Sternberg ha corrido algo mejor suerte. Distingue la inteligencia analítica, la que miden los tests académicos, de la inteligencia práctica, la capacidad de listillo callejero para sortear problemas del mundo real, y de la inteligencia creativa. La distinción entre capacidad práctica y analítica ha acumulado bastante más respaldo empírico que el esquema de Gardner, y capta algo real sobre las personas que razonan mal sobre el papel pero prosperan en situaciones enredadas, o lo contrario. Aun así, ningún rival ha desplazado a g, porque las tozudas correlaciones positivas que Spearman halló en 1904 siguen apareciendo por mucho que se segmenten los tests.

Lo que la heredabilidad nos dice y lo que no

Pocas estadísticas en psicología se malinterpretan de forma tan rutinaria como la heredabilidad del CI, así que conviene frenar un poco. Los estudios de genética del comportamiento, basados en gemelos, adoptados y familias, estiman la heredabilidad del CI en algún punto entre el 50 y el 80 por ciento en adultos, y notablemente más baja en niños pequeños, donde el entorno familiar compartido pesa más. El hecho de que el número suba con la edad, de forma contraintuitiva, refleja que las personas, al crecer, eligen y moldean cada vez más entornos que encajan con sus disposiciones.

Aquí viene la parte crucial. La heredabilidad es una estadística a nivel de población sobre las fuentes de la varianza, es decir, sobre por qué las personas dentro de un grupo difieren entre sí. No es una afirmación a nivel individual sobre qué causó la inteligencia de una persona concreta, y no implica de ningún modo fijo que un rasgo sea inmutable. Una heredabilidad del 70 por ciento no significa que el 70 por ciento de tu inteligencia venga de tus genes y el 30 por ciento de tu crianza; esa frase no tiene sentido. Significa que, dentro de la población estudiada y su particular rango de entornos, alrededor del 70 por ciento de las diferencias entre las personas se remontan a diferencias genéticas.

El mal uso que más importa tiene que ver con las diferencias entre poblaciones, y la lógica aquí es decisiva. Un rasgo puede ser muy heredable dentro de cada uno de dos grupos mientras que la brecha media entre esos grupos es enteramente ambiental. El genetista Richard Lewontin hizo el argumento inolvidable en 1970 con un experimento mental: toma semillas genéticamente variadas, divídelas y cultiva un lote en suelo rico y el otro en suelo pobre. Dentro de cada maceta, las diferencias de altura son puramente genéticas, así que la heredabilidad es del 100 por cien y, sin embargo, la diferencia media entre las dos macetas está causada por completo por el suelo. La estadística intragrupo simplemente no autoriza ninguna conclusión entre grupos. Aplicado a la inteligencia humana, la alta heredabilidad del CI dentro de las poblaciones no nos dice nada sobre las causas de las diferencias medias entre poblaciones, y la investigación contemporánea sobre las brechas de puntuación relacionadas con la raza apunta con firmeza hacia explicaciones ambientales y no genéticas.

Un predictor real con límites reales

Nada de esto importaría si las puntuaciones de CI no predijeran nada, pero sí predicen, y eso es parte de por qué el constructo ha sobrevivido a un siglo de crítica. El CI correlaciona de forma moderada con el rendimiento académico, con el desempeño en una amplia gama de ocupaciones e incluso con varios resultados de salud y longevidad. Para los poco glamurosos estándares de la ciencia social, es una de las medidas con mayor validez predictiva que la psicología ha producido jamás, y fingir lo contrario es una forma de negación.

Moderada, eso sí, es la palabra operativa, y el encuadre honesto es que el CI es un predictor fuerte entre varios, no un veredicto sobre una vida. La responsabilidad, la tendencia a ser disciplinado y fiable, predice el éxito a largo plazo al menos igual de bien en muchos ámbitos. La habilidad social, la motivación, la pura oportunidad y la suerte tienen todas un peso real, y ninguna de ellas aparece en un test de razonamiento. La cuestión no es desestimar el CI, sino situarlo: capta algo importante y estable sobre la capacidad cognitiva de una persona, y deja sin medir un territorio vasto y de consecuencias enormes.

Ese territorio sin medir incluye algunas de las capacidades que más admiramos. La creatividad, que se apoya en gran medida en el pensamiento divergente, la generación de muchas posibilidades variadas y originales, solo está parcialmente ligada al CI; más allá de un umbral moderado, ambas siguen caminos separados. La pericia es otra cosa todavía, construida menos por la capacidad bruta que por el esfuerzo acumulado, el largo aprendizaje de la práctica deliberada que estudió el psicólogo Anders Ericsson y que la divulgación comprimió en el tosco lema de las diez mil horas. Y la sabiduría, la capacidad de integrar conocimiento, experiencia y juicio equilibrado sobre cómo vivir, queda en gran parte fuera del alcance de cualquier test de razonamiento. Una puntuación puede decirte algo cierto sobre con qué rapidez y abstracción razona una mente bajo condiciones cronometradas, pero no puede decirte si esa mente es creativa, experta o sabia, y nunca se construyó para ello.

Ideas clave

La inteligencia se resiste a una definición limpia, así que la psicología la operacionaliza a través de tests estandarizados construidos en torno al descubrimiento de Spearman en 1904 de que tareas mentales diversas correlacionan de forma positiva, revelando un factor general llamado g; la imagen moderna es jerárquica, con g en la cúspide sobre las amplias capacidades fluida y cristalizada (la primera con su pico en la juventud, la segunda creciendo a lo largo de la vida) y los factores específicos verbal, espacial, matemático y de velocidad por debajo, todos puntuados frente a normas poblacionales fijadas en una media de 100 y una desviación típica de 15, donde la mayoría de los adultos caen entre 85 y 115 y las puntuaciones más allá de 55 o 145 son extremadamente raras. El efecto Flynn de unos tres puntos por década, más fuerte en el razonamiento abstracto, muestra que las puntuaciones son sensibles al entorno aun cuando los genes impulsan buena parte de la varianza intrapoblacional, con una heredabilidad estimada entre el 50 y el 80 por ciento en adultos; lo crucial es que la heredabilidad describe la varianza dentro de un grupo, no la causación individual, y la lógica de Lewontin muestra que no dice nada sobre las brechas entre poblaciones, que la evidencia atribuye al entorno. Rivales como las inteligencias múltiples de Gardner tienen un respaldo débil frente al tozudo factor general, mientras que la distinción de Sternberg entre lo práctico y lo analítico corre mejor suerte y, aunque el CI está entre los constructos con mayor validez predictiva de la psicología, es solo un predictor moderado y parcial, que deja la responsabilidad, la oportunidad, la suerte, la creatividad, la pericia y la sabiduría en gran medida fuera de su medida.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free