El factor g [a] es un constructo desarrollado en investigaciones psicométricas de las capacidades cognitivas y la inteligencia humana . Es una variable que resume las correlaciones positivas entre diferentes tareas cognitivas, lo que refleja el hecho de que el desempeño de un individuo en un tipo de tarea cognitiva tiende a ser comparable al desempeño de esa persona en otros tipos de tareas cognitivas. [ cita requerida ] El factor g generalmente representa entre el 40 y el 50 por ciento de las diferencias de desempeño entre individuos en una prueba cognitiva dada , y las puntuaciones compuestas ("puntuaciones de CI") basadas en muchas pruebas se consideran con frecuencia estimaciones de la posición de los individuos en el factor g . [1] Los términos CI , inteligencia general, capacidad cognitiva general, capacidad mental general y simplemente inteligencia a menudo se usan indistintamente para referirse a este núcleo común compartido por las pruebas cognitivas. [2] Sin embargo, el factor g en sí mismo es un constructo matemático que indica el nivel de correlación observada entre las tareas cognitivas. [3] El valor medido de este constructo depende de las tareas cognitivas que se utilicen, y se sabe poco sobre las causas subyacentes de las correlaciones observadas.
La existencia del factor g fue propuesta originalmente por el psicólogo inglés Charles Spearman a principios del siglo XX. Observó que las calificaciones de desempeño de los niños, en materias escolares aparentemente no relacionadas, estaban correlacionadas positivamente y razonó que estas correlaciones reflejaban la influencia de una habilidad mental general subyacente que entraba en el desempeño en todo tipo de pruebas mentales. Spearman sugirió que todo el desempeño mental podría conceptualizarse en términos de un solo factor de habilidad general, al que denominó g , y muchos factores de habilidad específicos de la tarea. Poco después de que Spearman propusiera la existencia de g , fue cuestionada por Godfrey Thomson , quien presentó evidencia de que tales intercorrelaciones entre los resultados de las pruebas podrían surgir incluso si no existiera el factor g . [4] Los modelos factoriales actuales de inteligencia generalmente representan las habilidades cognitivas como una jerarquía de tres niveles, donde hay muchos factores estrechos en la parte inferior de la jerarquía, un puñado de factores amplios y más generales en el nivel intermedio y en el ápice un solo factor, denominado factor g , que representa la varianza común a todas las tareas cognitivas.
Tradicionalmente, la investigación sobre g se ha concentrado en investigaciones psicométricas de datos de pruebas, con un énfasis especial en los enfoques de análisis factorial . Sin embargo, la investigación empírica sobre la naturaleza de g también se ha basado en la psicología cognitiva experimental y la cronometría mental , la anatomía y fisiología cerebral, la genética cuantitativa y molecular y la evolución de los primates . [5] La investigación en el campo de la genética conductual ha demostrado que el constructo de g es altamente hereditario en poblaciones medidas. Tiene una serie de otros correlatos biológicos, incluido el tamaño del cerebro . También es un predictor significativo de las diferencias individuales en muchos resultados sociales, particularmente en educación y empleo.
Los críticos han sostenido que el énfasis en g es inapropiado y supone una devaluación de otras capacidades importantes. Algunos científicos, entre ellos Stephen J. Gould , han sostenido que el concepto de g es una construcción meramente cosificada en lugar de una medida válida de la inteligencia humana.
Las pruebas de capacidad cognitiva están diseñadas para medir diferentes aspectos de la cognición. Los dominios específicos evaluados por las pruebas incluyen la habilidad matemática, la fluidez verbal, la visualización espacial y la memoria, entre otros. Sin embargo, las personas que se destacan en un tipo de prueba tienden a sobresalir también en otros tipos de pruebas, mientras que quienes obtienen malos resultados en una prueba tienden a obtenerlos en todas las pruebas, independientemente del contenido de las pruebas. [8] El psicólogo inglés Charles Spearman fue el primero en describir este fenómeno. [9] En un famoso artículo de investigación publicado en 1904, [10] observó que las medidas de desempeño de los niños en materias escolares aparentemente no relacionadas estaban correlacionadas positivamente. Este hallazgo se ha replicado desde entonces numerosas veces. El hallazgo constante de matrices de correlación universalmente positivas de los resultados de las pruebas mentales (o la "variedad positiva"), a pesar de las grandes diferencias en el contenido de las pruebas, se ha descrito como "posiblemente el resultado más replicado en toda la psicología". [11] Las correlaciones cero o negativas entre las pruebas sugieren la presencia de un error de muestreo o una restricción del rango de capacidad en la muestra estudiada. [12]
Utilizando el análisis factorial o métodos estadísticos relacionados, es posible identificar un único factor común que puede considerarse como una variable resumen que caracteriza las correlaciones entre todas las diferentes pruebas en una batería de pruebas. Spearman se refirió a este factor común como el factor general o simplemente g . (Por convención, g siempre se imprime en cursiva minúscula). Matemáticamente, el factor g es una fuente de variación entre individuos , lo que significa que no se puede hablar de manera significativa de que las habilidades mentales de un individuo consistan en g u otros factores en un grado específico. Solo se puede hablar de la posición de un individuo en g (u otros factores) en comparación con otros individuos en una población relevante. [12] [13] [14]
Diferentes pruebas en una batería de pruebas pueden correlacionarse con (o "cargarse") el factor g de la batería en diferentes grados. Estas correlaciones se conocen como cargas g . La puntuación del factor g de un individuo que realiza la prueba , que representa su posición relativa en el factor g en el grupo total de individuos, se puede estimar utilizando las cargas g . Las puntuaciones de CI a escala completa de una batería de pruebas generalmente estarán altamente correlacionadas con las puntuaciones del factor g , y a menudo se consideran estimaciones de g . Por ejemplo, se ha encontrado que las correlaciones entre las puntuaciones del factor g y las puntuaciones de CI a escala completa de las pruebas de David Wechsler son mayores que .95. [1] [12] [15] Los términos CI, inteligencia general, capacidad cognitiva general, capacidad mental general o simplemente inteligencia se usan con frecuencia indistintamente para referirse al núcleo común compartido por las pruebas cognitivas. [2]
Las cargas g de las pruebas mentales son siempre positivas y suelen oscilar entre .10 y .90, con una media de alrededor de .60 y una desviación estándar de alrededor de .15. Las matrices progresivas de Raven se encuentran entre las pruebas con las cargas g más altas , alrededor de .80. Las pruebas de vocabulario e información general también suelen tener cargas g altas . [16] [17] Sin embargo, la carga g de la misma prueba puede variar un poco dependiendo de la composición de la batería de pruebas. [18]
La complejidad de las pruebas y las exigencias que imponen a la manipulación mental están relacionadas con las cargas g de las pruebas . Por ejemplo, en la prueba de repetición de dígitos hacia adelante, se le pide al sujeto que repita una secuencia de dígitos en el orden en que se presentaron después de escucharlos una vez a una velocidad de un dígito por segundo. La prueba de repetición de dígitos hacia atrás es, en todo lo demás, la misma, excepto que se le pide al sujeto que repita los dígitos en el orden inverso al que se presentaron. La prueba de repetición de dígitos hacia atrás es más compleja que la prueba de repetición de dígitos hacia adelante y tiene una carga g significativamente mayor . De manera similar, las cargas g de las pruebas de cálculo aritmético, ortografía y lectura de palabras son menores que las de las pruebas de resolución de problemas aritméticos, composición de textos y comprensión lectora, respectivamente. [12] [19]
La dificultad de las pruebas y las cargas g son conceptos distintos que pueden o no estar relacionados empíricamente en cualquier situación específica. Las pruebas que tienen el mismo nivel de dificultad, según el índice de la proporción de ítems de prueba que los examinados no superan, pueden presentar una amplia gama de cargas g . Por ejemplo, se ha demostrado que las pruebas de memoria mecánica tienen el mismo nivel de dificultad pero cargas g considerablemente más bajas que muchas pruebas que implican razonamiento. [19] [20]
Si bien la existencia de g como regularidad estadística está bien establecida y no genera controversia entre los expertos, no hay consenso sobre qué causa las intercorrelaciones positivas. Se han propuesto varias explicaciones. [21]
Charles Spearman razonó que las correlaciones entre pruebas reflejaban la influencia de un factor causal común, una habilidad mental general que entra en el desempeño en todo tipo de tareas mentales. Sin embargo, pensó que los mejores indicadores de g eran aquellas pruebas que reflejaban lo que él llamaba la educción de relaciones y correlatos , que incluía habilidades como la deducción , la inducción , la resolución de problemas, la comprensión de relaciones, la inferencia de reglas y la detección de diferencias y similitudes. Spearman planteó la hipótesis de que g era equivalente a "energía mental". Sin embargo, esta era más una explicación metafórica, y permaneció agnóstico sobre la base física de esta energía, esperando que la investigación futura descubriera la naturaleza fisiológica exacta de g . [22]
Siguiendo a Spearman, Arthur Jensen sostuvo que todas las tareas mentales utilizan g en algún grado. Según Jensen, el factor g representa un "destilado" de las puntuaciones en diferentes pruebas en lugar de una suma o un promedio de dichas puntuaciones, y el análisis factorial actúa como procedimiento de destilación . [17] Argumentó que g no puede describirse en términos de las características de los ítems o el contenido de información de las pruebas, señalando que tareas mentales muy diferentes pueden tener cargas de g casi iguales . Wechsler sostuvo de manera similar que g no es una habilidad en absoluto, sino más bien una propiedad general del cerebro. Jensen planteó la hipótesis de que g corresponde a las diferencias individuales en la velocidad o eficiencia de los procesos neuronales asociados con las habilidades mentales. [23] También sugirió que dadas las asociaciones entre g y las tareas cognitivas elementales, debería ser posible construir una prueba de escala de proporción de g que use el tiempo como unidad de medida. [24]
La llamada teoría de muestreo de g , desarrollada originalmente por Edward Thorndike y Godfrey Thomson , propone que la existencia de la variedad positiva puede explicarse sin referencia a una capacidad subyacente unitaria. Según esta teoría, hay una serie de procesos mentales no correlacionados, y todas las pruebas se basan en diferentes muestras de estos procesos. Las intercorrelaciones entre pruebas son causadas por una superposición entre los procesos aprovechados por las pruebas. [25] [26] Por lo tanto, la variedad positiva surge debido a un problema de medición, una incapacidad para medir procesos mentales de grano más fino, presumiblemente no correlacionados. [14]
Se ha demostrado que no es posible distinguir estadísticamente entre el modelo de g de Spearman y el modelo de muestreo; ambos son igualmente capaces de dar cuenta de las intercorrelaciones entre pruebas. [27] La teoría del muestreo también es consistente con la observación de que las tareas mentales más complejas tienen cargas g más altas , porque se espera que las tareas más complejas involucren una muestra más grande de elementos neuronales y, por lo tanto, tengan más de ellos en común con otras tareas. [28]
Algunos investigadores han argumentado que el modelo de muestreo invalida el concepto de g como psicológico, porque sugiere que los factores g derivados de diferentes baterías de pruebas simplemente reflejan los elementos compartidos de las pruebas particulares contenidas en cada batería, en lugar de una g que sea común a todas las pruebas. De manera similar, las altas correlaciones entre diferentes baterías podrían deberse a que miden el mismo conjunto de habilidades, en lugar de la misma habilidad. [29]
Los críticos han argumentado que la teoría del muestreo es incongruente con ciertos hallazgos empíricos. Con base en la teoría del muestreo, se podría esperar que las pruebas cognitivas relacionadas compartan muchos elementos y, por lo tanto, estén altamente correlacionadas. Sin embargo, algunas pruebas estrechamente relacionadas, como la de repetición de dígitos hacia adelante y hacia atrás, solo están correlacionadas modestamente, mientras que algunas pruebas aparentemente completamente diferentes, como las pruebas de vocabulario y las matrices de Raven, están constantemente altamente correlacionadas. Otro hallazgo problemático es que el daño cerebral con frecuencia conduce a deterioros cognitivos específicos en lugar de un deterioro general que se podría esperar con base en la teoría del muestreo. [14] [30]
El modelo de "mutualismo" de g propone que los procesos cognitivos no están correlacionados inicialmente, pero que la variedad positiva surge durante el desarrollo individual debido a las relaciones mutuamente beneficiosas entre los procesos cognitivos. Por lo tanto, no hay un solo proceso o capacidad subyacente a las correlaciones positivas entre las pruebas. Durante el curso del desarrollo, sostiene la teoría, cualquier proceso particularmente eficiente beneficiará a otros procesos, con el resultado de que los procesos terminarán correlacionándose entre sí. Por lo tanto, los coeficientes intelectuales igualmente altos en diferentes personas pueden deberse a ventajas iniciales bastante diferentes que tenían. [14] [31] Los críticos han argumentado que las correlaciones observadas entre las cargas g y los coeficientes de heredabilidad de las subpruebas son problemáticas para la teoría del mutualismo. [32]
El análisis factorial es una familia de técnicas matemáticas que se pueden utilizar para representar correlaciones entre pruebas de inteligencia en términos de un número menor de variables conocidas como factores. El propósito es simplificar la matriz de correlación mediante el uso de factores subyacentes hipotéticos para explicar los patrones en ella. Cuando todas las correlaciones en una matriz son positivas, como lo son en el caso del CI, el análisis factorial producirá un factor general común a todas las pruebas. El factor general de las pruebas de CI se conoce como el factor g , y generalmente representa entre el 40 y el 50 por ciento de la varianza en las baterías de pruebas de CI. [33] La presencia de correlaciones entre muchas pruebas cognitivas muy variables se ha tomado a menudo como evidencia de la existencia de g , pero McFarland (2012) demostró que tales correlaciones no brindan mayor o menor respaldo a la existencia de g que a la existencia de múltiples factores de inteligencia. [34]
Charles Spearman desarrolló el análisis factorial para estudiar las correlaciones entre pruebas. Inicialmente, desarrolló un modelo de inteligencia en el que las variaciones en todas las puntuaciones de las pruebas de inteligencia se explican por solo dos tipos de variables: primero, factores que son específicos de cada prueba (denominados s ); y segundo, un factor g que explica las correlaciones positivas entre las pruebas. Esto se conoce como la teoría de dos factores de Spearman. Investigaciones posteriores basadas en baterías de pruebas más diversas que las utilizadas por Spearman demostraron que g por sí sola no podía explicar todas las correlaciones entre pruebas. Específicamente, se encontró que incluso después de controlar g , algunas pruebas todavía estaban correlacionadas entre sí. Esto llevó a la postulación de factores de grupo que representan la varianza que los grupos de pruebas con demandas de tareas similares (por ejemplo, verbales, espaciales o numéricas) tienen en común además de la varianza compartida g . [35]
Mediante la rotación de factores , en principio es posible producir un número infinito de soluciones factoriales diferentes que sean matemáticamente equivalentes en su capacidad para explicar las intercorrelaciones entre pruebas cognitivas. Estas incluyen soluciones que no contienen un factor g . Por lo tanto, el análisis factorial por sí solo no puede establecer cuál es la estructura subyacente de la inteligencia. Al elegir entre diferentes soluciones factoriales, los investigadores tienen que examinar los resultados del análisis factorial junto con otra información sobre la estructura de las capacidades cognitivas. [36]
Existen muchas razones psicológicamente relevantes para preferir soluciones factoriales que contienen un factor g . Entre ellas se incluyen la existencia de la variedad positiva, el hecho de que ciertos tipos de pruebas (generalmente las más complejas) tienen cargas g consistentemente mayores , la invariancia sustancial de los factores g en diferentes baterías de pruebas, la imposibilidad de construir baterías de pruebas que no produzcan un factor g y la validez práctica generalizada de g como predictor de resultados individuales. El factor g , junto con los factores de grupo, representa mejor el hecho empíricamente establecido de que, en promedio, las diferencias generales de capacidad entre individuos son mayores que las diferencias entre las capacidades dentro de los individuos, mientras que una solución factorial con factores ortogonales sin g oscurece este hecho. Además, g parece ser el componente más hereditario de la inteligencia. [37] La investigación que utiliza las técnicas de análisis factorial confirmatorio también ha proporcionado apoyo a la existencia de g . [36]
Se puede calcular un factor g a partir de una matriz de correlación de resultados de pruebas utilizando varios métodos diferentes. Estos incluyen el análisis factorial exploratorio, el análisis de componentes principales (PCA) y el análisis factorial confirmatorio. Diferentes métodos de extracción de factores producen resultados altamente consistentes, aunque a veces se ha encontrado que el PCA produce estimaciones infladas de la influencia de g en las puntuaciones de las pruebas. [18] [38]
Existe un amplio consenso contemporáneo de que la varianza cognitiva entre las personas se puede conceptualizar en tres niveles jerárquicos, que se distinguen por su grado de generalidad. En el nivel más bajo, menos general, hay muchos factores estrechos de primer orden; en un nivel más alto, hay un número relativamente pequeño, entre cinco y diez, de factores de segundo orden amplios (es decir, más generales) (o factores de grupo); y en el ápice, hay un solo factor de tercer orden, g , el factor general común a todas las pruebas. [39] [40] [41] El factor g suele explicar la mayoría de la varianza total del factor común de las baterías de pruebas de CI. [42] Los modelos jerárquicos contemporáneos de inteligencia incluyen la teoría de los tres estratos y la teoría de Cattell-Horn-Carroll . [43]
Spearman propuso el principio de la indiferencia del indicador , según el cual el contenido preciso de las pruebas de inteligencia no es importante para identificar g , porque g entra en el desempeño en todo tipo de pruebas. Por lo tanto, cualquier prueba puede usarse como indicador de g . [44] Siguiendo a Spearman, Arthur Jensen argumentó más recientemente que un factor g extraído de una batería de pruebas siempre será el mismo, dentro de los límites del error de medición, que el extraído de otra batería, siempre que las baterías sean grandes y diversas. [45] Según este punto de vista, cada prueba mental, sin importar cuán distintiva sea, requiere g en cierta medida. Por lo tanto, una puntuación compuesta de varias pruebas diferentes se cargará en g con más fuerza que cualquiera de las puntuaciones de pruebas individuales, porque los componentes g se acumulan en la puntuación compuesta, mientras que los componentes no g no correlacionados se cancelarán entre sí. Teóricamente, la puntuación compuesta de una batería de pruebas infinitamente grande y diversa sería, entonces, una medida perfecta de g . [46]
Por el contrario, LL Thurstone sostuvo que un factor g extraído de una batería de pruebas refleja el promedio de todas las habilidades requeridas por la batería en particular, y que por lo tanto g varía de una batería a otra y "no tiene un significado psicológico fundamental". [47] En la misma línea, John Horn sostuvo que los factores g no tienen significado porque no son invariantes en las distintas baterías de pruebas, y sostuvo que las correlaciones entre diferentes medidas de habilidad surgen porque es difícil definir una acción humana que depende de una sola habilidad. [48] [49]
Para demostrar que las diferentes baterías reflejan la misma g , se deben administrar varias baterías de prueba a los mismos individuos, extraer factores g de cada batería y demostrar que los factores están altamente correlacionados. Esto se puede hacer dentro de un marco de análisis factorial confirmatorio. [21] Wendy Johnson y colegas han publicado dos estudios de este tipo. [50] [51] El primero encontró que las correlaciones entre los factores g extraídos de tres baterías diferentes fueron .99, .99 y 1.00, lo que respalda la hipótesis de que los factores g de diferentes baterías son los mismos y que la identificación de g no depende de las habilidades específicas evaluadas. El segundo estudio encontró que los factores g derivados de cuatro de las cinco baterías de prueba se correlacionaron entre .95 y 1.00, mientras que las correlaciones variaron de .79 a .96 para la quinta batería, la Prueba de Inteligencia Cultural Justa de Cattell (CFIT). Atribuyeron las correlaciones algo más bajas con la batería CFIT a su falta de diversidad de contenido, ya que solo contiene elementos de tipo matriz, e interpretaron los hallazgos como un respaldo a la afirmación de que los factores g derivados de diferentes baterías de pruebas son los mismos siempre que las baterías sean lo suficientemente diversas. Los resultados sugieren que se puede identificar de manera consistente el mismo g a partir de diferentes baterías de pruebas. [39] [52] Este enfoque ha sido criticado por el psicólogo Lazar Stankov en el Manual de comprensión y medición de la inteligencia, quien concluyó que "las correlaciones entre los factores g de diferentes baterías de pruebas no son la unidad". [53]
Un estudio realizado por Scott Barry Kaufman y sus colegas mostró que el factor general extraído de la prueba de habilidades cognitivas Woodjock-Johnson y el factor general extraído de las baterías de pruebas de logros están altamente correlacionados, pero no son isomorfos. [54]
La forma de la distribución poblacional de g es desconocida, porque g no puede medirse en una escala de proporción [ aclaración necesaria ] . (Las distribuciones de puntajes en pruebas de CI típicas son aproximadamente normales, pero esto se logra por construcción, es decir, normalizando los puntajes brutos). Se ha argumentado [ ¿quién? ] que, no obstante, hay buenas razones para suponer que g se distribuye normalmente en la población general, al menos dentro de un rango de ±2 desviaciones estándar de la media. En particular, g puede considerarse como una variable compuesta que refleja los efectos aditivos de muchas influencias genéticas y ambientales independientes, y dicha variable debería, según el teorema del límite central , seguir una distribución normal. [55]
Varios investigadores han sugerido que la proporción de variación explicada por g puede no ser uniforme en todos los subgrupos dentro de una población. La ley de rendimientos decrecientes de Spearman ( SLODR ), también denominada hipótesis de diferenciación de la capacidad cognitiva , predice que las correlaciones positivas entre diferentes capacidades cognitivas son más débiles entre los subgrupos de individuos más inteligentes. Más específicamente, SLODR predice que el factor g explicará una proporción menor de las diferencias individuales en las puntuaciones de las pruebas cognitivas en las puntuaciones más altas en el factor g .
La SLODR fue propuesta originalmente en 1927 por Charles Spearman [56], quien informó que la correlación promedio entre 12 pruebas de capacidad cognitiva era de .466 en 78 niños normales y de .782 en 22 niños "defectuosos". Detterman y Daniel redescubrieron este fenómeno en 1989 [57]. Informaron que para las subpruebas tanto del WAIS como del WISC , las intercorrelaciones de las subpruebas disminuyeron de manera monótona con el grupo de capacidad, desde aproximadamente una intercorrelación promedio de .7 entre individuos con CI menores de 78 a .4 entre individuos con CI mayores de 122 [58].
La SLODR se ha replicado en una variedad de muestras de niños y adultos que han sido medidos utilizando una amplia gama de pruebas cognitivas. El enfoque más común ha sido dividir a los individuos en múltiples grupos de capacidad utilizando un proxy observable para su capacidad intelectual general, y luego comparar la interrelación promedio entre las subpruebas en los diferentes grupos, o comparar la proporción de variación explicada por un solo factor común, en los diferentes grupos. [59] Sin embargo, como Deary et al. (1996). [59] y Tucker-Drob (2009) [60] han señalado, dividir la distribución continua de la inteligencia en un número arbitrario de grupos de capacidad discretos es menos que ideal para examinar la SLODR. Tucker-Drob (2009) [60] revisó extensamente la literatura sobre la SLODR y los diversos métodos por los cuales se había probado previamente, y propuso que la SLODR podría capturarse más apropiadamente ajustando un modelo de factor común que permita que las relaciones entre el factor y sus indicadores sean de naturaleza no lineal. Tucker-Drob aplicó un modelo factorial de este tipo a datos representativos a nivel nacional de niños y adultos en los Estados Unidos y encontró evidencia consistente de la SLODR. Por ejemplo, Tucker-Drob (2009) encontró que un factor general explicaba aproximadamente el 75% de la variación en siete habilidades cognitivas diferentes entre adultos con un coeficiente intelectual muy bajo, pero solo explicaba aproximadamente el 30% de la variación en las habilidades entre adultos con un coeficiente intelectual muy alto.
Un estudio metaanalítico reciente de Blum y Holling [61] también brindó apoyo a la hipótesis de diferenciación. A diferencia de la mayoría de las investigaciones sobre el tema, este trabajo hizo posible estudiar las variables de capacidad y edad como predictores continuos de la saturación g , y no solo comparar grupos de sujetos de prueba con habilidades más bajas y más altas o más jóvenes y más viejos. Los resultados demuestran que la correlación media y las cargas g de las pruebas de capacidad cognitiva disminuyen con el aumento de la capacidad, pero aumentan con la edad del encuestado. La SLODR, como lo describe Charles Spearman , podría confirmarse por una disminución de la saturación g como una función del CI, así como un aumento de la saturación g desde la mediana edad hasta la senescencia. Específicamente hablando, para muestras con una inteligencia media que es dos desviaciones estándar (es decir, 30 puntos de CI) más alta, la correlación media que se espera disminuye aproximadamente en 0,15 puntos. La pregunta sigue siendo si una diferencia de esta magnitud podría resultar en una mayor complejidad factorial aparente cuando los datos cognitivos se factorizan para la muestra de mayor capacidad, en oposición a la muestra de menor capacidad. Parece probable que se tienda a observar una mayor dimensionalidad de los factores en el caso de una mayor capacidad, pero la magnitud de este efecto (es decir, cuánta mayor probabilidad y cuántos factores más) sigue siendo incierta.
El alcance de la validez práctica de g como predictor de resultados educativos, económicos y sociales es objeto de un debate continuo. [62] Algunos investigadores han argumentado que es de mayor alcance y universal que cualquier otra variable psicológica conocida, [63] y que la validez de g aumenta a medida que aumenta la complejidad de la tarea medida. [64] [65] Otros han argumentado que las pruebas de habilidades específicas superan al factor g en análisis ajustados a ciertas situaciones del mundo real. [66] [67] [68]
La validez práctica de una prueba se mide por su correlación con el desempeño en algún criterio externo a la prueba, como el promedio de calificaciones de la universidad o una calificación del desempeño laboral. La correlación entre las puntuaciones de la prueba y una medida de algún criterio se denomina coeficiente de validez . Una forma de interpretar un coeficiente de validez es elevarlo al cuadrado para obtener la varianza explicada por la prueba. Por ejemplo, un coeficiente de validez de 0,30 corresponde al 9 por ciento de la varianza explicada. Sin embargo, este enfoque ha sido criticado por ser engañoso y poco informativo, y se han propuesto varias alternativas. Un enfoque posiblemente más interpretable es observar el porcentaje de examinados en cada quintil de puntuación de la prueba que cumplen con algún estándar de éxito acordado. Por ejemplo, si la correlación entre las puntuaciones de la prueba y el desempeño es de 0,30, la expectativa es que el 67 por ciento de los que están en el quintil superior tendrán un desempeño superior al promedio, en comparación con el 33 por ciento de los que están en el quintil inferior. [69] [70]
La validez predictiva de g es más evidente en el ámbito del rendimiento escolar, aparentemente porque g está estrechamente vinculada a la capacidad de aprender material nuevo y comprender conceptos y significados. [64]
En la escuela primaria, la correlación entre el CI y las calificaciones y los puntajes de rendimiento está entre .60 y .70. En niveles educativos más avanzados, más estudiantes del extremo inferior de la distribución del CI abandonan, lo que restringe el rango de CI y da como resultado coeficientes de validez más bajos. En la escuela secundaria, la universidad y la escuela de posgrado, los coeficientes de validez son .50-.60, .40-.50 y .30-.40, respectivamente. Las cargas g de los puntajes de CI son altas, pero es posible que parte de la validez del CI para predecir el rendimiento escolar sea atribuible a factores medidos por el CI independientemente de g . Según la investigación de Robert L. Thorndike , entre el 80 y el 90 por ciento de la varianza predecible en el rendimiento escolar se debe a g , y el resto se atribuye a factores no g medidos por el CI y otras pruebas. [71]
Las puntuaciones de las pruebas de rendimiento están más estrechamente relacionadas con el cociente intelectual que las calificaciones escolares. Esto puede deberse a que las calificaciones están más influenciadas por las percepciones idiosincrásicas que el maestro tiene del estudiante. [72] En un estudio longitudinal en inglés, las puntuaciones g medidas a los 11 años se correlacionaron con las 25 pruebas temáticas del examen GCSE nacional que se tomaron a los 16 años. Las correlaciones variaron de .77 para la prueba de matemáticas a .42 para la prueba de arte. La correlación entre g y un factor educativo general calculado a partir de las pruebas GCSE fue de .81. [73]
Las investigaciones sugieren que el SAT , ampliamente utilizado en las admisiones universitarias, es principalmente una medida de g . Se ha encontrado una correlación de .82 entre las puntuaciones g calculadas a partir de una batería de pruebas de CI y las puntuaciones SAT. En un estudio de 165.000 estudiantes en 41 universidades de EE. UU., se encontró que las puntuaciones SAT estaban correlacionadas en .47 con el promedio de calificaciones del primer año de universidad después de corregir la restricción de rango en las puntuaciones SAT (la correlación aumenta a .55 cuando la dificultad del curso se mantiene constante, es decir, si todos los estudiantes asistieron al mismo conjunto de clases). [69] [74]
Existe una alta correlación de .90 a .95 entre las clasificaciones de prestigio de las ocupaciones, según la clasificación de la población general, y las puntuaciones promedio de inteligencia general de las personas empleadas en cada ocupación. A nivel de empleados individuales, la asociación entre el prestigio laboral y g es menor: un estudio estadounidense a gran escala informó una correlación de .65 (.72 corregido por atenuación ). El nivel medio de g aumenta así con el prestigio laboral percibido. También se ha encontrado que la dispersión de las puntuaciones de inteligencia general es menor en ocupaciones más prestigiosas que en ocupaciones de nivel inferior, lo que sugiere que las ocupaciones de nivel superior tienen requisitos mínimos de g . [75] [76]
Las investigaciones indican que las pruebas de g son los mejores predictores individuales del desempeño laboral, con un coeficiente de validez promedio de .55 en varios metanálisis de estudios basados en calificaciones de supervisores y muestras de trabajos. El coeficiente de validez metaanalítica promedio para el desempeño en la capacitación laboral es de .63. [77] Se ha encontrado que la validez de g en los trabajos de mayor complejidad (trabajos profesionales, científicos y de alta gerencia) es mayor que en los trabajos de menor complejidad, pero g tiene validez predictiva incluso para los trabajos más simples. Las investigaciones también muestran que las pruebas de aptitud específicas diseñadas para cada trabajo proporcionan poco o ningún aumento en la validez predictiva sobre las pruebas de inteligencia general. Se cree que g afecta el desempeño laboral principalmente al facilitar la adquisición de conocimiento relacionado con el trabajo. La validez predictiva de g es mayor que la de la experiencia laboral, y una mayor experiencia en el trabajo no disminuye la validez de g . [64] [75]
En un metaanálisis de 2011, los investigadores descubrieron que la capacidad cognitiva general (GCA) predecía el desempeño laboral mejor que la personalidad ( modelo de cinco factores ) y tres corrientes de inteligencia emocional . Examinaron la importancia relativa de estos constructos para predecir el desempeño laboral y descubrieron que la capacidad cognitiva explicaba la mayor parte de la varianza en el desempeño laboral. [78] Otros estudios sugirieron que la GCA y la inteligencia emocional tienen una contribución lineal independiente y complementaria al desempeño laboral. Côté y Miners (2015) [79] encontraron que estos constructos están interrelacionados al evaluar su relación con dos aspectos del desempeño laboral: el comportamiento ciudadano organizacional (OCB) y el desempeño de la tarea. La inteligencia emocional es un mejor predictor del desempeño de la tarea y el OCB cuando la GCA es baja y viceversa. Por ejemplo, un empleado con baja GCA compensará su desempeño de la tarea y OCB, si la inteligencia emocional es alta.
Aunque estos efectos compensatorios favorecen la inteligencia emocional , la GCA sigue siendo el mejor predictor del desempeño laboral. Varios investigadores han estudiado la correlación entre la GCA y el desempeño laboral entre diferentes puestos de trabajo. Por ejemplo, Ghiselli (1973) [80] encontró que los vendedores tenían una correlación más alta que los dependientes. Los primeros obtuvieron una correlación de 0,61 para la GCA, 0,40 para la capacidad perceptiva y 0,29 para las capacidades psicomotoras; mientras que los dependientes obtuvieron una correlación de 0,27 para la GCA, 0,22 para la capacidad perceptiva y 0,17 para las capacidades psicomotoras. [81] Otros estudios compararon la correlación GCA - desempeño laboral entre trabajos de diferente complejidad. Hunter y Hunter (1984) [82] desarrollaron un metaanálisis con más de 400 estudios y encontraron que esta correlación era mayor para trabajos de alta complejidad (0,57). Seguido de los trabajos de complejidad media (0,51) y baja complejidad (0,38).
El desempeño laboral se mide mediante calificaciones objetivas y subjetivas. Aunque las primeras son mejores que las subjetivas, la mayoría de los estudios sobre desempeño laboral y GCA se han basado en calificaciones de desempeño de supervisores. Este criterio de calificación se considera problemático y poco confiable, principalmente por su dificultad para definir qué es un desempeño bueno y malo. La calificación de los supervisores tiende a ser subjetiva e inconsistente entre los empleados. [83] Además, la calificación del supervisor del desempeño laboral está influenciada por diferentes factores, como el efecto halo , [84] atractivo facial , [85] sesgo racial o étnico y la altura de los empleados. [86] Sin embargo, Vinchur, Schippmann, Switzer y Roth (1998) [81] encontraron en su estudio con empleados de ventas que el desempeño de ventas objetivo tenía una correlación de 0.04 con GCA, mientras que la calificación del desempeño del supervisor tenía una correlación de 0.40. Estos hallazgos fueron sorprendentes, considerando que el criterio principal para evaluar a estos empleados serían las ventas objetivas.
Al comprender cómo el GCA se asocia al desempeño laboral, varios investigadores concluyeron que el GCA afecta la adquisición de conocimiento laboral, lo que a su vez mejora el desempeño laboral . En otras palabras, las personas con un alto GCA son capaces de aprender más rápido y adquirir más conocimiento laboral fácilmente, lo que les permite desempeñarse mejor. Por el contrario, la falta de capacidad para adquirir conocimiento laboral afectará directamente el desempeño laboral. Esto se debe a los bajos niveles de GCA. Además, el GCA tiene un efecto directo en el desempeño laboral. Diariamente, los empleados están expuestos constantemente a desafíos y tareas de resolución de problemas, cuyo éxito depende únicamente de su GCA. Estos hallazgos son desalentadores para las entidades gubernamentales encargadas de proteger los derechos de los trabajadores. [87] Debido a la alta correlación del GCA con el desempeño laboral, las empresas contratan empleados en función de las puntuaciones de las pruebas de GCA. Inevitablemente, esta práctica niega la oportunidad de trabajar a muchas personas con bajo GCA. [88] Investigadores anteriores han encontrado diferencias significativas en el GCA entre grupos de raza / etnia. Por ejemplo, existe un debate sobre si los estudios estaban sesgados en contra de los afroamericanos, que obtuvieron puntuaciones significativamente más bajas que los estadounidenses blancos en las pruebas de GCA. [89] Sin embargo, los hallazgos sobre la correlación entre el GCA y el desempeño laboral deben tomarse con cautela. Algunos investigadores han advertido sobre la existencia de artefactos estadísticos relacionados con las medidas de desempeño laboral y las puntuaciones de las pruebas GCA. Por ejemplo, Viswesvaran, Ones y Schmidt (1996) [90] argumentaron que es bastante imposible obtener medidas perfectas de desempeño laboral sin incurrir en ningún error metodológico. Además, los estudios sobre el GCA y el desempeño laboral siempre son susceptibles de restricción de rango, porque los datos se recopilan principalmente de empleados actuales, descuidando a aquellos que no fueron contratados. Por lo tanto, la muestra proviene de empleados que aprobaron con éxito el proceso de contratación, incluidas las medidas de GCA. [91]
La correlación entre los ingresos y la g , medida a través de los puntajes de CI, promedia alrededor de 0,40 en todos los estudios. La correlación es mayor en los niveles más altos de educación y aumenta con la edad, estabilizándose cuando las personas alcanzan su máximo potencial profesional en la mediana edad. Incluso cuando la educación, la ocupación y el entorno socioeconómico se mantienen constantes, la correlación no desaparece. [92]
El factor g se refleja en muchos resultados sociales. Muchos problemas de conducta social, como el abandono escolar, la dependencia crónica de la asistencia social, la propensión a sufrir accidentes y la delincuencia, están correlacionados negativamente con g independientemente de la clase social de origen. [93] Los resultados de salud y mortalidad también están vinculados a g , y las puntuaciones más altas en las pruebas de la infancia predicen mejores resultados de salud y mortalidad en la edad adulta (véase Epidemiología cognitiva ). [94]
En 2004, el psicólogo Satoshi Kanazawa argumentó que g era una adaptación psicológica del procesamiento de información específica del dominio y típica de la especie , [ 95] y en 2010, Kanazawa argumentó que g se correlacionaba solo con el desempeño en problemas evolutivamente desconocidos en lugar de problemas evolutivamente familiares, proponiendo lo que denominó la "hipótesis de interacción Savanna-IQ". [96] [97] En 2006, Psychological Review publicó un comentario que revisaba el artículo de Kanazawa de 2004 escrito por los psicólogos Denny Borsboom y Conor Dolan que argumentaba que la concepción de Kanazawa de g no tenía respaldo empírico y era puramente hipotética y que una explicación evolutiva de g debía abordarla como una fuente de diferencias individuales , [98] y en respuesta al artículo de Kanazawa de 2010, los psicólogos Scott Barry Kaufman , Colin G. DeYoung , Deirdre Reis y Jeremy R. Gray publicaron un estudio en 2011 en Intelligence de 112 sujetos que tomaron una versión para computadora de 70 ítems de la tarea de selección de Wason (un rompecabezas de lógica ) en un contexto de relaciones sociales como lo propusieron los psicólogos evolucionistas Leda Cosmides y John Tooby en The Adapted Mind , [99] y encontraron en cambio que "el desempeño en problemas no arbitrarios, evolutivamente familiares está más fuertemente relacionado con la inteligencia general que el desempeño en problemas arbitrarios, problemas evolutivamente novedosos”. [100] [101]
La heredabilidad es la proporción de variación fenotípica de un rasgo en una población que puede atribuirse a factores genéticos. Se ha estimado que la heredabilidad de g se encuentra entre el 40 y el 80 por ciento utilizando diseños de estudios de gemelos, adopción y otros diseños familiares, así como métodos genéticos moleculares. Las estimaciones basadas en la totalidad de la evidencia ubican la heredabilidad de g en aproximadamente el 50%. [102] Se ha encontrado que aumenta linealmente con la edad. Por ejemplo, un estudio a gran escala que involucró a más de 11.000 pares de gemelos de cuatro países informó que la heredabilidad de g era del 41 por ciento a los nueve años, del 55 por ciento a los doce años y del 66 por ciento a los diecisiete años. Otros estudios han estimado que la heredabilidad es tan alta como el 80 por ciento en la edad adulta, aunque puede disminuir en la vejez. La mayor parte de la investigación sobre la heredabilidad de g se ha llevado a cabo en Estados Unidos y Europa Occidental , pero los estudios en Rusia ( Moscú ), la antigua Alemania del Este , Japón y la India rural han arrojado estimaciones de heredabilidad similares a los estudios occidentales. [39] [103] [104] [105]
Al igual que con la heredabilidad en general, la heredabilidad de g se puede entender en referencia a una población específica en un lugar y tiempo específicos, y los hallazgos para una población no se aplican a una población diferente que está expuesta a diferentes factores ambientales. [106] Se puede esperar que una población que está expuesta a fuertes factores ambientales tenga un nivel más bajo de heredabilidad que una población que está expuesta solo a factores ambientales débiles. Por ejemplo, un estudio de gemelos encontró que las diferencias de genotipo explican casi por completo la varianza en las puntuaciones de CI dentro de las familias adineradas, pero hacen una contribución cercana a cero para explicar las diferencias de puntuación de CI en familias empobrecidas. [107] Cabe destacar que los hallazgos de heredabilidad también solo se refieren a la variación total dentro de una población y no respaldan una explicación genética para las diferencias entre grupos. [108] Es teóricamente posible que las diferencias entre el g promedio de dos grupos se deban en un 100% a factores ambientales incluso si la varianza dentro de cada grupo es 100% heredable.
La investigación genética conductual también ha establecido que los efectos ambientales compartidos (o entre familias) sobre la g son fuertes en la infancia, pero disminuyen después y son insignificantes en la edad adulta. Esto indica que los efectos ambientales que son importantes para el desarrollo de la g son únicos y no se comparten entre los miembros de la misma familia. [104]
La correlación genética es una estadística que indica hasta qué punto los mismos efectos genéticos influyen en dos rasgos diferentes. Si la correlación genética entre dos rasgos es cero, los efectos genéticos sobre ellos son independientes, mientras que una correlación de 1,0 significa que el mismo conjunto de genes explica la heredabilidad de ambos rasgos (independientemente de lo alta o baja que sea la heredabilidad de cada uno). Se ha comprobado sistemáticamente que las correlaciones genéticas entre capacidades mentales específicas (como la capacidad verbal y la capacidad espacial) son muy altas, cercanas a 1,0. Esto indica que la variación genética en las capacidades cognitivas se debe casi en su totalidad a la variación genética en lo que sea que g sea. También sugiere que lo que es común entre las capacidades cognitivas es causado en gran medida por los genes, y que la independencia entre las capacidades se debe en gran medida a los efectos ambientales. Por tanto, se ha argumentado que cuando se identifican los genes de la inteligencia, serán "genes generalistas", cada uno de los cuales afecta a muchas capacidades cognitivas diferentes. [104] [109] [110]
Muchas investigaciones apuntan a que g es un rasgo altamente poligénico influenciado por muchas variantes genéticas comunes, cada una de las cuales tiene solo pequeños efectos. Otra posibilidad es que las diferencias hereditarias en g se deban a que los individuos tienen diferentes "cargas" de mutaciones raras y perjudiciales, y que la variación genética entre individuos persiste debido al equilibrio entre mutación y selección . [110] [111]
Se ha informado de que varios genes candidatos están asociados con diferencias de inteligencia, pero los tamaños del efecto han sido pequeños y casi ninguno de los hallazgos se ha replicado. Hasta ahora, no se ha vinculado de manera concluyente ninguna variante genética individual con una inteligencia en el rango normal. Muchos investigadores creen que se necesitarán muestras muy grandes para detectar de manera confiable polimorfismos genéticos individuales asociados con g . [39] [111] Sin embargo, aunque ha resultado difícil encontrar genes que influyen en la variación de g en el rango normal, se han descubierto muchos trastornos de un solo gen con discapacidad intelectual entre sus síntomas. [112]
Se ha sugerido que se ha encontrado que la carga g de las pruebas mentales se correlaciona con la heredabilidad, [32] pero tanto los datos empíricos como la metodología estadística que afectan a esta cuestión son temas de controversia activa. [113] [114] [115] Varios estudios sugieren que las pruebas con cargas g más grandes se ven más afectadas por la depresión endogámica que reduce las puntuaciones de las pruebas. [ cita requerida ] También hay evidencia de que las pruebas con cargas g más grandes están asociadas con efectos heteróticos positivos más grandes en las puntuaciones de las pruebas, lo que se ha sugerido que indica la presencia de efectos de dominancia genética para g . [116]
g tiene una serie de correlaciones en el cerebro. Los estudios que utilizan imágenes por resonancia magnética (IRM) han establecido que g y el volumen cerebral total están moderadamente correlacionados (r~.3–.4). El tamaño externo de la cabeza tiene una correlación de ~.2 con g . La investigación de IRM sobre las regiones cerebrales indica que los volúmenes de las cortezas frontal , parietal y temporal , y el hipocampo también están correlacionados con g , generalmente en .25 o más, mientras que las correlaciones, promediadas en muchos estudios, con la materia gris general y la materia blanca general se han encontrado en .31 y .27, respectivamente. Algunos estudios, pero no todos, también han encontrado correlaciones positivas entre g y el grosor cortical. Sin embargo, las razones subyacentes de estas asociaciones entre la cantidad de tejido cerebral y las diferencias en las capacidades cognitivas siguen siendo en gran medida desconocidas. [2]
La mayoría de los investigadores creen que la inteligencia no puede localizarse en una única región del cerebro, como el lóbulo frontal. Los estudios sobre lesiones cerebrales han encontrado asociaciones pequeñas pero consistentes que indican que las personas con más lesiones en la materia blanca tienden a tener una menor capacidad cognitiva. Las investigaciones que utilizan espectroscopia de RMN han descubierto correlaciones algo inconsistentes pero generalmente positivas entre la inteligencia y la integridad de la materia blanca, lo que respalda la idea de que la materia blanca es importante para la inteligencia. [2]
Algunas investigaciones sugieren que, además de la integridad de la materia blanca, su eficiencia organizativa también está relacionada con la inteligencia. La hipótesis de que la eficiencia cerebral tiene un papel en la inteligencia está respaldada por la investigación con resonancia magnética funcional que muestra que las personas más inteligentes generalmente procesan la información de manera más eficiente, es decir, utilizan menos recursos cerebrales para la misma tarea que las personas menos inteligentes. [2]
Las asociaciones pequeñas pero relativamente consistentes con los puntajes de las pruebas de inteligencia incluyen también la actividad cerebral, medida mediante registros de EEG o potenciales relacionados con eventos , y la velocidad de conducción nerviosa . [117] [118]
También se ha observado evidencia de un factor general de inteligencia en animales no humanos. Los estudios han demostrado que g es responsable del 47% de la varianza a nivel de especie en primates [119] y alrededor del 55% de la varianza individual observada en ratones [120] [121] Sin embargo, una revisión y metaanálisis de la inteligencia general encontró que la correlación promedio entre las capacidades cognitivas era de 0,18 y sugirió que el respaldo general para g es débil en animales no humanos [122] .
Aunque no se puede evaluar utilizando las mismas medidas de inteligencia que se utilizan en los seres humanos, la capacidad cognitiva se puede medir con una variedad de herramientas interactivas y de observación centradas en la innovación , la inversión de hábitos , el aprendizaje social y las respuestas a la novedad . Se utilizan modelos no humanos de g, como los ratones, para estudiar las influencias genéticas en la inteligencia y la investigación del desarrollo neurológico sobre los mecanismos subyacentes y los correlatos biológicos de g . [123]
De manera similar a g para individuos, una nueva línea de investigación apunta a extraer un factor de inteligencia colectiva general c para grupos que muestran la capacidad general de un grupo para realizar una amplia gama de tareas. [124] La definición, operacionalización y enfoque estadístico para este factor c se derivan de g y son similares a g . Se investigan las causas, la validez predictiva, así como otros paralelismos con g . [125]
La altura está correlacionada con la inteligencia (r~.2), pero esta correlación no se ha encontrado generalmente dentro de las familias (es decir, entre hermanos), lo que sugiere que es resultado de un apareamiento cruzado por altura e inteligencia, o de otro factor que se correlaciona con ambos (por ejemplo, la nutrición). Se sabe que la miopía está asociada con la inteligencia, con una correlación de alrededor de .2 a .25, y esta asociación también se ha encontrado dentro de las familias. [126]
Los estudios transculturales indican que el factor g se puede observar siempre que se administra una batería de pruebas cognitivas diversas y complejas a una muestra humana. También se ha descubierto que la estructura factorial de las pruebas de CI es consistente entre sexos y grupos étnicos en los EE. UU. y en otros lugares. [118] Se ha descubierto que el factor g es el más invariante de todos los factores en las comparaciones transculturales. Por ejemplo, cuando se compararon los factores g calculados a partir de una muestra de estandarización estadounidense de la batería de CI de Wechsler y de muestras grandes que completaron la traducción japonesa de la misma batería, el coeficiente de congruencia fue de 0,99, lo que indica una identidad virtual. De manera similar, el coeficiente de congruencia entre los factores g obtenidos a partir de muestras de estandarización de blancos y negros de la batería WISC en los EE. UU. fue de 0,995, y la varianza en las puntuaciones de las pruebas explicada por g fue muy similar para ambos grupos. [127]
La mayoría de los estudios sugieren que existen diferencias insignificantes en el nivel medio de g entre los sexos, pero que las diferencias de género en las capacidades cognitivas se encuentran en dominios más estrechos. Por ejemplo, los hombres generalmente superan a las mujeres en tareas espaciales, mientras que las mujeres generalmente superan a los hombres en tareas verbales. [128] Otra diferencia que se ha encontrado en muchos estudios es que los hombres muestran más variabilidad en las capacidades generales y específicas que las mujeres, con proporcionalmente más hombres tanto en el extremo inferior como en el extremo superior de la distribución de puntajes de la prueba. [129]
Se han encontrado diferencias en g entre grupos raciales y étnicos, particularmente en los EE. UU. entre los examinados que se identifican como negros y blancos, aunque estas diferencias parecen haber disminuido significativamente con el tiempo, [114] y ser atribuibles a causas ambientales (en lugar de genéticas). [114] [130] Algunos investigadores han sugerido que la magnitud de la brecha entre negros y blancos en los resultados de las pruebas cognitivas depende de la magnitud de la carga g de la prueba , y que las pruebas que muestran una carga g más alta producen brechas más grandes (ver la hipótesis de Spearman ), [131] mientras que otros han criticado esta visión como metodológicamente infundada. [132] [133] Otros han notado que a pesar de la creciente carga g de las baterías de pruebas de CI con el tiempo, la brecha de rendimiento entre los grupos raciales continúa disminuyendo. [114] Un análisis comparativo ha demostrado que, si bien a finales de los años 1960 existía una brecha de aproximadamente 1,1 desviaciones estándar en el coeficiente intelectual medio (alrededor de 16 puntos) entre los estadounidenses blancos y negros, entre 1972 y 2002 los estadounidenses negros ganaron entre 4 y 7 puntos de coeficiente intelectual en relación con los blancos no hispanos, y que "la brecha g entre negros y blancos disminuyó prácticamente en tándem con la brecha de coeficiente intelectual". [114] En contraste, los estadounidenses de ascendencia del este asiático generalmente superan ligeramente a los estadounidenses blancos. [134] Se ha afirmado que se pueden observar diferencias raciales y étnicas similares a las encontradas en los EE. UU. a nivel mundial, [135] pero la importancia, la base metodológica y la verdad de tales afirmaciones han sido discutidas. [136] [137] [138] [139] [140] [141]
Las tareas cognitivas elementales (ECT) también se correlacionan fuertemente con g . Las ECT son, como sugiere el nombre, tareas simples que aparentemente requieren muy poca inteligencia, pero aún así se correlacionan fuertemente con pruebas de inteligencia más exhaustivas. Determinar si una luz es roja o azul y determinar si hay cuatro o cinco cuadrados dibujados en una pantalla de computadora son dos ejemplos de ECT. Las respuestas a tales preguntas generalmente se proporcionan presionando rápidamente botones. A menudo, además de los botones para las dos opciones proporcionadas, se mantiene presionado un tercer botón desde el comienzo de la prueba. Cuando se le da el estímulo al sujeto, retira su mano del botón de inicio al botón de la respuesta correcta. Esto permite al examinador determinar cuánto tiempo se dedicó a pensar en la respuesta a la pregunta (tiempo de reacción, generalmente medido en pequeñas fracciones de segundo) y cuánto tiempo se dedicó al movimiento físico de la mano hasta el botón correcto (tiempo de movimiento). El tiempo de reacción se correlaciona fuertemente con g , mientras que el tiempo de movimiento se correlaciona menos fuertemente. [142] Las pruebas ECT han permitido el examen cuantitativo de hipótesis relacionadas con el sesgo de la prueba, la motivación del sujeto y las diferencias grupales. En virtud de su simplicidad, las ECT proporcionan un vínculo entre las pruebas clásicas de CI y las investigaciones biológicas como los estudios de fMRI .
Una teoría sostiene que g es idéntica o casi idéntica a la capacidad de la memoria de trabajo . Entre otras pruebas de esta opinión, algunos estudios han descubierto que los factores que representan a g y la memoria de trabajo están perfectamente correlacionados. Sin embargo, en un metanálisis se descubrió que la correlación era considerablemente menor. [143] Una crítica que se ha hecho a los estudios que identifican a g con la memoria de trabajo es que "no avanzamos en la comprensión al mostrar que un concepto misterioso está vinculado a otro". [144]
Las teorías psicométricas de la inteligencia tienen como objetivo cuantificar el crecimiento intelectual e identificar las diferencias de capacidad entre individuos y grupos. En contraste, la teoría del desarrollo cognitivo de Jean Piaget busca comprender los cambios cualitativos en el desarrollo intelectual de los niños. Piaget diseñó una serie de tareas para verificar las hipótesis que surgen de su teoría. Las tareas no estaban destinadas a medir las diferencias individuales y no tienen equivalente en las pruebas psicométricas de inteligencia. [145] [146] Por ejemplo, en una de las tareas de conservación piagetianas más conocidas, se le pregunta a un niño si la cantidad de agua en dos vasos idénticos es la misma. Después de que el niño acepta que la cantidad es la misma, el investigador vierte el agua de uno de los vasos en un vaso de forma diferente para que la cantidad parezca diferente aunque siga siendo la misma. Luego se le pregunta al niño si la cantidad de agua en los dos vasos es la misma o diferente.
A pesar de las diferentes tradiciones de investigación en las que se desarrollaron las pruebas psicométricas y las tareas piagetianas, se ha descubierto que las correlaciones entre los dos tipos de medidas son consistentemente positivas y, en general, de magnitud moderada. Un factor general común subyace a ellas. Se ha demostrado que es posible construir una batería compuesta por tareas piagetianas que sea una medida de g tan buena como las pruebas de CI estándar. [145] [147]
La visión tradicional en psicología es que no existe una relación significativa entre la personalidad y la inteligencia, y que ambas deben estudiarse por separado. La inteligencia puede entenderse en términos de lo que un individuo puede hacer, o cuál es su rendimiento máximo , mientras que la personalidad puede pensarse en términos de lo que un individuo hará típicamente , o cuáles son sus tendencias generales de comportamiento. Los metaanálisis a gran escala han descubierto que existen cientos de conexiones de magnitud >.20 entre las capacidades cognitivas y los rasgos de personalidad en los Cinco Grandes . Esto es a pesar del hecho de que las correlaciones con los factores globales de los Cinco Grandes son pequeñas, excepto por la Apertura (.26). [148] Surgen relaciones más interesantes en otros niveles (por ejemplo, .23 para la faceta de actividad de la extraversión con la capacidad mental general, -.29 para la faceta de temperamento desigual del neuroticismo, .32 para el aspecto de laboriosidad de la escrupulosidad, .26 para el aspecto de compasión de la amabilidad). [149]
Las asociaciones entre inteligencia y personalidad generalmente se han interpretado de dos maneras principales. La primera perspectiva es que los rasgos de personalidad influyen en el desempeño en las pruebas de inteligencia . Por ejemplo, una persona puede no desempeñarse a un nivel máximo en una prueba de CI debido a su ansiedad y propensión al estrés. La segunda perspectiva considera que la inteligencia y la personalidad están relacionadas conceptualmente , y que los rasgos de personalidad determinan cómo las personas aplican e invierten sus habilidades cognitivas, lo que lleva a la expansión del conocimiento y a una mayor diferenciación cognitiva. [150] [151] Otras teorías (por ejemplo, la teoría de los complejos de rasgos cibernéticos) consideran la personalidad y la capacidad cognitiva como parámetros entrelazados de los individuos que coevolucionaron y también están co-influenciados durante el desarrollo (por ejemplo, por la inanición temprana en la vida). [152]
Algunos investigadores creen que existe un nivel umbral de g por debajo del cual la creatividad socialmente significativa es poco frecuente, pero que, por lo demás, no existe relación entre ambos. Se ha sugerido que este umbral se encuentra al menos una desviación estándar por encima de la media de la población. Por encima del umbral, se cree que las diferencias de personalidad son determinantes importantes de la variación individual en la creatividad. [153] [154]
Otros han puesto en tela de juicio la teoría del umbral. Si bien no niegan que la oportunidad y otros atributos personales además de la inteligencia, como la energía y el compromiso, son importantes para la creatividad, sostienen que g está positivamente asociada con la creatividad incluso en el extremo superior de la distribución de capacidades. El estudio longitudinal de la juventud matemáticamente precoz ha aportado pruebas de esta afirmación. Ha demostrado que los individuos identificados por pruebas estandarizadas como intelectualmente dotados en la adolescencia temprana logran logros creativos (por ejemplo, obtener patentes o publicar obras literarias o científicas) a un ritmo varias veces superior al de la población general, y que incluso dentro del 1 por ciento superior de la capacidad cognitiva, aquellos con mayor capacidad tienen más probabilidades de lograr logros sobresalientes. El estudio también ha sugerido que el nivel de g actúa como predictor del nivel de logro, mientras que los patrones específicos de capacidad cognitiva predicen el ámbito del logro. [155] [156]
Las investigaciones sobre el factor G, así como otros valores psicométricos, han sido ampliamente criticadas por no tener debidamente en cuenta el trasfondo eugenésico de sus prácticas de investigación. [157] Se ha atribuido el reduccionismo del factor G a haber evolucionado a partir de "teorías pseudocientíficas" sobre la raza y la inteligencia. [158] La g de Spearman y el concepto de inteligencia heredada e inmutable fueron una bendición tanto para los eugenistas como para los pseudocientíficos. [159]
Joseph Graves Jr. y Amanda Johnson han argumentado que g "...es para los psicometristas lo que el éter de Huygens fue para los primeros físicos: una nulidad tomada como un artículo de fe en lugar de algo que necesita verificación mediante datos reales". [160]
Algunos críticos especialmente severos se han referido al factor g y a la psicometría como una forma de pseudociencia. [161]
Raymond Cattell , un estudiante de Charles Spearman, modificó el modelo unitario del factor g y dividió g en dos dominios amplios y relativamente independientes: inteligencia fluida (G f ) e inteligencia cristalizada (G c ). G f se conceptualiza como una capacidad para resolver problemas nuevos, y se evalúa mejor con pruebas con poco contenido cultural o académico, como las matrices de Raven. G c puede considerarse como un conocimiento consolidado, que refleja las habilidades y la información que un individuo adquiere y retiene a lo largo de su vida. G c depende de la educación y otras formas de aculturación, y se evalúa mejor con pruebas que enfatizan el conocimiento académico y cultural. [2] [43] [162] Se puede pensar que G f consiste principalmente en las capacidades actuales de razonamiento y resolución de problemas, mientras que G c refleja el resultado de procesos cognitivos ejecutados previamente . [163]
La razón para la separación de G f y G c fue explicar el desarrollo cognitivo de los individuos a lo largo del tiempo. Si bien se ha descubierto que G f y G c están altamente correlacionados, difieren en la forma en que cambian a lo largo de la vida. G f tiende a alcanzar su punto máximo alrededor de los 20 años, y luego disminuye lentamente. Por el contrario, G c es estable o aumenta a lo largo de la edad adulta. Se ha criticado un único factor general por ocultar este patrón bifurcado de desarrollo. Cattell sostuvo que G f reflejaba diferencias individuales en la eficiencia del sistema nervioso central . G c era, en el pensamiento de Cattell, el resultado de que una persona "invirtiera" su G f en experiencias de aprendizaje a lo largo de la vida. [2] [29] [43] [164]
Cattell, junto con John Horn , expandió posteriormente el modelo Gf-Gc para incluir una serie de otras habilidades amplias, como G q (razonamiento cuantitativo) y G v (razonamiento visual-espacial). Si bien todos los factores de habilidad amplia en el modelo G f -G c extendido están correlacionados positivamente y, por lo tanto, permitirían la extracción de un factor g de orden superior , Cattell y Horn sostuvieron que sería erróneo postular que un factor general subyace a estas habilidades amplias. Argumentaron que los factores g calculados a partir de diferentes baterías de pruebas no son invariantes y darían diferentes valores de g , y que las correlaciones entre las pruebas surgen porque es difícil evaluar solo una habilidad a la vez. [2] [48] [165]
Sin embargo, varios investigadores han sugerido que el modelo G f -G c es compatible con una comprensión centrada en g de las capacidades cognitivas. Por ejemplo, el modelo de inteligencia de tres estratos de John B. Carroll incluye tanto G f como G c junto con un factor g de orden superior . Basándose en análisis factoriales de muchos conjuntos de datos, algunos investigadores también han argumentado que G f y g son uno y el mismo factor y que los factores g de diferentes baterías de pruebas son sustancialmente invariantes siempre que las baterías sean grandes y diversas. [43] [166] [167]
Varios teóricos han propuesto que existen capacidades intelectuales que no están correlacionadas entre sí. Entre los primeros se encuentra LL Thurstone , que creó un modelo de capacidades mentales primarias que representan dominios supuestamente independientes de la inteligencia. Sin embargo, se descubrió que las pruebas de Thurstone sobre estas capacidades producían un fuerte factor general. Sostuvo que la falta de independencia entre sus pruebas reflejaba la dificultad de construir pruebas "factorialmente puras" que midieran sólo una capacidad. De manera similar, JP Guilford propuso un modelo de inteligencia que comprendía hasta 180 capacidades distintas y no correlacionadas, y afirmó ser capaz de evaluarlas todas. Análisis posteriores han demostrado que los procedimientos factoriales que Guilford presentó como evidencia de su teoría no la respaldaban, y que los datos de las pruebas que, según él, proporcionaban evidencia contra g , de hecho mostraban el patrón habitual de intercorrelaciones después de la corrección de los artefactos estadísticos. [168] [169]
Más recientemente, Howard Gardner ha desarrollado la teoría de las inteligencias múltiples . Postula la existencia de nueve dominios de inteligencia diferentes e independientes, como la inteligencia matemática, lingüística, espacial, musical, corporal-kinestésica, metacognitiva y existencial, y sostiene que los individuos que fracasan en algunos de ellos pueden sobresalir en otros. Según Gardner, los exámenes y las escuelas tradicionalmente enfatizan solo las habilidades lingüísticas y lógicas, mientras que descuidan otras formas de inteligencia.
Aunque la teoría de Gardner es popular entre los pedagogos , ha sido muy criticada por psicólogos y psicometristas. Una crítica es que la teoría viola tanto los usos científicos como los cotidianos de la palabra "inteligencia". Varios investigadores han argumentado que no todas las inteligencias de Gardner caen dentro de la esfera cognitiva. Por ejemplo, Gardner sostiene que una carrera exitosa en los deportes profesionales o en la música popular refleja inteligencia corporal-kinestésica e inteligencia musical , respectivamente, aunque normalmente se podría hablar de habilidades , talentos o capacidades atléticas y musicales .
Otra crítica a la teoría de Gardner es que muchos de sus supuestos dominios de inteligencia independientes están de hecho correlacionados entre sí. En respuesta a los análisis empíricos que muestran correlaciones entre los dominios, Gardner ha argumentado que las correlaciones existen debido al formato común de las pruebas y porque todas las pruebas requieren habilidades lingüísticas y lógicas. Sus críticos, a su vez, han señalado que no todas las pruebas de CI se administran en formato de papel y lápiz, que además de las habilidades lingüísticas y lógicas, las baterías de pruebas de CI también contienen medidas de, por ejemplo, habilidades espaciales, y que las tareas cognitivas elementales (por ejemplo, tiempo de inspección y tiempo de reacción) que no involucran razonamiento lingüístico o lógico también se correlacionan con las baterías de CI convencionales. [73] [170] [171] [172]
Robert Sternberg , en colaboración con varios colegas, también ha sugerido que la inteligencia tiene dimensiones independientes de g . Sostiene que hay tres clases de inteligencia: analítica, práctica y creativa. Según Sternberg, las pruebas psicométricas tradicionales miden solo la inteligencia analítica y deberían ampliarse para evaluar también la inteligencia creativa y práctica. Ha ideado varias pruebas a tal efecto. Sternberg equipara la inteligencia analítica con la inteligencia académica y la contrasta con la inteligencia práctica, definida como la capacidad de lidiar con problemas de la vida real mal definidos. La inteligencia tácita es un componente importante de la inteligencia práctica, que consiste en el conocimiento que no se enseña explícitamente pero que se requiere en muchas situaciones de la vida real. Evaluar la creatividad independientemente de las pruebas de inteligencia ha resultado tradicionalmente difícil, pero Sternberg y sus colegas han afirmado haber creado también pruebas válidas de creatividad.
La validación de la teoría de Sternberg requiere que las tres habilidades evaluadas no estén sustancialmente correlacionadas y tengan validez predictiva independiente. Sternberg ha llevado a cabo muchos experimentos que, según él, confirman la validez de su teoría, pero varios investigadores han cuestionado esta conclusión. Por ejemplo, en su nuevo análisis de un estudio de validación de la prueba STAT de Sternberg, Nathan Brody demostró que la validez predictiva de la STAT, una prueba de tres habilidades supuestamente independientes, se debía casi exclusivamente a un único factor general subyacente a las pruebas, que Brody equiparó con el factor g . [173] [174]
James Flynn ha sostenido que la inteligencia debe ser conceptualizada en tres niveles diferentes: la fisiología cerebral, las diferencias cognitivas entre individuos y las tendencias sociales en la inteligencia a lo largo del tiempo. Según este modelo, el factor g es un concepto útil con respecto a las diferencias individuales, pero su poder explicativo es limitado cuando el foco de la investigación es la fisiología cerebral o, especialmente, el efecto de las tendencias sociales en la inteligencia. Flynn ha criticado la noción de que las ganancias cognitivas a lo largo del tiempo, o el efecto Flynn, son "huecas" si no se puede demostrar que son aumentos en g . Sostiene que el efecto Flynn refleja prioridades sociales cambiantes y la adaptación de los individuos a ellas. Aplicar el concepto de diferencias individuales de g al efecto Flynn es confundir diferentes niveles de análisis. Por otra parte, según Flynn, también es falaz negar, haciendo referencia a las tendencias en la inteligencia a lo largo del tiempo, que algunos individuos tienen "mejores cerebros y mentes" para hacer frente a las demandas cognitivas de su época particular. A nivel de la fisiología cerebral, Flynn ha enfatizado que los grupos neuronales localizados pueden verse afectados de manera diferente por el ejercicio cognitivo, y que hay factores importantes que afectan a todos los grupos neuronales. [175]
El paleontólogo y biólogo Stephen Jay Gould presentó una crítica en su libro de 1981 The Mismeasure of Man (La falsa medida del hombre) . Sostuvo que los psicometristas habían reificado falazmente el factor g en una "cosa" ineludible que proporcionaba una explicación conveniente para la inteligencia humana, basada únicamente en la teoría matemática en lugar de la aplicación rigurosa de la teoría matemática al conocimiento biológico. [176] Un ejemplo se proporciona en el trabajo de Cyril Burt, publicado póstumamente en 1972: "Las dos conclusiones principales a las que hemos llegado parecen claras y fuera de toda duda. La hipótesis de un factor general que entra en cada tipo de proceso cognitivo, sugerida tentativamente por especulaciones derivadas de la neurología y la biología, está plenamente confirmada por la evidencia estadística; y la afirmación de que las diferencias en este factor general dependen en gran medida de la constitución genética del individuo parece incontestable. El concepto de una capacidad cognitiva innata y general, que se desprende de estos dos supuestos, aunque se admita que es pura abstracción, es por lo tanto totalmente coherente con los hechos empíricos". [177]
Varios investigadores han criticado los argumentos de Gould. Por ejemplo, han rechazado la acusación de cosificación, sosteniendo que el uso de factores extraídos como g como variables causales potenciales cuya realidad puede ser apoyada o rechazada por investigaciones posteriores constituye una práctica científica normal que de ninguna manera distingue a la psicometría de otras ciencias. Los críticos también han sugerido que Gould no comprendía el propósito del análisis factorial y que ignoraba los avances metodológicos relevantes en el campo. Si bien diferentes soluciones factoriales pueden ser matemáticamente equivalentes en su capacidad para dar cuenta de las intercorrelaciones entre pruebas, las soluciones que arrojan un factor g son psicológicamente preferibles por varias razones extrínsecas al análisis factorial, incluido el fenómeno de la variedad positiva, el hecho de que la misma g puede surgir de baterías de pruebas bastante diferentes, la validez práctica generalizada de g y la vinculación de g con muchas variables biológicas. [36] [37] [ página necesaria ]
John Horn y John McArdle han sostenido que la teoría g moderna , tal como la defiende, por ejemplo, Arthur Jensen, es infalsable , porque la existencia de un factor común como g se deduce tautológicamente de las correlaciones positivas entre las pruebas. Contrastaron la teoría jerárquica moderna de g con la teoría original de dos factores de Spearman, que era fácilmente falsable (y de hecho fue falsada). [29]
El hecho de que diversas pruebas cognitivas tiendan a estar correlacionadas positivamente se ha tomado como evidencia de una única capacidad general o factor "g"... la presencia de una variedad positiva en las correlaciones entre diversas pruebas cognitivas no proporciona un apoyo diferencial ni para los modelos de un solo factor ni para los modelos de múltiples factores de las capacidades generales.