© Prensa Médica Latinoamericana 2013 - ISSN 1688-4094 Ciencias Psicológicas 2013; VII (2): 183 - 197 INTERPRETACIÓN DEL WISC-IV. PUNTUACIONES COMPUESTAS Y MODELOS CHC WISC-IV SCORING AND CHC-BASED INTERPRETATIVE APPROACHES María Elena Brenlla Centro de Investigaciones en Psicología y Psicopedagogía (CIPP), Argentina Universidad Católica Argentina Resumen: Los objetivos de este artículo fueron valorar si la adaptación argentina de la Escala de Inteligencia de Wechsler para Niños, cuarta edición WISC-IV (Taborda, Brenlla y Barbenza, 2011), evalúa los mismos constructos en distintos grupos de edad, analizar si la estructura de puntuaciones compuestas de cuatro dominios específicos y un factor general postulada por los autores del WISC-IV se replica en nuestro medio y evaluar dos modelos alternativos basados en la teoría de Cattel-Horn-Carroll (CHC). Se llevaron a cabo estudios de Análisis Factorial Confirmatorio de las puntuaciones obtenidas (n = 1437). Los resultados indican que el WISC-IV evalúa los mismos constructos en distintas edades, que tanto la estructura de puntuaciones compuestas propuesta en el WISC-IV como uno de los modelos CHC son significativos para interpretar las puntuaciones del test y que la varianza explicada es similar en ambos modelos. El WISC-IV evalúa habilidad cristalizada, procesamiento visual, razonamiento fluido, memoria de corto plazo y operativa y procesamiento visual. En particular, se ha notado que el razonamiento fluido y el procesamiento visual pueden evaluarse por separado o combinados como razonamiento perceptivo. Palabras Clave: inteligencia, niños, interpretación, puntuaciones compuestas Abstract: The validity of WISC-IV current four-factor scoring structure and the Cattel-Horn-Carroll (CHC) theory-based models of the Wechsler Intelligence Scale for Children-Fourth Edition (WISC-IV) we investigated by the application of confirmatory factor analysis of scores from the argentine WISC-IV standardized sample (n = 1437). Results reveal that the WISC-IV measures the same constructs across age, the resulting interpretation could be applied to children with various age levels. Both the four-factor structure and the alternative CHC-based model were supported. Variance explained was similar across models. The WISC-IV measures crystallized ability, visual processing, fluid reasoning, working memory and processing speed. In particular, either separating fluid reasoning and visual processing, or combining them as the Perceptual Reasoning Index provides meaningful explanation. Keywords: intelligence, children, interpretation, composite scores Introducción Es conocida la importancia que la psicometría tiene para la psicología. En la psicología experimental, proveyendo de la construcción de procedimientos –escalas- para la medición de estímulos; en la psicología diferencial, proponiendo modelos para la cuantificación de las diferencias individuales de los sujetos en rasgos, atributos y/o conductas (Martínez Arias, 1996). Un aspecto esencial es la construcción de tests que posibiliten la medición y la estimación válida y confiable de esas diferencias individuales ya que esto tiene gran impacto tanto en el ámbito de la investigación cuanto en la psicología aplicada, en particular en la evaluación psicológica (EP). Entre los tests de los que se vale la EP se destacan los psicométricos caracterizados por refinamientos metodológicos y tecnológicos que ayudaron enormemente a la precisión y validez de las medidas con ellos realizados. Esto permitió, por una parte, una evaluación más ajustada de los rasgos, atributos o características que medían y, por otra, profundizar y ampliar el campo de la investigación de variables psicológicas. Un subgrupo son los tests de ejecución máxima que evalúan atributos cognitivos a través de tareas de rendimiento. Correspondencia: María Elena Brenlla. Facultad de Psicología y Psicopedagogía, Universidad Católica Argentina Correo Electrónico: [email protected] 183 Ciencias Psicológicas 2013; VII (2): 183 - 197 Mediante ellos se ha logrado no solo contribuir a un mejor diagnóstico de trastornos relacionados –tales como el retraso y el talento intelectuales o los trastornos de aprendizaje– sino también han posibilitado inferencias teóricas sustantivas a partir del análisis e interpretación de métodos factoriales. Esto ha dado lugar a lo que se conoce como el enfoque psicométrico para la explicación de la inteligencia (Cohen y Swerdlick, 2000). Fue Spearman (1904, 1927) quien estableció, en los albores del siglo XX, una teoría de la inteligencia y un método para probarla –el análisis factorial– cuyos postulados básicos han mostrado consistencia y robustez hasta la actualidad. Spearman pensó una teoría que se caracteriza por su parsimonia: esto es, con pocas variables se explica un gran dominio de conocimiento. Esencialmente, consideraba que en cualquier habilidad intelectual pueden distinguirse –al menos formalmente- un factor general (g) de la inteligencia y otro específico. El factor general se caracteriza por mantenerse constante en cada individuo aunque puede variar dentro de márgenes muy amplios de un sujeto a otro. En cambio, los específicos, varían no solo entre los diversos individuos sino también en el mismo sujeto conforme a qué aptitud está siendo examinada. Con el tiempo, comprendió que entre algunas habilidades específicas –como la de memorizar sílabas y números– era posible establecer grupos extensos de tareas próximamente relacionadas. Spearman llamó factores de grupo a aquellas características que están presentes en más de una habilidad pero no en todas y que expresan alguna afinidad entre las integrantes de un conjunto. Gran parte del debate sobre la evaluación intelectual durante los últimos 60 años se ha centrado en la existencia de este aspecto global subyacente de la inteligencia que influye en el desempeño del individuo a través de dominios cognitivos (Gustafsson & Undheim, 1996; Jensen, 1998). Unas décadas más tarde que Spearman, Cattell (1941, 1957) introdujo la noción que la inteligencia estaba compuesta por dos factores, la inteligencia fluida y la cristalizada. La primera relacionada con la actuación intelectual ante problemas novedosos y, la segunda, con el conocimiento adquirido. Luego, su discípulo y colega Horn amplió esta teoría e incluyó factores tales como la percepción visual, la 184 memoria de corto plazo y el almacenamiento y recuperación a largo plazo, entre otros (Horn, 1985, 1988, 1991; Horn & Noll, 1997). Después de varias décadas de investigación, las ideas de Cattell y Horn en cuanto a dominios más específicos de la inteligencia han recibido un apoyo empírico sustancial. Carroll (1993, 1997), en su ya clásica revisión, comparó los resultados de distintos análisis factoriales de las medidas de habilidades cognitivas existentes y concluyó que la evidencia de un factor general de inteligencia era abrumadora. Al mismo tiempo, indicó que la inteligencia tiene una estructura jerárquica y que se compone de habilidades específicas que parecen agruparse en dominios de habilidad cognitiva de nivel superior (Carroll, 1993; Keight, 1990). La confluencia de la teoría de la inteligencia fluida y cristalizada de Cattell y Horn y de la concepción jerárquica de Carroll se plasmó en lo que hoy conocemos como la teoría CHC. Ésta versa acerca del contenido y la estructura de la inteligencia y sostiene que las habilidades intelectuales se organizan en tres estratos, un estrato próximo (narrow strata), un estrato amplio (broad strata) y un estrato general. La CHC fue revisada y ampliada sobre la base de los estudios de McGrew y Flanagan (1998) y McGrew (2009), en la actualidad, hay consenso en considerar que el primer estrato está constituido por 70 componentes que se subsumen en habilidades amplias del segundo estrato, a saber, inteligencia cristalizada, razonamiento fluido, procesamientos visual y auditivo, memoria de corto plazo, recuperación a largo plazo, velocidad de procesamiento, conocimiento cuantitativo y habilidades para la lectura y la escritura. Según la revisión de McGrew (2009) y de Schneider y McGrew (2012), en este estrato deberían incluirse también la velocidad para la reacción y la decisión, la velocidad psicomotora, el conocimiento de dominios específicos y las habilidades táctiles, cinestésicas, olfatorias y psicomotoras. De esta manera, el estrato II incluye 16 habilidades. Éstas, a su vez, se condensan en el tercer estrato que, en términos psicométricos, se corresponde con g. En forma paralela a esta línea de investigaciones y también inspirado en las concepciones de Spearman, Wechsler (1939) había definido a la inteligencia como “la capacidad global y agregada de un individuo para actuar con una finalidad, pensar racionalmente y re- WISC-IV puntuaciones compuestas y modelos CHC lacionarse adecuadamente con el entorno” (p. 3). Sobre la base de estos supuestos, creó sus mundialmente conocidos tests de inteligencia (Wechsler Adult Intelligence Scale –WAIS–; Wechsler Intelligence Scale for Children – WISC–; Wechsler Preschool and Primary Scale of Intelligence –WPPSI–). Para el diseño de sus tests, Wechsler seleccionó y desarrolló medidas destinadas a evaluar los aspectos cognitivos de la inteligencia que consideró más relevantes: comprensión verbal, razonamiento abstracto, organización perceptual, razonamiento cuantitativo, memoria y velocidad de procesamiento. Las teorías y las medidas de inteligencia más modernas han confirmado que todas esas áreas reflejan aspectos importantes de la habilidad cognitiva (Carroll, 1993, 1997; Horn, 1991). Algunos investigadores han deducido que Wechsler consideraba que la estructura de la inteligencia tenía dos factores y que por eso dividió sus tests en tareas verbales y de ejecución (Wechsler, 2003). Aunque este agrupamiento fue de naturaleza racional y no psicométrica dio lugar, en las versiones anteriores del Test de Inteligencia para Niños de Wechsler (WISC, WISC-R, WISC-III), a tres Cocientes Intelectuales (CI): Verbal (CIT), de Ejecución (CIE) y Total (CIT). No obstante, en la revisión más reciente –WISC-IV– se eliminaron los CI verbal y de ejecución, se incrementó la medición de dominios de funcionamiento cognitivo más específicos –velocidad de procesamiento (VP), memoria operativa (MO), comprensión verbal (CV) y razonamiento perceptivo (RP)– y se mantuvo la evaluación de la inteligencia global a través de un cociente intelectual total. Estos cambios en el WISC-IV, que son de un tenor muy importante, obedecen indudablemente al aggiornamiento del test a los hallazgos de la teoría CHC habida cuenta que, en términos estrictos, no hay una teoría formal que sustente a las escalas Wechsler más que la asunción general de los postulados de Spearman. Por otro lado, no hay que olvidar que la CHC ha tenido la suficiente consistencia como para servir de fundamento a otros tests de inteligencia o de habilidades cognitivas como el Stanford-Binet Fifth Edition (Roid, 2003) o el Woodcock-Johnson Test of Cognitive Abilities III (Woodcock, McGrew & Mather, 2001). Ya la evidencia obtenida de investigaciones anteriores con el WISC-III indicaba que éste medía cuatro dominios cognitivos: Comprensión Verbal, Organización Perceptiva, Ausencia de Distractibilidad y Velocidad de Procesamiento (Blaha & Wallbrown, 1996; Sattler, 2001; Wechsler, 1991). Debido a que el WISC-IV retiene diez subtests de la edición anterior y agrega cinco subtests nuevos diseñados para medir constructos similares, se esperaba que el WISC-IV midiera los mismos cuatro dominios cognitivos. Para probar esta hipótesis, los autores del WISC-IV llevaron a cabo estudios factoriales exploratorios y confirmatorios. Basándose en la teoría, la investigación y los resultados de los análisis factoriales exploratorios pudo evaluarse el modelo factorial propuesto para el WISC-IV utilizando modelos de ecuación estructural (Jöreskog & Sörbom, 1993). El análisis factorial confirmatorio está diseñado para testear la estructura interna especificada por los investigadores. En este sentido, es diferente del exploratorio ya que la agrupación de subtests se realiza a priori y no por medio de un algoritmo. Las relaciones específicas entre las variables observadas (por ejemplo los subtests) y las variables latentes (por ejemplo, Comprensión Verbal) se indican previamente y ese modelo se testea para determinar si las relaciones entre las variables observadas y las latentes confirman la estructura sobre la que se hizo la hipótesis. En el estudio norteamericano con el WISC-IV se testearon diferentes modelos de entre uno y cinco factores y se compararon entre sí para evaluar su estructura factorial y las evidencias de validez interna. Todos los modelos asumieron que los factores pueden tener correlación y que los errores no tenían correlación entre sí. Los resultados reportados por los autores del WISC-IV (Wechsler, 2003) sugieren que los modelos de 4 y 5 factores se ajustan bien a los datos. Sin embargo, los referidos al modelo 5 no indican una mejora sustancial sobre el modelo 4 y tienen el inconveniente de que plantean un factor compuesto por un solo subtest (Aritmética). De acuerdo a ello, la hipótesis de cuatro dominios bien diferenciados de la inteligencia resultó más consistente y recibió un sustento muy satisfactorio luego de realizados dichos análisis (Wechsler, 2003). 185 Ciencias Psicológicas 2013; VII (2): 183 - 197 La Figura 1 muestra la estructura interna definitiva del WISC-IV. Figura 1. Estructura del WISC-IV (Wechsler, 2003) No obstante, Keith, Fine, Taub, Reynolds & Kranzler (2006) han objetado esta estructura de cuatro dominios específicos en el WISC-IV. En su artículo Análisis de primer orden, con muestras múltiples, análisis factorial confirmatorio del WISC-IV: qué es lo que se evalúa?1 reseñan un estudio realizado a partir de la muestra norteamericana cuyos objetivos fueron analizar si el test evalúa los mismos constructos en los distintos rangos de edad y contribuir a la explicación de la naturaleza de ellos. Los resultados que obtuvieron indicaron que si bien el WISC-IV evaluaba los mismos atributos en las distintas edades, no obstante, la estructura de puntuaciones del test se ajustaba mejor a un modelo alternativo basado en la teoría CHC que al de los cuatro dominios específicos postulado por los autores del WISC-IV (Comprensión verbal; Razonamiento perceptivo; Memoria operativa y Velocidad de procesamiento). El modelo que propusieron Keith et al. (2006) sugiere que el WISC-IV mide aspectos de la inteligencia cristalizada, del procesamiento visual, del razonamiento fluido, de la memoria de corto plazo y de la velocidad de procesamiento. Por esta razón, recomiendan que los usuarios del WISC-IV reagrupen la interpretación de los subtests de Razonamiento perceptivo y de Aritmética tal como lo muestra la Figura 2. En ésta puede notarse que la novedad del modelo de Keith consiste en reubicar en distintos dominios a los subtests de Completamiento de figuras, Aritmética, Búsqueda de símbolos y Matrices, ya que estas pruebas son las que, en el análisis 1 (Higher Order, Multisample, Confirmatory Factor Análisis of the Wechsler Intelligence Scale for Childrem – Fourth Edition: What Does It measure?) 186 factorial, presentaron cargas compartidas en esos distintos factores. Unos años más tarde, Chen, Keith, Chen y Chang (2009), replicaron la investigación de Keith et al. (2006) a partir de los datos de la muestra taiwanesa del WISC-IV. Los resultados coincidieron en cuanto que el test evalúa los mismos constructos a través de las distintas edades pero difirieron claramente respecto de la supremacía del modelo CHC y aún de la estructura de subtests que la componen. De acuerdo a los hallazgos de Chen et al. (2009) ambos modelos –el de la estructura de cuatro factores del WISC-IV y el modelo alternativo CHC– recibieron un sustento empírico satisfactorio. La varianza explicada fue similar en ambos y tanto uno como otro proveyeron de explicaciones significativas acerca de la organización interna del test. No obstante, la estructura factorial según criterios CHC no coincidió con la obtenida por Keith. En la Figura 2 se muestra la estructura obtenida por Chen et al. (2009). Las diferencias más importantes son en cuanto al razonamiento fluido, la inteligencia cristalizada y el procesamiento visual. Concomitantemente, los subtests Completamiento de figuras (CF), Aritmética (Ar), Búsqueda de símbolos (BS), Semejanzas (S) y Matrices (M) presentaron cargas compartidas en distintos factores. Por ejemplo, según el estudio de Keith et al. (2006) M tiene cargas compartidas en procesamiento visual y razonamiento Fluido; CF, en procesamiento visual e inteligencia cristalizada y Ar, en memoria de trabajo y razonamiento fluido. Por el contrario, en el estudio de Chen et al. (2009), Matrices carga solo en el segundo, CF solo en procesamiento visual y Ar en memoria de trabajo e inteligencia cristalizada pero no en razonamiento fluido. En consecuencia, el análisis de las puntuaciones sobre la base del modelo CHC y sobre la estructura de cuatro factores del WISC-IV (CIT e Índices CV, RP, MO y VP) son de interés para analizar e interpretar los resultados del test en ambos estudios aunque sus resultados difieren de los hallados por Keith et al. (2006) no solo en cuanto a la supremacía de la teoría CHC para explicar las puntuaciones del WISC-IV sino también a la estructura de su modelo CHC. Como es lógico, este tipo de resultados divergentes interpelan las evidencias de la validez de la estructura interna de las pun- WISC-IV puntuaciones compuestas y modelos CHC Figura 2. Estructura del WISC-IV según la teoría CHC (Keith et al., 2006 y Chen et al., 2009) tuaciones del test. Y, con ello, la calidad de las inferencias psicológicas que pueden hacerse a partir de sus resultados. No debe olvidarse que muchos tests, como es el caso del WISC-IV, brindan información que puede ser relevante para la toma de decisión en psicología aplicada (clínica, educacional, forense, entre otras). Su administración permite al psicólogo evaluar la habilidad intelectual de niños y adolescentes y es uno de los elementos de juicio que se tienen en cuenta para indicar la educación especial, la pertinencia de una intervención psicopedagógica o la derivación a otras especialidades como la neurología o la psicología clínica (Wechsler, 2004). Por ende, resulta crucial contar con estudios que avalen que la estructura interna del test responde a una concepción clara de la inteligencia y no a una construcción pseudoética (Marín, 1986; Triandis et al., 1980), en la que se aceptan como válidas y universales las inferencias realizadas en otros contextos sin el debido análisis en la cultura en la que se quiere adaptar un test. En vista de estos antecedentes y de la importancia que tiene el estudio de los supuestos teóricos sobre los que se fundamenta un test, los objetivos de este artículo son (a) valorar si en la adaptación argentina del WISC-IV (Taborda, Brenlla y Barbenza, 2011) se evalúan los mismos constructos en distintos grupos de edad, tal como ocurre en la versión norteamericana, (b) analizar si la estructura de puntuaciones compuestas de cuatro dominios específicos y un factor general postulada por los autores del WISC-IV se replica en nuestro medio y (c) poner a prueba los modelos alternativos basados en la CHC propuestos por Keith et al. (2006) y Chen et al. (2009). Método Tipo de estudio y diseño Se trata de un estudio de naturaleza inferencial con diseño transversal que se sirve de métodos estadísticos específicos para el estudio de las evidencias de validez interna del WISC-IV en el que se comparan distintos modelos para la explicación de su estructura interna. Se utilizaron modelos de ecuaciones estructurales para analizar los objetivos propuestos. A continuación se describen los modelos operativos utilizados en este estudio. Grupos de edad Los datos se reagruparon en cuatro categorías de edad: 6-7 años / 8 a 10 años / 11 a 13 años / 14 a 16 años. 187 Ciencias Psicológicas 2013; VII (2): 183 - 197 Modelo de Puntuaciones Compuestas del WISC-IV Para el agrupamiento de los subtests, véase la Figura 1. Modelos de Cattel-Horn-Carroll (CHC). Modelo de Keith et al. (2006) y de Chen et al. (2009): Para el agrupamiento de cada uno de los modelos, véase la Figura 2. Muestra El estudio para la tipificación del WISC-IV fue diseñado para reflejar la población infantojuvenil de las edades comprendidas entre los 6 y 16 años del Área Metropolitana de Buenos Aires (AMBA). En el diseño del plan de muestreo se consideraron tres variables para la estratificación, el sexo, la edad, y la zona. Se consultaron los datos del Censo (Instituto Nacional de Estadísticas y Censos [INDEC], 2001) acerca de la población escolar de 6 a 16 años en cada región y, sobre esta base, se calculó para cada uno de los 11 grupos de edad la cantidad de casos necesarios según sexo, edad y región que debían recolectarse. Para cada grupo de edad, se consideran tres subgrupos clasificados de a tres meses, por ejemplo, 6:0 a 6:3/ 6:4 a 6:7/ 6:8 a 6:11, con cantidad semejante de casos en cada subgrupo. Se establecieron como criterios de exclusión a los siguientes: (a) haber sido evaluado mediante cualquier instrumento de medición de inteligencia en los últimos 6 meses; (b) dificultades visuales y auditivas sin corregir o limitantes; (c) falta de fluidez verbal; (c) fallos severos en la expresión verbal o de comunicación; (d) problemas motores en extremidades superiores; (e) estar en tratamiento psiquiátrico, psicológico o psicofarmacológico y (f) diagnóstico previo de alguna enfermedad que pueda disminuir el desempeño en el test. Entre diciembre de 2009 y noviembre de 2010 se recolectaron los 1485 casos estipulados pero 48 debieron ser desechados por datos incompletos o fallos en la administración o puntuación. Por tal razón la muestra final fue de 1437 casos. De estos, el 50.4% fueron niñas y el 49.6%, niños. La cantidad de casos por franja de edad osciló entre 120 y 142 y, en cuanto a la zona de residencia, el 34.9% fue de partidos de la zona sur, el 34.7% de la zona norte y el 30.2 de la zona oeste del Gran Buenos Aires. 188 Aunque no fue un criterio para la estratificación, es interesante notar los datos acerca del nivel educativo del adulto a cargo del niño –que, en lo usual, es la madre o el padre– ya que es un buen indicio del nivel socioeconómico del hogar. En nuestro estudio, consideramos aquellos casos en los que el registro de la educación se comparecía con las categorías globales de cantidad de años de estudios aprobados del INDEC (2004) (n = 1053) y se eliminaron aquellos cuyo registro fue confuso o incompleto (n = 391). Así, se relevaron 14 casos con menos de 4 años de estudios (1.4%), 84 casos con 4 a 6 (8.3%); 288 con entre 7 y 9 años de educación (27.3%); 344 con 10 a 12 años (32.6%) y 293 con más de 13 años de estudios (27.8%). El análisis de los datos sugiere una concordancia importante entre los datos promedio suministrados por el INDEC (4.5%, 6.1%, 34.3%, 31,4% y 25.4%, respectivamente) y los obtenidos en la muestra de tipificación, ya indicados. De esta manera puede considerarse que se ha logrado una buena representación de la población infanto-juvenil del AMBA, en especial en cuanto al sexo, la edad, el nivel educativo de los padres y la región de residencia. Técnicas e instrumentos de recolección de datos - Escala de Inteligencia de Wechsler para Niños - Cuarta Edición (WISC-IV) en su adaptación para Buenos Aires (Taborda, Barbenza y Brenlla, 2011). Se trata de un instrumento de administración individual para evaluar la inteligencia de niños o adolescentes de entre 6 años 0 meses y 16 años 11 meses (6:0 - 16:11). El WISC-IV consta de 10 subtests principales y 5 subtests optativos y otorga puntuaciones compuestas que proveen información sobre el funcionamiento intelectual en cuatro áreas cognitivas específicas (Puntuaciones Índice) y un Cociente Intelectual Total (CIT), tal como fue descripto en Figura 1. Su fiabilidad y validez ha sido estudiada tanto en EE.UU (Wechsler, 2003) y España (Wechsler, 2005) como en Argentina, en los cuales se encontraron evidencias satisfactorias de las propiedades psicométricas del WISC-IV. En términos resumidos, para nuestro medio, las evidencias de consistencia interna -estimadas a partir del método de división por mitades- muestran coeficientes entre 0.79 y 0.90 y los de estabilidad test-retest, entre 0.77 WISC-IV puntuaciones compuestas y modelos CHC y 0.86, así como adecuada discriminación entre grupos clínicos y evidencias satisfactorias de validez interna. Al igual que en el estudio de E.E. U.U., se observó que de los cinco modelos propuestos para el análisis de las puntuaciones del test, el más consistente resultó el de cuatro factores, debido a que el modelo de 5 factores no mejoró significativamente al de 4 y estuvo formado por un sola prueba (Aritmética). Para una descripción detallada de los procedimientos, consúltese la edición publicada por Paidós (Wechsler, 2011). Dichos procedimientos y resultados fueron evaluados y aprobados por el comité científico de la editora norteamericana. mos constructos en distintos grupos de edad, tal como ocurre en la versión norteamericana, (b) analizar si la estructura de puntuaciones compuestas de cuatro dominios específicos y un factor general postulada por los autores del WISC-IV se replica en nuestro medio y (c) poner a prueba el modelo alternativo basado en la CHC propuesto por Keith et al.(2006) y por Chen et al. (2009). Para realizar una exposición ordenada, cada objetivo se brinda en forma de pregunta y luego se describen los resultados obtenidos. Procedimiento ¿La adaptación Buenos Aires del WISC-IV evalúa los mismos constructos en distintos grupos de edad, tal como ocurre en el estudio original? Entre diciembre de 2009 y noviembre de 2010 se recolectaron 1437 casos de sujetos de 6 a 16 años. Cada uno fue administrado individualmente por un evaluador entrenado a tal fin. Se llevaron a cabo cursos de capacitación para la administración y puntuación del test. Se solicitó el consentimiento del padre, madre o tutor del niño a fin de cumplir con los requerimientos éticos de investigaciones en psicología. Se registró el nivel educativo alcanzado por los padres o tutores así como los datos del niño incluidos en la Hoja de Registro. La identificación de los niños que reunieran los requisitos de inclusión de la muestra de tipificación se realizó a través de reclutadores entrenados (70%) y de examinadores independientes (30 %), a cargo de tres grupos de distintas unidades académicas. Los datos de la muestra de tipificación sirvieron para construir bases de datos en planillas Excel y bajo la plataforma del programa Statistical Package for Social Sciencies 18 (SPSS 18). En cuanto a las técnicas de análisis de datos, se utilizaron modelos de Análisis Factorial Confirmatorio (AFC), que permiten contrastar la validez ajustando un modelo teórico previamente estipulado y diagnosticando su bondad de ajuste a través de distintos índices. En este modelo, cada ítem satura únicamente sobre el factor-dimensión del que se supone que constituye un indicador válido. Para su cálculo se utilizó el programa AMOS 18 (Arbuckle, 2009). La primera cuestión que se analizó fue si los subtests del WISC-IV evalúan los mismos constructos en los distintos grupos de edad para lo cual se aplicaron métodos de AFC multigrupo. Al igual que en los estudios de Keith et al. (2006) y Chen et al. (2009), el primer paso consistió en comparar la equivalencia de las matrices de covarianza de los subtests según los rangos de edad considerados (6-7 años; 8 a 10 años; 11 a 13 años y 14 a 16 años). En un segundo paso se analizó la invariancia de un modelo estructural específico, para lo cual las matrices de varianza y de covarianza se calcularon a fin que sean similares en los distintos grupos de edad. El modelo resultante se acopló bien a los datos, ya que presentó buenos índices de ajuste (SRMR = .05; RMSEA = .05; TLI = .94; NFI = .92). Esto significa que, respecto de los subtests del WISC-IV, las correlaciones observadas en la muestra y las predichas por el modelo difieren en promedio solo en un .05 –que es la interpretación usual de SRMR-. Ello sugiere que, independientemente del nivel de edad, las puntuaciones que obtuvieron los niños en el WISCIV expresan claros e invariantes patrones de correlaciones entre los subtests. En este sentido los hallazgos en cuanto a la estructura interna del WISC-IV son aplicables a todas las edades y refrendan la estructura de puntuaciones compuestas propugnada por los autores originales del test (Wechsler, 2003) y otros alternativos que presenten evidencias sólidas de validez. Resultados ¿La adaptación Buenos Aires del WISC-IV evalúa cuatro dominios diferenciados y un factor general de inteligencia, tal como se propone en el estudio original? Los objetivos principales de este estudio fueron (a) valorar si el WISC-IV evalúa los mis- 189 Ciencias Psicológicas 2013; VII (2): 183 - 197 Tal como se indicó en la introducción, el WISC-IV propone que la interpretación del test se realice sobre la base de las puntuaciones compuestas de cociente intelectual e índices de dominios específicos. Para comparar si esta estructura de puntuaciones es válida en nuestro medio, se utilizaron técnicas de AFC para analizar el comportamiento de los subtests principales y optativos en la muestra de Buenos Aires. A diferencia de lo realizado en oportunidad de los estudios de validez anteriores (Taborda et al., 2011), en los que se trabajó con un análisis de factores relacionados, en este caso, se analizó un modelo jerárquico constituido por un factor general, cuatro factores correspondientes a CV, RP, MO y VP y, como variables observadas, las puntuaciones a los 15 subtests del WISC-IV. En la Figura 3 se muestra la solución hallada para el modelo de 4 factores mediante la aplicación del método de análisis factorial confirmatorio (AFC). Puede notarse que los coeficientes de regresión estandarizados confirman los factores que se conjeturaron (CV, RP, MO y VP) y que los que tienen mayor carga en g son los de Comprensión Verbal (β = .86), Razonamiento perceptivo (β = .91) y Memoria operativa (β = .89) en tanto que, Velocidad de procesamiento (β = .54), es el de menor carga en g. Es de resaltar que todos los coeficientes son muy altos y que las cargas factoriales de los subtests se ajustan con nitidez a la estructura de puntuaciones compuestas ideada en el WISC-IV. Por ejemplo, los coeficientes de los subtests que componen el índice de Comprensión verbal tienen cargas factoriales que oscilan entre .69 a .81; los de Razonamiento perceptivo, entre .60 a .70, los de Memoria operativa, de .61 a .73 y los de Velocidad de procesamiento, entre .43 a .74. Además, todas las asociaciones especificadas por el modelo mostraron un peso significativo (p < .001) sobre el factor en cuestión. Figura 3. Estructura factorial de la adaptación Buenos Aires del WISC-IV según el modelo de Puntuaciones Compuestas (Wechsler, 2003) 190 WISC-IV puntuaciones compuestas y modelos CHC Para la evaluación de la bondad de ajuste, se analizaron estadísticos de ajuste absoluto, relativo y parsimonioso. Entre los primeros, las medidas más utilizadas son el estadístico χ2 o índice de razón de verosimilitud y el índice goodness-of-fit (GFI). El primero solo indica la significación estadística del modelo completo y permite contrastar la hipótesis nula de que todos los errores de éste son nulos, vale decir, que hay un ajuste total entre el modelo teórico y la muestra utilizada. Por tanto es deseable no rechazar la hipótesis nula. El modelo produjo una χ2 significativa (384.250, p < .001). Como es conocido, el índice χ2 raramente es utilizado como prueba única o concluyente de bondad del ajuste de un modelo ya que se basa en la hipótesis excesivamente restrictiva de que S es igual a Σ. Además, en muchos casos, la distribución de los datos no se ajusta a una distribución χ2 o su valor está influenciado por el tamaño de la muestra (Arias, 2008; Tanaka, 1993; The Structural Equation Modeling Discussion Network [SEMNET] , 2010). Por ello, muchos autores (Arbuckle, 2009; Tanaka, 1993) recomiendan examinar no solo la significación sino también la magnitud del χ2 a través del índice χ2 /gl, donde los grados de libertad se utilizan como un estándar para juzgar si ese valor de χ2 es grande o pequeño. Se consideran excelentes los valores entre 1 y 2 (Stahl, 2010), buenos los menores a 3 (Tabachnik & Fidell, 2001), aceptables a los comprendidos entre 3 y 5, sobre todo si el análisis se realiza sobre muestras grandes como es este caso y, rechazables, si son mayores que 5 (Bentler & Bonnet, 1980). De acuerdo a estos criterios, este índice reflejó valores aceptables (4.46), en la muestra total (n = 1437) y, cuando se replicó el mismo análisis según los grupos de edad – que incluían menos casos –, los valores obtenidos fueron muy buenos ya que oscilaron entre 1.5 y 2.5. Por su lado, el GFI mide la cantidad de varianza y covarianza en la matriz observada que está predicha por la matriz reproducida. Se recomienda que su valor sea igual o mayor a .95 (Arbuckle, 2009; Ruiz, Pardo y San Martín, 2010), por lo que el valor obtenido (.96) puede ser considerado muy bueno. El otro índice de ajuste absoluto que se evalúa es el AGFI (adjusted goodness-of-fit). El AGFI es el índice GFI ajustado por los grados de libertad y permite comparar el modelo propuesto con un modelo nulo que se toma de referencia. Este modelo nulo estipula la falta absoluta de asociación entre las variables y es calculado por el programa AMOS por defecto. El AGFI indica la proporción de la varianza explicada por el modelo y su valor de referencia es de β.95 (Arbuckle, 2009; Tabachnik & Fidell, 2001). Como puede notarse el valor obtenido ( .95) indica un muy buen ajuste según los criterios establecidos. El RMSR (Root mean square residual), es la raíz cuadrada de la media de los residuos entre los elementos correspondientes a la matriz observada y a la reproducida. Si los residuos se aproximan a 0, el valor de RMSR será cero que se interpreta como un ajuste perfecto. Por lo general, los valores de β. 05 se consideran “premonitorios” de un buen ajuste aunque se consideran aceptables –sobre todo con muestras grandes– los valores ≤ 08. En este caso, el valor fue de .08, que indica un ajuste aceptable entre el modelo propuesto y la matriz de observaciones. El RMSEA es un índice del error de aproximación medio cuadrático a valores de la población. De acuerdo con Arbuckle (2009) los valores de ≤.08 indican que el modelo ajusta apropiadamente. Así, los índices obtenidos (.047; .044 – .054 p .670) indican que existe un 67% de probabilidad de que el valor real sea menor a .05. El NFI es un índice de ajuste comparativo y se interpreta como un porcentaje de incremento en la bondad de ajuste sobre el modelo nulo. Por ejemplo, un NFI de .90 sugiere que el modelo propuesto ajusta 90% mejor que el nulo. Usualmente se toma como valor de referencia un NFI ≥ 95, por lo que el índice obtenido ( .95), refleja un buen ajuste. De igual manera, el Comparative Fit Index (CIF) – análogo al anterior – mostró valores considerados de buen ajuste ( .96). En conjunto, los resultados obtenidos a partir del AFC indican que la estructura de puntuaciones compuestas de la adaptación argentina del WISC-IV se ajusta a la idea de que el test evalúa un factor general de la inteligencia y cuatro dominios específicos, tal como fue propuesto en la edición original (Wechsler, 2003). ¿La adaptación Buenos Aires del WISC-IV evalúa las habilidades de acuerdo a la teoría CHC? Para contestar a esta pregunta se realizaron AFC de las puntuaciones de la muestra de tipificación argentina reagrupando los ítems según los dominios supuestos por la CHC. 191 Ciencias Psicológicas 2013; VII (2): 183 - 197 Se tuvo en cuenta tanto el modelo de Keith et al. (2006) como el de Chen et al. (2009) que se ilustraron en la Figura 2. El primer modelo no produjo una solución satisfactoria. Se registraron varianzas negativas y la inspección de los coeficientes beta estandarizados indicó que el subtest Matrices presentó cargas negativas y exiguas en razonamiento fluido (-.03) y cargas positivas y significativas en procesamiento visual (.75), estimación contraria al modelo propuesto por Keith et al.(2006). Estos rasgos hacen que la solución hallada no sea admisible. En cambio, el modelo propuesto por Chen et al. (2009) presentó un buen ajuste. Todos los coeficientes estandarizados van en la dirección esperada, sus valores son, por lo general, medios o altos y estadísticamente significativos. En la figura 4 se muestra la solución hallada. Se observa que los coeficientes de regresión estandarizados confirman los factores que se conjeturaron (procesamiento visual; razonamiento fluido; habilidad cristalizada; memoria y velocidad de procesamiento) y que los que tienen mayor carga en g son Procesamiento visual (β = .96), Razonamiento fluido (β = .95), Habilidad Cristalizada (β = .80) y Memoria (β = .79) mientras que el de menor carga es Velocidad de Procesamiento (β = .46). Los índices de bondad de ajuste calculados son similares a los obtenidos para el modelo de puntuaciones compuestas del WISC-IV (χ2/gl = 4.15, GFI = .96, AGFI = .95, RMSEA = .04 [LO90 = .042 / HI90 = .052, p .833], RMSR = .07, NFI = .95 y CFI = .97). En la Tabla 1 se brindan los datos de ambos modelos: puntuaciones WISC-IV y Modelo CHC de Chen et al. (2009). A pesar de esta similitud en cuanto al ajuste empírico, hay que señalar que en el modelo CHC alternativo las cargas factoriales son menos nítidas que las observadas en el del WISCIV. Por ejemplo, el modelo CHC supone que las Figura 4. Estructura factorial de la adaptación Buenos Aires del WISC-IV según el modelo CHC de Chen et al.(2009) 192 WISC-IV puntuaciones compuestas y modelos CHC Tabla 1 Estadísticos de bondad de ajuste modelos WISC-IV y CHC alternativo χ² gl GFI AGFI NFI CFI RMSEA SRMR WISC-IV Puntuaciones 384.250 86 .96 .95 .95 .96 .04 .08 CHC Modelo Chen et al. 341.008 82 .96 .95 .95 .97 .04 .07 Modelo tareas de Búsqueda de símbolos tendrán una carga compartida entre el procesamiento visual y la velocidad de procesamiento. Si bien los resultados así lo indican, los coeficientes son bajos para el primero (β = .17) pero sustantivos para el segundo (β = .59). De manera análoga, Aritmética tiene una carga baja en inteligencia cristalizada (β = .29) y más alta para Memoria (β = .47) y, Semejanzas, cargas muchos más importantes en Habilidad cristalizada que en Razonamiento fluido (β = .70 y β = .12, respectivamente). Además, hay que notar que Matrices –que en el modelo de Keith se agrupaba con Aritmética y Conceptos y que había presentado varianza negativa con Razonamiento fluido– registró coeficientes altos y significativos en este dominio (β = .70). Construcción con Cubos: razonamiento perceptivo, específicamente, procesamiento visual. Completamiento de Figuras: razonamiento perceptivo y, secundariamente, procesamiento visual. Conceptos y Matrices: razonamiento perceptivo, particularmente, el razonamiento fluido. Retención de Dígitos, Letras y Números: memoria operativa y de corto plazo. Aritmética: memoria operativa y de corto plazo y, secundariamente, la habilidad cristalizada. Clave y Animales: velocidad de procesamiento. Búsqueda de Símbolos: velocidad de procesamiento y, secundariamente, procesamiento visual. ¿Qué evalúan los subtests de la adaptación Buenos Aires del WISC-IV? Discusión y Conclusiones Como se indicó, tanto el modelo de puntuaciones compuestas del WISC-IV como el modelo CHC de Chen et al.(2009) reflejaron buenos o muy buenos índices de ajuste a los supuestos teóricos establecidos a priori. En consecuencia ambos proveen inferencias teóricas válidas acerca de la estructura interna del WISC-IV. Dado que ello tiene importancia a la hora de interpretar el test, a continuación se describen cuáles son los procesos involucrados en la resolución de las tareas de los subtests del WSC-IV a fin que el profesional disponga de una guía basada en el estudio de los dos modelos alternativos de inteligencia en la muestra de tipificación de Buenos Aires. Semejanzas: En virtud del análisis de los modelos WISC-IV y CHC, puede considerarse que este subtest mide, primariamente, la comprensión verbal y la inteligencia cristalizada y, secundariamente, el razonamiento fluido. Vocabulario, Comprensión, Información y Adivinanzas: comprensión verbal, inteligencia cristalizada. Los resultados a los que se arribó en este estudio permiten decir que tanto la estructura de puntuaciones compuestas propuesta por los autores del WISC-IV como el modelo alternativo CHC resultan igualmente significativos para interpretar las puntuaciones del test y que las inferencias son aplicables a todas las edades consideradas –6 a 16 años–. En este sentido, el estudio factorial confirmatorio realizado en Buenos Aires replica los hallazgos del estudio original en cuanto a la consistencia del modelo de cuatro factores en distintos grupos de edad (Wechsler, 2003), coincide con el llevado a cabo en Taiwan (Chen et al., 2009) en el que tanto el modelo propuesto en el WISC-IV y el basado en la teoría CHC presentan ajustes satisfactorios y difiere del estudio de Keith et al. (2006), que sostiene que otro modelo inspirado en la CHC es más sustantivo que el de cuatro factores para la interpretación del WISC-IV. En particular, los resultados de nuestro estudio revelan que los subtests Aritmética, 193 Ciencias Psicológicas 2013; VII (2): 183 - 197 Matrices, Completamiento de figuras y Búsqueda de símbolos presentan cargas factoriales compartidas en ambos modelos. Aritmética puede considerarse primariamente como una medida de memoria operativa tal como postula el modelo WISC-IV pero también de habilidad cristalizada. Matrices, refleja primariamente el razonamiento perceptivo y el razonamiento fluido mientras que Búsqueda de símbolos y Completamiento de figuras expresan la habilidad en tareas de procesamiento visual. De este modo, los resultados de este estudio avalan la idea de una visión integrativa entre los modelos WISC-IV y CHC para la interpretación de las puntuaciones del test. Además los resultados sugieren que el razonamiento fluido es, al igual que los cuatro dominios propuestos en el WISC-IV, una excelente medida de g en tanto que el factor de Velocidad de Procesamiento es el que menos contribuye a su explicación. Entre los subtests, Semejanzas, Vocabulario, Construcción con cubos, Conceptos, Aritmética, Matrices, Letras y Números y Retención de dígitos representan una porción importante de la varianza explicada y, en ambos modelos, Animales es el de menor peso explicativo. Así como se han encontrado estas coincidencias sustanciales con las investigaciones de la versión original del WISC-IV (Wechsler, 2003) y con el estudio de Taiwan (Chen et al., 2009), también se hallaron discrepancias con otros. En especial, algunos resultados son claramente diferentes de los informados por Keith et al. (2006) para la muestra norteamericana. El desmembramiento de la medida de Razonamiento perceptivo en los factores de Procesamiento visual y de Razonamiento fluido propugnado por Keith en su modelo ajusta satisfactoriamente en la población infantil de EE.UU pero no en la muestra de Buenos Aires ni en la de Taiwan. Si bien se observó en los dos estudios que Construcción con cubos y Completamiento de figuras cargan sobre Procesamiento visual y Matrices y Conceptos sobre Razonamiento fluido no obstante, las puntuaciones obtenidas por los niños revelan una correlación más importante y significativa entre ambos que la observada en el país de origen. Tomando un argumento de Chen et al. (2009) podría conjeturarse que cuando a los niños se les presenta un estímulo visual, podría activarse casi automáticamente la pizarra viso-espacial del sistema de memoria operativa (Baddeley, 2003) y poner en marcha 194 así los procesos del razonamiento fluido. De esta manera, tanto la interpretación basada en el modelo WISC-IV –razonamiento perceptivocomo el modelo alternativo CHC de Buenos Aires y Taiwan –que propone la consideración de dos factores relacionados- son igualmente sustantivos para el análisis de las puntuaciones. Otra discrepancia de interés es la encontrada respecto de Completamiento de figuras (CF). Keith et al. (2006) reportaron cargas cruzadas de este subtest en Procesamiento visual ( .42) y en Habilidad cristalizada ( .31) mientras que, en nuestro estudio, las cargas fueron importantes para el primero ( .61) y no significativas para la segunda. Como se indicó, en EE.UU. los valores son cercanos y moderados en cambio, en las muestras de Buenos Aires y de Taiwan, la carga principal recae sobre el procesamiento visual pero no sobre la inteligencia cristalizada. Como recordará el lector, en CF el entrevistado tiene que decir que parte le falta a un dibujo que se presenta en láminas de colores por lo que la tarea propuesta requiere de concentración, memoria, análisis y síntesis visuales y conocimiento visual adquirido. En este sentido, la tarea se comparece con la definición de McGrew (2009) acerca del procesamiento visual como la “habilidad para generar, almacenar, recuperar y transformar sensaciones e imágenes visuales” más que con una asociación con la inteligencia cristalizada como indicaba el estudio de Keith et al. (2006). Además, el hecho que la carga fuera nítida coadyuva a considerar que CF es una tarea definida de procesamiento visual noverbal. Por lo tanto, los resultados de Buenos Aires y Taiwan en cuanto a la pregnancia del procesamiento visual en CF son teóricamente consistentes y pueden contribuir a la comprensión de los procesos psicológicos implicados en este subtest. De acuerdo con el citado estudio de Keith, en el subtest de Aritmética (Ar), los niños norteamericanos puntúan de manera tal que puede considerarse como una medida del razonamiento fluido. Si bien ello coincide en parte con el análisis realizado en nuestro medio, también es verdad que los resultados muestran ciertas diferencias cuando se analiza en forma conjunta la influencia de otros factores. Tanto en la muestra de Buenos Aires como en la de Taiwan, Aritmética mostró cargas compartidas con la Inteligencia cristalizada (.29 y .30, respectivamente) y con la Memoria de corto plazo (.47 y .51, en el mismo orden), por lo que estos WISC-IV puntuaciones compuestas y modelos CHC factores parecen ser más importantes que otros en su explicación. Estas discrepancias respecto de qué evalúa Ar ya se habían identificado en estudios previos con el WISC-III, donde se mostró que este subtest evaluaba razonamiento fluido pero también inteligencia cristalizada y memoria de corto plazo (Keith & Witta, 1997). Además, como señalan Keith et al. (2006) en las limitaciones de su estudio, el hecho de no haber contado con medidas específicas de razonamiento numérico (RN) pudo haber distorsionado los resultados ya que la evidencia previa ha mostrado que cuando se incluyen medidas de RN –por ejemplo, rendimiento en matemáticas- Aritmética carga en razonamiento numérico pero no en fluido. Keith et al. (2006) indican que diversas condiciones pueden afectar el rendimiento en este subtest, tales como los programas escolares de matemáticas o el nivel de sofisticación para la resolución de problemas. Hay que recordar que la inteligencia cristalizada se relaciona significativamente con el conocimiento adquirido en el sistema escolar en tanto que el razonamiento fluido implica manipular abstracciones, reglas, generalizaciones y relaciones lógicas. Según estos datos, los mecanismos y procesos que subyacen a este subtest podrían ser diferentes para los niños de EE.UU. y de las muestras de Buenos Aires y de Taiwan. Así, las puntuaciones en Aritmética en esta investigación parecen depender más de los conocimientos adquiridos y el entrenamiento previo que de la aplicación de leyes lógicas. ¿Qué representan estos datos? ¿qué la resolución de estos problemas se relaciona con conocer los procedimientos específicos que se aprenden en la escuela, con la comprensión verbal y con el procesamiento auditivo de los enunciados más que con procesos de deducción o inducción lógicas? Sea cual fuere la respuesta, lo interesante es que en culturas tan distintas como la argentina y taiwanesa se encontraron similitudes en la estructura factorial del WISC-IV que difieren en algunos puntos importantes con la hallada en el estudio norteamericano. Si bien los análisis factoriales son de importancia para clarificar la naturaleza de los constructos que se pretenden evaluar no hay que perder de vista, tal como indican Prifitera, Weiss, Saklofske y Rohlfus (2005), que el análisis factorial es solo una herramienta para conocer cuál es la mejor manera de interpretar las relaciones entre los subtests y que, cuando se seleccio- nan o eligen ciertos factores, ello debería estar orientado por su potencial utilidad clínica y no por un modo mecanizado de interpretar el test. Por ejemplo, cuando el rendimiento de un niño en las pruebas de razonamiento perceptivo sea errático o inconsistente, el profesional debería revisar las puntuaciones considerando su consistencia con los dominios de razonamiento fluido o de procesamiento visual. En términos globales, los resultados reseñados en este artículo proveen información sólida para comprender la estructura interna del WISC-IV y su relación con los procesos cognitivos en distintas culturas. Si bien en este trabajo se analizó una muestra amplia y representativa de niños residentes en el Área Metropolitana de Buenos Aires –cuya población representa el 32% de la población argentina–, no obstante se considera como una limitación el que no abarque las otras regiones del país. Asimismo, otra limitación es que este estudio se focalizó en las habilidades del estrato general y amplio indicadas por la CHC pero no exploró las habilidades limitadas o próximas. Como conclusión puede señalarse que tanto la estructura de cuatro factores propuesta por los autores del WISC-IV (Wechsler, 2003) como el modelo alternativo basado en la teoría CHC son enfoques sustantivos para realizar la interpretación del WISC-IV en nuestro medio. Además, los resultados de este estudio coadyuvan a la comprensión de cuáles son los constructos principales que evalúa el WISC-IV y qué particularidades y diferencias se encontraron respecto de los estudios de origen. En consonancia con ello, al realizar la interpretación de las puntuaciones del WISC-IV, es importante notar no solo las similitudes sino también las discrepancias respecto de las habilidades cognitivas subyacentes en distintas culturas. Referencias Arbuckle, J. L. (2009). Amos 18 User’s Guide. Chicago, IL.: SPSS Inc. Arias, B. (2008). Desarrollo de un ejemplo de análisis factorial confirmatorio. Seminario de actualización en investigación sobre discapacidad SAID 2008. Recuperado de http://www.benitoarias.com/articulos/ afc.pdf Baddeley, A. (2003). Working Memory: Looking back and looking forward. Nature Reviews Neurosciencie, 4, 829-839. Bentler. P.M., & Bonett, D.G. (1980). Significance tests and goodness-of-fit in the analysis of covariance structures. Psychological Bulletin, 88, 588-606. 195 Ciencias Psicológicas 2013; VII (2): 183 - 197 Blaha, J., & Wallbrown, F. H. (1996). Hierarchical factor structure of theWechsler intelligence scale for children-III. Psychological Assessment, 8, 214-218. Carroll, J. B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge, England: Cambridge University Press. Carroll, J. B. (1997). The three-stratum theory of cognitive abilities. En D. P. Flanagan, J. L. Genshaft & P. L. Harrison (Eds.), Contemporary intellectual assessment: Theories, tests, and issues (pp. 122130). Nueva York: Guilford Press. Cattell, R. B. (1941). Some theoretical issues in adult intelligence testing. Psychological Bulletin, 38, 592. Cattell, R.B. (1957). Culture fair intelligence test, a measure of “g”: Scale 3, forms A and B (high school pupils and adults of superior intelligence). Savoy, IL: Institute for Personality and Ability Testing Chen, H.Y., Keith, T.Z., Chen, Y.H., & Chang, B.S. (2009). What does tne WISC-IV measure? Validation of the Scoring and CHC.based Interpretative Approaches. Journal of research in Education Sciencies, 54 (3), 85-108. Cohen, R.J., y Swerdlik, M.E. (2000): Pruebas y Evaluación Psicológicas. México: McGraw Hill Gustafsson J. E., & Undheim J. O. (1996). Individual differences in cognitive functions. En D. C. Berliner & R. C. Calfee (Eds.), Handbook of educational psychology (pp. 186-242), Nueva York: MacMillan. Horn, J. L. (1985). Remodeling old models of intelligence. En B. B.Wolman (Ed.), Handbook of intelligence: Theories, measurement, and applications (pp. 267300). Nueva York: Wiley. Horn, J. L. (1988). Thinking about human intelligence. En J. R. Nesselroad & R. B. Cattell (Eds.), Handbook of multivariate experimental psychology (pp. 645685). New York: Plenum Press. Horn, J. L. (1991). Measurement of intellectual capabilities: A review of theory. En K. S. McGrew, J. K. Werder & R. W. Woodcock (Eds.), Woodcock-Johnson technical manual (pp. 197-232). Itasca, IL: Riverside. Horn, J. L. & Noll, J. (1997). Human cognitive capabilities: Gf-Gc theory. En D. P. Flanagan, J. L. Genshaft & P. L. Harrison (Eds.), Contemporary intellectual assessment: Theories, tests, and issues (pp. 53-91), Nueva York: Guilford Press. Instituto Nacional de Estadísticas y Censos. (2001). Censo nacional de población, hogares y vivienda 2001 Buenos Aires: Autor. Instituto Nacional de Estadísticas y Censos. (2004). Situación educacional de la población de Argentina según el Censo 2001. Revista informativa del censo 2001. Número 1. Jensen, A. R. (1998). The g factor: The science of mental ability. Westport, CT: Praeger Publishers. Jöreskog, K. G., & Sörbom, D. (1993). LISREL 8 User’s Reference Guide. Chicago: Scientific Software International. Keith, T. Z. (1990). Confirmatory and hierarchical confirmatory analysis of the differential ability scales. Journal of Psychoeducational Assessment, 8(3), 391-405. Keith, T.Z., Fine, J.G., Taub, G., Reynolds, M.R., & Kranzler, J.H. (2006). Higher Order, Multisample, Confirmatory Factor Analysis of the Weschler Intelligence Scale for Children-Fourth Edition: What does It Measure? School Psychology Review, 35 (1), 108-127. 196 Keith, T. Z., & Witta, E. L. (1997). Hierarchical and crossage confirmatory factor analysis of the WISC-III: What does it measure? School Psychology Quarterly, 12, 89-107. Marín.G. (1986). Metodología de la Investigación Psicológica. Acta Psiquiátrica y Psicológica de América Latina, 32, 3-5. Martínez Arias, R. (1996) Psicometría: Teoría de los Tests Psicológicos y Educativos. Madrid: Síntesis McGrew, K., & Flanagan, D. (1998). The intelligence test desk reference (ITDR): The Gf-Gc cross-batery assessment. Boston: Allyn & Bacon. McGrew, K. S. (2009). CHC theory and the human cognitive abilities project: standing on the shoulders of the giants of psychometric intelligence research. Intelligence, a Multidisciplinary Journal, 37, 1-10. Prifitera, A., Weiss, L.G., Saklofske, D.H., & Rolfhus, E. (2005). The WISC-IV in the clinical assessment text. En A. Prifitera, D.H. Saklofske & L.G. Weisss (Eds.), WISC-IV clinical use and interpretation: Scientistpractitioner perspectives (pp. 3-32). San Diego, CA: Academic Press. Roid, G. H. (2003). Stanford-Binet Intelligence Scales, Fifth Edition (SB:V). Itasca, IL: Riverside Publishing. Ruiz, M. A., Pardo, A. y San Martín, R. (2010). Modelos de ecuaciones estructurales. Papeles del psicólogo, 31(1),34-45. Sattler, J. M. (2001). Assessment of children: Cognitive applications (4ª ed.). San Diego, CA: Author. Schneider, W. J., & McGrew, K. (2012) The CattellHorn-Carroll model of intelligence. En D. Flanagan & P. Harrison (Eds.), Contemporary Intellectual Assessment: Theories, Tests, and Issues (3a ed.). (pp. 99-144) New York: Guilford. Spearman, C. (1904). The Proof and Measurement of Association between two things. American Journal of Psychology, II, 72-73. Spearman, C. (1927). The Nature of Intelligence and the Principles of Cognition. New York: MacMillan. Stahl, D. (2010). Introduction to Path Analysis and Structural Equation Modelling with AMOS Biostatistics and Computing. Recuperado de http:// www.kcl.ac.uk/iop/depts/biostatistics/teaching/ previouslecturenotes/amos/amosweek2.pdf Tabachnick, B.G., & Fidell, L.S. (2001). Using Multivariate Statistics, Fourth Edition. Needham Heights, MA: Allyn & Bacon. Taborda, A.R., Brenlla, M.E., & Barbenza, C. (2011). Adaptación argentina de la Escala de Inteligencia de Wechsler para Niños IV (WISC-IV) En D. Wechsler (Ed.), Escala de Inteligencia de Wechsler para Niños IV (WISC-IV) (pp.37-55). Buenos Aires: Paidós. Tanaka, J.S. (1993). Multifaceted conceptions of fit in structural equation models. En K.A. Bollen & J.S. Long (Eds.), Testing structural equation models. (pp. 10-39) Newbury Park, CA: Sage. The Structural Equation Modeling Discussion Network (2010). The Structural Equation Modeling Discussion Network Archives. Disponible en http:// www2.gsu.edu/~mkteer/semnet.html. Triandis, H. C., Lambert, W. W., Berry, J. W., Brislin, R. W., Draguns, J., Lonner, W., & Heron, A. (1980). Handbook of cross-cultural psychology (6 vol.). Boston, MA: Allyn & Bacon. WISC-IV puntuaciones compuestas y modelos CHC Wechsler, D. (1939). The Measurement of Adult Intelligence. Baltimore, MD: Williams & Wilkins. Wechsler, D. (1991). Wechsler intelligence scale for children-third edition. San Antonio, TX: The Psychological Corporation. Wechsler, D. (2003). Wechsler intelligence scale for children-fourth edition. San Antonio, TX: The Psychological Corporation. Wechsler, D. (2004).Wechsler Scale of Intelligence, Fourth ed. London: Pearson Assessment Wechsler, D. (2005). Escala de Inteligencia Wechsler para Niños IV. (WISC-IV). Madrid: TEA. Wechsler, D. (2011). Escala de Inteligencia de Wechsler para Niños IV (WISC-V). Buenos Aires: Paidós. Woodcock, R. W., McGrew, K. S., & Mather, N. (2001). Woodcock-Johnson III Test. Riverside Publishing Company. Itasca, IL. Terry L. Blackwell. Para citar este artículo: Brenlla, M.E. (2013). Interpretación del WISC-IV. Puntuaciones compuestas y Modelos CHC. Ciencias Psicológicas VII (2): 183 - 197. Recibido: 12/2012 Revisado: 06/2013 Aceptado: 08/2013 197