ESTAD^STICA ESPAÑOLA Núm. 99, 1983, págs. 33 a 59 Aspectos teóricos y una aplicación práctica del análisis factorial de correspondencias por M. ^UCIA NAVARRO GOMEZ Facultad de Ciencias Económicas Universidad de Málaga RESUMEN EI análisis de correspondencias, desarrollado por Benzecri ', se encuadra en el marco de la estadística descriptiva multidimensional. lnspirado, como el análisis de componentes principales, en los principios del análisis factorial cldsico, fundado por Spearman y Thurstone, tiene por objeto extraer los principales factores de un gran conjunto de datos de difícil percepción inmediata, evitando, al mismo tiempo, la forrnulación de cualquier modelo causal que condicionaría la interpretació^ n de los resultados, EI análisis de correspondencias se distingue, sin embargo, del método de las componentes principales, dado que la conversión .ie los datos brutos en frecuencias relativas permite tratar en general informaciones de naturaleza cualitativa, al mismo tiempo que datos cuantitativos expresados en unidades de medida diferentes. De manera m^is precisa, el análisis de correspondencias resume la información contenida en una tabla de contingencia referida a dos conjuntos de grandes dimensiones, teniendo en cuenta el carácter probabilístico de los datos para remediar su heterogeneidad. ' Benzecri, J. P., y otros: L'rlnulyse ^ies cionnées. Dunod. París, 1973. Tomo 2: L'unulyse cies correspondences. ^-:s^rAnisT^r,A ES!^AÑt)l.A Después de trans#ormar los elementos de la tabla, el análisis de correspc^ndencias permite dar una visián fácilmente perceptible de dos nubes de puntos, al proyectar éstos sobre un subespacio de pocas dimensiones (generalmenie dos), cie forma que se conserve una parte importante de la informacián iniciatmente canstituida. Se trata entances de dar un significado coherente a los ejes sobre tos cuales se han proyectado !os puntos, apoyándose para ello en ciertas ayudas de interpretación que proporciona el método. E1 objeto de este artícuto es presentar los fundamentos teóricos ciel análisis de correspondencias y dar un ejemplo de aplicacián que haga referencia a las interacciones que se ejercen entre los sistemas educativos y econtímicos de un cierio número de paíse^ de la OCD^ E, en 1970 2. Pulahras c•lc^^^e: Anáiisis factoriai de correspondencias, aplicacián del métocio al estudio de interacciones, sistema educativo-económico cie los países de la OCDE. 1. .l. METODO DEL ANALISIS FACTORiAL DE CORRESPONDENCIAS LOS PR[NCIPIOS DEL ANÁL[SIS Sea X la matriz de datos compuesta de n fiias (representativas def conjunto 1 de las observaciones} y rn columnas (relativas al conjunto J de las variables). Para poner un ejemplo, consideremos la población de n municipios de una región, relacionada con sus m mejores categor^as profesionales. En el espacio de las categorías profesionales (1RM) tendremos n puntos-municipios, cada uno de ellos con m componentes. Así, en [a matriz X, el eiemento x;^ representa el número de individuos que habitan en el municipio i, que pertenecen a la categoña profesional j. A nosotros no nos interesan los efectivos brutos, sino los efectivos relativos de las categorías con relación a la población, ya que es evidente que en los pequeños municipios las componentes serún pequeñas y no podrán compararse con las de la.s gr~andes ciudades. El interés se centra así en definir las propQrciones de cada una de las categorías profesionales en cada municipio, con el fin de resaltar su estructura socioprofesional y poder realizar comparaciones entre ellos. 2 Esta aplicación está basada en un trabajo del autor titulado. L'Pnvirnnnement écon^rn^que de !'education dan.r quelques ^ays de l' U^DE, c^le 1965 a 1976, real izado a pet ic ión de la OCDE. ASF'l^CTOti T^^:ORICY)s Y I^NA AF'I.ICAC'fON F'RAC:. D^1. ANAL_ISIS t-AC'TC)RIAL f3^: CURRESNON. Sean xi, f• - Xij j^l el efectivo de poblacicán de la ciudad i, n x, j = ^ xij el efectivo de la categoña j para todos los municipios, m X ^ ^ - L L -xi^ j=1 i^ ^ el efectivo total de la poblacián considerada. De estas fármulas podemos deducir las frecuencias relativas siguientes, que son estimaciones de probabilidades X ij ^ ij X la probabilidad asociada al término x^, ij la probabilidad marginal que indica la importancia del municipio ^ en ia región, n ^ ^ ,, ` , ,^ ij i= I la probabilidad marginal que indica la imp^ortancia de la categoría j en la regián. Podemc)s entonces construir, en el espacio IRm, la nuhe de n puntos L; definidas asi L ^ ^i 1 ^^i2 .. , i , ., ^i. ^^i. pim pi. F.tiTAi)IS T!('A ^:SI'AA^()I.A c^ lu que e^ I^^ mism^.^ '^0 1 , _X^. "xt2 '^ int Xi. .^ ; . Los n puntos tienen ^n coordenadas y están ponderados por la probabil idad p; . Matemáticamente, para cada punto L, tenemos la relación que es la ecuación de un hiperplano de (m - 1) dimensiones, sobre ei que están situados todos los puntos L^ ;. E1 c^bjetivu del an^^lisis es proyectar la nube de puntos sobre un plano de pocas dimensiones, de manera que la nube proyectada deforme lo menos posible la realidad. ^J dicho de o.tro rnodo, que la proyección refleje lo más fielmente posible las proximidacies entre los n individuos, en relación con las m variables, EI análisis factorial de correspondencias traduce similitudes de comportamientos entre dos individuos i e i` del conjunto [, cuando las proyecciones de esos dos puntos están próximas en el subespacio vectorial, lo que se mide mediante la distancia siguiente `^ ^ c^` { L; , L^ ) = ^i ^- ^^ ^i [1] ^•l pi. ^ Lo mismo puede hacerse para el conjunto J, obteniéndose una nube de m puntus C^ C^ _ p U , ^ ^i , ^,j !^. ^ i^ , j ponderados por ^.^, en el espacio de n dimensiones IR". También aquí se cumple la relación i= `' La proximidad de dos puntos significa que la estructura de las filas que ellos representan son parecidas. En nuestru ejemplo se trataría de 1a estructura socioprofesional de dos municipios. La distancia que las repre^enta será tanto más pequeña cuanto las componentes de L; y L.^, estén m^s prúximds para tudos lus valores de j. F'RAC:. DEI. ANAl.ltilti I AC"T()RIAI, [)í- C`()RREtiE'()N As!'EC'TC)s TE.()RICUS Y t IVA AF}i_.ICACI<)N ^% Esta expresic^n se distribuye como t^na ^r` con !n -! 1 C»r - 11 gr^^d^^s de lihert^^d `. 1 EI término n es un tactor ^ie ponderacicín que se intruci^ic.^e par^i atenuar pc^sibleti va.^ lores elevados de cierta^ variables. Esta distancia tiene la importante propiedad de verificar el principio de «equivalencia distribucional». Esto significa que si se reúnen dos puntos L^ y L2, de estructuras similares, en un solo punto Lr,, al cual se le asigna la suma de las poncieraciones de L, y L^, entonces las distancias entre todas las demás parejas de puntos no se modifican; es decir, que no cambia ni el reparto ni las propiedades de la nube. Esta propiedad explica la estabilidad de los resultados obtenidos y su independencia de la arbitrariedad de las nomenclaturas utilizadas. Sin embargo, la distancia elegida no es una suma cie cuadrados y estc) es un inconveniente para poder tratar el problema en el esquema general del anál isis de datos. La dificultad será resuelta realizando un cambio de escala de los ejes. En efecto, en forma matricial, la ciistancia precedente [ 1) puede escribirse de la manera siguiente: I^z { I--i • L ^ .) -- ^^C i j - x í ^^^ ^ (^!. i^ ^^(;,^ > ^ 2^ donde x ij ^ ^ ^i. ^ ^i.Í ^ i ^^ p , i. D= dia,g 1 p 1 1 ^,..., ^ ,....,. ^n ^ ^ ; En efecto, se han estimado n- t parámetros ^i a partir de las observaciones, y el n-ésimo se deduce de los otros, pues De igual forma se han estimado (m - 1) parámetros ^ ^, puesto yue 3K t^.s tAU^sTi(.^A E^^'AN(.)l_A La di^tanciu efegida e^ a^í una t^orm^^ cuadr^ticd ^uya matriz aycx:iadd es U, que ptxlemuti h^^cer unit^ria par normali^.acic^^n cie Ic^^, eje^ ^iel esp^^cio vectoriaf, facilitanclo atii Ic.^s c^lculu^ ufteric^re^. H n etite ca^c^, la^ ^^i ct^ordenacid^ del inciiviciuo i^e cfet^inen ahura pt^r ^ I_; = !'; t p. Í2pi. , j^, 2 ^ ^^ . ..., p.í^ir2pr , ^ 2^pí. Fstas nuevas cuordendcids conciucen el prcablema a de un análisis simple 6. ^ La nube de n puntos L; e^;tá dhor^ en el hiperplano de ecuación 1.?. BÚS{,11,'EDA DE LOS ElES FACT4RIALES ^ 1'royectemos ahc^ra la nube de los n puntos transtormadoS L; ortogonalmente sobre un eje yue pa^e pur el arigen, de furma que las distancias entre las proyecciunes cie los puntos, meciic^as sc^bre t^5ta recta, respeten lo más posibfe la5 distaneias entre los puntos en el espaciu 1Rm. Sea ^^ el vectur unitario, de dirección_arbitraria, que determina el eje F„ ' . Proyectemuti ^c^bre é l ci^s puntc^^ cualesyuiera. L; y L;^ . L^t magnituct de esta proyecc:ión vale pur definic icín ^` : .. .. .. .. !, !; • = tr' ( L; - 1_; • 1 ^ ` ^ Cuantc^ m^^yur sea Id longitud l; !;, tantu mt^ti cunturtne estará con la ciistanc ia L; L;^ que representa. 1'ur tantu, ^i ^e yuiere que f^^ cietormación de la nube sea minima en la pruyeceicin, habrá que maximiz^ir la5 longitucíes de las proyecciones, para tuda.^ las parejas { i, f' ) cie ubservaciones. Es ciec ir, habrá yue encuntrar u tal que `' ^ ^ fi Se ubscrvará yue la distancia entre los puntos L; y L;• es idéntica a la yue existe entre los puntos L_; y 1_;•. ' Hay ^ n eje^, puestu yrie irabajamos en el e^+paciv IRm . _ ^ I^or ^iet'inicicín, la rnagnitucf del 4egmentu t^;•, proyección de) vectur (L; - L;,) s^^bre ^u, es el ^ ` prucluctv escal^ir ^iel vectc^r ( L; -- L;, ) por e! vec:tur t^ ^ ^ ^^ ^ ^ 1; I;^ = L; L, , tT -- t^ ^ i L_; _._ 1.; ,) `' Según el tec^rema ^c Pitát;uras, e! euadra^u cie la ciistancia al urigen de un punto cie la nube se eiescumponP en el cua^iraciu cie su pruyección subre t^^,, y en el cuacira^iu de su distancia (urt^^gunal) u E^„ . E'ur lu yue cia igudl hacer mínirrta la diytanci^a al eje o máxima la proyecc ión subre zi. ASPECTOS TEORICOS Y UNA APL1CACtON PRAC. DEL ANALISiS FACTORIAL DE CORRESPON. 39 ..r ^ ^ 1; Í; . 2 = ^ ^ tr' ^ L; ^ ;^ , , sea máximo, bajo la restricción 10 rr "rr = 1 Z ^- Pero L ^ u' ( L; - L;^ ) _ ^ ^ rr' ( L; - L;, > ( L; - L;, )' u ;;^^ ;, ^ = u' ^ ^ ( L; -- L;. ) ( L^ - L;, )' u ^ , La expresión entre corchetes representa una determinada matriz W, por lo que maximizar ^ ^ l^^ es lo mismo que maximizar cr'Wcr, bajo la restricción u'u = 1. ^ , La matriz simétrica W, de orden (m, m), es la matriz de variancias y covariancias 1 cie la nube de puntos L;, cuyo término p uz ^ ^ ^^ P;. )_ indica la variancia que caracteriza la dispersión de la nube sobre un eje cualquiera j", n ^, _ .^ p ^ r r= t ^ ^ v _ p 1/2 ^^.^ ^ !^ r ^ U2 P. k f ^ik ^ r. _ p U2 k representa la covariancia. E1 términu w jk puede ponerse también en la forma siguiente: ^ _^ h;j- p^: p ^ ,,`, jk ^ph p f )1!2 l^' P;k _ p^• ^^ • k_ ^p^ p k)V2 Si hacemos pii - p^,p :i r^ - -)u2 (Pr p^ "' Puesto que u es unitario. " Se llama variabilidad tc^tal de la nube de puntos L; , sobre las m ejes factoriales, a K^ j= es decir, a la traLa de la matriz W. y 4a E tiTAUIS^T K^A ^ 5NA1'^()l..,A paría J = ^ , . , . . ^t ; ./ E:ste términu es el elementu genéricu de una matriz R de orden (n. ^rr ), tal que [ 3) = R' R ^ Aparece así que la variabilicfad de la nube de puntos L; , dada por 1a traza de la matriz W'^, no es mds que 1a diferencia entre las frecuencias observadas n^ y las probabilictades ^^ ; .^,^ ; esta canticíad se distribuye como una ^2 con (n -- l)( ^n - l) grados de libertad, bajo la hipótesis de independencia de las ^las y columnas de la tabla de contingencia, tal y como vimos anteriormente. Nuestrca prablema es ahora encontrar el vector unitario rr que maximice rl`Wr^, o, según [ 3^ , rr' R' Rer , bajo la condic ión c^' u= 1, esta maximizac ión va a determinar un primer vector propio, asuciado a un primer valor propia de la matriz W". Utilizando el método de los multiplicadores de Lagrange, la t'unción a maximizar se escribe c^ = u` W t^ - r. ^( rl' rl -- 1) Derivando cun respecto a ri e igualandu a cero, queda W rl = ^. ,tl Aparece entonces tl como un vector propio de la matriz W. Además rr' Wti = rl'^. ^rl = r^ rrr'rl = r., Asi, cuando !a torma cuadrática «' Wrl es máxima, tiene por valor r^, , que es un valor propio de la matriz W, relativa al vector característico rr. Cuandu existen varios valures propios, como r^ ' Wt^ debe ser máximo, r. ^ tiene que ser el mayor valor propiu de W. E1 vector r^ determina e1 primer eje tactorial F„ , que correspunde al primer t^actor, ^ subre e I c u a1 se proyec ta n 1 os pu ntus L; . Se trata ahora de ajustar la nube por un plano, con este fin deberemos determinar un segundo eje f^,., ortogonal con F„ y definido por un vectur unitario ^' '`'. El problema es, pues, maximizar ^ ^' W ^ ^ bajo las restricciunes !1' 1' _ ^ y 1'' 1' = (^ '^ Ver nota 11 de la página precedente. " Los valores prapius de la matri2 W son iciénticos a los de R' R. 'a La artogonalidad de los ejes implica que ir' ^ r = 0. Como el vectur ^ ^ es unitario, satis#^ace por det^inición ta condición ^^`^^ = l. ASf'E:CT()S TE()RfC()s Y UNA AI'LIC'AC'I()N NRAC. L7Fl, ANAI_IS15 F AC'.iUFtIAI. DF-: C()RRE-:tiF^()N. For un proceso análogo al evcxado precedentemente, se demuestra que ^^ es el vector propio relativo al valor propio ^.^ de la rnatriz W. La t«rma cuadrática ^^' W^^ toma el valor máximo i.^ para ese vector; r' _i es, por consecuencia, el seguncio mayor valor propio de W. La demostración se generaliza buseando los demás vectores caracteristicos de la matriz W, que definen los ejes factoriales sucesivos. La determinación de estos ejes implica la diagonalización de la matriz simétrica W. Sea n la matriz de los valores propios de W, tal que W ! A' n A co n n - d iag (%^ , , ^. 2 , . . . , 1. ^, ) y 'r. ^ > ^. 2 > . . . > i^. ,^ . Según las reglas elementales del cálculo matricial, tenemos traza W = traza ^ = j= 1 Como los valores numéricos de ^^ son decrecientes, la suma de los primeros valores propios representan una fracción importante de la traza; asi, en la práctica, basta con elegir los primeros de estos valores para obtener una representación satisfactoria de ld información original. E1 poder explicativo de un eje factorial viene dado por fa relación entre el valor propio correspondiente al factor propio que determina el eje y la suma de todos los valores propios. Así, por ejemplo, para el primer eje factoríal Fu será r^ ^ tr W Los ejes factoriales tienen así la propiedad de extraer progresivamente la mayor inforrnación posible relativa a las proximidades enire los puntos. Una vez obtenidos los ejes factoriales, se deducen de ellas las coordenadas de los n puntos L; . Si, por ejernplo, se irata del eje F^, , estas coordenadas son iguales a ^ ,^; - L^ F„ 1 ,^/ ^. donde 1 _ es un factor de dilatación. ✓ r^ az F:sTADi:^Ti('.4 #^til'AN()t..A Es importante señalar que el a^nálisis cie currespc^ndencias se efectúa en el centro de gravedad de la nube de puntus; por esta razón, cunviene prescindir c1e1 primer eje t^actorial, puesi^^ que pur definición, éste une el urígen con el centro de gravedad de la nuhe ' ^. Yur c^lculos sirnétricos es posible trabajar en el espacio 1R" y estudiar, en este caso, las proxitnidades de 1©s m puntos. Existen relaociones entre los f^actores de !R" y fRm. En efecto, Ids coordenadas de los puntos sobre un eje factorial de IR^ son proporcionales a las componentes de los factores en 1R" , que ccarresp^onden a los mismos valores propios. E,^ pusible así representar sc^ ^bre e{ mismo gráfico, en el plano de los dus primeros ejes f`actoriales (correspondientes a valores cie t. ^ i), las proximitiades entre los elementc^s del conjuntu I y los de! conjunto J. Esta simultaneidaci oe representación es la que sugiere el signiticado de los ejes factoriales. Yard facilitar esta tared .^e recurre a ciertas ayuda.s de interpretación que pruporciona al análisis. 1.^. LAS AYUDAS DE 1NTERPRETAC1t5N Es cc^mún consicierar tres ayudas para la interpretación: las contribuciones a la formac i+^n del factor; Las proyecciones sobre e1 factor; las correlaciones con los factores. a} Lus c^^r^rttrrhr^c•ic^nes u la .Jc^rmaci^^rr r^Pl fac^tc^r 16 (C:'TR) Son las que indican la parte que tuma cada variable en la variancia explicada par un t'dc tor . En todu análisis es necesario extraer del eonjunto de fas cuntribuciones a la formación cie un eje, aquellas que presentan Ic^s valores más elevados. Una clasificación de las diterentes contribuciones en urden decreciente permitir^ después elegir lds variables más pertinentes ba Lus prcr_yYC-c•i^^nes sohre P^ ^júctc^r ( i F} Es importante examinar tas cc^ordenadas de lcas punt:^s sobre el eje factorial, buscando las c^pc^4íciones. Si este contraste existe, él va a#'acilitar muchu la interpretación del 14 EI valor prapio c©rrespondienteal primer eje táctorial es igual a l; los utros valures propios son naturalmente inferiores a l. `6 En !d literatura estadística se encuentra también !a expresión de contribuciones absalutas para designar estas ayudas de interpretación. ASr'FCTOS T^:(^Rr(Y)4 Y l NA AF'[.ICAC'ION r'RA('. UEI. ANAI^fSlS r.aC`^^OftlAt. I)F ('f)RRESI^)N. 43 factor, puesto que entonces puede definirse el factor p+^^r la opoticic^n de dos caracteres. Sin embargo, hay que ser prudentes en el an^ili^is de las prc^yecc^ones, pues ^i bien, para una variable dada, a un valor mayor de su ccx)rdenada, rnayor es su contribución a la formación del factor, eso no impide que pueda suceder que cie dos variables sea aquella cuya coordenada es más pequeña la que tenga una contribución mayor. c) Las correlucir^rres con los factvres "(COR} Este tercer tipo de ayuda a la interpretación traduce la relación existente entre la variable y el tactor, indicando la contribución de éste en la inercia del punto. Si se busca determinar un sentido de causalidad en esta relación, hahrá que comparar la serie de las correlaciones con la de las contribuciones. Pero como una fuerte contribución no implica una correlación elevada, esto hace que la utilización de las correlaciones sea delicada y se hace necesario el análisis de todos los elementos (contribuciones, proyecciones y correlaciones) para poder dar una interpretación correcta y precisa a los factores. 2. APL1CACtON PRACTICA Vamos a utilizar el análisis factorial de correspondencias para examinar las interacciones ejercidas entre los sistemas educativos y económicos, en el año 1970, de los países siguientes: Canadá, Finlandia, Francia, Alemanía, Suecia y Estados Unidos. 2.1. LAS VARIABLES ELEGIDAS C.os datos de referencia han sido extraídos de los «Annua^res Statistiques de 1'Enseignement», de las «Statistiques de la Population Active», y ue las «Comptes Nationaux des Pays de i'OCDE», publicados regularmente por esta Organización. A partir de estas informaciones de base hemos elaborado !os siguientes indicadores A) Variahles del sistema educati^?o 19, se^ún ni ^ ^e! de enseñanza 2O a) Las tusus hrr^tus dP esct^^uri<acic^n (en abreviatura S). Estas tasas se def'inen, para cada nivel educativo, por el cociente entre el número de alumnos inscritos en ese nivel y la población en edad susceptible de asistir al mismcj. " Se habla de correlaciones con el factor o de contribucior^es relativas. '" Estos indicadores figuran en el Anexo l. '9 P©r razones informativas solamente hemos considerado la enseñanza púhliea. 2O Se trata del nivel de primaria-media, superior y total (compuzsto de los anteriores y de ^a enseñan^a prescolar y especial). 44 ESTA[^I^TICA ESf'AfVt)t_A b) L^^s ^ust^^.t l?cihlic•r^s c1E^ ^ufrcc•ucrc.in r^r^r ulurrtncr fen abreviatura R). Vienen expretiaclc^rs por la relación entre los gastos públicos asignados a cada nivel de enseñanza y el número de alumnos inscritos en el mismo. Solamente se consideran los gastos corriente5 o de funcionamiento, y, para que sean comparables en lo^ diferentes paí:^es, han sido convertidos en moneda constante, primero, y, después, expresados en dólares USA a prec io y tasa de cambio de 1975 21. B> Varial^les dPl sisternu ^c•clncimicn, seki^n ni^^eles de ensFñun?a a) Lus rPlucic^nPS de dependenr•iu dp lc! pr^hlucicán pscolE^r a lu poblucic^n uc•tit^u (en abreviatura U>. lndican la importancia del número de alumnos, en un nivel dado cíe educación, en relación al conjunto de la población activa de cada pdís, puesto que es eila en realidad quien soporta directamente los costes de enseñanza. b) Lu purte clel PIB usixnudu u Ins ni^•^l^s d^ edr.cc•ac•r`ón {en abreviatura P). Este porcentaje, establecido como la relación entre los gastos públicos asignados a la enseñanza y et P!B del país, mide el esfuerzo nacional realizado por la eclucación. c) Las tusus de paro pvr ^rupos de edud {en abreviatura T). Tres tasas de paro han sido construidas: la de la población de quince a diecinueve añas (comparada a la tasa de escolarización de la enseñanza prirnaria-media 22), la de la población de veinte a veinticuatro años (para la superior) y la de quince a veinticuatro años (para la enseñanza total). Estas tasas se han definido como el cociente entre el número de parados de un grupo de edad dado y la población activa total. d) El PIB pc.rr personu (en abreviatura R^ ). lgual que para los gastos públicos de educación, expresado también en dólares USA a precio y tasa de cambio de 1975. 2.2 OPERACIONES PREVIAS AL AN^1LIStS DE CO ^ RRESPC^NDENClAS Como ya se indicó, el análisis de carrespondencias necesita la transformación de la tabla de datos iniciales en una tabia de contingencia que hay que construir. Esta 21 Por razones prácticas, los datos monetarios han sido expresados en dálares USA de 197S. 22 La tasa de quince a diecinueve años deberia confrontarse, teóricamente, a la tasa de escolarización de la enseñanza media, pero como la educación primaria es obligatoria, no hay inconveniente en compararla con la tasa de escolarizacián en la enseñanza primaria-media. A^t'EC"i^OS " TEORIC'C)S Y IaNA AN1_ICACION NRAC'. DEI. ANAI..ISIS F-At"i'ORIAI_ DE: C't)RR^SF^)l^^ 4S subsección tiene por objeto el detallar su elabc^ración y el precisar las nomenclaturas utilizadas en los an^lisis. 2.2.1 Lcr c•vnstrricc•ic^n c1c^ !us tublus cle c•c^nttnKE^nc•iu El análisis de correspondencias exige que todos los datos iratados posean las cualidades de homogeneidad y de exhaustividad; o, dicho de atro modo, que toda.s las magnitudes deben ser cantidades de la misma naturaleza, y que los conjuntos puestos en correspondencia deben representar el inventario completo de toda el domi nio en estudio. Así, para respetar el principio de homogeneidad, las variables originales han sido transformadas en variables ficticias. Para poner un ejemplo, consideremos el caso del PIB por persona, éste varía para e1 conjunto de países considerados de 1.314 a 7.K24 dólares USA 2^, en el año 1970. Teniendo en cuenta la dispersión de este indicador, se han construido tres variables ficticias para cada país: -- una para el caso en el que el PI B por persona del país es pequeño {i nferior a 4.000 dólares USA); - otra, cuando el PIB por persona es mediano (comprendido entre 4.000 y 6.000 dólares USA); - una última, cuando el PIB por persona es elevado (superior a 6.000 dólares USA). De esta manera, como todas las variables se han descompuesto en tres variables ficticias, la tabla inicial de 10 filas (que representan los países o los individuos) y 16 columnas (que representan los indicadores de los sistemas educativos y económicos) se ha reemplazado por una matriz de contingencia de 10 filas y 48 columnas. Los intervalos utilizados para efectuar esta transformación de los datos se han basado generalmente en que las observaciones se distribuyeran equiproporcionalmente alrededor de la media de cada variable. Además, estos intervalos nunca van a estar vacíos. A pesar de todas estas precauciones, tal clasificación de los datos comporta siempre «a priori» cierta parte de arbitrariedad; por eso, a fin de verificar su pertinencia, los mismos análisis de correspondencias se han efectuado utilizando variables ficticias para cuatro modalidades y no sólo para tres 24. 2^ Se trata de dólares USA a precio y tasa de cambio de 1975, 24 La de^nición exacta de la construccián de las variables en 3 y 4 modalidades se da en el Anexo I11. 4fi F^TADISTiC'A FSF'A!V()[_,A 2.2.? Lus uhr^^ ^•iclturus irtili; udu^ Los paises o inciividuos se representan en los planos factoriales, según las siguientes abreviaturas: Canadd = C AN A Finlandia = FINL Fra.neia = FRAN Alemania = GERM J ap+c^n = J A PA Holanda -- NETH - Portugal = PQRT España = SPAI Suecia = SWED Estados Unidos = UNST En cuanto a las variables se represenian por las abreviatur•as ya mencionadas en la sección anterior 2^ completadas por tres índices: i, j, k, que indican, respectivamente, el nivel de enseñanza (o la clase de edad a que se re#iere ese nivel), ef valor que toma la variable eonsiderada y el año de observación del fenómeno. EI índice i es igual a l cuar^do se trata de la enseñanza primaria-media (o de la clase de edad de quince a diecinueve años), a 2 si se trata de la enseñanza superior (o de la ctase de edad de veinte a veinticuatro años) y a 3 en el caso del conjunto de todos los niveles ( o cuando se trata de la c.lase de edad de quince a veinticuatro años) 26. En el caso de la descomposición en tres modalidades, el índice j toma los valores 1, 2 y 3, que corresponden, respectivamente, a un valor pequeño de la variable considerada, a un valor medio y a un valor grande de la variable 2'. EI índice k, que representa el año de observación, vale 0 en nuestro caso, ya que corresponde al año 19^0, que es el año para el que vamos a realizar el an^.lisis. 25 Recordemo ^^ae S designa las tasas brutas de escolarización, D las relaciones de dependencia a la poblaci. ,tiva, R!os gastos públicos educativos por alumno, P la parte del PIB asignada a!a enseñanza, T las tasas de paro por grupos de edad y R, el PI B por persona. ^b En el caso de los gastos públicos por alumno (R), el índice i varía de 2 a 4 según se trate de la enseñanza primaria-mPd^a (2), de la enseñanza superior (3) o del total de los niveles de educación (4 ^ . Z' En el caso de la descomposición en cuatro intervalos, j toma los valores l, 2, 3 y 4; el valor de cada variable así construida crece con el valor del índice j. ASI'ECTO^i T'EORICi)S Y I^NA At'L.ICACK)P^! NRAC. DEt. ANAt_ISI^ F,ACT`ORIAI. Dt=: C()RRESI-'()N. a7 Con esta notación tenemos, por ejemplo, que la variahle 5,,,, designa, para el añ^ 1970, una tasa bruta de escolarización en la enseñanza superior cie un valor medic^ `x. Así, iodas las variables construidas son localizables con e^te códigu de tres ind ices, excepto el P1B por persona, que se designa por Ft,,^k ^y. L©S RESULTADOS DE LOS ANÁLISlS 2.3 EI comportamiento diferenciado de los países en materia de enseñanza pública es aprehendido, de forma transversal, rnediante la aplicacicín del análisis de correspondencias para este año. Se examina así la matriz de datos definida en 1y70, para extraer de ella la situación de los sistemas educativos de los países, en relación a la amplitud de su desarrollo económico. EI gráfico 1 reproduce el primer plano factorial del análisis que relaciona los l0 países considerados y las 33 variables educativas y ecónomicas relativas a los niveles de enseñanza de primaria-media y superior 30. La tabla l muestra las ayudas de interpretación referentes a las observaciones y variables que tiguran en este primer plana factorial. E1 eje horizontal de! gráfico 1 corresponde al primer factor ( F, ) y ex pl ica el 35 por 100 de la variación de la nube de puntos; el eje vertical corresponde al segunda factor ( Fz) y explica el 23 por 100 del fenómeno 31. Los puntos del grá^co son el resultado de tomar las coordenadas cie las 33 variables y de los l0 países sobre ei primero y segundo factores . Con el tin de dar un significado lo más coherente posible de los factores, hemos seleccionado las proyecc:ones de los puntos (observaciones y variables) más significativas sobre el plano factorial. Esta elección se ha efectúado a partir de las ayudas de interpretación (tabla 1) en función de varios criterios: 2" En el Anexo [ 1[, el lector podrá verificar que, para ia descomposic ión en 3 inte rvalos, esta tasa está comprendida entre 10 y 23 por 100. 24 E1 índice ^, que representa habitualmente el nivel de enseñanza, toma el valor 1 en el caso del PIB por pers^na R,,ya que esta variable es naturalmente independiente del nivel educativc). ^0 Estas 33 variables corresponden a fa descomposición de las variables iniciales en tres intervalos. ;' El primer plano factorial toma así e^ cuenta el SK por 100 de la variancia cie fa nube de puntos (cf, tabla 1 >. ESTADtSTiCA E5PAIVOLA ^ ^ o ^- ASNFC.'"TOS ^TEORIC't)S Y t!NA AI'I.ICACION F'R,4C. DE[. A^NAI_ISIS t-AC'Tl)RIAI- [)h: C(>RFtF.S[^)N 49 ^' et d' t^- P- O N et CT Q^+ ^t -- rt ^t ^ r+^ ^ r.. r.d ^ ^ .^. M .... ... ^ ^,p f`^ pçy v'^ N CT Q ^^ t'1 OG N M^O 00 N•-• t^ •^ M^^ LT N d' d` C^Q ^^p ._. ... ^T ^ ^ V^ ...M e*^ JG1^ ^Df^ ^f"^^ ~Mr+'1 ^/')^ti0^^^'M^Q ^1"^^+1OG ^Cix Q^O^M .-^ f^^ ..^ M M M f'r1 G^ Vl M^--^ ^ ^.^. .... ^.^. -- i 1 -- I I I i ^ ^ ^ ^D t^. O M ^t O t ^ v'^ ^ ^ t^- `D ^ d ^ ^ ^t M ^ O^ ^ ['^ N ^ ^7 ^^^MwOCTÑ d`C^^^,,^Q' ^ ^!' N N r^1 ^D M ^ t~+'1 N O^O ti^^ Ñ O^ ^!^T M^ p^ M ONO ^O I ^..: i ^ Q ^ ^ u ^ ^ I ^ Ñ^^Ñ^`DÑ ^ d`M ^ ^OÑf^ ^DN^ ^ 0 ^ ^ ^_ N N ^ M p O^ ^ Ñ^íiTM e'r1 1^ M N V'1 rr1 V1 c'•1 ^ `d" Ñ rf ^ OMO ^/'1 e* ... t'^ `^?` `^ [`. 1``^ N ^ C`- N ^f^^ h ^ .-.. !^ !'^e}^OÑMI^ `^^f'^^ ^ N ^ ^O O^ ^ d' N G4 M^O Q^ N M Q^ ^t K1 f'1 N ^ M ^,-+ ^ ^ ^'" ^ ( ^ ^ (^^ ^ ^ ^ ^ M 01 N_ ^p ^i. w 0 .... ^ ^ ^ 0 LY. ^ a ^c LZ.. ^ ^ I.--: ^ V ^ ^ C^ ^ ^ 0 .... ... ^ ^ ^ ^ ^ -.,. ^ ^ t+1^T^00^N^MN M^OOOQCZG^ Q^N r+1NCTQ^Ot`^ NGT ^.-^ Q^ e+1 ^V N^ N p .-.^ ^.. c^1 N N M ^t`^P^-M^pNNNf`^N^ pq NNNr'r1^1MMNMN M^jN MMN l^ ^-+ 00 !^ N v'1 ^D et Q^ N1©OOMN^1 ^Q^^lM^NON N ^t t11 N e'r1 M M^t M `Q^ M N^ M t'^1 Q^ V M ^! ['^ OO ^ ^T CJ^ O^ ^ ^_ ^p'^ M M w-+ OC ^Q t^- `^ ^e`^ - O L ^ ^M^1^t0000©ÑÑt`^ Q ó et ^ ^i ^ó t^ ^i e^+^ ^-- cz r`, N ^ 4. ^t~1M^ ^ÑÑÑe^^G1Ñe`'rD1Ñ^^tNN^ ^ a 00^©Ñ^O^,OyQO^,OV ^CÑ^00 .-. .-. .-. ^ .--. ^ .-^ ^--^ ^.+ N N N ^y N N N N c^u^v^L^G'^C^a.a.o..cGc^ C^c^c/^v^©C^ L7.^ .^ N t`^ ^ C^ a^. _ 4 ^ 4 W ó > ^^^^^^^^^^^^^^^^^ OrD ^ ^ ^ ^^d'O^MO ^x V^1^ ^p N ^0p0 o^J t^ C^ ^ u^ d' ^.7 ^í^Ñ^^^Ó ^ O c^óc^óóc^óc^ó ^-- ^C O O O O CT N N ..^ .,-. N ^r1 ^ ... N r^ e.T ^1 ^D t^ oo O^ O ^ .. ^ N e+1 ^ V1 ^C ['^ 40 CT O^ N M^f V> >D P^ .... ..., .... .^ ._. ..., .^ ^. E:STA^ DiSi'ICA FS^'AÑOL.A ^t1 t^i^^O^NpQ`^,0^ .^» .^. .^. ... .... ... ... O O Mi v1 +h et ^D C^ N f^^ -- p N.,.,.. ... .... ... ... et E.. .-.. ^ ^, .^., .^., .^. ._. M N N f+1 v'ti •-^ r+ !'`^ f"^, Vy N N CT N Met ^t^^rf^Ñ^^CN^tOGN`^T .... .-^ ri ^^^jN r^, ^t ^ vz ^^ ^r•^P`-[`~^ `^^^^M^^ ^.: ,...: + i ^ i i ^ i ^`1 N^-- O^r ^p N Q N^^ 1'^ CT O'^ N O'^ .... t.. ^, .... r+1 t+1 f `.. ..,.. .... .-. c.i d U qC © v1 M N 1'+1 ^--^ CT $ M ,,... Q M +^. !'^1 M !'^1 +r ^ fJ ^i. ^p r1 ^C} N `^D ^I ^ ^ V ^1 f`^ rr1 ^O MQ i7 ^^^^^M I ! 1 i--^ I I ^ ^ N 00 ^ 04 ^/'1 f"^ ^-+ 1'~^ 00 Q` ._. ...^ .,_. t^ ^t N e!' ^--^ N M `V' ^^^=^^^^^^ ^í^i^jt^^^ OONO~i0 t*'1 !}' i^ N1 ^ ^ ^1 i ^ .... pQ Ñ^OQN^T^^ÑNÑ N e"'1 M p Q •^+ et ^p N t'1 ^D N N OQ +^+ N +'^1 ^^ GT V^ et ^-* tT N^D ^' V1 t+1 1'^ er tr1 ^--^ ^-+ Y", OC3 ,`^ i ^✓ N t``- Ñ^ OC^ ^D V7 ^^ h- ^•• i i--^ i i.^ i I.- ._.. I I ( f I I Cy^M^^MN^^t^ M ^+ M wOOMN ^ ^ ^ ^ ^ ^ ^ CrOÑ^^OÑ^ ^^^^^^^^^^ ó V ^ !^JÑ^V^1^Mr^^1^ J4ÑQOOO^^f ^O OC M v'1 N'^ 04 er ^D ^ Ñ^ M OU ^ tNr1 OC N^/1 Lt. ^^ ^ ^^^^^^^^^^^^^^^^ ^^. ^ ^MÑMÑ^ rN+1Mf^1Ñ^efiN`1 ^ ^rt --^ ^ i.--: i i I i ,^ i ^ i ^ ^ ^ ^ i•-^ I ^--: Ñ GT ^ t'`^ CT t^`- G 0^ f'^^- Ñ .... .... .^. .^. ^^^^^^^^^^ Q 4 ^^ Ñ ^ ^^`J ^ Ñ Ñ Ñ Ñ ^ ^ ^ ^ OMip ^ ^' ^ a OQ OO ^ f^ 00 `^t ^^ O^G t'^ ^ ONO OC3 V'^, V^ w : ^ ^ ^ N1 ^ N e^^ ^ Ñ e^ ^ Ñ ^1 ^ Ñ ^ N J M t'r1 e'^1 ... .^. ... .r. .^.. .... ^vy M M .,. 00 Q^ O+-- N t+1 d" v^ ^D ^`` 00 ^^ MMM ^+^+NNNNNN ^Nh1N E•. pp^^+'^ C_iN^N_o^r-N a q^ f'^^ 00 d' ^^^T f"'^ d' O^ : Z^Q^+^^`^i~^ ^ ^Li^C^^^^^^ ^ V p^i: á. i c^G oC cC oC c^G c^G E-- E-- E-- E-» E-^ E-r v o ... cv r^, er ^n ^o ir- oo m .... ASF'HC:'1'OS TEORlt'OS Y ll NA ANLICAC ION NRAC. DE l. ANAI_ISI^ t AC:`T'ORIAI_ I)t^: C'(}RR^SI-'ON. St -- Por una parte, pard pc)ner de relieve las oposicianes sobre el factc^r en estudio, hemos retenidu los puntos de cc^c^rdenadas extremas, positi^^as o negativas. -- Por otra parte, hemos seleccionado entre estos puntos aquellos que presentan una gran contribución absoluta (CTR) 32; sin omitir las contribuciones relativas (COR), para así ver si el eje en cuestión explica una parte importante de una variable o de una observación, o si esta variable u observación es mejor explicada por otro factor. a) Br^syueciu clel sikní,^ic•uclu c1P! primPr fuct^r Entre las variables que tienen contribuciones ahsolutas y relativas elevddas, se nota una oposición clara entre las que representan, en arnbos niveles educativos, pegueños y grandes valores de las tasas brutas de escolariz.ación, de las relaciones de dependencia de la población escolar a la activa, de las tasas de paro por edad, de los gastos educativos por alumno 33 y del P1B por persona. Por otra parte, el gráfico 1 muesira un movimiento casi unitorme de las variables que va del tercer cuadrante al segundo y después al cuarto; la que traduce las valores peyueños, medianos y grandes tamados sucesivamente pur ellas. Sin embargo, ciertas variables evolucionan de forma algo diferente, como por ejemplo, la parte del PIB dedicada a las gastos públicos de educación de ambos niveles educativos, o los gastos públicos de enseñanza por alumnos del nivel superior. Estas variables explicar•án el segundo factor. A partir cie estas indicaciones, hemos padido interpretar el primer factor como el eje de clesc^rrollc^ ciP I^^s sistemus educ•uti ^ ws , entendiendo este desarrollo en un se ntido puramente cuantitativo (constatacto a partir de variables tales cumu las tasas brutas de escalarización o los gastos de enseñanza por alumno), puesto q^e no dispanern^s de indicadores que hagan referencia a la calidad de los servicios educativc^s. Sobre este eje se encuentran agrupados, a la izquierda, los valures débiles de las variables cie enseñanza y, a medida que se va a la derecha, hallamas los fuertes. Esta interpretación se confirma por las proyecciune4 de las observacianes, ya yue se distingue igualmente una neta oposición entre, a la iZquierda, los países cuyos sistemas educativos están poco desarrollados, como Portugal y España, y a la derecha, aquellos ;2 Es decir, los que explican bien et eje. 33 para el nivel de enseñanza superior, la oposición de esta variable se da entre valor^es peyueños y medianos. 5? i:ti^r,A[.^ISTi('A ^SI',4[VOl_.A cuyc^s tiistemas de en3eñanza e^;t^iln muy detiarrc^llacic^s, cumo Estadus Unicios y C^inadd ;^ . h) Bt,ísyttE^clct cfE^! si^,^nrtlc•ctcfca cl^^l st^^^^tnrltt ,juc•tctr Mediante similares razonamientos, 1^emos deducido la interpretación del segundo factur camo el representante del es^tter<.ta cie lus ^ctises ^^ctr lct edrrcac•icSrr; puesto que las ^^ariables que presentan cantribuciones absalutas y relativas importantes respecto a este factor son, entre c^tras, las indicadoras de la importancia relativa que tienen los gastos educativos en el PtB o la que tiene la población escolar en la activa (tabia l), es ciecir, las que traducen la actitud de los Gobiernos frente a la educación. Est^^ interpretación es particularmente clara para el nivel de enseñanza de primaria-media, como nos lo demuestra la clara anusición entre los valores pequeños y grandes de 1as variables citadas; sin embargo, na lo es tanto para la ensef^anza su perior. En efecto, se constata que el esfuerzo realiza^io en los países pur la educación no es uniforme, según los niveles de enseñanza; sino que, por el contrario, un débil esfuerzo en educación primaria-media va asociado, generalmente, a un esfuerzo importante en el ni vel de enser^anza superior, y viceversa. Esta característica, que está de hecho en el origen de los sistemas educativos desequilibrados, va a llevarnos a matizar la interpretación del segundo eje factorial, que representa en realidad la importancia relativa del esfitertio realizudo por !a enseñunzu primarin-media respecto al de la enseñarrza superior 3 s. Como podíamos prever, el PIB por persona {indicador de la «riqueza» del país) no está correlacianado positivamente can el esfuerzo de los países por la ecfucación. Efectivamente, enconiramos, bajo el eje factorial vertical, las variables que ind ican un débil esfuerzo en materia educativa, junto a1 PIB por persona más elevado; mientras que, arriba de este segundo factor, un PIB por persona mediano está asociado a esfuerzos por la educación relativamente importantes. c) Comentaric^ c,lel ^rrr»er ^Icino ^actoria! Si se consideran las cios nubes de puntos ( variables y paises), no se pueden estable- cer correspondencias entre un punto de una nube con un punto de la otra; por ejemplo, no se puede interpretar la proximidad entre el punto «Alemania» y el punto «T„^,» (débil tasa de paro del grupo de ecfad quince a diecinueve años}; pero, por el contrario, ;4 Estos cuatru países presentan las mayores contribuciones absalutas y relativas. 3s E1 esfuerzo dedicado a la enseñanza primaria-media es de hecho inversamente proporcional al esfuerzo realizado por la educación superior. ASI'ECTOs T'F:ORIC^)S Y lll^fA Ak'LICACI{)N F'RAC. t^F.l. ANAI_1SIS F-At`TnRIAI_ C^E C"ORRF.SI^C)N. 5^ sí puede interpretarse la proximidad entre dos puntos de una mismd nube. Por ejemplo, el hecho de que Canadá esté cerca de Estados [Jnidos indica que ambos países tienen comportamientos similares y que sus sistemas educdtivos y económicos están r^elativamente próximos; lo mismo puede decirse de ^=rancia y f=inlandia. [^e igual forma, la proximidad de dos variables indica que todos los países tienen un comportamient^ similar respecto a ellas. Los puntos situados cerca del centro de gravedaci corresponden al perfii medio. Las indicaciones anteriores nos permiten formar una tipología de paises en tres grandes categorias: En el extremo izquierdo del gráfico se encuentran agrupados los países cuyos sistemas educativos están poco desarrollados y en los cuales, la relación entre los est^uerzos realizados en favor de la enseñanza primaria-media y la enseñanza superior, es relativamente débil respecto a la media de los países. Este primer grupo está constituido por España, Portugal, Japón y Alemania. En el extremo derec ho del grático se encuentran Canadá, Estados Unidos y Suecia, que presentan eí sistema eciucativo (sobre todo en el nivel de enseñanza superior) más desarrollado de todos y que realizan, al mismo tiempo, un esfuerzo relativamente débil por la enseñanza primaria-media comparado con el que dedican a la superior. Enire ambos grupos de la tipologia se hallan: Finlandia, Frdncia y Holanda. Estos países se enc uentran en una situación intermedia de desarrcallo de sus sistemas educativos, y realizan un esfuerzo importante por la educación primaria-media comparado con el que dedican a la superior ;`^. C©NCLU510N ES EI análisis de correspondencias efectuado ha permitido aportar una nueva visión del movimiento de diferenciación de los países en cuanto a su sistema de cnseñanza, poniendo, asimismo, de manifiesto las interacciones existentes entre sus sistemas educativo y económico. Aunc^ue la interpretación de los factores no ha resultndo ser una tarea fácil, comu podía preverse, el significado que hemos encontrado para los dos primeros ejes factoriales son: ;^ Estas afirmaciones quedarán cuntirmadas más adelanie, cuando se estudien separadamente los dos niveles educativos. E^TADfS^fICA ES}'AÑ{)!_A 2. EI estado de desarrollc^ del sistema educativa (ciesarr^llo considerado sólo en términos cuantitativos>. El esfuerzo realizddo pur la enseñanza primaria-media, en cc7mparacicin al dedicdcio a la educación superior. Una constataci+ón impcartante, referente a este segundo factor, es que el esfuerzo que ios paises realizan por ia educación no es uniforme, según el nivel de enseñanza; sino que, por el contrario, un pequeño esfuerzo por la educacicín primaria-media va generalmente asociado a un esfuerzo importante en el nivel de enseñanza superior. Esta característica, que es de hecho el origen de los sistemas educativos desequilibrados, nos hizo matizar la interpretación ciel segundo eje factorial en la forma que hemos indicacio má^^ arriba. En función de estos dos factores principales hemos podido establecer una tipología de paises, formdda por ires grandes grupos; cada uno de ellos compuesto por países que se caracterizan por estructuras similares de sus sistemas educativcs y de sus diversos determinantes. A^I'ECTO5 TEt)KICY^S Y UNA ANLICAClt)N 1'RAC. UE1. ANAI_1SIS t ACTORiAI, C)F^ (:'ORRES!'ON. SS ANEXC) I Tabla 1 EVOLUCION DE LAS VARIABLES QUE RELAClONAN EL SISTEMA EDUCAT1ti'O Y EC_ ECONOMICO POR NIVEL DE ENSEÑANZA Y POR PAISES (19701 Par^es Vuriaó/es Cana- Finlan- F`ran- Alemadci dia cia nia Ja^án Ncrlan- Portuda ga! España Suec• ^a Estados Unidos ENSEÑANZA PRl M.MEDlA PUBLICA Tasa bruta de escolarización ................... 0,991 0,915 0,769 0,746 O,K7S 0,88í^ O,ó03 0,49C ^ 0,929 0,974 Relación de dependencia a la población activa ...,.. O,ó3 l(i,405 0,359 0,319 0,330 O,S 19 0,344 0,266 0,30fi O,S07 Gastos públicos Ror alumno {en dólare s U SA 1975 ).. 1. 243 1.017 1.020 798 b47 1.1 S 3 71 190 1.95 2 l. 334 Porceniaje del Pl B asignado a la enseñanza .......... 5,18 4,1 K 2,82 1,80 2.80 4,O1 U,74 0,84 3,72 4,27 Tasa de paro de l5 a l9 añ^s 13,9 4,2 S,7 0,3 2,0 3,4 4,3 3,2 3,3 14,5 hNSEIVANZA SUPER[OR PUBLICA Tasa bruta de escolarizacicín U,246 0,16l^ 0,1^2 0,131 0,036 O, IS3 0,0S5 U,114 0,235 0,319 Relac ión de dependenc ia a la población activa ... ... O,U56 0,034 U,U3b 0,019 0,007 0,037 0,014 0,022 0,039 O,U67 Gastos públícos por alumno {en dólares U SA 1975) .. 4.374 1.103 1.460 3.512 4.837 4.141 Porcentaje del Pl B asignado a la enseñanza .......... 1,62 0,38 0,41 0,-18 4,48 1,04 Tasa de paro de 20 a 24 años 7,5 2,3 3,0 0,4 2,0 2,^ 333 701 3.699 3.758 0, l4 1,3 0,2ó 1,4 0,89 2,2 1,60 7,0 ENSEÑANZA PUBLICA TO TA L Tasa bruta de escolarización 0,719 0,577 0,625 0,507 O,SOS O,b89 0,346 U,355 O,ó08 0,675 Relación de dependencia a la poblacián activa ...... 0,727 0,453 0,492 0,35 l 0,34b 0,676 0,358 0,316 0,377 0,610 Gastos públicos por alumno (Pn dólares USA 19?S) .. 1.465 1.012 9SS 1.024 760 1.302 144 224 2.530 1.527 Porcentaje del PI B asignado a la enseñanza .......... 7,03 4,64 3,63 2,54 S,9U 3,45 1,25 1,17 5,93 5,87 Tasa de paro de 1 S a 24 años í0,0 3,1 3,1 0,4 2,9 2,0 2,2 ^,4 9,9 2,9 Pl B por persona ( en dólares USA 1975) . ............ 6.028 4.709 5.474 b.257 3.799 5.440 1.314 2.333 7.8^4 6.644 ^b ESTADISZ'ICa ^s^ar^ot_a ANEXC) !t Tabla 1 PURCENTAJES QL.1E REPRESENTAN l_A ENSEÑANZA PUBLICA EN LA ENSEÑAN"1_A T©TAL FOR NiVEI. EDUCAT1Vt^ Y P'OR PAIS (1970) Pafsts Ausirdlia . . . . . . . . . . . . . . . . . . . . . . Austria .. . ... . . . . . . .. . . . . . . . . . . Bélgica . . . . . . . . . . . . . . . . . . . . . . . . Canadá ........................ Dinamarca ..................... Finlandia . . . . . . . . . . . . . . . . . . . . . . Francia ........................ Alemania . . . . . . . . . . . . . . . . . . . . . . Grecia . . . . . . . . . . . . . . . . . . . . . . . . . lslandia ........................ Irlanda ........................ Italia ... .. . .. . . .. .... . . . . . . . . . . Japón . . . . . . . . . . . . . . . . . . . . . . . . . Luxemburgo . . . . . . . . . . . . . . . . . . . Holanda . . . . . . . . . . . . . . . . . . . . . . . Nueva Zxlanda . . . . . . . . . . . . . . . . . Noruega ....................... Portugal . . . . . . . . . . . . . . . . . . . . . . . España ........................ Suecia ......................... Suiza .......................... Turquía ....................... Inglaterra . . . . . . . . . . . . . . . . . . . . . . Estados Unidos ...... .. .... .... Yugoslavia . . . . . . . . . . . . . . . . . . . . . °^ de la Enseñanza Frirn.-Med. públéca en e! tota! de ta Ensñ. Prirtt . - Alyd ia 77,9 92,5 45,7 97,6 ... ... 82,4 9ó,7 8ó,7 ... 96,5 90,5 92,0 .., 100,0 88,7 99,3 86,7 60,4 100,0 ,.. 98,9 ,.. 89,4 100,0 ^b de la Enseñanza púb/ica en la Enseñan^a t^tot 7b,9 84,9 43,3 97.7 ... ... 83,9 96,6 Sfi,9 ... 96,3 KO,ó 8l ,S ... 100,0 83,4 97,0 K6,0 59,0 100,0 ... ,.. 94,r^ R5,9 ••• % de !u Enseñanza Superior púólrca tn el total de la Enaeñanza Superr`^^r 98,4 9b,ó 40,7 100,0 ... .,. 96,5 96,1 92,8 ... 93,9 99,9 23,2 ... 100,0 100,0 90,5 93,9 79,7 100,0 ... ... ... 73,2 100,0 Atil'ECT^()S TEC)RIC()5 Y UNA Al^L_ICAC!()ltit NRAC. D^.L ANA(..ISIS t-AC^t()RIA1. UE C()RRESf'()N. 57 ANEXO I1 i Tabla 1 TRANSr~ORMACION DE LAS VARIABLES DE BASE EN 3 Y 4 1NTERVALOS Países Vuric^6les 3 intervalos /! 4 intervulos /!I I !/ I!1 1V Enseñanza prirn.med. públicu Tasa bruta de escolarización , . . . . . . . < C,700 Relación de dependencia a la poblacíón activa . . . . . . .< 0,350 Gastos públicos por alumno {en dólares U SA de 1975 }....< 700 Pc^rcentaje del PI B asignado a la enseñanza . . . . . . . . . . . .< 2,70 Tasa de paro de 1 S a 19 años . . . . . . . . < 4,0 0,700-0,900 > 0,900 0.700 0,700-0,800 0,350-0,450 > 0,450 < 0, 30^Q 0, 300-0, 40!0 0, 400-O,S00 > 0,500 < 700 700- l.000 1. 000-1. 300 > 1. 300 ^00-1. 2011 > 1. 200 0,^00-0,900 > 0,900 2,70-4,0 > 4,0 2,0 2,0-3,0 3,0-4,0 > 4,0 4,0-10,0 > i0,0 4,0 4,0-7,0 7,0- i 3,5 > 13,5 Enseñcrnza superinr públic•u Tasa bruta de escolarización . . . . . . . . < 0,100 Relación de dependenc ia a la población activa . . . . . . . < 0,020 ^iastos púhlicos por alumno (en dólares U SA de 1975 )....< 1. 500 Porcentaje del P1 B 0,100-0,230 > 0,230 < O,OKO U,080-0,160 0,160-0,230 > 0,230 0,020-0,040 > 0,040 < 0,020 0,020-U,OSS 0,035-0,045 > 0,045 1. 500-4. 000 > 4.000 1.000 1.000-2.500 2.5(10-4.000 > 4.000 asignado a la enseñanza . . . . . . . . . . . < 0,4 Tasa de paro de 20 a 24 años . . . . . . . . < 2,9 0,4-1,0 > 1,0 0,3 0,3-0,5 O,S-1,0 > l ,0 2,0-5,8 > 5,8 2,7 2,7-4,0 4,0-5,9 > S ,9 0,450-0,650 > O,b50 < 0,450 0,450-0,574 0,574-0,660 > 0,660 0,400-0,600 > O,óUO 0,375 0,37S-U,S00 0,500-0,650 > 0,650 ^00-1.300 > 1. 300 3,0-5,0 3,0-b,S EnseñUnzu púhlica total Tasa bruta de esc^^larizac ión . . . . . . . . { 0,450 Relacián de dependenc ia a la pobiación activa . . . . . . . < 0,400 Gastos públicos por alumno^ (en dólares U SA de 1975) < 800 Porcentaje del PIB asignado a la enseñanza . . . . . . . . . . . . < 3,0 Tasa de paro de 15 a 24 años . . . . . . . . < 3,0 P1B p. pers. (en dólares U SA de 1975 )< 4.000 4.000-6.000 < H00 800-1.200 > S,0 3,0 3,0-4,0 4,0-5,5 > 5,5 > b,5 2,5 2,5--^,0 4,0-9,1 > 9,1 > 6.000 2. S00 2.500-5 . 0(XJ 1. 200-1.500 > 1. S00 S . 000-ó.500 > 6. 500 ^s^'ADISTICA ESPAÑ()l..A SK Bl^8L.1C)GRAF[A BENLECRt, J. P., y otros: «L'analyse cies données^. Tomo 2: L'unulyse des rurresp^^ndunces. Dunod, París, 1973. BERTIER, P., y BOURQCHE, J. M.: Analyse d^s donnPes mr^ltidinzensiunnelles. PU F, París, 1975. CAILLEZ, ^ ., y PAGES, J. P.: Introductian ^/"analyse des dvnn^es. Smtash, 1517b, CEHESSAT, R.: Fzercises carrementés de Statistique et informatique appliquées. Dunod, Parfs, t97ó. LEe^^RT, L., y FENEL4N, J. P.: Statlstique et informatique appliquées, 3.^ edition. Dunod, París, 1975 . LEBwRT, L.; M4RiNEwu, A., y T^^ BwRt,, N.: Techniques de lu descriptivn statistique. Dunod, Paris, i977. VOLLE, M.: «Analyse des données^. ^cc^nnrrricu, 1978. SU MMARY The analysis of correspondence, develuped by Benzecri, comes within the frame of descriptive multidimentional statistics. Based, like the analysis of principal companents, on the principles of classic factorial analysis founded by Spearman and Thurstone, it has as its airn the extraction of the main factors from a large group of data which are difticult to perceive immediatety and at the same time avoiding the formulation af any causal model which would condition the interpretation of the results. Hawever, the analysis of correspandence is distinct from the method of principa! components due to the fact that the conversion fo brute data into relative frequencies permits af the treatment in general of information of a qualitative nature at the same time quantitative expressed in units of different sizes. ln a more precise way, the analysis of co: respondence sums up the information contained in a table of cantingencies referring to two groups of large sizes and taking into account the probabilistic character of the data to rernedy their l^eterogenity. After transforming the elements c^f the table, the analysis of correspondence gives a perfectly clear vision of two clusters af points when this is projected on to a sub-space of small dimensions ( usually two) in such way as to maintain an important part of the information it initially constituted. So, it deals with giving a coherent meaning ta the axles on which the points have been projected and taking advantage uf the certain help in interpretation which the method provides. AS^^ECTOS T^;nRICOS Y UNA AF'LICACInN F'RAC. UEl_ ANAL_tSIS FACTORIAI_ DE CORRESF'ON_ 4y The aim of this article is to present the theoreticat principles of the analysis of correspondence and give an example of its application whieh makes reference to the interactian which takes place between the education and econ^mic systems af a certain number the O ^ ECD's countries in 1970. Key words: Factorial analysis of correspandence. Application of the method to inte^actian studies. Edu:ation-economic systems in the O^ ECD's countries. AMS, 1970. Subject classi^cation: b2 H 2S.