ESTADISTICA ESPAÑOLA Vol. 37, Núm. 139, 1995, págs. 169 a 182 Un modelo para el estudio de la variabilidad de los estímulos en MDS para datos de clasificación por PEDR© A. GARCIA, J. FERNANDO VERA y ANDRES GONZALEZ Departamento de Estadística e I. O. Facultad de Cíencías Universidad de Granada RESUMEN Proponemos un modelo confirrnatorio de Multidimensionai Scaling (MDS) a dos vías para el tratamiento de datos de similaridad obtenidos por el método de Categorías Sucesivas en la línea de Takane (1981) . La particu laridad básica de este modelo es la incorporación de un factor de variabilidad referido a los estimulos. La estimación de dichos factores de variabilidad se realiia por máxima verosimilitud, y su tratamiento computacional se Ileva a cabo mediante un algoritmo de Gradiente Conjugado con Reinicios. Pa/abras clave: Multidimensional Scaling, Método de Categorías Sucesivas, Configuracíón Espacial Máximo Verosímil, Variabilidad en los Estímulos. Clasificación AM5: 65U05. 1. INTRODUCCICJN Multidimensional Scaling (MDS) es un conjunto de técnicas estadísticas que abordan el problema de la representación, en un espacio de dimensión prefija- 1 iQ 1=.STA[)1tiT1C'A F',SPAÑC)l.A da, de un conjunto de n puntos no observables, de los que se conocen sus interdistancias. Como ejemplo ilustrativo consideremos el problema de la reconstruccíón de un mapa a partir de las distancias por carretera entre n ciudades. Si denotamos por e a la matriz de esas distancias, se trata de encontrar una representación en un espacio de dimensión T de las n ciudades, a la que Ilamaremos rnatriz de configuración X en dicha dimensión. Este problema ^ tiene solución exacta para distancias euclídeas ^Young-Householder (1938)j, si no se fija T, pudiendo encontrarse la dimensión mínima en la que la matriz e de partida coincide con la matriz de distancias D asociada a la matriz dé configuración. EI problema se complica si se desea una representación en dimensión menor que la que proporciona la solución exacta, o bien cuando la matriz de partida no es una mairiz de distancias sino, en general, una de medidas de proximidad, o sea, de similaridades o disimílaridades tales como coeficientes de correlación, pseudodistancías, etc. Volviendo al ejemplo anterior, supongamos que se desea una representación de las ciudades en dimensión T= 2, a pesar de que es ínmediato advertir que las ciudades se encuentran en un espacio tridirnensional, además de no haber sido medidas las distancias en línea recta. En este caso, es razonable esperar que fa configuración exacta tenga más de dos dimensiones, por lo que para Ti 2 existirán distorsiones. Torgerson ( 1952) abordó por primera vez el problema de MDS para matrices de pseudodistancias que violan la propiedad de transitividad de las distancias euclídeas mediante el conocido como Procedimiento Métrico Clásico. Dicho m8todo se basa en una relación aditiva entre las distancias estímadas en la matriz de configuración, d,^, y las pseudodistancias de partida observadas, 5;1, dada por: C E I^+ Tras estimar c, es aplicado el teorema de Young-Householder para calcúlar la confíguración. Este procedimiento, con pequeñas modificaciones, ha sido aplicado extensamente a problemas de índole psicólogica, como el de la clasificación en escalas de razón en el que a cada individuo se le presentan n estímulos por parejas y se le pide que las clasifique en una escala de1 tipo 0 a 10 o del tipo muy diferentes a idénticas, según una característica de referencia. Por ejemplo, consideremos una colección de n marcas de refrescos en la que cada una de las parejas posibles se clasifica por un juez en una escala de 0 a 10 según la característica dulzura. Los valores observados para cada pareja de estímulos son recogidos en una matriz sobre la cual se aplicará el procedimiento de Torgerson para obtener la Matriz de Configuración deseada ac'. Además, para mejorar la fiabilidad es considerada la repetición del proceso de clasificación en R ocasiones, por lo que se dispondrá en general no de una, sino de R matrices de datos. lIN MOt^ta.O PARA I^a f:STUI>Ic^ ( ^t^ F.A VARI.^RIL.I[)A[^ [^t^. l.OS t^:ST1MULOS EN MI)S 171 Ramsay (1977) introduce el primer modelo probabilistico de N^IDS en el que entre las disimi(aridades observadas y la distancia teórica se establece la r®lacián 8;^, ^ d;^ + e;^,, considerando e;^, ^ A(o, a2} si se utilizan los logaritmos de disimilaridades y distancias o bien, como alternativa simétrica a la lognormal, e;^, ^ N(o, a2} si se utilizan los valores sin transformar. Aunque la principal novedad que incorpora el modelo de Ramsay estriba en la posibilidad de emplear máxima verosimilitud para la estimación de los parómetros, es necesario resaltar que la aplicacián de este modelo va unida a la consideración de ciertas restricciones entre las que destaca que el número de categorías de clasíficación sea mayor que siete [Rarnsay (1973}j. A pesar de que el modelo de Ramsay ofrece resultados aceptables cuando se verífican las hipátesis de partida, en la práctica se presentan muchas situaciones en las que los datos son obtenidos en escalas de clasi#icación con un número rnenor de categorías, para los que no son apropiadas distribuciones continuas como la normal o la lognormal. Este hecho, entre otros, Ileva a Takane (1981) a formular un modelo probabilístico que, al contrario que el de Ramsay, resulta apropiado cuando las clasificaciones se efectúan en escalas con menos categorías, modelo que denomina de Categorías Sucesivas (CS}. En él, los valores objeto de estudio son las frecuencias de clasificacián en cada clase y no el valor concreto de disimilaridad, por lo que se puede hablar de un MDS cualitativo como caso particular de MDS no métrico. En su modela para un único individuo, Takane considera dos aproximaciones alternativas que relacionan distancias y disimilaridades: una aditiva, S;^r ^ d;^ + e;.,, con e;^, 1 ^ N(o, a2), y otra multiplicativa, S-^,r^ ^ d^^i^ • e..^^r , con log {e.. ^^r }^ N(o, a^), donde, al igual que en el de Ramsay, a2 denota la variabilidad relativa al_ individuo encuestado. No obstante, en la práctica se comprueba que la consideración de este término de variabilidad es bastante restrictiva, ya que la variabilidad en la clasificación no sólo interesa explicarla globalmente respecto al individuo, sino que suele deberse a que cierto(s) estírnulo(s) puedan ser más difíciles de clasificar, es decir, que el individuo pueda quedar influenciada por un determinado estímulo en aquellas opiniones en las que interviene. Además, el hecho de que un estímulo tenga mayor variabilidad incide claramente en la dimensión de la configuración resultante, corno se pone de manifiesto en Ramsay ( 1978) o en Winsberg y Carroll (1989), aunque, en este último, el término de variabilídad se estudia a traT vés del modelo de representación en la forrna d;^ =[^(x^t - x^r)2 +(s; + s1) '^^, ^ r= , donde x;t es la coordenada de! estímulo i en dimensión t y s; es la especificidad del estímulo i en cuanto a su contribución a la distancia. t:s^rAui:^T^a^^^ FsvANC^^.^ Para recoger esta particularidad, en el modelo de Ramsay el término de error a2 es sustituido por otro a;^ , definido en base a una descomposicián del tipocs;^=(a?+a?)/2. En este trabajo se propone un modelo para el análisis probabilístico con MDS de datos obtenidos rnediante el procedimiento de Categorías Sucesivas para un único individuo que, basado en el de Takane, descornpone la variabilidad global en componentes relativas a los estímulos que intervienen en el estudio. 2. MODELO CS CON TERMtNO DE VARIABILIDAD PARA LOS ESTIMULOS Para la descripción del modelo, supuesto que los datos son obtenidos medíante el procedimiento de Categorías Sucesivas, denotemos por n el número de estimulos, los cuales son presentados por parejas en R ocasiones a un único individuo para su clasificación en M categorías. Denotamos las cotas de las categorías por {bm}m - o. ..., M, siendo la cota superior de la m-ésima categoría igual a la cota inferior de la (m + 1)- ésima. Además, sin pérdida de generalidad, asumiremos que: --oo = bo <_ . . . <_ bm ^ . . . <_ bM _ a^ con lo que no se considerarán diferencias en las cotas para cada réplica del experimento. Por otro lado, siguiendo la filosofia de! modelo de Takane, se asume que la disimilaridad que el individuo asigna al par (i, j) en la réplíca r, es algún valor no observable del intervaio en el que clasifica dicho par, es decir: 5;^^ E [ b^ m_^ ^, bm ), n1= 1, ..., M [11 con lo que puede suponerse continuidad en las disimilaridades. Para modelizar ia reiación entre distancias y disimilaridades se considera el modelo aditivo dado por: ^;^^ = d;^ + @^^r , COn @;^r ~ N (^ ^ Q^^ ) [2^ en el que a;? es un tármino de variabilidad referido al par que se clasifica y constante para cada réplica. Aunque pueden ser considerados otros modelos alternativos clásicos como: b;1^ = d;1 • @^^^ (modelo multiplicativo) [3] UN MUUE1.O PARA Hl. F:S'1'lsUlU l)k^ LA VARIABIt,l1:^AU UF• l C)^ E•:til IMl^1.C)ti H:N MOti y log (eij,) ^ N(o, ai^ ), y bo > 0, o bíen: (modelo potencial) 5,^, = b (d,^)a ^ e,^, [4j siendo log (e;^,) ^ N(o, a;?), y bo > 0, nos hemos centrado en el modelo aditívo, pudiendo extenderse los resultados sin dificultad tanto al multiplicativo como al potencial sin más que considerar transformaciones de línealidad como la logarítmica. Debido a que la variabilidad que modeliza el término ai? procede de fuentes diferentes y supuesta la falta de interacción entre dichas fuentes, se considera una descomposición de dicho término de la forma: a;^ = a2 a; a^ , b' i a; ? 0, [5j Esta descomposición modeliza la variabílidad debida a cada par de estímulos sin suponer un gran aumento en el número de parámetros a estimar. Denotemos por p,Ím la probabilidad de que el individuo clasifique el par (i, j) en la categoría m para cualquier r^plica r. Considerando el modelo de errores [2j, se tiene : c^^^m Í^m pi^m = g (Si1r) d (^^^,) = b1m-t! g (z } d iZ ) [6^ a^^(m-t) con: c^;Ím = bm - diÍ Y Z~ N(a ^ aij ) siendo g(^) la función de densidad asociada a Si^ . Se define la variable indícadora u;^m, como: . 1, Si Oijr E ^m [?^ 0, en caso contrario u^^m^ denotando con oi^, E Cm para significar que los objetos i y j en la réplica r se han clasificado en la categoría m. Por tanto, bajo la hipótesis de independencia entre las réplicas, la verosimilitud asociada a la clasificación de un par después de R réplicas viene dada por: M _ R u^imi _ M u^^m L(i, Í)-^^ ^ pi1^^ - m ^ 1 piÍm [$^ E:STADISTIC'A f',SPAN()LA siendo U,^m (^ ^, U^^,n,) la f^ecuencia de clasificación del par ( i, j) en la categoría m, en la réplica r. Así pues, la v^rosimilitud asociada al proceso global de clasificación de !os pares ser^: [9] L-^ ^^^,i^ c%, i^ La condición de independencia se obtiene experimentalmente si a! individuo se le presentan los pares de estímulos aleatoríamente en cada réplica, de forma que no haya aprendizaje en el proceso. Por tanto, resulta necesario que el proceso de toma de datos sea riguroso en este aspecto. 3. ESTIMACION DE LOS PARAMETROS. TRATAMtENTO COMPUTACIONAL EI procedimiento utilizado para la estimación de los parámetros ha sido el de máxima verosimilitud. De la expresión [8j se deduce que uno de los aspectos necesarias para !a estimación de los parámetros consi ^te en la evaluación de las p;^m en [6]. Esta cuestión se resuelve habitualmente mediante métodos numéricos [Thisted (1988)]. Sin embargo, e! procedimiento computacional utilizado y que se describe a continuación hace uso de una aproximación a la distribución logística, muy utílizada en modelos de respuesta cualitativa, como puede verse en Bock (1975) o Takane (1981). Por tanto, usando la expresión de la distribución en [6] se tiene que: 8,^m F;^m = g (z) d ( z) ^ [1 + exp ( -s;^ a;lm )]-' ^ [10] siendo s;^ un parámetro de dispersión que aproximadamente toma el valor nl^a,f. Haciendo uso de [1©], las derivadas parciales necesarias en !os procedimientos iterativos vienen dadas por !a expresión general: ap;^r„ a F^^m ae ^ ae a F^l (^^ -1) ae donde por 9 se indica cualquiera de los parámetros constituyentes del modelo. En el apéndice final se recogen las expresiones de las derivadas parciales para cada parámetro o conjunto de parámetros del modelo. LJN M{)[7^E:1_O PARA El. 1:STU1)IO UE LA VAR[ABll.ll)AU l)E, L.OS t^.S"T'IMUL.(:)S EN M1)S l Í5 Para el cálculo de los estimadores asociados a la verosimilitud definida, se ha desarrollado un programa en BASIC 7.1 en el que se ha implementado un algoritmo de optimización por bloques junto con el procedimiento de Gradiente Conjugado con Reínicios debido a Powell (1977), para cada conjunto de parémetros estructurales del modelo. EI procedimiento es similar a los métodos clásicos de mínimos cuadrados alternativos como A^SCAL [Takane et al. (1977)], aunque más eficiente computacionalmente, a pesar de la dificultad intrínseca a estos algoritmos de encontrar mínimos locales. Por otra parte, e! procedimiento es más eficiente que los algoritmos propuestos por Takane (1981 } y Takane y Carroll (1981), ya que la utilización de métodos Scoring en este caso no mejoran las estimaciones y, sin embargo, son más costosos en su computación [Jedidi y DeSarbo (1991 ^]. Tal y como antes comentébamos, ei procedimiento computacional es de optimización por bloques. Se introduce una configuración inicial X^°^, por ejernplo la que proporciona la solución métríca de Torgerson (nátese que la soluci^n métrica es el caso particular de categorias igualmente espaciadas bm = a* rn+ b con a y b constantes) o bien una aleatoria. A partir de la nueva configuración obtenida, X^' } y de los valores iniciales dados para el resto del conjunto de parámetros, se minimiza por el método citado la expresión de la logverosimilitud asociada a X. EI paso siguiente consiste en la actualización de los parámetros restantes manteniendo fijos los valores estimados de la configuración en el paso anterior. En primer lugar se calculan nuevas estimaciones de ios factores de variabiiidad, minimizando con el mismo procedimienio algorítmico !as expresiones de las derivadas parciales que aparecen en el Apéndice. Seguidamente, se actualizan las cotas de las categorías, pudiendo hacer uso de restricciones estructurales [Takane (1981)], con lo que finaliza el primer bloque iterativo. A continuación se considera otro bloque can valores iniciales dados por las estímaciones del bioque anterior, y así sucesivamente hasta obtener convergencia. EI criterio de convergencía considerado para la finalización del procedimiento iterativo es el dado por: I ^^g L(v - 1) _ lag ^(v) ^ ^ E1 [12] mediante el cual se controla que la diferencia de los logaritmos de las verosimilitudes entre cada iteración v y la anterior sea menor que cierta cantidad. Para solventar problemas de redandeo también se ha considerado otro criterio que consiste en fijar un número méximo de iteracíones. Por otra parte, en cada bloque parcial se controla la convergencia mediante la langitud del vector gradiente : F^.5TAf)IS^TI('.A F;tiPANO! A j %^i llologL^">II^f2 f131 de forma que ósta sea suficientemente peque^ia. De^bido a que cualquier isometría sobre la configuración estimada es solución del problema MDS, en la expresión del vector gradiente se han incorporado restricciones que se incluyen en el procedimiento algorítmico a través de funciones de penalizacián en la forma habitual. Una de ellas se usa para fijar la configuracián en el centroide con ^ x^t = 0, d t. La otra se refiere a los valores de va^ riabilidad asociados a los estímulos, e impone que ^ a; = n. Esta restricción se ^ justifica en que a los efectos de! estudio propuesto sólo nos interesa el valOr relativo de variabilidad en el estímulo, concentrando el término global en a2. De no tratarse así, puede darse el caso de que en dimensián mayor la confíguracíán siempre tíene menor variabilidad en todas sus componentes, y difícilmente sería localizable el(los) estímulo(s) que en dimensión menor íntroducen mayor variabílidad. De ahí que e! término a2 también se pueda interpretar como e! término de variabilidad asociado a la dimensión. 4. UN EJEMPLO I^USTRATIVO En el ejemplo siguiente se ha considerado !a configuración teórica que aparece en la figura 1. Flgura 1 1.6 Nç 1.2 Y ^ S 4.6 0.4 0 0 o.a 0.8 1.2 Dímensión 1 2 UN MODF.I.O PARA EL ESTUDIO DE LA VARIABILII)AU DF.: I.US F:ST1Ml.[_E)S EN M[)S ^%7 Se trata de perturbar las distancias originales de esta configuración teórica por un procedirniento de simulación. Seguidame^ite aplicarnos el modelo desarrollado sobre las matrices de pseudodistancias obtenidas. En una primera simulación, se han generado 100 valores aleatorios a partir de cada uno de los valores teóricos de distancia con 6- .01 y a; = 1, b i. Estos valores obtenidos serán las disimilaridades que se considerarán en el proceso de clasificación. Para la estimacián de la configuracián resultante se han supuesto cinco categorias igualmente espaciadas con bm ^ a* rn+ b con a=.56 y b=--.36, m= 1, ..., 6, aparte de las categorías extremas hasta recorrer todo ^$, Seguidamente se clasifican estos valores en las clases correspondientes, y se obtienen los U;^m constituyentes de [8] sobre los que se inicia el procedirniento iterativo para el cálculo de la configuración estimada. La configuración estimada que se obtiene aparece en la figura 2. Figu^a 2 1.5 1 0.5 N C ^O .^ C m ^_ ^ --0.5 -1 _5 -1.5 -0.5 0 0.5 1 1.5 Dimensió^ 1 Tabla 1 Dimensián log L N.Q parárn. AIC VAF á á b T= 2 197.322 23 -348.645 .9903 .08 .227 1.02 T=3 208.474 33 -350.949 .9958 .06 .255 .97 i^x t•.^^r,an^sr^c^,a t-:st^.aNt^t_.a Esta tabla, junto con !a figura anterior, muestra que la configuración estimada se ajusta casi exactamente a la configuración teórica de partida, como indica la r^edída de variabilidad explícada (VAF), que se acerca bastante al i 00% global. Por otra parte, !as estimaciones para los factores de variabilidad de los estimulos aparecen en !a tabla siguiente: Tabla 2 Estímulo A B C D E F G H ! J T= 2 .59 1.12 .10 . 31 2.46 . 58 1.02 1.90 .55 1.32 T= 3 .40 1.08 .39 .17 3.07 ,23 .92 1.78 .56 1.38 donde hay que notar que dichos estimadores se ajustan relativamenie bien a los que se han utilizado en el procedimiento de simulación, aunque, como es lógico, el estímulo con mayor incidencia en cuanto a varíabilidad es aquel sobre el que se fija la configuración, es decír, el que se corresponde con el centroide, al ser !a configuración simétrica. En lo que se refiere a la dimensión para la configuración, es claro también que el porcentaje de variabilidad explicado por !a dimensión tercera es relativamente débil como para que sea conveniente una representación en dimensión mayor de dos. Además, la mera comparación del estadístico AIC, más adecuado en estos modelos debido al número de parámetros a estimar [Akaike (1974^], muestra que una dimensión mayor para la configuración no es significativa. Sin embargo, nuestro interés se centra, como hemos dicho, en evaluar la incidencia de un estímulo con alta variabilídad asociada sobre ia configuración estimada y, por consiguiente, sobre el problema de la dimensionalidad de !a misma. Para ello se han generado nuevamente 100 valores aleatorios sobre los valores de distancia, con a=.01 y a; _.7, d i^ 10, y un a^ o = 3.7. Considerado el mismo sistema de clasificación, en !a tabla 3 aparecen los resultados que se obtienen al aplicar el procedimiento. Tab^a 3 Dimensíón log L N.Q parám. AIC VAF á á ^ b T=2 55.669 23 -65.339 .8532 .0176 .532 -.21 T=3 77.811 33 -89.622 . 9614 .0108 .547 --.28 UN MO[)ka.O PARA Fl... ESTI.JDlO DE L.A VARIABII..IDAI) C)l^ LO5 ESTIMULC)S EN MDS li^ donde se puede notar que ias consideraciones efectuadas anteriormente para el problema de la dimensionalidad indican que en este caso la canfiguración en dimensión 3 proporciona significativamente un rnejor ajuste, tanto en lo que se refiere al tanto por ciento de variabilidad explicada como al estadístico AIC respecto de la logverosimilitud asociada a dicha configuración. Figura 3 0.5 N C `^ O ^ --0.5 -1.5 --1.5 --0.5 0 0.5 1 1.5 Dimensión t Por otra parte, se trata de calibrar la incidencia dimensional de un estímulo con una variabilidad significativamente más alta que el resto. Aunque en la figura 3 se observa que ia configuración en dimensión 2 es, muy similar a la del caso anterior, la tabla siguiente: Tabla 4 Estímulo A B D T=2 .00 . 00 .76 T^ 3 .00 .02 .00 D E F G H I J . 89 2.57 .00 .00 .00 .00 6.61 1.03 1.28 .00 .44 .00 2.20 4.95 f^STA[)ISTI('A f^tiPAÑ()t_A muestra claramente que en dimensión 2, al estímulo J le corresponde una estimacián para su término de varíabilidad significativamente mayor que la del resto de los estímulos salvo, como era de esperar, el del estímulo centroide de la configuracióra. Por otra parte, en dimensión 3 dicha estimación disminuye considerablemente para el estímulo J, cuestión achacable al aumento de la dimensión. 5. REFERENCIAS AKAlKE, H. (1974): «A New Look at the Statistical Model fdentification», IEEE Transactions on Auiomatic Control, 19, 716-723. B©cK, R. D. (1975): Multivariate Statistica/ Methods in Behavioura/ Research, ^ McGraw-Hi11. GARCíA-LÓPEZ, P. A. (1994): Inferencia en MDS no métrico, Tesis Doctoral, Universidad de Granada. GARCÍA-LÚPEZ, P. A.; GONZÁLEZ, A., y VERA, J. F. (1993): «Contríbutions to the Nonmetric Maximum Likelihood MDS from Directional Rankings af Similarities Method», Proceedings of the 1993 European Meeting of the Psychometríc Society. JEDIDI, .K., y DESARBO, W. S. (1991): «A Stochastic MDS Procedure for the Spatial Representation of Three-Mode, Three-Way Pick Any/j Data», Psychometrika, 56, 471-494. PowELL, M. J. D. (1977): «Restart Procedures for the Conjugate Gradient Method^^, Mathematical Programming, 12, 241-254. RAMSAY, J. O. (1973): «The Effect of Number of Categories in Rating Scales on Estimation of Scale Values», Psychometrika, 38, 513-532. (1977): «Maximum Likelihood Estimation in Multidimensional Scaling», Psychomet^ika, 42, 241-266. (1978) : «Confidence Regions for M DS Analysis», Psychometrika, 43, 145160. TAKANE, Y. (1981): «Multidimensional Successive Categories Scaling: A Maximum Likelihood Method», Psychometrika, 46, 9-28. TAKANE, Y., y Carrofl, J. D. (1981): «Nonmetric Maximum Likelíhood MDS from Directional Rankings of Similarities», Psychometrika, 46, 389-406. TAKANE, Y.; YouNG, F. W., y DE LEEUw, J. (1977): «Nonmetríc Individual Differences MDS: An alternating Leasi Squares Method with Optima! Scaling Features», Psychometrika, 42, 7-67. l1N MOi)f-:l.O PARA EL t:STllDlf) UE l.A VARtAHILI[)AD C>F, l.OS ^_S"T1Ml'I Ofi FN M[)ti i$ ^ TNISTED, R. A. (1988): E/ements of Statistica/ Computing. Nurnerical Computation, Chapman & Hall. TORGERSON, W. S, (1952): «Multidimensionai scaling: f Theory and Methodsi>, Psychometrika, 17, 401-419. WINSBERG, S., y Carroll, J. D. (1989}: ^p^ cuasi-Nonmetric Method for Multidimensiona! Scaling via an Extended Euclidean Model», Psychometrika, 54, 217229. YouNG, G., y HouSEHOLDER, A. S. (1938): «Discussion of a set of points in terms of their mutual distances», Psychometrika, 3, 19-22. APENDICE Las derivadas parciales necesarias en los procedimientos iterativos vienen dadas por las expresiones siguientes: aF;^m aF;jm c^d^j ax4r ad;^r ax4t a Fijm [ ^ 4] . _ _F^/m ( ^ _ F^jm ) S^j ad,j ad;j : [ 15] (S;t - sjt> (Xit - Xjr^ con 8 la delta de Kronecker. á F,^,,,, - F^ jm (1 -' FjÍm ) s^ j abm a F^^m aCi a F^jm acx .^ ^ S^^ i _ F^^m } F^^m (1 -F^^m (1 _ a a^^m S^l F^^m ) 2a , c?^1m r [ 18] [ 19] i$2 ESTa[^IST1Ca ESPawc)La A MODEL FOR THE EVALUATIt3N OF STIMULt VARtABILITY IN MDS CLASSIFICATION DATA SUMMARY We propose a confirmatory multídimensional scaling (MDS) twoway modei. Data are similarities obtained by the model of successive categories proposed by Takane (1981). As a basic aspect, the model has a variability factor for stimuli. A maximum likelihood procedure is developed for parameters estimation. The computational treatment is based on a conjugate gradient algorithm with automatic restarts. Key words: multidimensional scaling, meihod of successive categories, maximum likelihood configuration, variability of stimuti. AMS Classification: fi5U05.