Un modelo para el estudio de la variabilidad de los estímulos en

Anuncio
ESTADISTICA ESPAÑOLA
Vol. 37, Núm. 139, 1995, págs. 169 a 182
Un modelo para el estudio
de la variabilidad de los estímulos
en MDS para datos de clasificación
por
PEDR© A. GARCIA, J. FERNANDO VERA y ANDRES GONZALEZ
Departamento de Estadística e I. O.
Facultad de Cíencías
Universidad de Granada
RESUMEN
Proponemos un modelo confirrnatorio de Multidimensionai Scaling (MDS) a dos vías para el tratamiento de datos de similaridad
obtenidos por el método de Categorías Sucesivas en la línea de Takane (1981) . La particu laridad básica de este modelo es la incorporación de un factor de variabilidad referido a los estimulos. La estimación de dichos factores de variabilidad se realiia por máxima
verosimilitud, y su tratamiento computacional se Ileva a cabo mediante un algoritmo de Gradiente Conjugado con Reinicios.
Pa/abras clave: Multidimensional Scaling, Método de Categorías Sucesivas, Configuracíón Espacial Máximo Verosímil, Variabilidad
en los Estímulos.
Clasificación AM5: 65U05.
1.
INTRODUCCICJN
Multidimensional Scaling (MDS) es un conjunto de técnicas estadísticas que
abordan el problema de la representación, en un espacio de dimensión prefija-
1 iQ
1=.STA[)1tiT1C'A F',SPAÑC)l.A
da, de un conjunto de n puntos no observables, de los que se conocen sus interdistancias. Como ejemplo ilustrativo consideremos el problema de la reconstruccíón de un mapa a partir de las distancias por carretera entre n ciudades. Si
denotamos por e a la matriz de esas distancias, se trata de encontrar una representación en un espacio de dimensión T de las n ciudades, a la que Ilamaremos
rnatriz de configuración X en dicha dimensión. Este problema ^ tiene solución
exacta para distancias euclídeas ^Young-Householder (1938)j, si no se fija T,
pudiendo encontrarse la dimensión mínima en la que la matriz e de partida coincide con la matriz de distancias D asociada a la matriz dé configuración.
EI problema se complica si se desea una representación en dimensión menor que la que proporciona la solución exacta, o bien cuando la matriz de partida no es una mairiz de distancias sino, en general, una de medidas de proximidad, o sea, de similaridades o disimílaridades tales como coeficientes de correlación, pseudodistancías, etc. Volviendo al ejemplo anterior, supongamos que
se desea una representación de las ciudades en dimensión T= 2, a pesar de
que es ínmediato advertir que las ciudades se encuentran en un espacio tridirnensional, además de no haber sido medidas las distancias en línea recta. En
este caso, es razonable esperar que fa configuración exacta tenga más de dos
dimensiones, por lo que para Ti 2 existirán distorsiones.
Torgerson ( 1952) abordó por primera vez el problema de MDS para matrices
de pseudodistancias que violan la propiedad de transitividad de las distancias
euclídeas mediante el conocido como Procedimiento Métrico Clásico. Dicho m8todo se basa en una relación aditiva entre las distancias estímadas en la matriz
de configuración, d,^, y las pseudodistancias de partida observadas, 5;1, dada por:
C E I^+
Tras estimar c, es aplicado el teorema de Young-Householder para calcúlar la
confíguración.
Este procedimiento, con pequeñas modificaciones, ha sido aplicado extensamente a problemas de índole psicólogica, como el de la clasificación en escalas
de razón en el que a cada individuo se le presentan n estímulos por parejas y se
le pide que las clasifique en una escala de1 tipo 0 a 10 o del tipo muy diferentes
a idénticas, según una característica de referencia. Por ejemplo, consideremos
una colección de n marcas de refrescos en la que cada una de las parejas posibles se clasifica por un juez en una escala de 0 a 10 según la característica dulzura. Los valores observados para cada pareja de estímulos son recogidos en
una matriz sobre la cual se aplicará el procedimiento de Torgerson para obtener
la Matriz de Configuración deseada ac'. Además, para mejorar la fiabilidad es
considerada la repetición del proceso de clasificación en R ocasiones, por lo
que se dispondrá en general no de una, sino de R matrices de datos.
lIN MOt^ta.O PARA I^a f:STUI>Ic^ ( ^t^ F.A VARI.^RIL.I[)A[^ [^t^. l.OS t^:ST1MULOS EN MI)S
171
Ramsay (1977) introduce el primer modelo probabilistico de N^IDS en el que
entre las disimi(aridades observadas y la distancia teórica se establece la r®lacián 8;^, ^ d;^ + e;^,, considerando e;^, ^ A(o, a2} si se utilizan los logaritmos de
disimilaridades y distancias o bien, como alternativa simétrica a la lognormal,
e;^, ^ N(o, a2} si se utilizan los valores sin transformar.
Aunque la principal novedad que incorpora el modelo de Ramsay estriba en
la posibilidad de emplear máxima verosimilitud para la estimación de los parómetros, es necesario resaltar que la aplicacián de este modelo va unida a la
consideración de ciertas restricciones entre las que destaca que el número de
categorías de clasíficación sea mayor que siete [Rarnsay (1973}j.
A pesar de que el modelo de Ramsay ofrece resultados aceptables cuando
se verífican las hipátesis de partida, en la práctica se presentan muchas situaciones en las que los datos son obtenidos en escalas de clasi#icación con un número rnenor de categorías, para los que no son apropiadas distribuciones continuas como la normal o la lognormal. Este hecho, entre otros, Ileva a Takane
(1981) a formular un modelo probabilístico que, al contrario que el de Ramsay,
resulta apropiado cuando las clasificaciones se efectúan en escalas con menos
categorías, modelo que denomina de Categorías Sucesivas (CS}.
En él, los valores objeto de estudio son las frecuencias de clasificacián en
cada clase y no el valor concreto de disimilaridad, por lo que se puede hablar de
un MDS cualitativo como caso particular de MDS no métrico.
En su modela para un único individuo, Takane considera dos aproximaciones
alternativas que relacionan distancias y disimilaridades: una aditiva, S;^r ^ d;^ + e;.,,
con e;^,
1 ^ N(o, a2), y otra multiplicativa, S-^,r^ ^ d^^i^ • e..^^r , con log {e..
^^r }^ N(o, a^),
donde, al igual que en el de Ramsay, a2 denota la variabilidad relativa al_ individuo encuestado.
No obstante, en la práctica se comprueba que la consideración de este término de variabilidad es bastante restrictiva, ya que la variabilidad en la clasificación no sólo interesa explicarla globalmente respecto al individuo, sino que suele
deberse a que cierto(s) estírnulo(s) puedan ser más difíciles de clasificar, es decir, que el individuo pueda quedar influenciada por un determinado estímulo en
aquellas opiniones en las que interviene. Además, el hecho de que un estímulo
tenga mayor variabilidad incide claramente en la dimensión de la configuración
resultante, corno se pone de manifiesto en Ramsay ( 1978) o en Winsberg y Carroll (1989), aunque, en este último, el término de variabilídad se estudia a traT
vés del modelo de representación en la forrna d;^ =[^(x^t - x^r)2 +(s; + s1) '^^,
^
r= ,
donde x;t es la coordenada de! estímulo i en dimensión t y s; es la especificidad
del estímulo i en cuanto a su contribución a la distancia.
t:s^rAui:^T^a^^^ FsvANC^^.^
Para recoger esta particularidad, en el modelo de Ramsay el término de
error a2 es sustituido por otro a;^ , definido en base a una descomposicián del
tipocs;^=(a?+a?)/2.
En este trabajo se propone un modelo para el análisis probabilístico con MDS
de datos obtenidos rnediante el procedimiento de Categorías Sucesivas para un
único individuo que, basado en el de Takane, descornpone la variabilidad global
en componentes relativas a los estímulos que intervienen en el estudio.
2.
MODELO CS CON TERMtNO DE VARIABILIDAD PARA LOS ESTIMULOS
Para la descripción del modelo, supuesto que los datos son obtenidos medíante el procedimiento de Categorías Sucesivas, denotemos por n el número
de estimulos, los cuales son presentados por parejas en R ocasiones a un único
individuo para su clasificación en M categorías. Denotamos las cotas de las categorías por {bm}m - o. ..., M, siendo la cota superior de la m-ésima categoría igual
a la cota inferior de la (m + 1)- ésima. Además, sin pérdida de generalidad, asumiremos que:
--oo = bo <_ . . . <_ bm ^ . . . <_ bM _ a^
con lo que no se considerarán diferencias en las cotas para cada réplica del experimento.
Por otro lado, siguiendo la filosofia de! modelo de Takane, se asume que la
disimilaridad que el individuo asigna al par (i, j) en la réplíca r, es algún valor no
observable del intervaio en el que clasifica dicho par, es decir:
5;^^ E [ b^ m_^ ^, bm ),
n1= 1, ..., M
[11
con lo que puede suponerse continuidad en las disimilaridades.
Para modelizar ia reiación entre distancias y disimilaridades se considera el
modelo aditivo dado por:
^;^^ = d;^ + @^^r ,
COn
@;^r ~ N (^ ^ Q^^ )
[2^
en el que a;? es un tármino de variabilidad referido al par que se clasifica y constante para cada réplica.
Aunque pueden ser considerados otros modelos alternativos clásicos como:
b;1^ = d;1 • @^^^
(modelo multiplicativo)
[3]
UN MUUE1.O PARA Hl. F:S'1'lsUlU l)k^ LA VARIABIt,l1:^AU UF• l C)^ E•:til IMl^1.C)ti H:N MOti
y log (eij,) ^ N(o, ai^ ), y bo > 0, o bíen:
(modelo potencial)
5,^, = b (d,^)a ^ e,^,
[4j
siendo log (e;^,) ^ N(o, a;?), y bo > 0, nos hemos centrado en el modelo aditívo,
pudiendo extenderse los resultados sin dificultad tanto al multiplicativo como al
potencial sin más que considerar transformaciones de línealidad como la logarítmica.
Debido a que la variabilidad que modeliza el término ai? procede de fuentes
diferentes y supuesta la falta de interacción entre dichas fuentes, se considera
una descomposición de dicho término de la forma:
a;^ = a2 a; a^ ,
b' i
a; ? 0,
[5j
Esta descomposición modeliza la variabílidad debida a cada par de estímulos sin suponer un gran aumento en el número de parámetros a estimar.
Denotemos por p,Ím la probabilidad de que el individuo clasifique el par (i, j)
en la categoría m para cualquier r^plica r. Considerando el modelo de errores
[2j, se tiene :
c^^^m
Í^m
pi^m =
g (Si1r) d (^^^,) =
b1m-t!
g (z } d iZ )
[6^
a^^(m-t)
con:
c^;Ím = bm - diÍ
Y
Z~ N(a ^ aij )
siendo g(^) la función de densidad asociada a Si^ .
Se define la variable indícadora u;^m, como: .
1,
Si Oijr E ^m
[?^
0, en caso contrario
u^^m^
denotando con oi^, E Cm para significar que los objetos i y j en la réplica r se han
clasificado en la categoría m.
Por tanto, bajo la hipótesis de independencia entre las réplicas, la verosimilitud asociada a la clasificación de un par después de R réplicas viene dada por:
M
_
R
u^imi _
M
u^^m
L(i, Í)-^^ ^ pi1^^ - m ^ 1 piÍm
[$^
E:STADISTIC'A f',SPAN()LA
siendo U,^m (^ ^, U^^,n,) la f^ecuencia de clasificación del par ( i, j) en la categoría
m, en la réplica r. Así pues, la v^rosimilitud asociada al proceso global de clasificación de !os pares ser^:
[9]
L-^ ^^^,i^
c%, i^
La condición de independencia se obtiene experimentalmente si a! individuo
se le presentan los pares de estímulos aleatoríamente en cada réplica, de forma
que no haya aprendizaje en el proceso. Por tanto, resulta necesario que el proceso de toma de datos sea riguroso en este aspecto.
3.
ESTIMACION DE LOS PARAMETROS. TRATAMtENTO
COMPUTACIONAL
EI procedimiento utilizado para la estimación de los parámetros ha sido el de
máxima verosimilitud. De la expresión [8j se deduce que uno de los aspectos
necesarias para !a estimación de los parámetros consi ^te en la evaluación de
las p;^m en [6]. Esta cuestión se resuelve habitualmente mediante métodos numéricos [Thisted (1988)]. Sin embargo, e! procedimiento computacional utilizado
y que se describe a continuación hace uso de una aproximación a la distribución
logística, muy utílizada en modelos de respuesta cualitativa, como puede verse
en Bock (1975) o Takane (1981). Por tanto, usando la expresión de la distribución en [6] se tiene que:
8,^m
F;^m = g (z) d ( z) ^ [1 + exp ( -s;^ a;lm )]-'
^
[10]
siendo s;^ un parámetro de dispersión que aproximadamente toma el valor
nl^a,f.
Haciendo uso de [1©], las derivadas parciales necesarias en !os procedimientos iterativos vienen dadas por !a expresión general:
ap;^r„
a F^^m
ae ^ ae
a F^l (^^ -1)
ae
donde por 9 se indica cualquiera de los parámetros constituyentes del modelo.
En el apéndice final se recogen las expresiones de las derivadas parciales para
cada parámetro o conjunto de parámetros del modelo.
LJN M{)[7^E:1_O PARA El. 1:STU1)IO UE LA VAR[ABll.ll)AU l)E, L.OS t^.S"T'IMUL.(:)S EN M1)S
l Í5
Para el cálculo de los estimadores asociados a la verosimilitud definida, se
ha desarrollado un programa en BASIC 7.1 en el que se ha implementado un algoritmo de optimización por bloques junto con el procedimiento de Gradiente
Conjugado con Reínicios debido a Powell (1977), para cada conjunto de parémetros estructurales del modelo. EI procedimiento es similar a los métodos clásicos de mínimos cuadrados alternativos como A^SCAL [Takane et al. (1977)],
aunque más eficiente computacionalmente, a pesar de la dificultad intrínseca a
estos algoritmos de encontrar mínimos locales. Por otra parte, e! procedimiento
es más eficiente que los algoritmos propuestos por Takane (1981 } y Takane y
Carroll (1981), ya que la utilización de métodos Scoring en este caso no mejoran
las estimaciones y, sin embargo, son más costosos en su computación [Jedidi y
DeSarbo (1991 ^].
Tal y como antes comentébamos, ei procedimiento computacional es de optimización por bloques. Se introduce una configuración inicial X^°^, por ejernplo
la que proporciona la solución métríca de Torgerson (nátese que la soluci^n métrica es el caso particular de categorias igualmente espaciadas bm = a* rn+ b
con a y b constantes) o bien una aleatoria. A partir de la nueva configuración
obtenida, X^' } y de los valores iniciales dados para el resto del conjunto de parámetros, se minimiza por el método citado la expresión de la logverosimilitud
asociada a X.
EI paso siguiente consiste en la actualización de los parámetros restantes
manteniendo fijos los valores estimados de la configuración en el paso anterior.
En primer lugar se calculan nuevas estimaciones de ios factores de variabiiidad,
minimizando con el mismo procedimienio algorítmico !as expresiones de las derivadas parciales que aparecen en el Apéndice. Seguidamente, se actualizan las
cotas de las categorías, pudiendo hacer uso de restricciones estructurales [Takane (1981)], con lo que finaliza el primer bloque iterativo. A continuación se
considera otro bloque can valores iniciales dados por las estímaciones del bioque anterior, y así sucesivamente hasta obtener convergencia.
EI criterio de convergencía considerado para la finalización del procedimiento iterativo es el dado por:
I ^^g L(v - 1) _ lag ^(v) ^ ^ E1
[12]
mediante el cual se controla que la diferencia de los logaritmos de las verosimilitudes entre cada iteración v y la anterior sea menor que cierta cantidad.
Para solventar problemas de redandeo también se ha considerado otro criterio
que consiste en fijar un número méximo de iteracíones. Por otra parte, en cada
bloque parcial se controla la convergencia mediante la langitud del vector gradiente :
F^.5TAf)IS^TI('.A F;tiPANO! A
j %^i
llologL^">II^f2
f131
de forma que ósta sea suficientemente peque^ia.
De^bido a que cualquier isometría sobre la configuración estimada es solución del problema MDS, en la expresión del vector gradiente se han incorporado
restricciones que se incluyen en el procedimiento algorítmico a través de funciones de penalizacián en la forma habitual. Una de ellas se usa para fijar la configuracián en el centroide con ^ x^t = 0, d t. La otra se refiere a los valores de va^
riabilidad asociados a los estímulos, e impone que ^ a; = n. Esta restricción se
^
justifica en que a los efectos de! estudio propuesto sólo nos interesa el valOr relativo de variabilidad en el estímulo, concentrando el término global en a2. De no
tratarse así, puede darse el caso de que en dimensián mayor la confíguracíán
siempre tíene menor variabilidad en todas sus componentes, y difícilmente sería
localizable el(los) estímulo(s) que en dimensión menor íntroducen mayor variabílidad. De ahí que e! término a2 también se pueda interpretar como e! término
de variabilidad asociado a la dimensión.
4.
UN EJEMPLO I^USTRATIVO
En el ejemplo siguiente se ha considerado !a configuración teórica que aparece en la figura 1.
Flgura 1
1.6
Nç
1.2
Y
^
S 4.6
0.4
0
0
o.a
0.8
1.2
Dímensión 1
2
UN MODF.I.O PARA EL ESTUDIO DE LA VARIABILII)AU DF.: I.US F:ST1Ml.[_E)S EN M[)S
^%7
Se trata de perturbar las distancias originales de esta configuración teórica
por un procedirniento de simulación. Seguidame^ite aplicarnos el modelo desarrollado sobre las matrices de pseudodistancias obtenidas.
En una primera simulación, se han generado 100 valores aleatorios a partir
de cada uno de los valores teóricos de distancia con 6- .01 y a; = 1, b i. Estos
valores obtenidos serán las disimilaridades que se considerarán en el proceso
de clasificación. Para la estimacián de la configuracián resultante se han supuesto cinco categorias igualmente espaciadas con bm ^ a* rn+ b con a=.56 y
b=--.36, m= 1, ..., 6, aparte de las categorías extremas hasta recorrer todo ^$,
Seguidamente se clasifican estos valores en las clases correspondientes, y se
obtienen los U;^m constituyentes de [8] sobre los que se inicia el procedirniento
iterativo para el cálculo de la configuración estimada.
La configuración estimada que se obtiene aparece en la figura 2.
Figu^a 2
1.5
1
0.5
N
C
^O
.^
C
m
^_
^
--0.5
-1 _5
-1.5
-0.5
0
0.5
1
1.5
Dimensió^ 1
Tabla 1
Dimensián
log L
N.Q parárn.
AIC
VAF
á
á
b
T= 2
197.322
23
-348.645
.9903
.08
.227
1.02
T=3
208.474
33
-350.949
.9958
.06
.255
.97
i^x
t•.^^r,an^sr^c^,a t-:st^.aNt^t_.a
Esta tabla, junto con !a figura anterior, muestra que la configuración estimada se ajusta casi exactamente a la configuración teórica de partida, como indica
la r^edída de variabilidad explícada (VAF), que se acerca bastante al i 00% global. Por otra parte, !as estimaciones para los factores de variabilidad de los estimulos aparecen en !a tabla siguiente:
Tabla 2
Estímulo
A
B
C
D
E
F
G
H
!
J
T= 2
.59
1.12
.10
. 31
2.46
. 58
1.02
1.90
.55
1.32
T= 3
.40
1.08
.39
.17
3.07
,23
.92
1.78
.56
1.38
donde hay que notar que dichos estimadores se ajustan relativamenie bien a los
que se han utilizado en el procedimiento de simulación, aunque, como es lógico,
el estímulo con mayor incidencia en cuanto a varíabilidad es aquel sobre el que
se fija la configuración, es decír, el que se corresponde con el centroide, al ser
!a configuración simétrica.
En lo que se refiere a la dimensión para la configuración, es claro también
que el porcentaje de variabilidad explicado por !a dimensión tercera es relativamente débil como para que sea conveniente una representación en dimensión
mayor de dos. Además, la mera comparación del estadístico AIC, más adecuado en estos modelos debido al número de parámetros a estimar [Akaike (1974^],
muestra que una dimensión mayor para la configuración no es significativa.
Sin embargo, nuestro interés se centra, como hemos dicho, en evaluar la incidencia de un estímulo con alta variabilídad asociada sobre ia configuración estimada y, por consiguiente, sobre el problema de la dimensionalidad de !a misma.
Para ello se han generado nuevamente 100 valores aleatorios sobre los valores
de distancia, con a=.01 y a; _.7, d i^ 10, y un a^ o = 3.7. Considerado el mismo sistema de clasificación, en !a tabla 3 aparecen los resultados que se obtienen al aplicar el procedimiento.
Tab^a 3
Dimensíón
log L
N.Q parám.
AIC
VAF
á
á
^
b
T=2
55.669
23
-65.339
.8532
.0176
.532
-.21
T=3
77.811
33
-89.622
. 9614
.0108
.547
--.28
UN MO[)ka.O PARA Fl... ESTI.JDlO DE L.A VARIABII..IDAI) C)l^ LO5 ESTIMULC)S EN MDS
li^
donde se puede notar que ias consideraciones efectuadas anteriormente para el
problema de la dimensionalidad indican que en este caso la canfiguración en dimensión 3 proporciona significativamente un rnejor ajuste, tanto en lo que se refiere al tanto por ciento de variabilidad explicada como al estadístico AIC respecto de la logverosimilitud asociada a dicha configuración.
Figura 3
0.5
N
C
`^
O
^
--0.5
-1.5
--1.5
--0.5
0
0.5
1
1.5
Dimensión t
Por otra parte, se trata de calibrar la incidencia dimensional de un estímulo
con una variabilidad significativamente más alta que el resto. Aunque en la figura 3 se observa que ia configuración en dimensión 2 es, muy similar a la del
caso anterior, la tabla siguiente:
Tabla 4
Estímulo
A
B
D
T=2
.00
. 00
.76
T^ 3
.00
.02
.00
D
E
F
G
H
I
J
. 89
2.57
.00
.00
.00
.00
6.61
1.03
1.28
.00
.44
.00
2.20
4.95
f^STA[)ISTI('A f^tiPAÑ()t_A
muestra claramente que en dimensión 2, al estímulo J le corresponde una estimacián para su término de varíabilidad significativamente mayor que la del resto
de los estímulos salvo, como era de esperar, el del estímulo centroide de la configuracióra. Por otra parte, en dimensión 3 dicha estimación disminuye considerablemente para el estímulo J, cuestión achacable al aumento de la dimensión.
5.
REFERENCIAS
AKAlKE, H. (1974): «A New Look at the Statistical Model fdentification», IEEE
Transactions on Auiomatic Control, 19, 716-723.
B©cK, R. D. (1975): Multivariate Statistica/ Methods in Behavioura/ Research,
^
McGraw-Hi11.
GARCíA-LÓPEZ, P. A. (1994): Inferencia en MDS no métrico, Tesis Doctoral, Universidad de Granada.
GARCÍA-LÚPEZ, P. A.; GONZÁLEZ, A., y VERA, J. F. (1993): «Contríbutions to the
Nonmetric Maximum Likelihood MDS from Directional Rankings af Similarities Method», Proceedings of the 1993 European Meeting of the Psychometríc Society.
JEDIDI, .K., y DESARBO, W. S. (1991): «A Stochastic MDS Procedure for the Spatial Representation of Three-Mode, Three-Way Pick Any/j Data», Psychometrika, 56, 471-494.
PowELL, M. J. D. (1977): «Restart Procedures for the Conjugate Gradient
Method^^, Mathematical Programming, 12, 241-254.
RAMSAY, J. O. (1973): «The Effect of Number of Categories in Rating Scales on
Estimation of Scale Values», Psychometrika, 38, 513-532.
(1977): «Maximum Likelihood Estimation in Multidimensional Scaling», Psychomet^ika, 42, 241-266.
(1978) : «Confidence Regions for M DS Analysis», Psychometrika, 43, 145160.
TAKANE, Y. (1981): «Multidimensional Successive Categories Scaling: A Maximum Likelihood Method», Psychometrika, 46, 9-28.
TAKANE, Y., y Carrofl, J. D. (1981): «Nonmetric Maximum Likelíhood MDS from
Directional Rankings of Similarities», Psychometrika, 46, 389-406.
TAKANE, Y.; YouNG, F. W., y DE LEEUw, J. (1977): «Nonmetríc Individual Differences MDS: An alternating Leasi Squares Method with Optima! Scaling Features», Psychometrika, 42, 7-67.
l1N MOi)f-:l.O PARA EL t:STllDlf) UE l.A VARtAHILI[)AD C>F, l.OS ^_S"T1Ml'I Ofi FN M[)ti
i$ ^
TNISTED, R. A. (1988): E/ements of Statistica/ Computing. Nurnerical Computation, Chapman & Hall.
TORGERSON, W. S, (1952): «Multidimensionai scaling: f Theory and Methodsi>,
Psychometrika, 17, 401-419.
WINSBERG, S., y Carroll, J. D. (1989}: ^p^ cuasi-Nonmetric Method for Multidimensiona! Scaling via an Extended Euclidean Model», Psychometrika, 54, 217229.
YouNG, G., y HouSEHOLDER, A. S. (1938): «Discussion of a set of points in terms
of their mutual distances», Psychometrika, 3, 19-22.
APENDICE
Las derivadas parciales necesarias en los procedimientos iterativos vienen
dadas por las expresiones siguientes:
aF;^m
aF;jm
c^d^j
ax4r
ad;^r
ax4t
a Fijm
[ ^ 4]
. _ _F^/m ( ^ _ F^jm ) S^j
ad,j
ad;j
:
[ 15]
(S;t - sjt> (Xit - Xjr^
con 8 la delta de Kronecker.
á F,^,,,,
- F^ jm (1 -' FjÍm ) s^ j
abm
a F^^m
aCi
a F^jm
acx
.^
^
S^^
i
_
F^^m }
F^^m (1
-F^^m (1
_
a a^^m
S^l
F^^m ) 2a , c?^1m
r
[ 18]
[ 19]
i$2
ESTa[^IST1Ca ESPawc)La
A MODEL FOR THE EVALUATIt3N OF STIMULt VARtABILITY
IN MDS CLASSIFICATION DATA
SUMMARY
We propose a confirmatory multídimensional scaling (MDS) twoway modei. Data are similarities obtained by the model of successive
categories proposed by Takane (1981). As a basic aspect, the model
has a variability factor for stimuli. A maximum likelihood procedure is
developed for parameters estimation. The computational treatment is
based on a conjugate gradient algorithm with automatic restarts.
Key words: multidimensional scaling, meihod of successive categories, maximum likelihood configuration, variability of stimuti.
AMS Classification: fi5U05.
Descargar