Distancia entre dos columnas de una tabla F(I x J)

Anuncio
6. Definición del modo digital de resumir
la información de la Tabla F
✔ Distancia entre dos líneas de una tabla F(I x J) :
d (2i ,i' )
2
J
 nij ni' j 
2
= ∑ −
 = ∑ ( f ij − fi' j ) ∀ i ,i'
n.. 
j =1  n..
j =1
J
✔ Distancia entre dos columnas de una tabla F(I x J) :
d
2
( j , j' )
2
J
 nij nij' 
2
= ∑  −  = ∑ ( fij − f ij' ) ∀ j, j'
n.. 
i =1  n..
j =1
K
7. La Tabla F «conserva» la información
✔ La representación de la tabla T es homotética a la
representación de la tabla F.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°21
8. Distorsión de la información de la Tabla F
✔ El tamaño de la tabla observada no es el único factor de
posibles distorsiones de la lectura de la información.
✔ Comparando así dos elementos línea (columna) de la
tabla F ¿se comparan objetos comparables...?
Debemos mejorar la definición de los contenidos
de la información de una Tabla de Contingencia
a fin de comparar elementos comparables.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°22
9. Representación de la información en
términos de comparación de perfiles
a) Definición de los perfiles de los
elementos de la Tabla T
à PERFILES EN LÍNEA DE UNA TABLA T :
nij
f =
∀i = 1, ..., K ; ∀j = 1, ..., J
ni .
J
J n
ni.
1 J
ij
L
∑ f ij = ∑ = ∑ nij = = 1
ni.
ni. j =1
j =1
j =1 ni.
L
ij
y
à PERFILES EN COLUMNA DE UNA TABLA T :
nij
f =
∀i = 1, ..., K ; ∀j = 1, ..., J
n. j
I
I n
n. j
1 I
ij
C
∑ f ij = ∑ n = n ∑ nij = n = 1
i =1
i =1 . j
. j j =1
.j
C
ij
y
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°23
b) Definición de los perfiles de la tabla F
à PERFILES EN LÍNEA DE UNA TABLA F :
fij
f =
∀i = 1, ..., K ; ∀j = 1, ..., J
fi.
J
J f
fi.
1 J
ij
L
∑ f ij = ∑ f = f ∑ f ij = f = 1
j =1
j =1 i.
i. j =1
i.
L
ij
y
à PERFILES EN COLUMNA DE UNA TABLA F :
fij
f =
∀i = 1, ..., K ; ∀j = 1, ..., J
f. j
I
I f
f. j
1 I
ij
C
∑ f ij = ∑ f = f ∑ fij = f = 1
i =1
i =1 . j
. j j =1
.j
C
ij
y
➨
Perfil línea(columna) : distribución de frecuencias de
la subpoblación en línea (columna) para cada uno de
los caracteres en columna (línea).
L
➨ f ij
: es la proporción de la i-ésima subpoblación que
presenta la modalidad j de la variable en columna.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°24
c) Representación de la información en
términos de comparación de perfiles
✔
✔
Se asocia a la Tabla T, o a la Tabla F, dos tablas de perfiles.
Para comunicar la información contenida en esas tablas, se
utilizan las representaciones analógicas y digitales que ya
hemos visto.
d) Representación gráfica (analógica) de la
información de las tablas de perfiles
✔ Podemos materializar sobre esos gráficos las
«distancias» relativas entre esos puntos-perfiles
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°25
e) Representación digital de la información
de las tablas de perfiles
✔ Distancia entre dos perfiles-línea de la Tabla F:

= ∑
j =1 
J
d(i,i')
f ij fi'j 
− 
fi. f i'. 
2
∀i, i'
✔ Distancia entre dos perfiles-columna de la Tabla F:
 f ij fij ' 
= ∑  −

f . j' 
i =1  f . j
I
d( j , j' )
2
∀ j , j'
El índice d (i, i') o d(j, j') evalúa la «distancia» que caracteriza
la semejanza entre dos perfiles en el espacio euclidiano de
representación de los mismos.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°26
f) Representación gráfica de la información
contenida en una Tabla de Contingencia
✔
Distancia entre dos puntos-columna d(j,j') :
grado de semejanza entre dos elementos.
Se verifica que :
d( j , j' ) = ∑ ( f − f
3
i =1
C
ij
)
C 2
ij '
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
 fij fij' 
= ∑  −

f . j' 
i =1  f . j
3
2
Tr. N°27
10. Relación entre la información de las tablas
de perfiles y la información de la tabla F
TRANSFORMACIÓN DE LOS ESPACIOS DE REPRESENTACIÓN
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°28
✔ Cada eje sufre una dilatación diferente proporcional al
«peso» del elemento en la Tabla F.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°29
Las distancias también se transforman...
à Distancia entre dos líneas de la Tabla F :
d(i,i') = ∑ ( f ij − fi'j )
J
2
j =1
à Distancia entre dos perfiles-líneas asociados a la Tabla F :
d( i ,i' )
2

= ∑
j =1 
J
2
1
=
−
(
)
f
f
f
f
∑
i. i' j
f i. fi'. j =1 i'. ij
J
fij f i' j 
−

f i . fi'. 
11. Distorsión de la información aportada
por las Tablas de Perfiles
✔ La corrección de la información, mediante la comparación
de los perfiles, es aún insuficiente....
Por ello, es necesario comparar los perfiles...
ponderados.
Pr
ograma PREST
do CRIVISQ
A - 1999 - Eduar
UI
Programa
Eduardo
PRESTA
RIVISQUI
Tr. N°30
Descargar