TEMA 5: TRANSFORMACIONES LINEALES
● En muchas ocasiones transformar el conjunto de datos de
una
variable
facilita
su
estudio,
ya
que
genera
distribuciones más simples y con buenas propiedades
(Ejemplo: simetría, media cero, desviación típica igual a
uno…).
● En los temas anteriores ya hemos visto el efecto que tenían
algunas transformaciones de los datos en las medidas de
posición y dispersión estudiadas.
● En este tema nos vamos a centrar en las transformaciones
lineales (repasando sus efectos sobre las principales
medidas de descripción numérica de los datos) y
especialmente en los datos tipificados.
1
Transformaciones lineales en las variables
● La transformación lineal en los datos consiste en
multiplicarlos todos por un mismo número y luego
sumarles una cantidad igual a todos.
● Es decir, si se dispone de los datos:
x1 , x2 ,..., x N
los nuevos datos:
y1 ax1 b, y2 ax2 b, ..., y N ax N b
son una transformación lineal de los iniciales.
● Ejemplo: y ax b
x
1
2a
b2
3
3
x1 6, x2 3, x3 0, x4 6, x5 9
x1
x
x
2 0, y2 2 2 1, y3 3 2 2,
3
3
3
x
x
y4 4 2 4, y5 5 2 5
3
3
y1
2
● Recordemos de los temas anteriores el efecto de las
transformaciones lineales sobre las medidas de posición y
dispersión:
Si y ax b entonces:
Medidas de posición:
Media
→ y ax b
Mediana
→ med y amed x b
Medidas de dispersión:
Desviación típica
→ S y a Sx
MEDA
→ MEDAy a MEDAx
Rango Intercuartílico → RI y a RI x
3
Datos tipificados
● La transformación lineal más importante desde el punto de
vista estadístico consiste en tipificar las observaciones.
● Dado un conjunto de datos:
x1 , x2 ,..., x N
las observaciones tipificadas se construyen restando a cada
dato la media x y dividiéndolo por la desviación típica S x .
Así, los datos tipificados serán:
z1
● Al
x1 x
x x
x x
, z2 2
, ..., z N N
Sx
Sx
Sx
tipificar
una
variable
estamos
transformación lineal z ax b en la que:
a
1
Sx
b
4
x
Sx
haciendo
una
● El conjunto de datos tipificado tiene media cero y
desviación típica uno, es decir, z 0 y Sz 1.
z ax b
Sz a S x
x
x
0
Sx Sx
Sx
1
Sx
Ejemplo:
Dado el conjunto de datos:
x1 2 x2 4 x3 6 x4 8
con:
4
x
x
i
i1
4
20
5
4
4
Sx
x
2
i
i1
4
x2
120
25 2,236
4
5
los datos tipificados serán:
25
45
1,342 z2
0,447
2,236
2,236
65
85
z3
0,447 z4
1,342
2,236
2,236
z1
con:
4
z
z
i
i1
4
0
0
4
4
Sz
z
2
i
i1
4
z2
4,001
1
4
● Una variable tipificada expresa el número de desviaciones
típicas que cada observación dista de la media. Esto nos
permite comparar la posición relativa de cada dato en
diferentes distribuciones.
6
Ejemplo:
Los estudiantes de una clase han realizado dos pruebas: A
y B.
Prueba A: Calificación media= x A 6,23 con Sx A 2,3
Prueba B: Calificación media= x B 5,2
con Sx B 1,3
Un estudiante ha obtenido 6,84 en la prueba A y 6,31 en la
B, ¿qué resultado es mejor comparativamente?
El 6,31 de la prueba B
Si tipificamos ambos resultados con respecto a sus
distribuciones tenemos:
6,84 6,23
0,26
2,3
6,31 5,2
zB
0,85
1,3
zA
El resultado de 6,31 en B es comparativamente mejor que
el 6,84 en A, aunque éste último sea mayor en términos
absolutos. (Ver Figura 6.1 de Peña y Romo)
7
Ejercicio:
Las notas finales de una clase han sido:
Matemáticas:
x M 4 Sx M 18
,
Dibujo:
xD 7 S x D 1
Un alumno obtuvo un 6,25 en matemáticas y un 8 en
dibujo, ¿En qué asignatura tuvo mejor posición relativa?
Si tipificamos cada valor respecto a su distribución:
zM
6,25 4
1,25
1,8
zD
87
1
1
Comparado con el resto de la clase ha obtenido mejor
calificación en Matemáticas.
8