RELACIÓN ENTRE VARIABLES Estadística descriptiva bidimensional Tema 4 Introducción El tema anterior dedicado al estudio de una única variable. En la mayoría de estudios estadísticos intervienen DOS O MÁS ◦ Además de una descripción individual.. ◦ …es necesario estudiar las relaciones entre ellas. Caso más simple: dos variables del mismo tipo Distribuciones bidimensionales ◦ ¿Existe relación entre ellas? ◦ ¿Con qué intensidad? Introducción Distribuciones bidimensionales ◦ Cada observación posee dos caracteres o variables: peso y altura, edad y salario, sexo y color de ojos, etc. ◦ X e Y son las variables. X1, X2,. . . ,Xp los valores que toma la variable X Y1, Y2,. . . ,Yq los valores de la variable Y. ◦ Al par de variables (X, Y) lo llamaremos distribución bidimensional y sus valores serán los pares de valores Xi,Yj ). ◦ Los procedimientos para dos variables (estadística descriptiva bidimensional) se pueden generalizar para más de dos variables (estadística descriptiva multidimensional). Introducción Distribuciones bidimensionales ◦ Las distribuciones bidimensionales se pueden representar de dos maneras Tablas simples Tablas de doble entrada Cuando las dos variables que componen la distribución bidimensional son variables cualitativas tablas de contingencia. Cuando las dos variables que componen la distribución bidimensional son variables cuantitativas tablas de correlación. Introducción Distribuciones bidimensionales ◦ Las distribuciones bidimensionales se pueden representar de dos maneras Tablas simples Los datos aparecen ordenados en columans sucesivas junto con los valores de las variables a las que hacen referencia X Y f ij X1 Y1 f11 … … … X1 Yq fiq X2 Y1 f21 … … … X2 Yq f2q … … … Xp Yq fpq Introducción Distribuciones bidimensionales ◦ Las distribuciones bidimensionales se pueden representar de dos maneras Tablas simples: encuesta sobre el problema más grave que se enfrenta la sociedad. Variable X: principal problema Variable Y: grupos de edad X Y f ij Corrupción Jóvenes 70 Corrupción Adultos 55 Corrupción Ancianos 110 Economía Jóvenes 90 Economía Adultos 75 Economía Ancianos 130 Paro Jóvenes 140 Paro Adultos 115 Paro Ancianos 35 Introducción Distribuciones bidimensionales ◦ Las distribuciones bidimensionales se pueden representar de dos maneras Tablas de doble entrada X X1 X2 … Xi … Xp f11 f21 … fi1 … fp1 Y2 f12 f22 … fi2 … fp2 … … … … … … … Yj f1j f2j … fij … fpj … … … … … … … Yq f1q f2q … fiq … fpq Y Y1 donde fij es la frecuencia conjunta de (Xi , Yj ), es decir, el número de individuos de la muestra que toman el valor Xi para la variable X y el valor Yj para la variable Y . Introducción Distribuciones bidimensionales ◦ Las distribuciones bidimensionales se pueden representar de dos maneras Tablas de doble entrada: Corrupción Economía Paro Jóvenes 70 90 140 Adultos 55 75 115 Ancianos 110 130 35 Introducción Distribuciones bidimensionales ◦ Distribución marginal Frecuencias absolutas obtenidas sumando todas las frecuencias de las filas (var Y) y de las columnas (var X) X X1 X2 … Xi … Xp fi• f11 f21 … fi1 … fp1 f•1 Y2 f12 f22 … fi2 … fp2 f•2 … … … … … … … Yj f1j f2j … fij … fpj … … … … … … … Yq f1q f2q … fiq … fpq f•q fi• f1• f2• … fi• … fp• n Y Y1 f•j