Estrategia didáctica. 3.6.2.1. Distribución Ji Cuadrada Comentario: Cuando se tienen variables en escalas nominales, es necesario encontrar la asociación entre las variables, para lo cuál el coeficiente “Q” de Kendall se puede considerar este coeficiente, y para determinar si la asociación es significativa o se debe al azar , es necesario emplear la prueba de significación Ji Cuadrada. El coeficiente “Q” se utiliza en cuadros de 2 x 2 y el de Pearson “C” para cuadros de 2 x3 o de 3 x3. El coeficiente “Q” de Kendall, mide la asociación entre dos variables a nivel nominal y se usa en cuadros de 2 x 2 -1 < Q < 1 Si Q = -1 disociación entre variables Q = 1 asociación total Q = 0 no hay relación entre las variables, que es diferente de que exista disociación completa. Valor del coeficiente “Q” de Kendall Magnitud dela correlación o asociación < .25 Baja .25 - .45 Media baja .46 - .55 Media .56 - .75 Media alta > .75 Alta Cuadro teórico para el coeficiente “Q” de Kendall A B C D 1 𝑄= 𝐴𝐷 − 𝐵𝐶 𝐴𝐷 + 𝐵𝐶 Considerando la siguiente información de asistencia escolar de los hijos y alfabetismo de los padres, qué tipo de asociación de tendría: Asisten sus hijos a la escuela Padres alfabetas si no si 40 10 no 15 35 𝑸= 𝟒𝟎 ∗ 𝟑𝟓 − 𝟏𝟓 ∗ 𝟏𝟎 = 𝟎. 𝟖𝟑 𝟒𝟎 ∗ 𝟑𝟓 + 𝟐𝟓 ∗ 𝟏𝟎 Es decir existe una asociación alta entre asistencia a la escuela y la condición de alfabetismo. Para determinar si esta relación es significativa o se debe al azar, es necesario utilizar la prueba de significación (Ji Cuadrada) ∑ (𝑓𝑜 − 𝑓𝑒)2 𝑓𝑒 fo : frecuencia observada fe: frecuencia esperada Las fe se obtienen y se presentan en el Cuadro teórico siguiente: 𝐴= 𝑛1 ∗ 𝑛3 𝑁 𝐵= 𝑛1 ∗ 𝑛4 𝑁 n1 2 𝐶= 𝑛2 ∗ 𝑛3 𝑁 𝐷= n3 𝑛2 ∗ 𝑛4 𝑁 n2 n4 N Las frecuencias esperadas (fe) están en cursivas: 40 27.5 10 22.5 50 15 27.5 35 22.5 50 55 45 100 Cálculo de la Ji Cuadrada Casilla fo fe fo - fe (fo – fe)2 (fo – fe)2 𝑓𝑒 A 40 27.5 12.5 156.25 5.68 B 15 27.5 -12.5 156.25 5.68 C 10 22.5 -12.5 156.25 6.94 D 35 22.5 12.5 156.25 6.94 100.0 100.0 Ji cuadrada 25.24 Ji Cuadrada, es para variables de escala nominal Hipótesis: Ho: no existe relación entre las variables 95% de confianza 5% de error 3 Ji Cuadrada = 3.84 Grados de libertad: (número de columnas – 1) * (número de renglones -1) (2 -1)*(2-1) = 1 Si la Ji Cuadrada calculada > Ji Cuadrada teórica entrará en la región crítica entonces H0 se rechazará, es decir la relación entre las dos variables de análisis es significativa con 95% de confianza (1 - ), es decir se tiene 5% de probabilidad de que no sea. Resultado de búsqueda en Ji Cuadrada en la HE: Resultado en GeoGebra: Cuando el cuadro es de 2 x 3 o de 3 x 3 se utilizar el coeficiente “C” de Pearson 4 𝐽𝑖 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎 𝐶=√ 𝐽𝑖 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎 + 𝑁 Ejemplo: Sus hijos asisten a la escuela Siempre Está de acuerdo con el método de enseñanza del profesor Algunas veces Nunca Si No Indiferente Resolver los siguientes ejercicios: 1. En un estudio para determinar si el cáncer de pecho tiende a extenderse en las familias, los Drs. McKarthur y Hill investigaron la frecuencia de cáncer mamario encontrado en familias de mujeres con cáncer de pecho. Los datos se presentan a continuación, los datos se refieren a las madres de los sujetos. Cáncer mamario en el sujeto Cáncer mamario en la madre Si No Total Si 7 3 10 No 193 197 390 Total 200 200 400 2. Por medio de un cuestionario tomado en 2006, a profesores varones que recibían pensiones fueron clasificados según hábitos de fumar: los no fumadores y los fumadores y fumadores de pipa. Después se obtuvo el acta de defunción correspondiente a cada uno de los pensionados que fallecieron durante los seis años subsecuentes, obteniéndose la: 5 Clasificación de varones pensionados, según su hábito de fumar y su mortalidad en un lapso de seis años: No fumadores Fumadores de pipa Total Muertos 117 54 171 Vivos 950 384 1334 Total 1067 402 1505 % muertos 11.0 13.4 Respuesta con GeoGebra: Se rechaza la hipótesis ya que la Chi cuadrada calculada (.5732) < Chi cuadrada de tablas (3.84). 3. Se han relacionado la confesión religiosa y la filiación política y los datos se han resumido en le siguiente cuadro de contingencia: Supuestos: Nivel de medición: dos escalas nominales Modelo: muestra aleatoria independiente Hipótesis: no existen diferencias entre las poblaciones confesionales con relación con la preferencia política. 6 Conclusión: la Chi Cuadrada de tablas para 4 grados de libertad con un nivel de significancia del 95% es 9.4877 y la de los datos es 43.8102 es decir la Ho: nula se rechaza, es decir que si existe significancia entre las confesiones y los partidos políticos. 4. En la ciudad de Monterrey, las familias de alto ingreso generalmente envían a sus hijos a escuelas particulares, en tanto que las familias de bajo ingreso los envían a escuelas oficiales. Con objeto de someter a prueba esta hipótesis, se escogen 150 familias al azar y se obtiene los siguientes datos: Utilizar un nivel de significancia del 95% para rechazar la hipótesis nula Ho: hay independencia entre el monto del ingreso familiar y el tipo de escuela al que se envía a los hijos. 7 Decisión estadística: Como 69.8588 ∈ [3.84, ∞ > se rechaza Ho. Conclusión: Se puede decir , que con un 95% de confianza, son independientes el monto del ingreso familiar y el tipo de escuela al que se envía a los hijos. 5. Plantear 2 problemas para determinar el nivel de asociación y nivel de significancia. 8 Guardar con el nombre nombre-apellido.E3.6.2.1.Dist.Ji-grupo.doc 9