3.6.2.1. Distribución Ji Cuadrada

Anuncio
Estrategia didáctica. 3.6.2.1. Distribución Ji Cuadrada
Comentario: Cuando se tienen variables en escalas nominales, es necesario encontrar la
asociación entre las variables, para lo cuál el coeficiente “Q” de Kendall se puede
considerar este coeficiente, y para determinar si la asociación es significativa o se debe al
azar , es necesario emplear la prueba de significación Ji Cuadrada. El coeficiente “Q” se
utiliza en cuadros de 2 x 2 y el de Pearson “C” para cuadros de 2 x3 o de 3 x3.
El coeficiente “Q” de Kendall, mide la asociación entre dos variables a nivel nominal y se
usa en cuadros de 2 x 2
-1 < Q < 1
Si
Q = -1  disociación entre variables
Q = 1  asociación total
Q = 0  no hay relación entre las variables, que es diferente de que exista
disociación completa.
Valor del coeficiente “Q” de Kendall
Magnitud dela correlación o
asociación
< .25
Baja
.25 - .45
Media baja
.46 - .55
Media
.56 - .75
Media alta
> .75
Alta
Cuadro teórico para el coeficiente “Q” de Kendall
A
B
C
D
1
𝑄=
𝐴𝐷 − 𝐵𝐶
𝐴𝐷 + 𝐵𝐶
Considerando la siguiente información de asistencia escolar de los hijos y alfabetismo de
los padres, qué tipo de asociación de tendría:
Asisten sus hijos a la
escuela
Padres
alfabetas
si
no
si
40
10
no
15
35
𝑸=
𝟒𝟎 ∗ 𝟑𝟓 − 𝟏𝟓 ∗ 𝟏𝟎
= 𝟎. 𝟖𝟑
𝟒𝟎 ∗ 𝟑𝟓 + 𝟐𝟓 ∗ 𝟏𝟎
Es decir existe una asociación alta entre asistencia a la escuela y la condición de
alfabetismo.
Para determinar si esta relación es significativa o se debe al azar, es necesario utilizar la
prueba de significación (Ji Cuadrada)
∑
(𝑓𝑜 − 𝑓𝑒)2
𝑓𝑒
fo : frecuencia observada
fe: frecuencia esperada
Las fe se obtienen y se presentan en el Cuadro teórico siguiente:
𝐴=
𝑛1 ∗ 𝑛3
𝑁
𝐵=
𝑛1 ∗ 𝑛4
𝑁
n1
2
𝐶=
𝑛2 ∗ 𝑛3
𝑁
𝐷=
n3
𝑛2 ∗ 𝑛4
𝑁
n2
n4
N
Las frecuencias esperadas (fe) están en cursivas:
40
27.5
10
22.5
50
15
27.5
35
22.5
50
55
45
100
Cálculo de la Ji Cuadrada
Casilla
fo
fe
fo - fe
(fo – fe)2
(fo – fe)2
𝑓𝑒
A
40
27.5
12.5
156.25
5.68
B
15
27.5
-12.5
156.25
5.68
C
10
22.5
-12.5
156.25
6.94
D
35
22.5
12.5
156.25
6.94
100.0
100.0
Ji cuadrada
25.24
Ji Cuadrada, es para variables de escala nominal
Hipótesis: Ho: no existe relación entre las variables
95% de confianza  5% de error
3
Ji Cuadrada = 3.84
Grados de libertad:
(número de columnas – 1) * (número de renglones -1)
(2 -1)*(2-1) = 1
Si la Ji Cuadrada calculada > Ji Cuadrada teórica  entrará en la región crítica entonces
H0 se rechazará, es decir la relación entre las dos variables de análisis es significativa con
95% de confianza (1 - ), es decir se tiene 5% de probabilidad de que no sea.
Resultado de búsqueda en Ji Cuadrada en la HE:
Resultado en GeoGebra:
Cuando el cuadro es de 2 x 3 o de 3 x 3 se utilizar el coeficiente “C” de Pearson
4
𝐽𝑖 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎
𝐶=√
𝐽𝑖 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎 + 𝑁
Ejemplo:
Sus hijos asisten a la escuela
Siempre
Está de acuerdo
con el método
de enseñanza
del profesor
Algunas veces
Nunca
Si
No
Indiferente
Resolver los siguientes ejercicios:
1. En un estudio para determinar si el cáncer de pecho tiende a extenderse en las
familias, los Drs. McKarthur y Hill investigaron la frecuencia de cáncer mamario
encontrado en familias de mujeres con cáncer de pecho. Los datos se presentan a
continuación, los datos se refieren a las madres de los sujetos.
Cáncer mamario en el sujeto
Cáncer
mamario en la
madre
Si
No
Total
Si
7
3
10
No
193
197
390
Total
200
200
400
2. Por medio de un cuestionario tomado en 2006, a profesores varones que recibían
pensiones fueron clasificados según hábitos de fumar: los no fumadores y los
fumadores y fumadores de pipa. Después se obtuvo el acta de defunción
correspondiente a cada uno de los pensionados que fallecieron durante los seis años
subsecuentes, obteniéndose la:
5
Clasificación de varones pensionados, según su hábito de fumar y su mortalidad en
un lapso de seis años:
No fumadores
Fumadores de pipa
Total
Muertos
117
54
171
Vivos
950
384
1334
Total
1067
402
1505
% muertos
11.0
13.4
Respuesta con GeoGebra:
Se rechaza la hipótesis ya que la Chi cuadrada calculada (.5732) < Chi
cuadrada de tablas (3.84).
3. Se han relacionado la confesión religiosa y la filiación política y los datos se han
resumido en le siguiente cuadro de contingencia:
Supuestos:
Nivel de medición: dos escalas nominales
Modelo: muestra aleatoria independiente
Hipótesis: no existen diferencias entre las poblaciones confesionales con
relación con la preferencia política.
6
Conclusión: la Chi Cuadrada de tablas para 4 grados de libertad con un nivel de
significancia del 95% es 9.4877 y la de los datos es 43.8102 es decir la Ho: nula se
rechaza, es decir que si existe significancia entre las confesiones y los partidos políticos.
4. En la ciudad de Monterrey, las familias de alto ingreso generalmente envían a sus
hijos a escuelas particulares, en tanto que las familias de bajo ingreso los envían a
escuelas oficiales. Con objeto de someter a prueba esta hipótesis, se escogen 150
familias al azar y se obtiene los siguientes datos:
Utilizar un nivel de significancia del 95% para rechazar la hipótesis nula Ho:
hay independencia entre el monto del ingreso familiar y el tipo de escuela al
que se envía a los hijos.
7
Decisión estadística: Como 69.8588 ∈ [3.84, ∞ > se rechaza Ho.
Conclusión: Se puede decir , que con un 95% de confianza, son independientes el
monto del ingreso familiar y el tipo de escuela al que se envía a los hijos.
5. Plantear 2 problemas para determinar el nivel de asociación y nivel de significancia.
8
Guardar con el nombre nombre-apellido.E3.6.2.1.Dist.Ji-grupo.doc
9
Descargar