Distribución chi – cuadrado: 1. Prueba de independencia. 2. Prueba de homogeneidad de poblaciones Ing. WILFREDO MORMONTOY LAUREL MPH 19/07/2021 Wilfredo Mormontoy Laurel MPH 1 Prueba chi - cuadrado (2) 1. Definición Es toda prueba de significación estadística en la que el estadístico utilizado sigue la distribución 2 , si la H0 es cierta. En nuestras aplicaciones usaremos el siguiente estadístico: 2 (O i E i ) Ei 2 Donde: Oi = Frecuencias absolutas observadas Ei = Frecuencias absolutas esperadas 2 mide el grado de acuerdo entre frecuencias observadas y esperadas, suponiendo que H0 es verdadera. 19/07/2021 Wilfredo Mormontoy Laurel MPH 2 2. Distribución chi - cuadrado Familia de curvas asimétricas, una es diferente de otra en base a los grados de libertad (k). A medida que aumenta k, las curvas son menos asimétricas y más extendidas a la derecha: 19/07/2021 Wilfredo Mormontoy Laurel MPH 3 3. Aplicaciones Las aplicaciones más importantes de la distribución chi - cuadrado, son: Con una sola variable: Prueba de bondad de ajuste, ejemplo, prueba de normalidad Con dos variables: Prueba de independencia Prueba de homogeneidad de poblaciones. Estudiaremos estas dos aplicaciones que son las más usadas en investigaciones biomédicas tanto descriptivas como analíticas. 19/07/2021 Wilfredo Mormontoy Laurel MPH 4 PRUEBA DE INDEPENDENCIA Mayor posibilidad de uso en estudios descriptivos. Con una población. Se determina la posible asociación entre dos variables cualitativas. H0: Las dos variables son independientes. H1: Las dos variables no son independientes. 19/07/2021 PRUEBA DE HOMOGENEIDAD Mayor uso en estudios analíticos. Con dos o más poblaciones. Se determina si las poblaciones son homogéneas respecto a una variable cualitativa Ho: Las poblaciones son homogéneas respecto a la variable en estudio. H1: Las poblaciones no son homogéneas respecto a la variable. Wilfredo Mormontoy Laurel MPH 5 Prueba de independencia Permite determinar si dos variables cualitativas nominales son independientes (no están asociadas) cuando ambas se han medido en la misma unidad de análisis. Las n unidades de análisis se clasifican en categorías mutuamente excluyentes de modo que las frecuencias se presentan en una tabla de contingencia bivariada o de doble entrada o tabla de f filas x c columnas. Los totales marginales no están controlados por el investigador. 19/07/2021 Wilfredo Mormontoy Laurel MPH 6 Prueba de independencia Ejemplo En un estudio transversal se desea determinar la posible asociación entre tenencia de animales en el domicilio y parasitosis en niños menores de diez años. Los resultados se muestran en la tabla de contingencia siguiente. Tenencia de animales 19/07/2021 Parasitosis Total Si No Si 60 30 90 No 20 40 60 Total 80 70 150 Wilfredo Mormontoy Laurel MPH 7 Prueba de independencia 1. Planteamiento de hipótesis H0: No existe asociación entre tenencia de animales y parasitosis H1: Existe asociación entre tenencia de animales y parasitosis. 2. Nivel de significación: α = 0,05 3. Grados de libertad: G.l.= (f – 1)(c – 1) = (2-1)(2-1) = 1 19/07/2021 Wilfredo Mormontoy Laurel MPH 8 Prueba de independencia 19/07/2021 Tenencia de animales Si No Si 60 (48) 30 (42) 90 No Total 20 (32) 40 (28) 60 80 70 150 Parasitosis Wilfredo Mormontoy Laurel MPH Total 9 Prueba de independencia 5. Valor de P: De la tabla de distribución de 2 con g.l. = 1 y para χ2 = 16,071 calculado, P < 0,001 Con computadora el valor de P = 0,000 6. Decisión y conclusión: Decisión: Siendo P < 0,05, se rechaza Ho. Conclusión: La asociación entre tenencia de animales en el domicilio y parasitosis es estadísticamente significativa. (P = 0,000). ¿Sobre esta base, se puede afirmar que un posible factor causal de parasitosis es tenencia de animales? Justifique su respuesta. 19/07/2021 Wilfredo Mormontoy Laurel MPH 10 Prueba de homogeneidad de poblaciones 19/07/2021 Se aplica cuando se desea conocer si dos o más muestras provienen de poblaciones homogéneas Tiene mayor posibilidad de uso en estudios analíticos. La hipótesis nula establece que las muestras provienen de la misma población o que las poblaciones son homogéneas respecto a la variable de interés o no difieren significativamente respecto a la variable de interés. Wilfredo Mormontoy Laurel MPH 11 Ejemplo En un ensayo clínico con niños con asma crónica, se determinó la eficacia de salbutamol más bromuro de ipratropio (SAL + BI) y salbutamol (SAL). Los resultados respecto a la mejoría del trastorno obstructivo a los 15 minutos de iniciados los tratamientos, fueron: Mejoraron Total Tratamiento Si No SAL + BI 35(30) 5(10) 40 SAL 25(30) 15(10) 40 Total 60 20 80 ¿Difieren los tratamientos respecto a la proporción de pacientes con mejoría del trastorno obstructivo a los 15 minutos? 19/07/2021 Wilfredo Mormontoy Laurel MPH 12 1. Hipótesis Ho: Los tratamientos no difieren significativamente en cuanto a la proporción de pacientes con mejoría de trastorno obstructivo a los 15 minutos. (Las dos poblaciones de pacientes, que reciben el tratamiento, son homogéneas respecto a la mejoría del trastorno obstructivo ) H1: Los tratamientos difieren significativamente en cuanto a la proporción de pacientes con mejoría de trastorno obstructivo a los 15 minutos. (Las dos poblaciones de pacientes, que reciben el tratamiento, no son homogéneas respecto a la mejoría del trastorno obstructivo) Preguntas previas: 1) ¿Cuál es la diferencia observada de mejoría a favor de (SAL + BI) frente a SAL? 2) ¿Esta diferencia siempre será de esa magnitud cada vez que se replique el estudio? 19/07/2021 Wilfredo Mormontoy Laurel MPH 13 Prueba de homogeneidad de poblaciones 19/07/2021 Wilfredo Mormontoy Laurel MPH 14 Prueba de homogeneidad de poblaciones 3. Valor de P. De la tabla, con g.l.= 1 y para χ2 = 6,667 calculado, 0,005 < P 0,010. La computadora proporciona P = 0,010 4. Decisión y conclusión. Decisión: Siendo P 0,05, se rechaza H0. Conclusión: La proporción de pacientes que mejoraron habiendo recibido salbutamol más bromuro de ipratropio difiere de la proporción de pacientes que mejoraron habiendo recibido solo salbutamol, a los 15 minutos. (P = 0,010). 19/07/2021 Wilfredo Mormontoy Laurel MPH 15 En resumen La prueba de 2 se aplica en tablas de contingencia (prueba de independencia o de homogeneidad de poblaciones) si las variables son cualitativas con nivel de medición nominal y con categorías mutuamente excluyentes. Las muestras deben ser grandes para evitar tener Eij ≤ 5 . Si alguna Eij ≤ 5: En tablas de más de 2x2: si más del 20% de las Eij ≤ 5, combinar categorías (si se considera lógico, para que las Eij sean mayores que 5). En tablas de 2x2: se aplica prueba exacta de Fisher. 19/07/2021 Wilfredo Mormontoy Laurel MPH 16 Fórmula alternativa de cálculo de 2 en tablas de 2 x2 Una tabla de 2x2 se puede representar de la siguiente forma: Grupo 19/07/2021 Variable Total + - I a b a+b II c d c+d Total a+c b+d n = a+b+c+d Wilfredo Mormontoy Laurel MPH 17 Fórmula alternativa de cálculo de 2 en tablas de 2 x 2 2 n(ad - bc) χ (a c)(b d)(a b)(c d) 2 Donde a, b, c y d son frecuencias observadas y n el total general. Aplicando esta fórmula para el ejemplo anterior: 2 80(25x5 - 15x35) χ (60)(20)(40)(40) 2 19/07/2021 Wilfredo Mormontoy Laurel MPH = 6,667 18