Bioestadística Aplicada I, pág. 1 NMRCD/UPCH Cuarta semana Inferencia sobre variables cuantitativas Inferencia sobre variables cuantitativas Comando para comparación de media en una o dos poblaciones, apareadas o no apareadas Realiza el calculo de la Prueba de comparación de media (s) en una o dos ttesti poblaciones, apareadas o no apareadas Realiza el calculo para la prueba de igualdad de varianzas sdtest Realiza el calculo de la Prueba de rangos para datos cuantitativos, para dos ranksum poblaciones independientes Realiza el calculo de la Para la prueba para comparación de medias de mas de anova dos poblaciones independientes Realiza el calculo de comparación de rangos para dos o mas poblaciones kwallis Realiza el calculo de análisis de varianza (anova), además realizar pruebas de oneway múltiples comparaciones cuando se tiene mas de 2 poblaciones correlate Mide numéricamente la relación existente entre dos variables cuantitativas spearman Mide la asociación existente entre dos variables ttest ttest Este comando realiza el calculo para diferencia de medias en una población o dos poblaciones, en poblaciones que se encuentran relacionadas o independientes. Depende de ello se modifica el calculo de la misma prueba de hipótesis. Realizamos un ejemplo en una población Sintaxis ttest variable = valor Sea una población donde se estudia la inteligencia en menores que realizan la educación primaria, donde se espera que el promedio del test de inteligencia en los menores sea igual a 100. Ho: 100 Ha : 100 Entonces abrimos la base de datos de inteligencia.dta y realizamos los siguientes comandos. use c:\inteligencia.dta ttest wtotal = 100 Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 2 NMRCD/UPCH Entonces observamos tres hipótesis alternativas en las que observamos la hipótesis alternativa central, donde observamos un pvalor muy pequeño < 0.05. Por lo tanto rechazamos la hipótesis nula y aceptamos la hipótesis alternativa. Por lo tanto decimos que el promedio de inteligencia en la población de niños estudiados es diferente de 100. Realizamos un ejemplo en dos poblaciones independientes Sintaxis ttest variable, by(grupo) Se quiere saber si la inteligencia en la población es diferente en la población masculina a la femenina. Por lo tanto nuestra hipótesis a plantear serán: Ho : niños nilas Ho : niños nilas entonces como ya tenemos abierta la base de datos de inteligencia, realizamos el siguiente comando: ttest wtotal, by(sex) Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 3 NMRCD/UPCH Al observar los resultados podemos decir que el pvalor es igual a 0.1406, por lo que no podemos rechazar la hipótesis nula. Por lo tanto concluimos que no hay evidencia suficiente para poder rechazar la hipótesis nula. Realizamos un ejemplo en dos poblaciones independientes co varianzas diferentes Pero, hemos supuesto que las varianzas son iguales, que hubiera sucedido si las varianzas no fueran iguales, entonces realizaremos el mismo calculo con la opción que las varianzas nos son iguales. Por lo tanto realizaremos la siguiente rutina ttest wtotal, by(sex) unequal Por lo tanto nuestra hipótesis a plantear serán: Ho : niños nilas Ho : niños nilas Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 4 NMRCD/UPCH Al observar los resultados podemos decir que el pvalor es igual a 0.1383, por lo que no podemos rechazar la hipótesis nula. Además de ser diferente que en el caso con las varianzas iguales. Por lo tanto concluimos que no hay evidencia suficiente para poder rechazar la hipótesis nula. sdtest Este comando realiza la el calculo de la estadística F, para la prueba de igualdad de varianzas. Sintaxis sdtest variable, by(grupo) Realizando el ejemplo en la población según sexo Realizaremos la prueba de igualdad de varianzas para determinar si las varianzas son iguales en las poblaciones masculino y femenino, para la variable de interés medición de inteligencia (wtotal). Ho : niños nilas Ho : niños nilas Ya habiendo planteado nuestras hipótesis pasamos a realizar el calculo de la prueba en si, en el programa stata y en la base de datos de inteligencia que ya hemos abierto con anterioridad. sdtest wtotal, by (sex) Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 5 NMRCD/UPCH Entonces al observar los resultados tenemos el pvalor > que 0.05, por lo que decimos que no tenemos evidencias para rechazar la hipótesis de igualdad de varianza de inteligencia entre las poblaciones de sexo. Por lo tanto seguimos con el supuesto de igualdad de varianza para realizar la prueba de igualdad de medias de inteligencia entre estos dos grupos. ranksum Este comando realiza el calculo de un método no parametrico U de Mann Whitney para comparar la distribución de los valores entre dos poblaciones independientes. Sintaxis ranksum variable, by(grupo) Ejemplo similar al de inteligencia según sexo Entonces queremos saber si existe diferencias significativas entre las distribuciones de los valores de inteligencia según sexo, por lo que se plantear las hipótesis respectivas: Ho: La distribución de los valores de inteligencia en los niños es igual a la distribución de los valores de inteligencia en la niñas Ha: La distribución de los valores de inteligencia en los niños no es igual a la distribución de los valores de inteligencia en la niñas Entonces una ves enunciados nuestras hipótesis pasaremos a calcular nuestro pvalor para la prueba de rangos respectiva : Ranksum wtotal, by(sex) Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 6 NMRCD/UPCH Al observar lo resultados, obtenemos un pvalor > 0.05, por lo que decimos que no podemos rechazar nuestra hipótesis nula. Entonces concluimos que no tenemos evidencia sufiente para probar que la distribución de los valores de inteligencia entre las poblaciones de sexo es diferente. anova Este comando realiza el calculo de la estadística para comparación de medias en mas de dos poblaciones, teniendo como supuesto que las varianzas en las poblaciones son iguales. Sintaxis anova variable vargrupo Realicemos el análisis en mas de 2 poblaciones independientes Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias significativas en las medias de los valores de inteligencia según los evaluadores, por lo que plantearemos nuestras hipótesis. Ho : 1 2 3 4 5 6 Ha : i j para i, j = 1,..,6 i != j Entonces, enunciadas las respectivas hipótesis realizaremos el calculo de la estadística F, utilizando el comando “anova”, para la base de datos de inteligencia, que estamos trabajando. anova wtotal tester Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 7 NMRCD/UPCH Al observar nuestros resultados y observar el pvalor = 0.0241 calculado por la prueba F, entonces decimos que rechazamos la hipótesis nula para igualdad de medias. Finalmente decimos que existen evidencias suficientes para rechazar la hipótesis de igualdad de varianza en la media de inteligencia en los grupos evaluados según persona que evaluó a los menores. kwallis Este comando realiza el calculo del estadístico chi cuadrado para la prueba no parametrica de Kruskal Wallis, para comparar la distribución de una variable cuantitativa en mas de 2 grupos Sintaxis kwallis variable, by(vargrupo) Realicemos el análisis en mas de 2 poblaciones independientes Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias significativas en la distribución de valores registrados de inteligencia según los evaluadores, por lo que plantearemos nuestras hipótesis. Ho: La distribución de los valores de inteligencia registrados es igual para los seis grupos de niños evaluado por una persona diferente. Ha: La distribución de los valores de inteligencia registrados no es igual para los seis grupos de niños evaluados por una persona diferente. Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 8 NMRCD/UPCH Al observar nuestros resultados, tenemos un pvalor = 0.0205 < 0.05, por lo que rechazamos nuestra hipótesis nula de igualdad de distribución, por lo que aceptamos nuestra hipótesis alternativa. Entonces se concluye que existe evidencia significativa que demuestra que la distribución de los valores de inteligencia se distribuye en al menos un par de grupos de manera diferente. oneway Este comando realiza el análisis de varianza (ANOVA), pero además de realizar el análisis de varianza donde determina que las medias no son iguales, realiza la prueba de múltiples comparaciones (en este caso Bonferroni) donde podemos determinar que grupos presentan medias significativamente diferentes entre los grupos evaluados Sintaxis oneway variable vargrupo, bonferroni Realicemos el análisis en mas de 2 poblaciones independientes Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias significativas en las medias de los valores de inteligencia según los evaluadores, por lo que plantearemos nuestras hipótesis. Ho : 1 2 3 4 5 6 Ha : i j para i, j = 1,..,6 i != j Entonces, enunciadas las respectivas hipótesis realizaremos el calculo de la estadística F, utilizando el comando “anova”, para la base de datos de inteligencia, que estamos trabajando. Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 9 NMRCD/UPCH Entonces al observar los resultados obtenemos que el pvalor es menor, por lo que rechazamos la hipotesis nula que las medias de los 6 grupos son iguales. Pero allí no determinamos quienes son diferentes y quienes con iguales, entonces viendo las pruebas de comparaciones múltiples de Bonferroni, tenemos que: Entonces se determina que solo existe diferencias significativas entre 2 medias, esto suceden entre los grupos 1 y 4 Por lo que decimos que existe evidencia significativa para decir que existe diferencias sólo entre los promedios de los grupos 1 y 4. correlate Este comando lo que hace es calcular el grado de correlacion existente entre dos variables cuantitativas, esto puede ser ejecutado con multiples variables. Sintaxis Correlate var1 var2 var3 ...... varn Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net Bioestadística Aplicada I, pág. 10 NMRCD/UPCH Realicemos el análisis en 2 variables Queremos saber si existe correlación entre la variable wtotal (inteligencia) y haz1999 (talla para la edad), entonces realizaremos el siguiente comando: Correlate wtotal haz1999 Existe correlación entre las variables inteligencia y estados nutricional, por lo que decimos que existe la relacion, aunque en la muestra se observe una baja relacion spearman Este comando lo que hace es calcular el grado de asociación existente entre dos variables cuantitativas, esto puede ser ejecutado con multiples variables. Sintaxis spearman var1 var2 Realicemos el análisis en 2 variables Queremos saber si existe correlación entre la variable wtotal (inteligencia) y haz1999 (talla para la edad), entonces realizaremos el siguiente comando: spearman wtotal haz1999 Por lo que decimo que existe una asociación entre las variables. Lescano AG, Zimic M, Bautista CT, Gonzales MA www.abeperu.net