cuarta semana

Anuncio
Bioestadística Aplicada I, pág. 1
NMRCD/UPCH
Cuarta semana Inferencia sobre variables
cuantitativas
Inferencia sobre variables cuantitativas
Comando para comparación de media en una o dos poblaciones, apareadas o
no apareadas
Realiza el calculo de la Prueba de comparación de media (s) en una o dos
ttesti
poblaciones, apareadas o no apareadas
Realiza el calculo para la prueba de igualdad de varianzas
sdtest
Realiza el calculo de la Prueba de rangos para datos cuantitativos, para dos
ranksum
poblaciones independientes
Realiza el calculo de la Para la prueba para comparación de medias de mas de
anova
dos poblaciones independientes
Realiza el calculo de comparación de rangos para dos o mas poblaciones
kwallis
Realiza el calculo de análisis de varianza (anova), además realizar pruebas de
oneway
múltiples comparaciones cuando se tiene mas de 2 poblaciones
correlate Mide numéricamente la relación existente entre dos variables cuantitativas
spearman Mide la asociación existente entre dos variables
ttest
ttest
Este comando realiza el calculo para diferencia de medias en una población o dos poblaciones, en
poblaciones que se encuentran relacionadas o independientes. Depende de ello se modifica el
calculo de la misma prueba de hipótesis.
Realizamos un ejemplo en una población
Sintaxis
ttest variable = valor
Sea una población donde se estudia la inteligencia en menores que realizan la educación primaria,
donde se espera que el promedio del test de inteligencia en los menores sea igual a 100.
Ho:   100
Ha :   100
Entonces abrimos la base de datos de inteligencia.dta y realizamos los siguientes comandos.
use c:\inteligencia.dta
ttest wtotal = 100
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 2
NMRCD/UPCH
Entonces observamos tres hipótesis alternativas en las que observamos la hipótesis alternativa
central, donde observamos un pvalor muy pequeño < 0.05.
Por lo tanto rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.
Por lo tanto decimos que el promedio de inteligencia en la población de niños estudiados es
diferente de 100.
Realizamos un ejemplo en dos poblaciones independientes
Sintaxis
ttest variable, by(grupo)
Se quiere saber si la inteligencia en la población es diferente en la población masculina a la
femenina.
Por lo tanto nuestra hipótesis a plantear serán:
Ho :  niños   nilas
Ho :  niños   nilas
entonces como ya tenemos abierta la base de datos de inteligencia, realizamos el siguiente
comando:
ttest wtotal, by(sex)
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 3
NMRCD/UPCH
Al observar los resultados podemos decir que el pvalor es igual a 0.1406, por lo que no podemos
rechazar la hipótesis nula.
Por lo tanto concluimos que no hay evidencia suficiente para poder rechazar la hipótesis nula.
Realizamos un ejemplo en dos poblaciones independientes co varianzas diferentes
Pero, hemos supuesto que las varianzas son iguales, que hubiera sucedido si las varianzas no
fueran iguales, entonces realizaremos el mismo calculo con la opción que las varianzas nos son
iguales.
Por lo tanto realizaremos la siguiente rutina
ttest wtotal, by(sex) unequal
Por lo tanto nuestra hipótesis a plantear serán:
Ho :  niños   nilas
Ho :  niños   nilas
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 4
NMRCD/UPCH
Al observar los resultados podemos decir que el pvalor es igual a 0.1383, por lo que no podemos
rechazar la hipótesis nula. Además de ser diferente que en el caso con las varianzas iguales.
Por lo tanto concluimos que no hay evidencia suficiente para poder rechazar la hipótesis nula.
sdtest
Este comando realiza la el calculo de la estadística F, para la prueba de igualdad de varianzas.
Sintaxis
sdtest variable, by(grupo)
Realizando el ejemplo en la población según sexo
Realizaremos la prueba de igualdad de varianzas para determinar si las varianzas son iguales en
las poblaciones masculino y femenino, para la variable de interés medición de inteligencia
(wtotal).
Ho :  niños   nilas
Ho :  niños   nilas
Ya habiendo planteado nuestras hipótesis pasamos a realizar el calculo de la prueba en si, en el
programa stata y en la base de datos de inteligencia que ya hemos abierto con anterioridad.
sdtest wtotal, by (sex)
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 5
NMRCD/UPCH
Entonces al observar los resultados tenemos el pvalor > que 0.05, por lo que decimos que no
tenemos evidencias para rechazar la hipótesis de igualdad de varianza de inteligencia entre las
poblaciones de sexo. Por lo tanto seguimos con el supuesto de igualdad de varianza para realizar
la prueba de igualdad de medias de inteligencia entre estos dos grupos.
ranksum
Este comando realiza el calculo de un método no parametrico U de Mann Whitney para comparar
la distribución de los valores entre dos poblaciones independientes.
Sintaxis
ranksum variable, by(grupo)
Ejemplo similar al de inteligencia según sexo
Entonces queremos saber si existe diferencias significativas entre las distribuciones de los valores
de inteligencia según sexo, por lo que se plantear las hipótesis respectivas:
Ho: La distribución de los valores de inteligencia en los niños es igual a la distribución de los
valores de inteligencia en la niñas
Ha: La distribución de los valores de inteligencia en los niños no es igual a la distribución de los
valores de inteligencia en la niñas
Entonces una ves enunciados nuestras hipótesis pasaremos a calcular nuestro pvalor para la
prueba de rangos respectiva :
Ranksum wtotal, by(sex)
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 6
NMRCD/UPCH
Al observar lo resultados, obtenemos un pvalor > 0.05, por lo que decimos que no podemos
rechazar nuestra hipótesis nula.
Entonces concluimos que no tenemos evidencia sufiente para probar que la distribución de los
valores de inteligencia entre las poblaciones de sexo es diferente.
anova
Este comando realiza el calculo de la estadística para comparación de medias en mas de dos
poblaciones, teniendo como supuesto que las varianzas en las poblaciones son iguales.
Sintaxis
anova variable vargrupo
Realicemos el análisis en mas de 2 poblaciones independientes
Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias
significativas en las medias de los valores de inteligencia según los evaluadores, por lo que
plantearemos nuestras hipótesis.
Ho : 1   2  3   4  5  6
Ha :  i   j para i, j = 1,..,6 i != j
Entonces, enunciadas las respectivas hipótesis realizaremos el calculo de la estadística F,
utilizando el comando “anova”, para la base de datos de inteligencia, que estamos trabajando.
anova wtotal tester
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 7
NMRCD/UPCH
Al observar nuestros resultados y observar el pvalor = 0.0241 calculado por la prueba F, entonces
decimos que rechazamos la hipótesis nula para igualdad de medias.
Finalmente decimos que existen evidencias suficientes para rechazar la hipótesis de igualdad de
varianza en la media de inteligencia en los grupos evaluados según persona que evaluó a los
menores.
kwallis
Este comando realiza el calculo del estadístico chi cuadrado para la prueba no parametrica de
Kruskal Wallis, para comparar la distribución de una variable cuantitativa en mas de 2 grupos
Sintaxis
kwallis variable, by(vargrupo)
Realicemos el análisis en mas de 2 poblaciones independientes
Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias
significativas en la distribución de valores registrados de inteligencia según los evaluadores, por
lo que plantearemos nuestras hipótesis.
Ho: La distribución de los valores de inteligencia registrados es igual para los seis grupos de
niños evaluado por una persona diferente.
Ha: La distribución de los valores de inteligencia registrados no es igual para los seis grupos de
niños evaluados por una persona diferente.
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 8
NMRCD/UPCH
Al observar nuestros resultados, tenemos un pvalor = 0.0205 < 0.05, por lo que rechazamos
nuestra hipótesis nula de igualdad de distribución, por lo que aceptamos nuestra hipótesis
alternativa.
Entonces se concluye que existe evidencia significativa que demuestra que la distribución de los
valores de inteligencia se distribuye en al menos un par de grupos de manera diferente.
oneway
Este comando realiza el análisis de varianza (ANOVA), pero además de realizar el análisis de
varianza donde determina que las medias no son iguales, realiza la prueba de múltiples
comparaciones (en este caso Bonferroni) donde podemos determinar que grupos presentan
medias significativamente diferentes entre los grupos evaluados
Sintaxis
oneway variable vargrupo, bonferroni
Realicemos el análisis en mas de 2 poblaciones independientes
Como tenemos 6 personas que evaluaron a los menores, queremos saber si existen diferencias
significativas en las medias de los valores de inteligencia según los evaluadores, por lo que
plantearemos nuestras hipótesis.
Ho : 1   2  3   4  5  6
Ha :  i   j para i, j = 1,..,6 i != j
Entonces, enunciadas las respectivas hipótesis realizaremos el calculo de la estadística F,
utilizando el comando “anova”, para la base de datos de inteligencia, que estamos trabajando.
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 9
NMRCD/UPCH
Entonces al observar los resultados obtenemos que el pvalor es menor, por lo que rechazamos la
hipotesis nula que las medias de los 6 grupos son iguales.
Pero allí no determinamos quienes son diferentes y quienes con iguales, entonces viendo las
pruebas de comparaciones múltiples de Bonferroni, tenemos que:
Entonces se determina que solo existe diferencias significativas entre 2 medias, esto suceden
entre los grupos 1 y 4
Por lo que decimos que existe evidencia significativa para decir que existe diferencias sólo entre
los promedios de los grupos 1 y 4.
correlate
Este comando lo que hace es calcular el grado de correlacion existente entre dos variables
cuantitativas, esto puede ser ejecutado con multiples variables.
Sintaxis
Correlate var1 var2 var3 ...... varn
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Bioestadística Aplicada I, pág. 10
NMRCD/UPCH
Realicemos el análisis en 2 variables
Queremos saber si existe correlación entre la variable wtotal (inteligencia) y haz1999 (talla para
la edad), entonces realizaremos el siguiente comando:
Correlate wtotal haz1999
Existe correlación entre las variables inteligencia y estados nutricional, por lo que decimos que
existe la relacion, aunque en la muestra se observe una baja relacion
spearman
Este comando lo que hace es calcular el grado de asociación existente entre dos variables
cuantitativas, esto puede ser ejecutado con multiples variables.
Sintaxis
spearman var1 var2
Realicemos el análisis en 2 variables
Queremos saber si existe correlación entre la variable wtotal (inteligencia) y haz1999 (talla para
la edad), entonces realizaremos el siguiente comando:
spearman wtotal haz1999
Por lo que decimo que existe una asociación entre las variables.
Lescano AG, Zimic M, Bautista CT, Gonzales MA
www.abeperu.net
Descargar