EVSC 5020: Bioestadística Prueba de Hipótesis Dos muestras Prof. Rafael R. Canales-Pastrana EVSC 5020: Bioestadística 1 Gráfica EVSC 5020: Bioestadística 2 Significancia del valor p • Sí 0.01≤ p <0.05, el resultado se considera significativo. • Sí 0.001≤ p <0.01, el resultado se considera altamente significativo. • Sí p <0.0001, el resultado se considera muy altamente significativo. • Sí p >0.05, el resultado se NO considera significativo. EVSC 5020: Bioestadística 3 Poder de la prueba • Es la certeza estadística que se tiene de haber escogido la respuesta correcta. Factores que influyen: 1. Si la significancia disminuye (), el poder disminuye. 2. Si la diferencia entre las medias aumenta, el poder aumenta. 3. Si la desviación estándar () aumenta, el poder disminuye. 4. Si el tamaño de la muestra aumenta, el poder aumenta. EVSC 5020: Bioestadística 4 Factores que afectan el Tamaño de la muestra 1. El tamaño de la muestra aumenta según 2 aumenta. 2. El tamaño de la muestra aumenta según el nivel de significancia disminuye ( disminuye). 3. El tamaño de la muestra aumenta según, el poder de la prueba aumenta(1-). 4. El tamaño de la muestra disminuye según, el valor absoluto de la diferencia entre las medias aumenta. EVSC 5020: Bioestadística 5 Definiciones • Prueba de hipótesis de dos muestras: Es la comparación estadística de parámetros de diferentes poblaciones. • Estudios – Longitudinal o de seguimiento: El mismo grupo de individuos es analizado a través del tiempo. – Transversal: El individuo es solamente analizado a través del tiempo. – Pareado: Cuando el punto de información de las muestras se corresponden. – Independientes: Cuando el punto de información de las muestras no se corresponden. EVSC 5020: Bioestadística 6 Prueba t: Dos muestras (varianzas iguales) • Supuestos: – Las dos muestras son extraídas aleatoriamente, de dos poblaciones que tiene una distribución normal. – Las dos poblaciones tienen la misma varianza. s 2p SS1 SS 2 1 2 | X 1 X 2 | 0 t s X1 X 2 EVSC 5020: Bioestadística s X1 X 2 SS X s 2p n1 2 i s 2p n2 2 Xi n 7 Prueba t: Dos muestras (varianzas diferentes) • Se conoce como: El problema Behrens-Fisher • Supuestos: – Las dos muestras son extraídas aleatoriamente, de dos poblaciones que tiene una distribución normal. s' X1 X 2 ' s12 s22 n1 n2 s 2 X1 2 2 X1 s 2 2 X2 s s n1 1 EVSC 5020: Bioestadística 2 X2 2 n2 1 t' | X 1 X 2 | 0 s X2 1 s X2 2 SS X s2 2 i 2 Xi n SS n 1 8 Intervalos de confianza Varianzas iguales L | X 1 X 2 | (t , ) * (s X1 X 2 ) EVSC 5020: Bioestadística Varianzas diferentes L | X 1 X 2 | (t , ' ) * (s' X1 X 2 ) 9 Estimado de tamaño de muestra: Diferencia entre dos poblaciones • Para garantizar que el experimento cumple con el requisito del ancho del intervalo de confianza, es necesario calcular el tamaño de la muestra. • Es deseable que ambas muestras representativas de las poblaciones, sean del mismo tamaño. 2 2s p t 2 , n d2 • De no poderse cumplir el postulado anterior se calcula el tamaño de la muestra de una población en función de la n * n1 muestra limitante. n2 EVSC 5020: Bioestadística 2n1 n 10 Prueba F: Razón entre varianzas • Dependiendo de la similitud de las varianzas, se realizan diferentes pruebas de hipótesis. • Para esto se puede realizar una prueba de razón entre varianzas. s12 s22 F 2 o F 2 , la mayor s2 s1 • Se localiza el valor el la tabla de la distribución F, en función de los grados de libertad. Si la Ho no es rechazada, el mejor estimado de la varianza es: 2 2 SS SS s s 2 2 2 s 2p 1 11 1 2 1 2 EVSC 5020: Bioestadística 11 Prueba t pareada • En ocasiones se quiere analizar la diferencia de dos muestras sometidas a tratamientos diferentes. • Si el número de muestras es igual y se cumplen los supuestos de la prueba t, se puede realizar una prueba t pareada. d t sd – Donde d , es la media de las diferencia de los datos y sd , es el error estándar. EVSC 5020: Bioestadística 12 ¿Preguntas? EVSC 5020: Bioestadística 13