Pruebas de hipótesis de proporciones Trabajo publicado en www.ilustrados.com La mayor Comunidad de difusión del conocimiento PROPUESTA METODOLÓGICA SOBRE LA RESOLUCIÓN DE PROBLEMAS BIOMÉDICOS QUE CONDUCEN A LAS PRUEBAS O ENSAYOS DE HIPÓTESIS DE PROPORCIONES AUTOR: Prof.Asistente Lorenzo Pérez Milanés [email protected] 1 Pruebas de hipótesis de proporciones 2 Índice Resumen ................................................................... 3 Introducción ............................................................... 3 Desarrollo: ................................................................ 4 Metodología de resolución Bibliografía ............................................................... 19 Datos del autor .......................................................... 20 Año de realización: 2007 Resumen Pruebas de hipótesis de proporciones 3 Este artículo está dirigido fundamentalmente a los profesionales de la Salud y en especial a los estudiantes de 2do. Año de la carrera de Medicina y Estomatología, así como también para los de Enfermería de la Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” de Las Tunas, los cuales reciben las asignaturas de Informática Médica II, Informática e Investigación III y IV respectivamente, en la que se aborda la problemática de la resolución de problemas biomédicos que conducen a las “pruebas de hipótesis de proporciones” en el marco de la Estadística Inferencial. En el mismo se presentan algunas valoraciones teóricas sobre el tema y una propuesta metodológica con una serie de pasos lógicos para realizar las pruebas de hipótesis que utilizan los modelos de distribución normal de Gauss y binomial , así como algunas indicaciones en el uso del procesador Statgraphics versión 2,1 en Inglés para el cálculo y análisis de los resultados . Además este material puede ser también útil a otros profesionales que aborden la Estadística Inferencial en general. Introducción En múltiples de ocasiones cuando se trabaja en las ciencias de la salud surge con frecuencia la necesidad de tomar decisiones con relación a diferentes problemas de investigación, generalmente al no contar con el tiempo ni con los recursos para estudiar a toda la población, seleccionamos una muestra aleatoria a partir de la cual nos permita tomar decisiones sobre la población. Las Pruebas de Hipótesis tienen el propósito de ayudar al investigador a tomar decisiones sobre la población basándose en el análisis de una muestra aleatoria de la misma, las decisiones que debemos tomar son en relación con determinadas características de la población, denominados parámetros, que necesitamos conocer, para resolver un problema. De manera que hay que establecer un procedimiento objetivo que permita, sobre la base de la información muestral obtenida, tomar una decisión sobre los parámetros de la población, lo que determinará cierto grado de incertidumbre asociada a la decisión.- Este procedimiento se conoce como Prueba de Hipótesis. Existen innumerables de situaciones en el ámbito de la salud en el que las variables de interés al igual que en el caso de la estimación puntual y la estimación por intervalo de confianza, es posible construir pruebas de hipótesis para verificar suposiciones acerca del comportamiento de variables en la población cuando éstas no están medidas en escala continua, por lo que no pueden ser apropiadamente resumidas a través de la media aritmética, en la que el investigador está interesado en determinar posibles relaciones poblacionales, ejemplos de estos tipos de situaciones pueden ser: 4 Pruebas de hipótesis de proporciones La verificación de la efectividad de un medicamento para aliviar la alergia por un período de determinado, de un tratamiento preventivo novedoso para una enfermedad, etc., análisis de las cuales nos pueden conducir a las pruebas de hipótesis de proporciones con la correspondiente aplicación de las distribuciones binomial y normal de Gauss respectivamente como veremos más adelante. La experiencia nos ha conducido a tener en cuenta el fracaso que experimentan los principiantes y estudiantes en el proceso de resolución de problemas que conducen a estas distribuciones y en especial en la realización de pruebas de hipótesis de este tipo por numerosos factores como, prestar su atención solamente en las habilidades computacionales, en el quehacer metodológico o en la rama descriptiva de la Estadística como ciencia, por lo que pretendemos contribuir al éxito de esta temática en el contexto de los nuevos paradigmas de creación, difusión y utilización del conocimiento, de manera que consideramos que los apuntes que se proponen es un elemento a considerar en este sentido. Desarrollo: Pruebas de hipótesis de proporciones En general estos tipos de ensayos consisten en considerar una población y una característica a observar en cada individuo de esa población. Sea P * la proporción de individuos de la población que poseen la característica en cuestión. Consideremos además una muestra simple aleatoria de tamaño n de la población. Cada elemento de la población, y por tanto, cada elemento de la muestra posee o no la característica que se observa. Sea X, la variable aleatoria que toma el valor 1 si el elemento i-ésimo de la muestra posee la característica, y el valor 0 si no la posee (i= 1,2,…., n). Cada una de estas variables X1, X2,…Xn posee distribución de Bernoulli, o sea, binomial con parámetros 1 y p, y la variable aleatoria. n X=Xi i=1 que registra el número de elementos de la muestra que poseen la característica tiene entonces una distribución binomial con parámetros n y p. Estos resultados son exactos en el caso del muestreo con reemplazo y constituyen una buena aproximación si n es suficientemente grande. Además, n p = X i/ n i=1 ; será igual entonces a la proporción de individuos de la muestra que poseen la característica y se tiene también X=np 5 Pruebas de hipótesis de proporciones Si el tamaño n de la muestra es suficientemente grande la distribución de la variable aleatoria X es aproximadamente normal con media np y varianza np(1-p), y por tanto, se puede utilizar la distribución normal en lugar de la binomial para determinar la región crítica en las pruebas de hipótesis para una proporción p como se verá a continuación. Hipótesis estadísticas. Para tomar decisiones se hacen supuestos o conjeturas acerca de las poblaciones, tales suposiciones que pueden o ser ciertas o no se llaman hipótesis estadísticas. Estas se formulan para rechazarlas o invalidarlas. Ejemplos: I. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a una característica de la población, digamos que se quiere probar que la proporción poblacional p* es menor a un valor determinado p*o : lo expresado se acostumbra a representar por: H0: p* ≥ p*o H1: p* p*o II. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a una característica de la población, digamos que se quiere probar que la proporción poblacional p* es mayor a un valor determinado p*o : lo expresado se acostumbra a representar por: H0: p* ≤ p*o H1: p* > p*o III. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a una característica de la población, digamos que se quiere probar que la proporción poblacional p* no es igual a un valor determinado p*o; lo expresado se acostumbra a representar por: H0: p* = p*o H1: p* p*o Las que se denotan por H0 se les llaman hipótesis Nulas. Cualquier hipótesis “que difiera” de una hipótesis dada se llama alternativa y se denotan por H1 Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman Ensayos de significación o Reglas de decisión. Errores del tipo I y tipo II. Tipo I: Cuando “se rechaza” una hipótesis, cuando debería ser aceptada. Tipo II: Cuando “se acepta “una hipótesis que debería ser rechazada. En cualquiera de los dos casos se comete “un error “al tomar una decisión equivocada y resumiendo las situaciones anteriores respecto a las decisiones sobre H 0 a partir de los valores observados en la muestra aleatoria tenemos que: Pruebas de hipótesis de proporciones 6 Decisión sobre H0 Si H0 es: No rechazar Rechazar Verdadera Falsa Acción correcta Error de tipo II Error de tipo I Acción correcta Nivel de significación La probabilidad máxima con la que el ensayo de una hipótesis se puede cometer un error del tipo I se llama nivel de significación del ensayo. Se denota por (se fija antes de la extracción de la muestra). En la práctica se acostumbra a utilizar los niveles de significación = 0.05 (5%) o = 0.01 (1 %). En el caso del ejemplo I estamos en presencia de las llamadas hipótesis de “una cola” como se muestra en el siguiente gráfico y estas son equivalentes: H'0: µ ≥ µ o H'1: µ < µ o donde µ = np* y µ o = np*o Por tanto, utilizando el estadígrafo Z = (X – np*)/√np*(1-p*) = ( X - µ o ) / /√n donde X = X/n = p ; µ o = p*o y 2= p*(1-p*) Se puede demostrar también que: Z= (p-p*) / √p*Q*/n, siendo Q*= 1-p* Entonces para n suficientemente grande Z tiene distribución normal con media 0 y varianza 1 y la región crítica será {Z R Z < - Z1- }, donde Z1- es el percentil de orden 1- de la distribución normal estándar, según la tabla 1 - Z1- En el caso del ejemplo II estamos en presencia de las llamadas hipótesis de “una cola” como se muestra en el siguiente gráfico y por consideraciones análogas a las del caso 1 se llega a que: H0: p* ≤ p*o H1: p* > p*o Por consideraciones análogas a las del caso 1 se llega a que, utilizando el estadígrafo Z = (X – np*)/√np*(1-p*), la región crítica es: {Z R Z > Z1- } y Z1- es el percentil de orden 1- de la distribución normal estándar, según la tabla 1. Pruebas de hipótesis de proporciones 7 Z1 En el caso del ejemplo III estamos en presencia de las llamadas hipótesis de “dos cola” como se muestra en el siguiente gráfico y por consideraciones análogas a las del caso 1 se llega a que: H0: p* = p*o H1: p* ≠ p*o Por consideraciones análogas a las del caso 1 se llega a que, utilizando el estadígrafo Z = (X – np*)/√np*(1-p*), la región crítica es: {Z R Z > Z1-/2}, es decir, Z > Z1- /2 y Z <- Z1-/2 en la que Z1- /2 es el percentil de orden 1- de la distribución normal estándar, según la tabla 1. /2 /2 -Z1-/2 Z1-/2 Otro criterio de decisión que no queremos pasar por alto es el del p-valor Si el p-valor < se debe Rechazar Ho Si el p-valor ≥ se debe aceptar Ho Este estadístico o nivel de significación empírico como se conoce nos informa sobre cuál sería el nivel de significación más pequeño que nos hubiera permitido rechazar la hipótesis nula. En algunos procesadores como el Statgraphics, como veremos más adelante, es de fácil cálculo. Diferencias de proporciones Un problema de gran importancia y que se presenta frecuentemente en el trabajo estadístico es el determinar si dos poblaciones difieren con respecto a una cierta característica. 8 Pruebas de hipótesis de proporciones Por ejemplo ¿existe diferencia entre el porcentaje de fumadores y no fumadores que presentan cáncer bucal? Si x1 y x2 son el número de “éxitos” observados respectivamente, en grandes muestras aleatorias independientes de tamaño n1 y n2, y si p1 y p2 son las probabilidades correspondientes para el éxito en pruebas individuales, entonces la distribución del muestreo de la estadística: (1) x1 /n1 - x2/n2 (para n > 30) la diferencia entre las dos proporciones muéstrales se puede aproximar con bastante exactitud a una curva normal cuya media sea p1-p2 y su desviación estándar sea : (2)p1(1- p1)/n1+p2(1-p2)/n2 distribución estándar de la distribución del muestreo de las diferencias entre dos proporciones. Los problemas así expuestos se pueden tratar como problemas de pruebas de hipótesis, del tipo: Ho: P*1 = P*2 = P*; donde P*1 y P*2 son las dos proporciones de población de la característica que se analiza. H1: P*1 P*2 (en los problemas que tratan de las diferencias entre proporciones estamos interesados por lo general en probar si en realidad hay una diferencia entre P*1 y P*2. p1 y p2 como dijimos son las proporciones muéstrales de dos grandes muestras de tamaños n1 y n2 extraídas de poblaciones respectivas que tienen proporciones P1* y P2*. Consideremos la hipótesis nula de que no hay diferencia entre los parámetros poblacionales, es decir, P*1 = P*2. Se ve que la distribución muestral de la diferencia de proporciones se distribuye aproximadamente como una normal con media y desviación Standard dada por: P1*- P2* = 0 Q* = 1- P* P1* - P2* = P*Q*(1/n1 + 1 / n2), donde: P* = (n1p1 + n2 p2) / n1 + n2 e igual a x1 + x2 / n1 + n2 y conocida como media ponderada de las dos relaciones proporcionales, pues p = x / n . El método que estamos desarrollando ha de ser utilizado, solamente para muestras grandes. La variable estandarizada Z esta dada por: Z = p - p / P*Q*(1/n + 1/n ) 1 2 1 2 Esta expresión se obtiene de sustituir en la ecuación (2) a p1 y p2 por P*. También se puede plantear que Z= p1 - p2 / P*(1- P*) (1/n1 + 1/n2) y efectuando el producto que aparece en el denominador queda finalmente que: Z = p1-p2 / P*( 1- P* )/n1 + P*(1- P*)/n2) Si los valores de P1* y P2* se desconocen se utilizan los estimadores p1 y p2 como una aproximación de los mismos. Una vez calculada Z se procede en la forma indicada para las pruebas anteriores. 9 Pruebas de hipótesis de proporciones Después de haber analizado los elementos teóricos anteriores aparecen gravitando alrededor del tema que nos ocupa, las siguientes interrogantes: ¿ Cuándo tendríamos que realizar una prueba de proporciones o de diferencia de proporciones?,¿ Cómo se hacen estos tipos de pruebas ?, ¿ Cuáles serían los pasos a seguir para tener éxito en la realización de las mismas ?, ¿ Qué tendríamos que hacer en cada paso ?, en fin para responder a estas y a otras interrogantes que puedan surgir les proponemos a continuación una “metodología” de resolución de problemas biomédicos que conducen a estas pruebas de hipótesis. La misma está constituida por una serie de pasos lógicos que recomendamos seguir y que han sido extraídos de la experiencia que hemos acumulado en la impartición y en el trabajo metodológico a la Estadística Inferencial por parte del colectivo docente, así como de resultados en la aplicación de exámenes y técnicas cualitativas para conocer el grado de aceptación y satisfacción de esta metodología en los estudiantes con el propósito de facilitar y guiar a los mismos en la obtención del éxito de estos tests. Hemos querido presentarle a continuación la “metodología” mediante la tabla 2 con los pasos que sugerimos seguir para realizar las pruebas y en los que se podrán apreciar vínculos que nos mostraran, a través de tres ejemplos concretos, que debe hacerse en cada uno de ellos, así como su contenido. Ejemplo 1: Prueba de hipótesis de proporciones de una cola (a la izquierda). Ejemplo 2: Prueba de hipótesis de proporciones de una cola (a la derecha). Ejemplo 3: Prueba de hipótesis de proporciones de dos colas. Ejemplo 4: Prueba de hipótesis de diferencia de proporciones. Metodología de resolución de problemas que conducen a las pruebas de hipótesis de proporciones I. Tabla 2 Identificar el tipo de problema de ensayos de hipótesis. II. Buscar los valores de Z tabulados según el nivel de significación prefijado. Tabla de valores críticos de la distribución normal estándar III. Planteamiento de las hipótesis nula, alternativa y el criterio de decisión. De una cola a la izquierda De una cola a la derecha De dos colas Diferencia de proporciones De una cola a la izquierda De una cola a la derecha De dos colas Diferencia de proporciones De una cola a la izquierda De una cola a la derecha De dos colas Diferencia de proporciones IV. Cálculo de los estadígrafos Z y del intervalo de confianza. con el procesador estadístico. V. Análisis e interpretación de los resultados. VI. Toma de decisión. De una cola a la izquierda De una cola a la derecha De dos colas Diferencia de proporciones Pruebas de hipótesis de proporciones 10 Paso 1 Ejemplo 1 Un fabricante de una medicina alega que esta es efectiva en un 90 % para aliviar la alergia por un período de 8 h. En una muestra de 200 personas que tenían alergia, la medicina proporcionó mejoría a 160. Diga si lo alegado por el fabricante es cierto. Use = 0.05 Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la escala continua, refiriéndose a un % o proporción de efectividad de un medicamento, en la que es evidente el análisis de proporciones de una distribución muestral binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30) y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes para saber que estamos en presencia de una prueba de proporciones. Ejemplo 2 Se conoce que un medicamento utilizado en el tratamiento de cierta enfermedad es efectivo en un 75 % de los casos. Se plantea que un ligero cambio en la fórmula del medicamento conlleva mejores resultados. Pruebe para un = 0.05 si se obtiene el resultado esperado en la muestra de 101 pacientes donde se aplicó la nueva variante del medicamento, en la que 80 personas reaccionaron favorablemente. Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la escala continua, refiriéndose a un % o proporción de efectividad de un medicamento, en la que es evidente el análisis de proporciones de una distribución muestral binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30) y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes para saber que estamos en presencia de una prueba de proporciones. Ejemplo 3 Consideremos una muestra aleatoria de 257 individuos que fueron ingresados en un hospital de determinada región. La causa de hospitalización de 23 de ellos fue trastorno locomotor. Si la tasa de enfermedades locomotoras en hospitales semejantes de la región es de 5%, ¿puede considerarse que esta muestra sigue el patrón de enfermedad locomotora característico de la región? Utilice un nivel de significación de 0.05. Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la escala continua, refiriéndose a una tasa expresada en %, en la que es evidente el 11 Pruebas de hipótesis de proporciones análisis de proporciones de una distribución muestral binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30) y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes para saber que estamos en presencia de una prueba de proporciones. Ejemplo 4 Dos grupos de 100 personas cada uno, padecen una enfermedad. Al grupo 1, además del tratamiento habitual, se le aplica un suero y el grupo 2 (grupo control) permanece con el tratamiento habitual. Al final del ensayo se encuentra que 75 pacientes del grupo 1 y 65 del grupo 2 se recuperaron. ¿Cree usted que existe una diferencia significativa entre los que se recuperan en uno y otro grupo? Utilice un nivel de significación de 0.05 Después de leer el problema varias veces debemos identificar el tipo de prueba de hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la escala continua, refiriéndose a porcientos (%) o proporciones de efectividad de dos tratamientos aplicados a cada uno de los grupos de estudio respectivamente, lo que evidencia el análisis de dos proporciones de una distribución muestral binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30) y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes para saber que estamos en presencia de una prueba de diferencia de proporciones. Paso 3 Ejemplo 3,1 Sea p* la proporción poblacional de personas que mejoran su alergia usando la medicina. Estamos interesados en comprobar si la proporción de personas aliviadas por la medicina es menor que lo que se alega, puesto que si fuese igual o mayor el resultado respaldaría lo que afirma el productor. Entonces escogemos la hipótesis: H0: p* = 0.9 H1: p* < 0.9 (De una cola a la izquierda) El criterio de decisión será: La región crítica será {Z R Z < - Z1- } Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) / √p*Q*/n, siendo Q*= 1-p* es menor que el tabulado -Z1- (Z - Z1- ). Este punto crítico Z1- se obtiene en la tabla 1 para = 0.05, el cual constituye el paso 2, resultando ser 1.645. Aceptar Ho si Z > - Z1- Pruebas de hipótesis de proporciones 12 Ejemplo 3,2 Sea p* la proporción poblacional del medicamento utilizado en el tratamiento de la cierta enfermedad con efectivad del 75 % de los casos. Se plantea que un ligero cambio en la fórmula del medicamento conlleva mejores resultados. Estamos interesados en comprobar si la proporción o efectividad del medicamento con la nueva fórmula es mayor de lo que se alega, puesto que si fuese igual o menor el resultado respaldaría lo que se afirma del medicamento tradicional. Entonces escogemos la hipótesis: H0: p* = 0.75 H1 : p* 0.75 (De una cola a la derecha) El criterio de decisión será: La región crítica será {Z R Z > Z1- } Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) / √p*Q*/n, siendo Q*= 1-p* es mayor que el tabulado Z1- (Z Z1- ). Este punto crítico Z1- se obtiene en la tabla 1 para = 0.05, el cual constituye el paso 2, resultando ser 1.645. Aceptar Ho si Z Z1- Ejemplo 3,3 Sea p* la proporción poblacional de individuos que ingresan con trastorno locomotor, la cual se ha planteado que sigue el patrón de enfermedad locomotora característico de la región de una tasa del 5 %. Se quiere saber si la muestra utilizada sigue este patrón tradicional para la región o comprobar si la proporción o tasa de enfermedades locomotoras es desigual de lo que se alega, puesto que si fuese igual el resultado respaldaría lo que se afirma del patrón tradicional en hospitales semejantes. Entonces escogemos la hipótesis: H0: p* = 5 % H1 : p* ≠ 5 % (De dos colas) El criterio de decisión será: La región crítica será {Z R Z < -Z1-/2 y Z > Z1-/2} Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) / √p*Q*/n, siendo Q*= 1-p* es mayor que el tabulado Z1-/2 (Z Z1-/2) o menor que - Z1-/2 (Z < -Z1-/2). Este punto crítico Z1-/2 se obtiene en la tabla 1 para /2 = 0.025, el cual constituye el paso 2, resultando ser 1.96. Aceptar Ho si -Z1-/2 Z Z1-/2 Pruebas de hipótesis de proporciones 13 Ejemplo 3,4 Si se considera que p*1 represente la proporción poblacional de personas que se recuperan cuando se usa el suero y p*2 lo mismo pero sin usar el suero. Estamos interesados en saber si existe una diferencia significativa entre los que se recuperan en uno y otro grupo Entonces podemos plantear la hipótesis: H0: p*1 = p*2 H1: p*1 p*2 El criterio de decisión será: La región crítica será {Z R Z < -Z1-/2 y Z > Z1-/2} Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z = p1 - p2 / P*Q*(1/n1 + 1/n2), siendo P* = (n1p1 + n2 p2) / n1 + n2 e igual a x1 + x2 / n1 + n2 es mayor que el tabulado Z1-/2 (Z Z1-/2) o menor que -Z1-/2 (Z < -Z1-/2). Este punto crítico Z1-/2 se obtiene en la tabla 1 para /2 = 0.025, el cual constituye el paso 2, resultando ser 1.96. Aceptar Ho si -Z1-/2 Z Z1-/2 Paso 5 Ejemplo 5,1 Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se hacen los análisis e interpretaciones finales del problema. De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes: Como = 0.05, entonces z0.05 = –z0.5-0.05 = –z0.45 = –1.645 y como el estadígrafo Z calculado es -4.71 entones de acuerdo al criterio de decisión – 4.71 < –1.645 llegamos a la conclusión, de que lo alegado por el fabricante no se cumple usando un nivel de significación del 5%. Teniendo en cuenta los resultados por el procesador Statgraphics: El StatAdvisor Pruebas de hipótesis de proporciones 14 ----------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar son: Hipótesis Nula: theta = 0,9 Hipótesis Alternativa: theta < 0,9 En esta muestra de 200 observaciones, la proporción de la muestra es igual a 0,8. Puesto que el p-valor para el test es inferior a 0,05, la hipótesis nula se rechaza para el 95,0% de nivel de confianza. Los límites de confianza muestran que lo valores de theta soportado por los datos son inferiores o igual a 0,845449. Ejemplo 5,2 Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se hacen los análisis e interpretaciones finales del problema. De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes: Como = 0.05, entonces z0.95 = 1.645 y como el estadígrafo Z calculado es 0.93 entones de acuerdo al criterio de decisión 0.93 < 1.645 llegamos a la conclusión, de que el cambio en la fórmula del medicamento no conlleva a mejores resultados. Teniendo en cuenta los resultados por el procesador Statgraphics: StatAdvisor -------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar son: Hipótesis Nula: theta = 0.75 Hipótesis Alternativa: theta > 0.75 En esta muestra de 101 observaciones, la proporción de la muestra es igual a 0.79. Puesto que el p-valor para el test es superior o igual a 0.05, la hipótesis nula no puede rechazarse para el 95.0% de nivel de confianza. Los límites de confianza muestran que los valores de theta soportado por los datos son superiores o iguales a 0.712307. Pruebas de hipótesis de proporciones 15 Ejemplo 5,3 Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se hacen los análisis e interpretaciones finales del problema. De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes: Como = 0.05, entonces z0.5-0.05/2 = z0.475 = 1.96 y como el estadígrafo Z calculado es 2.87 entones de acuerdo al criterio de decisión 2.87 > 1.96 llegando a la conclusión de que se rechaza la hipótesis nula y no se puede considerar que la tasa de trastornos locomotores para ese hospital en específico siga el patrón de la región. Teniendo en cuenta los resultados por el procesador Statgraphics: El StatAdvisor -----------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar son: Hipótesis Nula: theta = 0.05 Hipótesis Alternativa: theta <> 0.05 En esta muestra de 257 observaciones, la proporción de la muestra es igual a 0.089. Puesto que el p-valor para el test es inferior a 0.05, la hipótesis nula se rechaza para el 95.0% de nivel de confianza. El intervalo de confianza muestra que los valores de theta soportado por los datos se encuentran entre 0.0571772 y 0.130684. Ejemplo 5,4 Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se hacen los análisis e interpretaciones finales del problema. De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes: Como = 0.05, entonces z1-0.05/2 = z0.975 = 1.96 y como el estadígrafo Z calculado es 1.54 entones de acuerdo al criterio de decisión -1.96 1.5432 1.96 cae en la región de aceptación, llegamos a la conclusión de que no se rechaza la hipótesis nula y no se puede considerar de que halla una diferencia significativa entre las personas que se recuperan a favor del grupo donde se introdujo el suero respecto al grupo control que permanece con el tratamiento habitual. Teniendo en cuenta los resultados por el procesador Statgraphics: El StatAdvisor ------------------ 16 Pruebas de hipótesis de proporciones Este análisis muestra los resultados de realizar el contraste de hipótesis referente a la diferencia de proporciones (theta1-theta2) de dos muestras de distribución binomial. Las dos hipótesis a considerar son: Hipótesis Nula: theta1-theta2 = 0.0 Hipótesis Alternativa: theta1-theta2 <> 0.0 En la primera muestra de 100 observaciones, la proporción de la muestra es igual a 0.75. En la segunda muestra de 100 observaciones la proporción de la muestra es igual a 0.65. Puesto que el p-valor para el test es superior o igual a 0.05, la hipótesis nula no puede rechazarse para el 95.0% de nivel de confianza. El intervalo de confianza muestra que los valores de theta1-theta2 soportado por los datos se encuentran entre -0.0262621 y 0.226262. NOTA: este test usa una aproximación normal. Debido al pequeño tamaño de las muestras, la aproximación puede no ser válida. Paso 6 Es en este paso donde usted debe decidir si a los resultados de la prueba de hipótesis los toma, los deja o se abstiene de ellos, en fin todo lo que hicimos antes fue para “DECIDIR”. Paso 2 Tabla 1 Valores críticos de la distribución normal estándar Las cabeceras de columna muestran el alfa (nivel de significación) para un contraste a una cola. Para un contraste a dos colas, elija el valor de encabezado que muestre la mitad del nivel alfa deseado. (Por ejemplo, para un contraste a dos colas al nivel de significación del 10 %, use la columna 0,05). 0,10 0,05 0,025 0,01 0,005 0,001 1,282 1,645 1,960 2,326 2,576 Como se observa en los resultados del caso 1 y 2, para =0.05 el valor del punto crítico Z1- es 1.645 Como se observa en los resultados del caso 3 y 4, para /2=0.025 el valor del punto crítico Z1-/2 es 1.960 3,090 Pruebas de hipótesis de proporciones 17 Paso 4 Ejemplo 4,1 Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n=160/200 = 0.8. Sustituyendo, Z = (0.8 – 0.9) / √ 0.9 (0.1)/200 = – 0.1/0.021 = – 4.71. Utilizando el Statgraphic los resultados son los siguientes: Contraste de Hipótesis ---------------------------Proporción de la Muestra = 0,8 Tamaño de la Muestra = 200 Aproximado 95,0% superior límite de confianza para p: [0,845449] Hipótesis Nula: proporción = 0,9 Alternativa: menor que p-Valor = 0,0000170073 Rechazar la hipótesis nula para alpha = 0,05. Recomendamos ver la página Web: http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral. htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre cómo realizar el procesamiento en las pruebas de hipótesis de proporciones. Ver ejemplo de cómo realizar el procesamiento de los datos con el Statgraphics 2,1 en este caso. Ejemplo 4,2 Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n =80/101 = 0.79 Sustituyendo, Z = (0.79 – 0.75) / √ 0.75 (0.25)/101 = 0.04/0.043 = 0.93 Utilizando el Statgraphic los resultados son los siguientes: Pruebas de hipótesis de proporciones 18 Contraste de Hipótesis -----------------------------------Proporción de la Muestra = 0.79 Tamaño de la Muestra = 101 Aproximado 95.0% inferior límite de confianza para p: [0.712307] Hipótesis Nula: proporción = 0.75 Alternativa: mayor que p-Valor = 0.195784 No rechazar la hipótesis nula para alpha = 0.05. Recomendamos: Ver la página Web: http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral. htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre cómo realizar el procesamiento en las pruebas de hipótesis de proporciones. Ejemplo 4,3 Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n =23/257 = 0.089 Sustituyendo, Z = (0.089 – 0.05) / √ 0.05(0.95)/257 = 0.039/0.01359 = 2.87 Utilizando el Statgraphics los resultados son los siguientes: Contraste de Hipótesis --------------------------Proporción de la Muestra = 0.089 Tamaño de la Muestra = 257 Aproximado 95.0% intervalo de confianza para p: [0.0571772, 0.130684] Hipótesis Nula: proporción = 0.05 Alternativa: no igual p-Valor = 0.0108548 Rechazar la hipótesis nula para alpha = 0.05. Recomendamos ver la página Web: http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral. htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre cómo realizar el procesamiento en las pruebas de proporciones. Ejemplo 4,4 Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo 19 Pruebas de hipótesis de proporciones Z = p1 - p2 / P*Q*(1/n1 + 1/n2), para ello hallemos el valor de P* = (n1p1 + n2 p2) / n1 + n2 e igual a x1 + x2 / n1 + n2 = 75+65/100+100 = 140/200 = 0.7 y la diferencia entre las proporciones estimadas de pacientes que se recuperaron en cada grupo p1 – p 2 = 75/100 – 65/100 = 0.1 Sustituyendo, Z = (0.1) / √ 0.7 (0.3) (1/100 +1/100) = 0.1 / √0.21 (0.02) = 0.1 /0.0648 = 1.5432 Utilizando el Statgraphics los resultados son los siguientes: Contraste de Hipótesis ----------------------------Proporciones de la Muestra = 0.75 y 0.65 Tamaños de la Muestra = 100 y 100 Aproximado 95.0% intervalo de confianza para la diferencia entre proporciones: [0.0262621, 0.226262] Hipótesis Nula: diferencia entre proporciones = 0.0 Alternativa: no igual Estadístico z calculado = 1.54303 p-Valor = 0.122822 No rechazar la hipótesis nula para alpha = 0.05. Advertencia: la aproximación normal no es apropiada para muestra de pequeño tamaño. Recomendamos ver la página Web: http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral. htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre cómo realizar el procesamiento en las pruebas de proporciones. Bibliografía 1. Cursos de Maestrías. Metodología de la Investigación, Promoción y Educación para la salud. [en CD-ROM User Guide]. ENSAP. Versión 1,0 La Habana, 2004. 2. Freund E. John. Estadística Elemental Moderna. Edición Revolucionaria. La Habana. 1987. 3. Colectivo de autores. Laboratorio de Estadística Matemática II. Editorial Félix Varela, la Habana,2004. 4. Guerra Bustillo W. Caridad y otros. Estadística. Editorial Félix Varela, la Habana,2004. 5. 6. 7. 8. 20 Pruebas de hipótesis de proporciones Oliva G. Leonardo, O´Farril M. Esperanza. Bioestadística y Computación, quía de estudio. Edit. Pueblo y Educación. La Habana. 1988. Oliva G. Leonardo y otros. Bioestadística. Cuaderno de ejercicios. Edit. Pueblo y Educación. La Habana. 1988. Colectivo de autores. Bioestadística y Computación. Editorial Pueblo y Educación. La Habana, 1987. Colectivo de autores. Informática Médica Tomo II. Editorial Ciencias Médicas. La Habana. 2005. Datos del autor Lic. Profesor Asistente Lorenzo Pérez Milanés Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta” Las Tunas, Cuba E-mail: [email protected] [email protected] Página Web: http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/lorenzo. php Procesador Le recomendamos utilizar el Zoom 200 % para ver mejor contenidos de las ventanas. Paso 1 Paso 3 Paso2 Paso4 Pruebas de hipótesis de proporciones Paso 5 Paso 5: extraer resultados 21 Pruebas de hipótesis de proporciones 22