http://www.ilustrados.com/documentos/eb-pruebaproporciones.doc

Anuncio
Pruebas de hipótesis de proporciones
Trabajo publicado en www.ilustrados.com
La mayor Comunidad de difusión del conocimiento
PROPUESTA METODOLÓGICA SOBRE LA
RESOLUCIÓN DE PROBLEMAS BIOMÉDICOS QUE
CONDUCEN A LAS PRUEBAS O ENSAYOS DE
HIPÓTESIS DE PROPORCIONES
AUTOR: Prof.Asistente Lorenzo Pérez Milanés
[email protected]
1
Pruebas de hipótesis de proporciones
2
Índice
Resumen ................................................................... 3
Introducción ............................................................... 3
Desarrollo: ................................................................ 4
Metodología de resolución
Bibliografía ............................................................... 19
Datos del autor .......................................................... 20
Año de realización: 2007
Resumen
Pruebas de hipótesis de proporciones
3
Este artículo está dirigido fundamentalmente a los profesionales de la Salud y en
especial a los estudiantes de 2do. Año de la carrera de Medicina y Estomatología, así
como también para los de Enfermería de la Facultad de Ciencias Médicas “Zoilo E.
Marinello Vidaurreta” de Las Tunas, los cuales reciben las asignaturas de
Informática Médica II, Informática e Investigación III y IV respectivamente, en la
que se aborda la problemática de la resolución de problemas biomédicos que conducen
a las “pruebas de hipótesis de proporciones” en el marco de la Estadística
Inferencial. En el mismo se presentan algunas valoraciones teóricas sobre el tema y
una propuesta metodológica con una serie de pasos lógicos para realizar las pruebas
de hipótesis que utilizan los modelos de distribución normal de Gauss y binomial , así
como algunas indicaciones en el uso del procesador Statgraphics versión 2,1 en Inglés
para el cálculo y análisis de los resultados . Además este material puede ser también
útil a otros profesionales que aborden la Estadística Inferencial en general.
Introducción
En múltiples de ocasiones cuando se trabaja en las ciencias de la salud surge con
frecuencia la necesidad de tomar decisiones con relación a diferentes problemas de
investigación, generalmente al no contar con el tiempo ni con los recursos para
estudiar a toda la población, seleccionamos una muestra aleatoria a partir de la cual
nos permita tomar decisiones sobre la población.
Las Pruebas de Hipótesis tienen el propósito de ayudar al investigador a tomar
decisiones sobre la población basándose en el análisis de una muestra aleatoria de la
misma, las decisiones que debemos tomar son en relación con determinadas
características de la población, denominados parámetros, que necesitamos conocer,
para resolver un problema.
De manera que hay que establecer un procedimiento objetivo que permita, sobre la
base de la información muestral obtenida, tomar una decisión sobre los parámetros
de la población, lo que determinará cierto grado de incertidumbre asociada a la
decisión.- Este procedimiento se conoce como Prueba de Hipótesis.
Existen innumerables de situaciones en el ámbito de la salud en el que las variables
de interés al igual que en el caso de la estimación puntual y la estimación por
intervalo de confianza, es posible construir pruebas de hipótesis para verificar
suposiciones acerca del comportamiento de variables en la población cuando éstas no
están medidas en escala continua, por lo que no pueden ser apropiadamente
resumidas a través de la media aritmética, en la que el investigador está interesado
en determinar posibles relaciones poblacionales, ejemplos de estos tipos de
situaciones pueden ser:
4
Pruebas de hipótesis de proporciones
La verificación de la efectividad de un medicamento para aliviar la alergia por un
período de determinado, de un tratamiento preventivo novedoso para una
enfermedad, etc., análisis de las cuales nos pueden conducir a las pruebas de
hipótesis de proporciones con la correspondiente aplicación de las distribuciones
binomial y normal de Gauss respectivamente como veremos más adelante.
La experiencia nos ha conducido a tener en cuenta el fracaso que experimentan los
principiantes y estudiantes en el proceso de resolución de problemas que conducen a
estas distribuciones y en especial en la realización de pruebas de hipótesis de este
tipo por numerosos factores como, prestar su atención solamente en las habilidades
computacionales, en el quehacer metodológico o en la rama descriptiva de la
Estadística como ciencia, por lo que pretendemos contribuir al éxito de esta
temática en el contexto de los nuevos paradigmas de creación, difusión y utilización
del conocimiento, de manera que consideramos que los apuntes que se proponen es un
elemento a considerar en este sentido.
Desarrollo:
Pruebas de hipótesis de proporciones
En general estos tipos de ensayos consisten en considerar una población y una
característica a observar en cada individuo de esa población. Sea P * la proporción de
individuos de la población que poseen la característica en cuestión. Consideremos
además una muestra simple aleatoria de tamaño n de la población. Cada elemento de
la población, y por tanto, cada elemento de la muestra posee o no la característica
que se observa.
Sea X, la variable aleatoria que toma el valor 1 si el elemento i-ésimo de la muestra
posee la característica, y el valor 0 si no la posee (i= 1,2,…., n). Cada una de estas
variables X1, X2,…Xn posee distribución de Bernoulli, o sea, binomial con parámetros 1
y p, y la variable aleatoria.
n
X=Xi
i=1
que registra el número de elementos de la muestra que poseen la característica tiene
entonces una distribución binomial con parámetros n y p. Estos resultados son
exactos en el caso del muestreo con reemplazo y constituyen una buena aproximación
si n es suficientemente grande.
Además,
n
p =  X i/ n
i=1
; será igual entonces a la proporción de individuos de la
muestra que poseen la característica y se tiene también
X=np
5
Pruebas de hipótesis de proporciones
Si el tamaño n de la muestra es suficientemente grande la distribución de la variable
aleatoria X es aproximadamente normal con media np y varianza np(1-p), y por
tanto, se puede utilizar la distribución normal en lugar de la binomial para determinar
la región crítica en las pruebas de hipótesis para una proporción p como se verá a
continuación.
Hipótesis estadísticas.
Para tomar decisiones se hacen supuestos o conjeturas acerca de las poblaciones,
tales suposiciones que pueden o ser ciertas o no se llaman hipótesis estadísticas.
Estas se formulan para rechazarlas o invalidarlas.
Ejemplos:
I. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a
una característica de la población, digamos que se quiere probar que la
proporción poblacional p* es menor a un valor determinado p*o : lo expresado
se acostumbra a representar por:
H0: p* ≥ p*o
H1: p*  p*o
II. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a
una característica de la población, digamos que se quiere probar que la
proporción poblacional p* es mayor a un valor determinado p*o : lo expresado
se acostumbra a representar por:
H0: p* ≤ p*o
H1: p* > p*o
III. Supóngase que se quiere examinar la validez o no, de una hipótesis referida a
una característica de la población, digamos que se quiere probar que la
proporción poblacional p* no es igual a un valor determinado p*o; lo expresado
se acostumbra a representar por:
H0: p* = p*o
H1: p*  p*o
Las que se denotan por H0 se les llaman hipótesis Nulas.

Cualquier hipótesis “que difiera” de una hipótesis dada se llama alternativa y se

denotan por H1
Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o
el determinar si las muestras observadas difieren significativamente de los
resultados esperados se llaman Ensayos de significación o Reglas de decisión.
Errores del tipo I y tipo II.
Tipo I: Cuando “se rechaza” una hipótesis, cuando debería ser aceptada.
Tipo II: Cuando “se acepta “una hipótesis que debería ser rechazada.
En cualquiera de los dos casos se comete “un error “al tomar una decisión equivocada
y resumiendo las situaciones anteriores respecto a las decisiones sobre H 0 a partir
de los valores observados en la muestra aleatoria tenemos que:
Pruebas de hipótesis de proporciones
6
Decisión sobre H0
Si H0 es:
No rechazar
Rechazar
Verdadera
Falsa
Acción correcta
Error de tipo II
Error de tipo I
Acción correcta
Nivel de significación
La probabilidad máxima con la que el ensayo de una hipótesis se puede cometer un
error del tipo I se llama nivel de significación del ensayo. Se denota por  (se fija
antes de la extracción de la muestra).
En la práctica se acostumbra a utilizar los niveles de significación  = 0.05 (5%) o  =
0.01 (1 %).
En el caso del ejemplo I estamos en presencia de las llamadas hipótesis de “una
cola” como se muestra en el siguiente gráfico y estas son equivalentes:
H'0: µ ≥ µ o
H'1: µ < µ o donde µ = np* y µ o = np*o
Por tanto, utilizando el estadígrafo
Z = (X – np*)/√np*(1-p*) = ( X - µ o ) /  /√n
donde X = X/n = p ; µ o = p*o y 2= p*(1-p*)
Se puede demostrar también que: Z= (p-p*) / √p*Q*/n, siendo Q*= 1-p*
Entonces para n suficientemente grande Z tiene distribución normal con media 0 y
varianza 1 y la región crítica será {Z R  Z < - Z1- }, donde Z1- es el percentil de
orden 1- de la distribución normal estándar, según la tabla 1
- Z1-
En el caso del ejemplo II estamos en presencia de las llamadas hipótesis de “una
cola” como se muestra en el siguiente gráfico y por consideraciones análogas a las del
caso 1 se llega a que:
H0: p* ≤ p*o
H1: p* > p*o
Por consideraciones análogas a las del caso 1 se llega a que, utilizando el estadígrafo
Z = (X – np*)/√np*(1-p*), la región crítica es: {Z R  Z > Z1- } y Z1- es el percentil
de orden 1- de la distribución normal estándar, según la tabla 1.
Pruebas de hipótesis de proporciones
7
Z1
En el caso del ejemplo III estamos en presencia de las llamadas hipótesis de “dos
cola” como se muestra en el siguiente gráfico y por consideraciones análogas a las del
caso 1 se llega a que:
H0: p* = p*o
H1: p* ≠ p*o
Por consideraciones análogas a las del caso 1 se llega a que, utilizando el estadígrafo
Z = (X – np*)/√np*(1-p*), la región crítica es: {Z R Z > Z1-/2}, es decir, Z > Z1- /2
y Z <- Z1-/2 en la que Z1- /2 es el percentil de orden 1- de la distribución normal
estándar, según la tabla 1.
/2
/2
-Z1-/2
Z1-/2
Otro criterio de decisión que no queremos pasar por alto es el del p-valor
Si el p-valor <  se debe Rechazar Ho
Si el p-valor ≥  se debe aceptar Ho
Este estadístico o nivel de significación empírico como se conoce nos informa sobre
cuál sería el nivel de significación más pequeño que nos hubiera permitido rechazar
la hipótesis nula. En algunos procesadores como el Statgraphics, como veremos más
adelante, es de fácil cálculo.
Diferencias de proporciones
Un problema de gran importancia y que se presenta frecuentemente en el trabajo
estadístico es el determinar si dos poblaciones difieren con respecto a una cierta
característica.
8
Pruebas de hipótesis de proporciones
Por ejemplo ¿existe diferencia entre el porcentaje de fumadores y no fumadores que
presentan cáncer bucal?
Si x1 y x2 son el número de “éxitos” observados respectivamente, en grandes
muestras aleatorias independientes de tamaño n1 y n2, y si p1 y p2 son las
probabilidades correspondientes para el éxito en pruebas individuales, entonces la
distribución del muestreo de la estadística:
(1) x1 /n1 - x2/n2 (para n > 30)
la diferencia entre las dos proporciones muéstrales se puede aproximar con bastante
exactitud a una curva normal cuya media sea p1-p2 y su desviación estándar sea :
(2)p1(1- p1)/n1+p2(1-p2)/n2 distribución estándar de la distribución del muestreo
de las diferencias entre dos proporciones.
Los problemas así expuestos se pueden tratar como problemas de pruebas de
hipótesis, del tipo:
Ho: P*1 = P*2 = P*; donde P*1 y P*2 son las dos proporciones de población de la
característica que se analiza.
H1: P*1  P*2 (en los problemas que tratan de las diferencias entre proporciones
estamos interesados por lo general en probar si en realidad hay una diferencia entre
P*1 y P*2.
p1 y p2 como dijimos son las proporciones muéstrales de dos grandes muestras de
tamaños n1 y n2 extraídas de poblaciones respectivas que tienen proporciones P1* y
P2*.
Consideremos la hipótesis nula de que no hay diferencia entre los parámetros
poblacionales, es decir, P*1 = P*2. Se ve que la distribución muestral de la diferencia
de proporciones se distribuye aproximadamente como una normal con media y
desviación Standard dada por:
 P1*- P2* = 0
Q* = 1- P*
P1* - P2* =  P*Q*(1/n1 + 1 / n2), donde: P* = (n1p1 + n2 p2) / n1 + n2 e igual a
x1 + x2 / n1 + n2 y conocida como media ponderada de las dos relaciones
proporcionales, pues p = x / n .
El método que estamos desarrollando ha de ser utilizado, solamente para muestras
grandes. La variable estandarizada Z esta dada por: Z = p - p /  P*Q*(1/n + 1/n )
1
2
1
2
Esta expresión se obtiene de sustituir en la ecuación (2) a p1 y p2 por P*.
También se puede plantear que Z= p1 - p2 / P*(1- P*) (1/n1 + 1/n2) y efectuando el
producto que aparece en el denominador queda finalmente que:
Z = p1-p2 /  P*( 1- P* )/n1 + P*(1- P*)/n2)
Si los valores de P1* y
P2*
se
desconocen se utilizan los estimadores p1 y p2 como una aproximación de los mismos.
Una vez calculada Z se procede en la forma indicada para las pruebas anteriores.
9
Pruebas de hipótesis de proporciones
Después de haber analizado los elementos teóricos anteriores aparecen gravitando
alrededor del tema que nos ocupa, las siguientes interrogantes: ¿ Cuándo tendríamos
que realizar una prueba de proporciones o de diferencia de proporciones?,¿ Cómo se
hacen estos tipos de pruebas ?, ¿ Cuáles serían los pasos a seguir para tener éxito en
la realización de las mismas ?, ¿ Qué tendríamos que hacer en cada paso ?, en fin
para responder a estas y a otras interrogantes que puedan surgir les proponemos a
continuación una “metodología” de resolución de problemas biomédicos que conducen
a estas pruebas de hipótesis. La misma está constituida por una serie de
pasos lógicos que recomendamos seguir y que han sido extraídos de la experiencia
que hemos acumulado en la impartición y en el trabajo metodológico a la Estadística
Inferencial por parte del colectivo docente, así como de resultados en la aplicación
de exámenes y técnicas cualitativas para conocer el grado de aceptación y
satisfacción de esta metodología en los estudiantes con el propósito de facilitar y
guiar a los mismos en la obtención del éxito de estos tests.
Hemos querido presentarle a continuación la “metodología” mediante la tabla 2 con
los pasos que sugerimos seguir para realizar las pruebas y en los que se podrán
apreciar vínculos que nos mostraran, a través de tres ejemplos concretos, que debe
hacerse en cada uno de ellos, así como su contenido.
Ejemplo 1: Prueba de hipótesis de proporciones de una cola (a la izquierda).
Ejemplo 2: Prueba de hipótesis de proporciones de una cola (a la derecha).
Ejemplo 3: Prueba de hipótesis de proporciones de dos colas.
Ejemplo 4: Prueba de hipótesis de diferencia de proporciones.
Metodología de resolución de problemas que conducen
a las pruebas de hipótesis de proporciones
I.
Tabla 2
Identificar el tipo de problema de ensayos de
hipótesis.




II.
Buscar los valores de Z tabulados según el nivel de
significación  prefijado.
 Tabla de valores críticos de la
distribución normal estándar
III.
Planteamiento de las hipótesis nula, alternativa y el
criterio de decisión.




De una cola a la izquierda
De una cola a la derecha
De dos colas
Diferencia de proporciones




De una cola a la izquierda
De una cola a la derecha
De dos colas
Diferencia de proporciones




De una cola a la izquierda
De una cola a la derecha
De dos colas
Diferencia de proporciones
IV. Cálculo de los estadígrafos Z y del intervalo de
confianza. con el procesador estadístico.
V. Análisis e interpretación de los resultados.
VI. Toma de decisión.
De una cola a la izquierda
De una cola a la derecha
De dos colas
Diferencia de proporciones
Pruebas de hipótesis de proporciones
10
Paso 1
Ejemplo 1
Un fabricante de una medicina alega que esta es efectiva en un 90 % para aliviar la
alergia por un período de 8 h. En una muestra de 200 personas que tenían alergia, la
medicina proporcionó mejoría a 160. Diga si lo alegado por el fabricante es cierto.
Use  = 0.05
Después de leer el problema varias veces debemos identificar el tipo de prueba de
hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la
escala continua, refiriéndose a un % o proporción de efectividad de un medicamento,
en la que es evidente el análisis de proporciones de una distribución muestral
binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30)
y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes
para saber que estamos en presencia de una prueba de proporciones.
Ejemplo 2
Se conoce que un medicamento utilizado en el tratamiento de cierta enfermedad es
efectivo en un 75 % de los casos. Se plantea que un ligero cambio en la fórmula del
medicamento conlleva mejores resultados.
Pruebe para un  = 0.05 si se obtiene el resultado esperado en la muestra de 101
pacientes donde se aplicó la nueva variante del medicamento, en la que 80 personas
reaccionaron favorablemente.
Después de leer el problema varias veces debemos identificar el tipo de prueba de
hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la
escala continua, refiriéndose a un % o proporción de efectividad de un medicamento,
en la que es evidente el análisis de proporciones de una distribución muestral
binomial que se aproxima a una normal al ser la muestra lo suficiente grande(n 30)
y n p > 5 como se puede apreciar. De manera que estos elementos son suficientes
para saber que estamos en presencia de una prueba de proporciones.
Ejemplo 3
Consideremos una muestra aleatoria de 257 individuos que fueron ingresados en un
hospital de determinada región. La causa de hospitalización de 23 de ellos fue
trastorno locomotor. Si la tasa de enfermedades locomotoras en hospitales
semejantes de la región es de 5%, ¿puede considerarse que esta muestra sigue el
patrón de enfermedad locomotora característico de la región? Utilice un nivel de
significación de 0.05.
Después de leer el problema varias veces debemos identificar el tipo de prueba de
hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la
escala continua, refiriéndose a una tasa expresada en %, en la que es evidente el
11
Pruebas de hipótesis de proporciones
análisis de proporciones de una distribución muestral binomial que se aproxima a una
normal al ser la muestra lo suficiente grande(n 30) y n p > 5 como se puede
apreciar. De manera que estos elementos son suficientes para saber que estamos en
presencia de una prueba de proporciones.
Ejemplo 4
Dos grupos de 100 personas cada uno, padecen una enfermedad. Al grupo 1, además
del tratamiento habitual, se le aplica un suero y el grupo 2 (grupo control) permanece
con el tratamiento habitual. Al final del ensayo se encuentra que 75 pacientes del
grupo 1 y 65 del grupo 2 se recuperaron. ¿Cree usted que existe una diferencia
significativa entre los que se recuperan en uno y otro grupo? Utilice un nivel de
significación de 0.05
Después de leer el problema varias veces debemos identificar el tipo de prueba de
hipótesis y para ello debemos darnos cuenta que la variable no se puede medir en la
escala continua, refiriéndose a porcientos (%) o proporciones de efectividad de dos
tratamientos aplicados a cada uno de los grupos de estudio respectivamente, lo que
evidencia el análisis de dos proporciones de una distribución muestral binomial que
se aproxima a una normal al ser la muestra lo suficiente grande(n 30) y n p > 5
como se puede apreciar. De manera que estos elementos son suficientes para saber
que estamos en presencia de una prueba de diferencia de proporciones.
Paso 3
Ejemplo 3,1
Sea p* la proporción poblacional de personas que mejoran su alergia usando la
medicina. Estamos interesados en comprobar si la proporción de personas aliviadas
por la medicina es menor que lo que se alega, puesto que si fuese igual o mayor el
resultado respaldaría lo que afirma el productor. Entonces escogemos la hipótesis:
H0: p* = 0.9
H1: p* < 0.9 (De una cola a la izquierda)
El criterio de decisión será:
La región crítica será {Z R  Z < - Z1- }
Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) /
√p*Q*/n, siendo Q*= 1-p* es menor que el tabulado -Z1- (Z  - Z1- ). Este punto
crítico Z1- se obtiene en la tabla 1 para  = 0.05, el cual constituye el paso 2,
resultando ser 1.645.
Aceptar Ho si Z > - Z1-
Pruebas de hipótesis de proporciones
12
Ejemplo 3,2
Sea p* la proporción poblacional del medicamento utilizado en el tratamiento de la
cierta enfermedad con efectivad del 75 % de los casos. Se plantea que un ligero
cambio en la fórmula del medicamento conlleva mejores resultados. Estamos
interesados en comprobar si la proporción o efectividad del medicamento con la
nueva fórmula es mayor de lo que se alega, puesto que si fuese igual o menor el
resultado respaldaría lo que se afirma del medicamento tradicional. Entonces
escogemos la hipótesis:
H0: p* = 0.75
H1 : p*  0.75
(De una cola a la derecha)
El criterio de decisión será:
La región crítica será {Z R  Z > Z1- }
Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) /
√p*Q*/n, siendo Q*= 1-p* es mayor que el tabulado Z1- (Z  Z1- ). Este punto crítico
Z1- se obtiene en la tabla 1 para  = 0.05, el cual constituye el paso 2, resultando ser
1.645.
Aceptar Ho si Z  Z1-
Ejemplo 3,3
Sea p* la proporción poblacional de individuos que ingresan con trastorno locomotor,
la cual se ha planteado que sigue el patrón de enfermedad locomotora característico
de la región de una tasa del 5 %. Se quiere saber si la muestra utilizada sigue este
patrón tradicional para la región o comprobar si la proporción o tasa de
enfermedades locomotoras es desigual de lo que se alega, puesto que si fuese igual
el resultado respaldaría lo que se afirma del patrón tradicional en hospitales
semejantes. Entonces escogemos la hipótesis:
H0: p* = 5 %
H1 : p* ≠ 5 % (De dos colas)
El criterio de decisión será:
La región crítica será {Z R Z < -Z1-/2 y Z > Z1-/2}
Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula Z= (p-p*) /
√p*Q*/n, siendo Q*= 1-p* es mayor que el tabulado Z1-/2 (Z  Z1-/2) o menor que -
Z1-/2 (Z < -Z1-/2). Este punto crítico Z1-/2 se obtiene en la tabla 1 para /2 =
0.025, el cual constituye el paso 2, resultando ser 1.96.
Aceptar Ho si -Z1-/2  Z  Z1-/2
Pruebas de hipótesis de proporciones
13
Ejemplo 3,4
Si se considera que p*1 represente la proporción poblacional de personas que se
recuperan cuando se usa el suero y p*2 lo mismo pero sin usar el suero. Estamos
interesados en saber si existe una diferencia significativa entre los que se
recuperan en uno y otro grupo Entonces podemos plantear la hipótesis:
H0: p*1 = p*2
H1: p*1  p*2
El criterio de decisión será:
La región crítica será {Z R Z < -Z1-/2 y Z > Z1-/2}
Rechazar Ho si el valor del estadígrafo Z obtenido mediante la fórmula
Z = p1 - p2 /  P*Q*(1/n1 + 1/n2), siendo P* = (n1p1 + n2 p2) / n1 + n2 e igual a x1 + x2 / n1 +
n2 es mayor que el tabulado Z1-/2 (Z  Z1-/2) o menor que -Z1-/2 (Z < -Z1-/2). Este
punto crítico Z1-/2 se obtiene en la tabla 1 para /2 = 0.025, el cual constituye el
paso 2, resultando ser 1.96.
Aceptar Ho si -Z1-/2  Z  Z1-/2
Paso 5
Ejemplo 5,1
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos
en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se
hacen los análisis e interpretaciones finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:
Como  = 0.05, entonces z0.05 = –z0.5-0.05 = –z0.45 = –1.645 y como el estadígrafo Z
calculado es -4.71 entones de acuerdo al criterio de decisión – 4.71 < –1.645 llegamos
a la conclusión, de que lo alegado por el fabricante no se cumple usando un nivel de
significación del 5%.
Teniendo en cuenta los resultados por el procesador Statgraphics:
El StatAdvisor
Pruebas de hipótesis de proporciones
14
----------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a
la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar
son:
Hipótesis Nula:
theta = 0,9
Hipótesis Alternativa: theta < 0,9
En esta muestra de 200 observaciones, la proporción de la muestra es igual a 0,8.
Puesto que el p-valor para el test es inferior a 0,05, la hipótesis nula se rechaza para
el 95,0% de nivel de confianza. Los límites de confianza muestran que lo valores de
theta soportado por los datos son inferiores o igual a 0,845449.
Ejemplo 5,2
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos
en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se
hacen los análisis e interpretaciones finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:
Como  = 0.05, entonces z0.95 = 1.645 y como el estadígrafo Z calculado es 0.93
entones de acuerdo al criterio de decisión 0.93 < 1.645 llegamos a la conclusión, de
que el cambio en la fórmula del medicamento no conlleva a mejores resultados.
Teniendo en cuenta los resultados por el procesador Statgraphics:
StatAdvisor
-------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a
la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar
son:
Hipótesis Nula:
theta = 0.75
Hipótesis Alternativa: theta > 0.75
En esta muestra de 101 observaciones, la proporción de la muestra es igual a 0.79.
Puesto que el p-valor para el test es superior o igual a 0.05, la hipótesis nula no puede
rechazarse para el 95.0% de nivel de confianza. Los límites de confianza muestran
que los valores de theta soportado por los datos son superiores o iguales a 0.712307.
Pruebas de hipótesis de proporciones
15
Ejemplo 5,3
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos
en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se
hacen los análisis e interpretaciones finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:
Como  = 0.05, entonces z0.5-0.05/2 = z0.475 = 1.96 y como el estadígrafo Z calculado
es 2.87 entones de acuerdo al criterio de decisión 2.87 > 1.96 llegando a la conclusión
de que se rechaza la hipótesis nula y no se puede considerar que la tasa de
trastornos locomotores para ese hospital en específico siga el patrón de la región.
Teniendo en cuenta los resultados por el procesador Statgraphics:
El StatAdvisor
-----------------Este análisis muestra los resultados de realizar el contraste de hipótesis referente a
la proporción (theta) de una distribución binomial. Las dos hipótesis a considerar
son:
Hipótesis Nula:
theta = 0.05
Hipótesis Alternativa: theta <> 0.05
En esta muestra de 257 observaciones, la proporción de la muestra es igual a 0.089.
Puesto que el p-valor para el test es inferior a 0.05, la hipótesis nula se rechaza para
el 95.0% de nivel de confianza. El intervalo de confianza muestra que los valores de
theta soportado por los datos se encuentran entre 0.0571772 y 0.130684.
Ejemplo 5,4
Este es el paso más importante de la prueba, pues utilizando los resultados obtenidos
en el procesamiento, especialmente los del paso 2 y planteamientos del 3, es que se
hacen los análisis e interpretaciones finales del problema.
De acuerdo a lo planteado en el problema hacemos los razonamientos siguientes:
Como  = 0.05, entonces z1-0.05/2 = z0.975 = 1.96 y como el estadígrafo Z calculado es
1.54 entones de acuerdo al criterio de decisión -1.96  1.5432  1.96 cae en la región
de aceptación, llegamos a la conclusión de que no se rechaza la hipótesis nula y no se
puede considerar de que halla una diferencia significativa entre las personas que se
recuperan a favor del grupo donde se introdujo el suero respecto al grupo control
que permanece con el tratamiento habitual.
Teniendo en cuenta los resultados por el procesador Statgraphics:
El StatAdvisor
------------------
16
Pruebas de hipótesis de proporciones
Este análisis muestra los resultados de realizar el contraste de hipótesis referente a
la diferencia de proporciones (theta1-theta2) de dos muestras de distribución
binomial. Las dos hipótesis a considerar son:
Hipótesis Nula:
theta1-theta2 = 0.0
Hipótesis Alternativa: theta1-theta2 <> 0.0
En la primera muestra de 100 observaciones, la proporción de la muestra es igual a
0.75. En la segunda muestra de 100 observaciones la proporción de la muestra es
igual a 0.65. Puesto que el p-valor para el test es superior o igual a 0.05, la hipótesis
nula no puede rechazarse para el 95.0% de nivel de confianza. El intervalo de
confianza muestra que los valores de theta1-theta2 soportado por los datos se
encuentran entre -0.0262621 y 0.226262.
NOTA: este test usa una aproximación normal. Debido al pequeño tamaño de las
muestras, la aproximación puede no ser válida.
Paso 6
Es en este paso donde usted debe decidir si a los resultados de la prueba de
hipótesis los toma, los deja o se abstiene de ellos, en fin todo lo que hicimos antes
fue para “DECIDIR”.
Paso 2
Tabla 1
Valores críticos de la distribución normal estándar
Las cabeceras de columna muestran el alfa (nivel de significación) para un contraste a una cola. Para un contraste
a dos colas, elija el valor de encabezado que muestre la mitad del nivel alfa deseado. (Por ejemplo, para un
contraste a dos colas al nivel de significación del 10 %, use la columna 0,05).
0,10 0,05 0,025
0,01
0,005 0,001
1,282
1,645
1,960
2,326
2,576
Como se observa en los resultados del
caso 1 y 2, para =0.05 el valor del
punto crítico Z1- es 1.645
Como se observa en los resultados del
caso 3 y 4, para /2=0.025 el valor del
punto crítico Z1-/2 es 1.960
3,090
Pruebas de hipótesis de proporciones
17
Paso 4
Ejemplo 4,1
Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo
Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n=160/200 = 0.8.
Sustituyendo, Z = (0.8 – 0.9) / √ 0.9 (0.1)/200 = – 0.1/0.021 = – 4.71.
Utilizando el Statgraphic los resultados son los siguientes:
Contraste de Hipótesis
---------------------------Proporción de la Muestra = 0,8
Tamaño de la Muestra = 200
Aproximado 95,0% superior límite de confianza para p: [0,845449]
Hipótesis Nula: proporción = 0,9
Alternativa: menor que
p-Valor = 0,0000170073
Rechazar la hipótesis nula para alpha = 0,05.
Recomendamos ver la página Web:
http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral.
htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre
cómo realizar el procesamiento en las pruebas de hipótesis de proporciones.
Ver ejemplo de cómo realizar el procesamiento de los datos con el Statgraphics 2,1
en este caso.
Ejemplo 4,2
Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo
Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n =80/101 = 0.79
Sustituyendo, Z = (0.79 – 0.75) / √ 0.75 (0.25)/101 = 0.04/0.043 = 0.93
Utilizando el Statgraphic los resultados son los siguientes:
Pruebas de hipótesis de proporciones
18
Contraste de Hipótesis
-----------------------------------Proporción de la Muestra = 0.79
Tamaño de la Muestra = 101
Aproximado 95.0% inferior límite de confianza para p: [0.712307]
Hipótesis Nula: proporción = 0.75
Alternativa: mayor que
p-Valor = 0.195784
No rechazar la hipótesis nula para alpha = 0.05.
Recomendamos:
Ver la página Web:
http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral.
htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre
cómo realizar el procesamiento en las pruebas de hipótesis de proporciones.
Ejemplo 4,3
Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo
Z = (p-p*) / √p*Q*/n, para ello hallemos el valor de p = x/n =23/257 = 0.089
Sustituyendo, Z = (0.089 – 0.05) / √ 0.05(0.95)/257 = 0.039/0.01359 = 2.87
Utilizando el Statgraphics los resultados son los siguientes:
Contraste de Hipótesis
--------------------------Proporción de la Muestra = 0.089
Tamaño de la Muestra = 257
Aproximado 95.0% intervalo de confianza para p: [0.0571772, 0.130684]
Hipótesis Nula: proporción = 0.05
Alternativa: no igual
p-Valor = 0.0108548
Rechazar la hipótesis nula para alpha = 0.05.
Recomendamos ver la página Web:
http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral.
htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre
cómo realizar el procesamiento en las pruebas de proporciones.
Ejemplo 4,4
Utilizando la calculadora de nuestro PC podemos procesar el valor del estadígrafo
19
Pruebas de hipótesis de proporciones
Z = p1 - p2 /  P*Q*(1/n1 + 1/n2), para ello hallemos el valor de P* = (n1p1 + n2 p2) / n1 + n2
e igual a x1 + x2 / n1 + n2 = 75+65/100+100 = 140/200 = 0.7 y la diferencia entre las
proporciones estimadas de pacientes que se recuperaron en cada grupo p1 – p 2 =
75/100 – 65/100 = 0.1
Sustituyendo, Z = (0.1) / √ 0.7 (0.3) (1/100 +1/100) = 0.1 / √0.21 (0.02) = 0.1 /0.0648
= 1.5432
Utilizando el Statgraphics los resultados son los siguientes:
Contraste de Hipótesis
----------------------------Proporciones de la Muestra = 0.75 y 0.65
Tamaños de la Muestra = 100 y 100
Aproximado 95.0% intervalo de confianza para la diferencia entre proporciones: [0.0262621, 0.226262]
Hipótesis Nula: diferencia entre proporciones = 0.0
Alternativa: no igual
Estadístico z calculado = 1.54303
p-Valor = 0.122822
No rechazar la hipótesis nula para alpha = 0.05.
Advertencia: la aproximación normal no es apropiada para muestra de pequeño
tamaño.
Recomendamos ver la página Web:
http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/tutoral.
htm mediante la cual acceder a un tutoral del procesador Statgraphics 2,1 sobre
cómo realizar el procesamiento en las pruebas de proporciones.
Bibliografía
1. Cursos de Maestrías. Metodología de la Investigación, Promoción y Educación
para la salud. [en CD-ROM User Guide]. ENSAP. Versión 1,0 La Habana, 2004.
2. Freund E. John. Estadística Elemental Moderna. Edición Revolucionaria. La Habana.
1987.
3. Colectivo de autores. Laboratorio de Estadística Matemática II. Editorial Félix
Varela, la Habana,2004.
4. Guerra Bustillo W. Caridad y otros. Estadística. Editorial Félix Varela, la
Habana,2004.
5.
6.
7.
8.
20
Pruebas de hipótesis de proporciones
Oliva G. Leonardo, O´Farril M. Esperanza. Bioestadística y Computación, quía de
estudio. Edit. Pueblo y Educación. La Habana. 1988.
Oliva G. Leonardo y otros. Bioestadística. Cuaderno de ejercicios. Edit. Pueblo y
Educación. La Habana. 1988.
Colectivo de autores. Bioestadística y Computación. Editorial Pueblo y Educación.
La Habana, 1987.
Colectivo de autores. Informática Médica Tomo II. Editorial Ciencias Médicas. La
Habana. 2005.
Datos del autor
Lic. Profesor Asistente Lorenzo Pérez Milanés
Facultad de Ciencias Médicas “Zoilo E. Marinello Vidaurreta”
Las Tunas, Cuba
E-mail: [email protected]
[email protected]
Página Web:
http://www.ltu.sld.cu/curso_introductorio/informatica_medica1/bioest/pag/lorenzo.
php
Procesador
Le recomendamos utilizar el Zoom 200 % para ver mejor contenidos de las ventanas.
Paso 1
Paso 3
Paso2
Paso4
Pruebas de hipótesis de proporciones
Paso 5
Paso 5: extraer resultados
21
Pruebas de hipótesis de proporciones
22
Descargar