Contrastes de hipótesis Objetivos:

Anuncio
Contrastes de hipótesis
Objetivos:
- Conocer el concepto de contraste de hipótesis y de nivel de significación de un contraste.
- A la vista de una situación real de carácter económico o social, modelizada por medio de una
distribución Normal (con varianza conocida) o Binomial, el alumno debe saber:
-
Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste de
hipótesis, unilateral o bilateral, sobre la media de una distribución normal con varianza
conocida, y decidir, a partir de una muestra aleatoria adecuada, si se rechaza o se acepta la
hipótesis nula a un nivel de significación dado.
-
Determinar las regiones de aceptación y de rechazo de la hipótesis nula en un contraste de
hipótesis, unilateral o bilateral, sobre el valor de una proporción y decidir, a partir de una
muestra aleatoria adecuada, si se rechaza o se acepta la hipótesis nula a un nivel de
significación dado.
Para ello estudiaremos:
- Elementos de un test de hipótesis.
- Metodología general de un test de hipótesis.
- Contraste de hipótesis para la media de una población.
- Contraste bilateral:    0
- Contraste unilateral:    0 o
  0
- Contraste de hipótesis para la proporción.
- Contraste bilateral: p  p0
- Contraste unilateral: p  p0 o
p  p0
Planteamiento de un problema: Los fabricantes de una determinada marca de leche afirman que el
contenido en materias grasas, por término medio, es del 12% o menos. La desviación típica es 2’2%. Para
estudiar si es cierta o no la afirmación de los fabricantes, una organización de consumidores toma una
muestra de 50 envases y se mide el porcentaje de grasa que hay en cada uno de ellos obteniéndose un
promedio del 12’6%.
¿Crees que se debe rechazar la hipótesis hecha por la empresa distribuidora de que el contenido de grasas
por término medio no supera el 12%, o bien no hay motivo suficiente para rechazarla?
Dar solución a este tipo de problemas es lo que vamos a hacer en este apartado del tema.
Introducción
En esta parte del tema abordaremos el importante aspecto de la toma de decisiones, es decir, plantearemos
determinadas hipótesis sobre los parámetros de una población y a partir de los datos de una muestra
decidiremos si podemos o no aceptar la hipótesis inicial.
Las hipótesis en estadística inferencial son afirmaciones que involucran al total de la población. Su verdad
o falsedad podría establecerse con exactitud si tuviésemos la oportunidad de evaluar a todos los individuos
que la componen. Como esto no es posible o no se lleva a cabo, el criterio para aceptar o rechazar una
hipótesis estadística se basa en un razonamiento de tipo probabilístico: a través del estudio de una o varias
muestras se determina la probabilidad de que los resultados obtenidos sean compatibles con la hipótesis
establecida. Si es altamente improbable que, de ser cierta la hipótesis, se hayan producido dichos
resultados la rechazaremos. Si no es así, lo más que podemos decir es que no existen razones para pensar
que tal hipótesis no sea cierta.
1. Elementos de un test de hipótesis
Hipótesis:
Trataremos de utilizar los datos obtenidos en una muestra para tomar decisiones sobre la población. Para
ello, debemos realizar ciertos supuestos o afirmaciones sobre una característica de una población. Estos
supuestos, que pueden ser o no ciertos, se llaman hipótesis estadísticas y pueden representarse mediante
una variable aleatoria.
Podemos, entonces, definir el test de hipótesis o contraste de hipótesis como el procedimiento estadístico
mediante el cual se investiga la verdad o falsedad de una hipótesis acerca de una población. Se realiza
cuando existen dos modelos teóricos sobre el comportamiento aleatorio de un carácter; generalmente uno
de ellos es un modelo establecido, al que se enfrenta un modelo alternativo.
Ejemplo 1: Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su desviación
típica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172 cm. ¿Puede afirmarse que
esa diferencia de 2 cm es debida al azar o realmente la estatura media ha variado?
Ejemplo 2: Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra. Pasado el
tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han descendido hasta el 49 %.
¿Ha cambiado realmente la opinión pública o tal resultado es debido al azar?
En los ejemplos anteriores hay una hipótesis de partida y los resultados obtenidos a partir de una muestra
difieren de la hipótesis. Y nos preguntamos si la diferencia es atribuible al azar.
Las hipótesis que formularemos en este tema serán sobre la media poblacional μ o la proporción
poblacional p.
Hipótesis nula, H0: Es la hipótesis emitida o formulada, es decir, la que se desea contrastar. Inicialmente
se considera que es verdadera y se mantiene o se rechaza como consecuencia del contraste. La
mantendremos salvo que los datos muestren de forma evidente su falsedad.
Hipótesis alternativa, H1: Es cualquier otra hipótesis que recoja una situación contraria a la dada en la
hipótesis nula, de forma que la aceptación de la hipótesis nula H0 implica el rechazo de la alternativa H1 y
viceversa, el rechazo de H0 implica la aceptación de H1.
En la toma de decisiones estadísticas, toda hipótesis nula ha de ir acompañada de una hipótesis alternativa
que es la que aspira a desplazar a la nula.
En el ejemplo1 anterior la hipótesis nula es: la altura media de los españoles es de 170 cm ( H 0 :   170 ) y la
hipótesis alternativa: la estatura media de los españoles ya no es 170 cm ( H 1 :   170).
Ejemplo ilustrativo 1: Decidir la inocencia o culpabilidad de una persona en un país en el que se sigue el principio
de presunción de inocencia:
Como se quiere evitar condenar a una persona inocente, sólo se hará cuando haya una fuerte evidencia de su
culpabilidad, cuando esté demostrada ésta. En caso de duda, se primará la inocencia frente a la culpabilidad. Por
tanto, en la terminología propuesta sería:
 H 0 : Inocente

 H 1 : Culpable
Ejemplo ilustrativo 2: Decidir si un alumno sabe o no la asignatura de Economía, y por tanto aprueba o suspende la
asignatura:
Desde el punto de vista del profesorado, un estudiante no sabe la asignatura mientras no demuestre lo contrario; es
decir, el examen ha de presentar pruebas suficientes de que conoce la asignatura. En general, en caso de duda o de
falta de datos, se primará el suspenso frente al aprobado. Por tanto, en la terminología propuesta sería:
H 0 : El alum noNO sabela asignatura ( suspenso)

H 1 : El alum noSI sabela asignatura (aprobado)
Observaciones: Sobre la metodología de los test de hipótesis hay que tener en cuenta que:
1. No sirve para demostrar H0.
2. Sirve para decidir que, a partir de los datos de la muestra, o no puede rechazarse H0, o es aceptable
suponer que H0 es cierta.
3. Sirve para demostrar H1 en el sentido de que, a partir de los datos de la muestra, hay una fuerte
evidencia de que H1 es cierta en comparación con H0.
Errores: Cuando trabajamos con el método del contraste de hipótesis podemos cometer dos tipos de
errores:
En los ejemplos anteriores:
1.- Decidir la inocencia o culpabilidad de una persona en un estado en el que se sigue el principio de presunción de
inocencia:
2.- Decidir si un alumno sabe o no la asignatura de Economía, y por tanto aprueba o suspende la asignatura:
Nivel de Significación y Potencia
Llamaremos nivel de significación de un contraste a un número,  , que se elige por el investigador para
construir el contraste, de tal modo que la probabilidad de cometer un error de tipo I no sea superior a  ,
es decir,  es la probabilidad de rechazar la hipótesis nula siendo verdadera. Es un valor muy pequeño
(0.1, 0.05, 0.01, 0.005, 0.001). El nivel de significación se relaciona con el nivel de confianza por:
Nc  N s  1.
Llamaremos potencia del contraste al valor de 1-  , siendo  la probabilidad de cometer un error de
tipo II, es decir,  es la probabilidad de no rechazar la hipótesis nula no siendo esta cierta.
Lo ideal sería minimizar  y  , pero esto no puede hacerse simultáneamente pues si disminuye uno
aumenta el otro y viceversa.
Así, si un examen es muy exigente se disminuye  , es decir, la probabilidad de aprobar a un estudiante
que no sabe; sin embargo, se aumenta  , la probabilidad de suspender a un estudiante que si sabe. Pero
si el examen es poco exigente disminuye la probabilidad de suspender a un alumno que si sabe la
asignatura (  ), pero aumenta la de aprobar a uno que no sabe lo suficiente (  ).
La única manera de disminuir los dos tipos de errores a la vez es aumentando el tamaño de la muestra
(preguntar muchas cosas, para tener más datos sobre lo que sabe o no el estudiante).
En general, se fija de antemano un nivel de confianza (1-  ), que asegure un error de tipo I admisible y
de entre todos los contrastes con dicho nivel de confianza se elige el de mayor potencia. (El estudio de la
potencia de un test se escapa al nivel de este curso, así que daremos por hecho que los contrastes de este
tema cumplen esa condición).
Estadístico de contraste o de prueba
El estadístico de prueba de un contraste es una función aleatoria de la muestra cuya distribución,
cuando H0 es cierta, debe ser conocida. Este estadístico sirve para extraer de la muestra la información
más adecuada para discernir cual de las dos hipótesis es más verosímil, a la vista de los datos observados.
Se llama valor observado o valor experimental del estadístico de prueba al valor de este estadístico
que resulta de los datos de la muestra que se ha elegido para realizar el contraste.
Región de Aceptación y Región Crítica o de Rechazo
Sabemos ya formular la hipótesis nula y la hipótesis alternativa. Lo que necesitamos ahora es un criterio
para saber si debemos aceptar una u otra, es decir, ¿con cuál de las dos hipótesis nos quedamos?
Al tener ya formulada la hipótesis nula, es necesario que las evidencias sean muy fuertes para rechazarla;
es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es significativo, y no
cambiamos, pero puede que los cambios sean debidos a otras causas. En este último caso es cuando el
cambio es significativo y rechazaremos.
Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo dentro del cual es normal que haya
cambios, es decir, una región tal que si el parámetro (en nuestro caso media o proporción) se mantiene en
dicho intervalo, nos seguimos quedando con H0, pues esas pequeñas variaciones son debidas al azar. Ese
intervalo o región se denomina región de aceptación, y será mayor o menor dependiendo del nivel de
significación.
La región que quede fuera de la región de aceptación indica que en este caso los cambios no se pueden
atribuir al azar, y por tanto hemos de rechazar H0 y aceptar H1. Tal región se llama región crítica o de
rechazo.
Importante: La región crítica o de rechazo de un contraste, a un nivel de significación  , se elige de tal
forma que, si H0 es cierta, la probabilidad de que el valor experimental del estadístico de prueba esté en
esta región es menor o igual que  , esta forma de elegir la región crítica implica:
a) Si el valor observado del estadístico de prueba ESTÁ en la región crítica correspondiente a un nivel de
significación  , SE RECHAZA la hipótesis nula a este nivel de significación.
b) Si el valor observado del estadístico de prueba NO ESTÁ en la región crítica, NO SE RECHAZA la
hipótesis nula.
En este último caso, el valor observado estará en la región de aceptación, pero eso no implica que se
acepte H0, sino que no se tiene suficiente evidencia muestral para rechazarla al nivel de  elegido.
Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la región de
aceptación y la región de rechazo.
a) Contraste Bilateral (o de dos colas):
En este caso la región de rechazo o región crítica está formada por los dos extremos fuera del intervalo.
Dicho caso se presenta cuando la hipótesis nula es del tipo H0 : μ = k (para la media) (o bien H0 : p = k, si
se trata de la proporción) y la hipótesis alternativa, por tanto, es del tipo H1: μk (o bien H1 : p k ).
En el caso de distribuciones normales (que son las que vemos en este tema), y para un contraste bilateral,
la región de aceptación, de forma gráfica, será:
Donde z  es el valor crítico cuyo cálculo ya se estudió en el tema anterior de intervalos de confianza, y
2
la región de aceptación no es más que dicho intervalo.
b) Contraste Unilateral (o de una cola):
En este caso la región de rechazo o región crítica está formada por sólo uno de los extremos fuera del
intervalo. Dicho caso se presenta cuando la hipótesis nula es del tipo H0 : μ k (o bien H0 : p k) y la
hipótesis alternativa, por tanto, es del tipo H1 : μk (o bien H1 : p k ). (El sentido de las desigualdades
puede cambiar).
En el caso unilateral, la región de aceptación de forma gráfica, es:
Unilateral por la derecha: ( H1   )
Donde z es un valor que en una N(0, 1) deja a su izquierda una probabilidad de 1  
Unilateral por la izquierda: ( H1   )
Donde z es un valor que en una N(0, 1) deja a su izquierda una probabilidad de 1  
2. Metodología general de un test de hipótesis.
Los procedimientos seguidos en las pruebas de hipótesis correspondientes a las situaciones de decisión
estadística se encuentran totalmente prefijados y se llevan a cabo en una serie de etapas que facilitan su
comprensión, y que son:
Paso 1º: Se enuncian la hipótesis nula H 0 y la alternativa H 1 . Consiste en atribuirle un valor a un
parámetro de cierta población (la hipótesis nula H 0 ) y el valor contrario será la hipótesis alternativa H 1 ,
es decir dichas hipótesis deben ser excluyentes.
Una vez enunciadas, se analizará si el contraste es bilateral (la hipótesis alternativa es del tipo ) o si se
trata de un contraste unilateral (la hipótesis alternativa es del tipo > o <).
Paso 2º: Se elige un estadístico de contraste cuya distribución muestral es conocida. En nuestro caso será
la media o la proporción muestral.
Paso 3º: Se determina, a partir del nivel de confianza, 1   , o del de significación,  , el valor de z 
2
para contrastes bilaterales o el de z para contrastes unilaterales, y con dichos valores se construyen las
regiones de aceptación correspondientes (y por tanto también las regiones de rechazo):
Paso 4º: Se calcula el valor concreto del estadístico de contraste a partir de la muestra.
Paso 5º: Aplicar el test, es decir, dependiendo de si el estadístico de contraste cae en la región de
aceptación o de rechazo, tomar la decisión de rechazar H0 o de indicar que no existen evidencias
estadísticas significativas como para rechazarla.
Estudiaremos ahora dos de los tipos de test de hipótesis más habituales: test para la media de una
población y test para la proporción de una población.
3. Contraste de hipótesis para la media
Vamos a sistematizar los pasos que se dan para realizar contrastes de hipótesis sobre la media de la
población, distinguiendo los casos en los que la hipótesis nula es del tipo    0 de aquellos otros en los
que en la hipótesis nula se aceptan desigualdades    0 o bien

  0 .
Si el Contraste es bilateral:    0
Paso 1º: Se formulan las hipótesis H 0 :   0 ;
H1 :    0 .
La hipótesis nula consiste en atribuirle un cierto valor a la media de la población.
Paso 2º: Se elige el estadístico de contraste.
Bien cuando n  30 o bien para cualquier valor de n si la población de partida es normal, las
medias se distribuyen N   0 ,   .
n

Tipificando tenemos: Z  X   0  N 0,1 , este es el estadístico de contraste.

n
Paso 3º: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el
test es bilateral la región de aceptación para un nivel de significación  es   z , z  .

2
2

Paso 4º: Se calcula el valor concreto del estadístico de contraste a partir de la muestra:
x  0
z0 

n
Paso 5º: Se comprueba si este valor concreto, z0, está dentro o fuera de la zona de aceptación.
- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesis
nula a este nivel de significación.
- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en la
región crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral para
rechazarla al nivel de  elegido.
Ejemplo 1: Se cree que el tiempo medio de ocio que dedican al día los estudiantes de Bachillerato sigue
una distribución normal de media 350 minutos y desviación típica 60 minutos. Para contrastar esta
hipótesis, se toma una muestra aleatoria formada por 100 alumnos, y se observa que el tiempo medio de
ocio es de 320 minutos. Con un nivel de significación del 10%, ¿se contradice la afirmación inicial?

Si el Contraste es unilateral:    0 o
Paso 1º: Formular las hipótesis H 0 :    0 ;
O bien H 0 :   0 ;
  0
H1 :    0 .
H1 :    0
Paso 2º: Se elige el estadístico de contraste.
Bien cuando n  30 o bien para cualquier valor de n si la población de partida es normal, las
medias se distribuyen N   0 ,   .
n

Tipificando tenemos: Z  X   0  N 0,1 , este es el estadístico de contraste.

n
Paso 3º: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el
test es unilateral la región de aceptación para un nivel de significación  es:
Para el caso H 0 :    0 ;
H1 :    0 :
  , z 
Para el caso H 0 :   0 ;
H1 :    0 :
 z ,  
En estos casos, toda la cola (intervalo de no aceptación o de rechazo) está en una de los extremos de la
distribución. Los valores críticos z se obtienen directamente de la tabla N (0,1) .
Paso 4º: Se calcula el valor concreto del estadístico de contraste a partir de la muestra:
x  0
z0 

n
Paso 5º: Se comprueba si este valor concreto, z0, está dentro o fuera de la zona de aceptación.
- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesis
nula a este nivel de significación.
- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en la
región crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral para
rechazarla al nivel de  elegido.
Ejemplo 2: Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de
duración de un empleo en la misma era de 6’5 años con una desviación típica de 4. ¿Sirve esta afirmación
para aceptar, con un nivel de significación del 1%, que el tiempo medio de empleo en esa fábrica es
menor o igual que 6?
Consideraciones a tener en cuenta:
- En la práctica, la muestra se toma después de haber formulado las hipótesis, con el fin de que el resultado
de la muestra no influya en el planteamiento de éstas.
- Al disminuir el nivel de significación,  , aumenta la región de aceptación y por tanto es posible que una
hipótesis que se rechace con un nivel de significación del 10% no se pueda rechazar a un nivel de
significación del 5%.
- Cuanto más “fuera” de la región de aceptación se encuentre nuestro estadístico de contraste, con mayor
confianza podremos rechazar la hipótesis nula y por tanto mayor seguridad tendremos en que nuestra
decisión es la correcta. De la misma manera, cuanto más “dentro” de la región de aceptación se encuentre,
mayor seguridad tendremos a la hora de no rechazar la hipótesis nula.
4. Contraste de hipótesis para la proporción
En los contraste de hipótesis para la proporción o porcentajes también se parte de una suposición o
porcentaje poblacional. Después se utiliza la proporción de la muestra, obtenida de forma aleatoria, para
comprobar si es cierta la suposición sobre la proporción poblacional. Si llamamos p a la proporción de
individuos de una población que tienen una determinada característica, el planteamiento para este tipo de
test será del tipo:

Si el Contraste es bilateral: p  p0
La hipótesis nula consiste en atribuirle un valor a la proporción de individuos que tiene una cierta
característica.
Paso 1: Formulamos las hipótesis H 0 : p  p0 ;
H1 : p  p0 .
Paso 2: Se elige el estadístico de contraste.
Como vimos en la primera parte del tema, la distribución de las proporciones muestrales, P̂ , se



distribuye N  p 0 ,
p0  q0
n

.


Tipificando obtendremos el estadístico de contraste para este test:
Z
Pˆ  p0
p0  q0
n
que sigue una N(0, 1)
Paso 3: Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el test
es bilateral la región de aceptación para un nivel de significación  es   z , z  .

2
2

Paso 4: Calculamos el valor concreto del estadístico de contraste a partir de la muestra
z0 
pˆ  p0
p0  q0
n
Paso 5: Se comprueba si esa proporción está dentro o fuera de la zona de aceptación.
- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesis
nula a este nivel de significación.
- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en la
región crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral para
rechazarla al nivel de  elegido.
Ejemplo 1: El ayuntamiento de una ciudad afirma que el 65 % de los accidentes juveniles de los fines de
semana son debidos al alcohol. Un investigador decide contrastar dicha hipótesis, para lo cual toma una
muestra formada por 35 accidentes y observa que 24 de ellos han sido debidos al alcohol. Con un nivel de
significación del 1%, ¿qué podemos decir sobre la afirmación del ayuntamiento?

Si el Contraste es unilateral: p  p0 o
Paso 1º: Formular las hipótesis H 0 : p  p0 ;
O bien H 0 : p  p0 ;
p  p0
H 1 : p  p0 .
H1 : p  p0
Paso 2º: Se elige el estadístico de contraste.



La distribución de las proporciones muestrales, P̂ , se distribuye N  p 0 ,
p0  q0
n

.


Tipificando obtendremos el estadístico de contraste para este test:
Z
Pˆ  p0
p0  q0
n
que sigue una N(0, 1)
Paso 3º: Obtención de la zona de aceptación.
Se calcula, a partir del nivel de significación, la región de aceptación y la de rechazo. Como el test es
unilateral la región de aceptación para un nivel de significación  es:
Para el caso H 0 : p  p0 ;
Para el caso H 0 : p  p0 ;
H 1 : p  p0 :
H1 : p  p0 :
  , z 
 z ,  
En estos casos, toda la cola (intervalo de no aceptación o de rechazo) está en una de los extremos de la
distribución. Los valores críticos z se obtienen directamente de la tabla N (0,1) .
Paso 4: Calculamos el valor concreto del estadístico de contraste a partir de la muestra
z0 
pˆ  p0
p0  q0
n
Paso 5: Se comprueba si esa proporción está dentro o fuera de la zona de aceptación.
- Si el valor observado del estadístico de prueba ESTÁ en la región crítica, SE RECHAZA la hipótesis
nula a este nivel de significación.
- Si el valor observado del estadístico de prueba está en la zona de aceptación y, por tanto, NO ESTÁ en la
región crítica, NO SE RECHAZA la hipótesis nula., no se tiene suficiente evidencia muestral para
rechazarla al nivel de  elegido.
Ejemplo 2: Un investigador, utilizando información de anteriores comicios, sostiene que, en una determinada zona,
el nivel de abstención en las próximas elecciones es del 40% como mínimo. Se elige una muestra aleatoria de 200
individuos para los que se concluye que 75 estarían dispuestos a votar. Determina, con un nivel de significación del
1%, si se puede admitir como cierta la afirmación del investigador.
Ejemplo 3: En el año 2000 el 25% de los partos fueron de madres de más de 35 años. Este año se ha tomado una
muestra de 120 partos de los cuales 33 fueron de madres de más de 35 años.
Con una significación del 10%, ¿se puede aceptar que la proporción de madres de más de 35 años sigue siendo
como mucho del 25%, frente a que ha aumentado?
RESUMEN DE FÓRMULAS
Relación de ejercicios propuestos
1) La altura en cm. de las cañas producidas por una variedad de carrizo en cada cosecha es una variable aleatoria que
sigue una ley normal con desviación típica  = 16 cm. Para contrastar si la altura media de las cañas de la última
cosecha es de 170 cm, se ha tomado una muestra aleatoria de 64 de estas cañas y se han medido sus longitudes,
resultando como media muestral x = 166 cm. ¿Son suficientes estos datos para rechazar que la altura media de las
cañas de la última cosecha es de 170 cm, a un nivel de significación  = 0.05?
2) Un comerciante ha observado durante un largo periodo de tiempo que sus beneficios semanales se distribuyen
según una ley normal con una media de 5000 euros y una desviación típica de 520 euros. A finales del año pasado se
abrió un supermercado frente a su comercio y él cree que su beneficio semanal medio ha disminuido desde entonces.
Para contrastar esta suposición, ha tomado una muestra aleatoria de 16 semanas del año actual y ha encontrado que el
beneficio semanal medio de esa muestra es de 4700 euros. ¿Puede afirmarse, a un nivel de significación  = 0.01,
que estos datos avalan la creencia del comerciante?
3) Sólo el 75% de los alumnos de un centro de enseñanza realizan correctamente un test psicotécnico que lleva
utilizándose mucho tiempo. Para tratar de mejorar este resultado, se modificó la redacción del test, y se propuso a un
grupo de 120 alumnos de ese centro, elegidos al azar. De los 120 alumnos a los que se les pasó el nuevo test, lo
realizaron correctamente 107. ¿Podemos afirmar que la nueva redacción del test ha aumentado la proporción de
respuestas correctas, a un nivel de significación  = 0.025?
4) En una ciudad, donde la proporción de fumadores con edad comprendida entre 18 y 20 años es del 30 %, el
ayuntamiento ha realizado una campaña contra el consumo de tabaco. Dos meses después de terminar dicha
campaña, se ha realizado una encuesta a 400 personas de estas edades, elegidas al azar, y se ha encontrado entre ellos
a 92 fumadores. ¿Podemos afirmar, a un nivel de significación  = 0,05, que esta campaña ha modificado la
proporción de fumadores entre 18 y 25 años?
5) Supongamos que 100 neumáticos de cierta marca duraron en promedio 21431 kilómetros. Si se supone que la
población es normal con una desviación típica poblacional de 1295 km, utilizando  = 0.05, ¿podemos considerar
que la duración media de los neumáticos es inferior a 22000 km?
6) Un constructor afirma que por lo menos el 75% de las casas que construye tienen calefacción. ¿Se estaría de
acuerdo con tal afirmación si una inspección aleatoria muestra que 72 de 135 casas cuentan con calefacción? (Usar
 = 0,1)
7) La edad de la población que vive en residencias de mayores en Cádiz sigue una distribución normal de desviación
típica 7,3 años. Se toma una muestra aleatoria simple de tamaño 50, y se obtiene una media muestral de 69 años. ¿Se
puede asegurar que la edad media de la población que vive en residencias de mayores en Cádiz es mayor de 70 años
con un nivel de significación del 5%?
8) Para conocer la producción media de sus olivos, un olivarero escoge al azar 10 de ellos, pesa su producción de
aceitunas, y obtiene los siguientes valores, expresados en kg: 175, 180, 210, 215, 186, 213, 190, 213, 184, 195.
Sabemos que la producción sigue una distribución normal con desviación típica igual a 15.3 kg. Con la información
obtenida, ¿se puede asegurar que la producción media de un olivo de ese agricultor es menor de 200 kg? (Usar  =
0,05)
9) El 40% de los escolares de cierto país suelen perder al menos un día de clase a causa de gripes y catarros. Sin
embargo, un estudio sobre 1000 escolares revela que en el último curso hubo 450 en tales circunstancias. Las
autoridades defienden que el porcentaje del 40% para toda la población de escolares se ha mantenido. Contrastar con
un nivel de significación del 5% la hipótesis defendida por las autoridades sanitarias, frente a que el porcentaje ha
aumentado, como parecen indicar los datos, explicando claramente a qué conclusión se llega.
10) El alcalde de una ciudad prometió, en su programa electoral, oponerse a la construcción de una central de
tratamiento de ciertos residuos, puesto que en aquel momento sólo un 10% de los ciudadanos estaban a favor de la
central de tratamiento de residuos. En los últimos días se ha encuestado a 100 personas de las cuales 14 están a favor
de la central. El alcalde afirma sin embargo que el porcentaje de ciudadanos a favor sigue siendo del 10% o incluso
ha disminuido. ¿Tiene razón el alcalde con un nivel de significación del 2 %?
11) Las autoridades educativas publican en un estudio que el 25% de los estudiantes de Bachillerato de una cierta
comunidad autónoma tienen ordenador portátil. A partir de una muestra aleatoria de tamaño 300 se ha obtenido que
sólo 70 de ellos tienen ordenador portátil. ¿Se podría asegurar que las autoridades dicen la verdad? (Usar  = 0,06)
12) Los estudiantes universitarios de cierto país dedican al estudio un número de horas semanales que sigue una
distribución normal de media desconocida y de desviación típica 7 horas. Si en una muestra de 200 estudiantes se
obtuvo una media muestral de 30 horas de estudio semanal.
a) Halle un intervalo de confianza al 95% para el número de horas de estudio semanales de los estudiantes
universitarios de dicho país.
b) ¿Se podría afirmar que los estudiantes universitarios de ese país estudian menos de 35 horas semanales? (Usar
 = 0,01)
1. Solución: Estos datos son suficientes para rechazar, a este nivel, que la altura media de las cañas de
esta cosecha sea de 170 cm.
2. Solución: No se puede afirmar, al nivel 0’01, que los datos de la muestra apoyan la creencia de que el
nuevo supermercado ha disminuido el beneficio semanal medio del comerciante.
3. Solución: Podemos afirmar que la nueva redacción del test ha aumentado la proporción de respuestas
correctas, a un nivel de significación  = 0.025.
4. Solución: Estos datos son suficientes para afirmar, al nivel 0.05, que se ha modificado la proporción de
fumadores entre los 18 y 25 años.
5. Solución: Podemos afirmar que la duración media de los neumáticos de dicha marca es menor de
22000 km, con una probabilidad de error tipo I,  , del 5 %.
6. Solución: Los datos de la muestra son suficientes para rechazar, a este nivel  = 0’1, la afirmación del
constructor de que la proporción de casas con calefacción que éste construye no es inferior al 75%.
7. Solución: Puede decirse que los datos de la muestra no permiten afirmar que la media de edad de
esas personas sea mayor que 70 años, al nivel de significación  = 0’05.
8. Solución: Puede decirse que los datos de la muestra confirman que la producción media de un olivo de
ese agricultor es menor de 200 kg, al nivel de significación  = 0’05.
9. Solución: Estos datos son suficientes para afirmar, al nivel  = 0’05, que el porcentaje de escolares
que pierden al menos un día de clase por causa de gripes y catarros ha aumentado, por lo que ese
porcentaje es mayor del 40 %. Entonces, la hipótesis mantenida por las autoridades no es correcta.
10. Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de ciudadanos que están
a favor de la construcción de la central de tratamiento de residuos es mayor del 10 %, al nivel de
significación  = 0’02. Por tanto, los datos de la muestra avalan la opinión del alcalde de que el
porcentaje de ciudadanos a favor sigue siendo del 10% o incluso ha disminuido.
11. Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de estudiantes de
Bachillerato que tienen ordenador portátil es distinto del 25 %, al nivel de significación  = 0’06. En
consecuencia, a este nivel, los datos no permiten rechazar que el estudio se corresponda con la realidad.
Por tanto, podemos afirmar que las autoridades educativas dicen la verdad.
12. Solución: a) Un intervalo de confianza al 95% para la media de horas de estudio semanales de los
universitarios es (29’03, 30’97).
b) Podemos afirmar que la media del número de horas de estudio semanales de los universitarios es
menor de 35 horas, al nivel de significación  = 0’01.
Descargar