Colección de ejercicios

Anuncio
ESTADISTICA
(Segundo curso de Ingenierı́a Informática)
Programa. Curso 2002-2003
1 Probabilidad: introducción y conceptos básicos.
2 Variables aleatorias: distribución de una variable aleatoria. Esperanza matemática. Media y varianza. Algunas distribuciones notables.
3 Vectores aleatorios: Distribuciones conjunta, marginales y condicionadas (casos
sencillos). Independencia. Suma de variables aleatorias independientes.
4 La ley de los grandes números y el teorema central del lı́mite: interpretación y significado práctico. Fundamentos probabilı́sticos de los métodos de
simulación.
5 Estimación paramétrica: estimación puntual. Conceptos básicos sobre estimadores. El método de máxima verosimilitud. Estimación por intervalos de
confianza. Distribuciones en el muestreo asociadas a la normal. Construcción
de intervalos de confianza: algunos ejemplos tı́picos para el caso de poblaciones
normales. Intervalos de confianza aproximados.
6 Contraste de hipótesis: conceptos básicos. Relación entre contraste de hipótesis
e intervalos de confianza: Ejemplos. Algunos contrastes clásicos relativos a parámetros de distribuciones binomiales y normales. Contrastes no paramétricos, tipo
“chi-cuadrado” (χ2 ), de bondad de ajuste, homogeneidad e independencia.
7 Introducción a los modelos de regresión: distribucion normal bivariante;
regresión lineal simple. Rectas de regresión. Coeficiente de correlación y su significado.
1
BIBLIOGRAFÍA
DeGroot, M.H. (1988). Probabilidad y Estadı́stica. Addison-Wesley Iberoamericana.
de la Horra, J. (2003). Estadı́stica Aplicada. Dı́az de Santos.
Mendenhall, R.L., Scheaffer, R.L., Wackerly, D.D. (1986). Estadı́stica Matemática
con Aplicaciones. Grupo Editorial Iberoamérica.
Montgomery, D.C., Runger, G.C. (1996). Probabilidad y Estadı́stica aplicadas a
la Ingenierı́a. McGraw Hill.
Peña, D. (2001). Fundamentos de Estadı́stica. Alianza Editiorial.
Peña , D. Romo, J.(1997). Introducción a la Estadı́stica para las Ciencias Sociales.
McGraw-Hill, 1997
Press, W.H., Teukolsky, S.A., Vetterling, W.T., Flannery, B.P. (1992).
Numerical Recipes in C. Cambridge University Press.
Rice, J.A. (1995). Mathematical Statistics and Data Analysis. Wadsworth & Brooks.
Ross, S.M. (1987). Probability and Statistics for Engineers and Scientists. Wiley.
Scheaffer, R.L., McClave, J.T. (1993). Probabilidad y Estadı́stica para Ingenierı́a.
Grupo Editorial Iberoamérica.
Trivedi, K.S. (1982). Probability and Statistics with Reliability, Queuing and Computer Science Applications. Prentice-Hall.
2
ESTADISTICA. Segundo curso de ingenierı́a informática
Ejercicios propuestos. Curso 2003-2004
1. En un directorio informático hay 20 archivos, de los cuales 6 son “‘grandes” (de
tamaño superior a un Mb) y el resto “pequeños”. Se seleccionan al azar, sin
reemplazamiento, 5 archivos de entre los 20. Calcular la probabilidad de que haya
exactamente dos archivos “grandes” entre los seleccionados. Resolver el mismo
problema en el caso de que los archivos se seleccionen con reemplazamiento.
2. En un laboratorio de informática hay 50 ordenadores de los cuales 15 están afectados por un virus. Diez estudiantes llegan al laboratorio y se sientan aleatoriamente
cada uno de ellos ante un ordenador. Calcular la probabilidad de que al menos
tres estudiantes hayan elegido ordenadores “contaminados”. No es imprescindible
realizar los cálculos; pueden dejarse indicados en la forma más simplificada que
sea posible.
3. Una empresa de software que diseña juegos para ordenador somete los diseños
preliminares de sus productos a la evaluación previa de un grupo seleccionado
de clientes. Según muestra la experiencia, el 95% de los productos que tuvieron
un gran éxito en el mercado recibieron buenas evaluaciones, el 60% de los de
éxito moderado recibieron buenas evaluaciones y sólo el 10% de los que tuvieron
escaso éxito fueron valorados favorablemente. Además, globalmente el 40% de los
productos de la empresa ha tenido mucho éxito, el 35% un éxito moderado y el
25% una baja aceptación.
a) ¿Cuál es la probabilidad de que un producto, elegido al azar entre la producción
de la fábrica obtenga una buena evaluación previa?
b) Si un nuevo producto obtiene una buena evaluación ¿cuál es la probabilidad de
que se convierta en un producto de gran éxito?
c) Si un producto no obtiene una buena evaluación ¿cuál es la probabilidad de que
se convierta en un producto de gran éxito?
4. El 20% de las visitas que recibe la página web de una empresa proceden de Japón,
el 30% de la Unión Europea, el 40% del continente americano y el 10% del resto del
mundo. Supongamos que la probabilidad de que un visitante realice una compra
es, para las cuatro procedencias indicadas, 0.10, 0.35, 0.25, 0.20, respectivamente.
Calcular la probabilidad de que un visitante elegido al azar realice una compra.
Calcular la probabilidad de que un visitante que no ha ha hecho ninguna compra
proceda de Japón.
3
5. Se elige al azar un número decimal de tres dı́gitos. Calcular la probabilidad de
que exactamente k dı́gitos sean mayores o iguales que 5, para 0 ≤ k ≤ 3.
6. Calcular la probabilidad de que, al lanzar repetidamente un dado, el tercer “seis”
aparezca exactamente en el décimo lanzamiento.
7. Supongamos que los chips producidos por una determinada compañı́a se someten
a un control de calidad de tal forma que la probabilidad de detectar un chip
defectuoso es 0.95 y la probabilidad de declarar ”no defectuoso” un chip que
realmente es correcto es 0.97. Si el 5% de los chips presentan alguna averı́a ¿Cuál
es la probabilidad de que un chip que se identifica como defectuoso sea correcto?
8. El Departamento de Control de Calidad (DCC) de una fábrica se encarga de examinar el funcionamiento de los aparatos producidos por la misma. Cada aparato
tiene (independientemente de los demás) algún defecto con probabilidad p. Si un
aparato es defectuoso el DCC lo detecta con probabilidad α. Además, durante
su comprobación en el DCC un aparato en buen estado puede comportarse como
defectuoso con una probabilidad β. Todos los aparatos que se han revelado como
defectuosos durante la comprobación se desechan. Hallar la probabilidad q0 de
que un aparato no desechado tenga algún defecto y la probabilidad q1 de que un
aparato desechado tenga algún defecto. ¿En qué condiciones es q0 > q1 ?
9. La probabilidad de que falle durante el perı́odo de garantı́a un conector eléctrico
que se mantiene seco es 0.01. Si el conector se humedece la probabilidad de fallo
durante el perı́odo de garantı́a es 0.05. Si el 90% de los conectores se mantienen
secos y el 10% se humedecen, ¿qué proporción de conectores se espera que fallen
durante el perı́odo de garantı́a?.
10. Un canal de comunicación recibe impulsos independientes a razón de 12 impulsos
por microsegundo. La probabilidad de un error de transmisión es de 0.001 para
cada impulso. Calcular las probabilidades de los siguientes sucesos:
(a) No hay ningún error en un microsegundo.
(b) Hay exactamente un error en un microsegundo.
(c) Hay al menos un error en un microsegundo.
4
(d) Hay exactamente dos errores en un microsegundo.
11. Los vuelos nacionales de una cierta compañı́a aérea disponen de 12 plazas de clase
preferente. La compañı́a sabe, por experiencia, que sólo el 90% de los pasajeros
que reservan plaza en esta categorı́a acuden finalmente a retirar su billete. Por
esta razón, deciden admitir hasta 14 reservas de clase preferente para cada vuelo.
Suponiendo que el cumplimiento de las reservas es independiente de unos pasajeros
a otros, calcular la probabilidad de que en un vuelo la compañı́a tenga efectivamente más pasajeros que plazas en clase preferente.
12. La probabilidad de que un sistema tenga n fallos durante un dı́a viene dada por
Pn =
1
e(n!)
n = 0, 1, 2, ...
Si se presentan n fallos, el sistema deja de funcionar con probabilidad 1 − (1/2)n .
Calcular la probabilidad de que el sistema haya tenido n fallos si ha dejado de
funcionar.
13. Demostrar que la función p(n) = nc , para n = 1, 2, . . . no puede ser, para ningún
valor de c, función de probabilidad de una distribución discreta.
14. Supongamos que un juego que consiste en sucesivos lanzamientos de moneda. Si
sale cara un jugador gana la cantidad que ha apostado, y si sale cruz pierde esta
cantidad. Supongamos que el jugador adopta la estrategia de doblar la apuesta
después de cada jugada en que haya perdido y retirarse del juego en el momento
en que gane por primera vez en algún lanzamiento. La apuesta en el primer
lanzamiento es de una unidad monetaria. Calcular la distribución de la última
apuesta realizada por el jugador. Obtener la media de esta distribución y comentar
el resultado (Paradoja de San Petersburgo).
15. Calcular el área esperada de un cuadrado cuyo lado tiene longitud aleatoria con
distribución uniforme en el intervalo (0, 1). Calcular y dibujar las gráficas de las
funciones de distribución y de densidad de la variable aleatoria área.
5
16. La probabilidad de error en la transmisión de un bit por un canal de comunicación
es p = 10−4 . ¿Cuál es la probabilidad de que se produzcan más de tres errores al
transmitir un bloque de 1000 bits?
17. Un individuo se reune una vez por semana con su grupo de amigos, son 10 en
total, para cenar. Cada semana sortean una botella de vino entre ellos.
a) Calcular la probabilidad de que el individuo gane por primera vez la quinta
semana.
b) Calcular la probabilidad de que en 8 semanas no gane nada.
c) Calcular la probabilidad de que en 8 semanas gane 4 botellas.
18. Supongamos que el número de mensajes que entran en un canal de comunicación
en un intervalo de t segundos de duración es una variable aleatoria con distribución
de Poisson de parámetro 0.3t. Calcular las probabilidades de los siguientes sucesos:
(a) En un intervalo de 10 segundos llegan exactamente 3 mensajes.
(b) En un perı́odo de 20 segundos llegan a lo sumo 20 mensajes.
(c) El número de mensajes que llegan en un intervalo de 5 segundos de duración
está comprendido entre 3 y 7.
19. En cada página de una enciclopedia caben 3000 letras. La editorial estima que se
comete una errata en cada 50000 letras. Suponiendo que el número de erratas por
página sigue aproximadamente una distribución de Poisson, se pide
(a) Calcular la probabilidad de que en una página haya exactamente dos erratas.
(b) Si se van revisando las páginas una a una, calcular la probabilidad de que la
primera errata que se encuentra aparezca en la quinta página revisada.
(c) Calcular la probabilidad de que en las cinco primeras páginas haya al menos
dos erratas.
20. Una editorial tiene contratados a varios correctores de pruebas. Un tercio de ellos
son considerados excelentes y el resto normales. El numero de erratas detectadas
por cada corrector sigue una distribución de Poisson. Un corrector excelente detecta una media de 3 erratas por cada hora de trabajo y uno normal una media
de 2.
Hallar la probabilidad de que un corrector elegido al azar encuentre 12 erratas si
trabaja 5 horas seguidas.
6
21. Una persona ebria realiza un paseo aleatorio de la siguiente forma: cada minuto
da un paso hacia el norte o hacia el sur con probabilidad 1/2, y los sucesivos pasos
son independientes. La longitud del paso es 1 m.
a) Calcular la probabilidad de que al cabo de una hora haya dado exactamente 20
pasos hacia el norte.
b) Calcular la probabilidad de que al cabo de una hora esté a menos de 3 metros
del punto de partida.
22. Se sabe que aproximadamente el 20% de los usuarios de Windows-NT no cierran
el programa adecuadamente. Supongamos que el Windows-NT está instalado en
un ordenador público que es utilizado aleatoriamente por personas que actúan
independientemente unas de otras.
(a) ¿Cuál es la probabilidad de que al menos 6 de las 9 primeras personas que van
a usar el ordenador cierre adecuadamente el Windows-NT?
(b) ¿Cuál es el número medio de personas que usan el ordenador desde el momento
en que se instala hasta que alguien no cierra el programa adecuadamente?
23. En cierta población, el número diario de accidentes de tráfico sigue una distribución
de Poisson de parámetro 0.9.
(a) Calcular la probabilidad de que en un dı́a haya al menos dos accidentes.
(b) Si los accidentes en los diferentes dı́as se producen de manera independiente, calcular la probabilidad de que en un año haya más de 90 dı́as en los que se
producen al menos dos accidentes.
24. Los impulsos procedentes de una fuente emisora tienen una intensidad cuya función
de distribución es F (x) = x4 /81, para 0 ≤ x < 3 (por tanto, F (x) = 0 para x < 0
y F (x) = 1 para x ≥ 3).
a) Se observan 10 de estos impulsos, cuyas intensidades se suponen independientes.
¿Cuál es la probabilidad de que al menos 2 de ellos tengan una intensidad superior
a 2?
b) Si se observan 100 impulsos independientes ¿cuál es la probabilidad de que al
menos 75 de ellos tengan una intensidad superior a 2?
c) Si se observan secuencialmente impulsos independientes producidos por la fuente
emisora ¿Cuál es la probabilidad de que haya que observar 14 de estos impulsos
para encontrar 4 que tengan una intensidad superior a 2?
7
25. De una estación parte un tren cada 20 minutos. Un viajero llega de improviso.
Hallar:
1) Función de distribución de la variable aleatoria “tiempo de espera”.
2) Probabilidad de que espere al tren menos de 7 minutos.
3) Esperanza y varianza de la variable aleatoria “tiempo de espera”.
4) Probabilidad de que espere exactamente 12 minutos.
26. El tiempo X (expresado en minutos) entre dos visitas consecutivas en una página
web durante el horario diurno es una variable aleatoria continua con función de
densidad
1
f (x) = e−x/3 , para x > 0.
3
a) Calcular E(X) y P {X > 1}.
b) Calcular la función de distribución de X.
c) Calcular la probabilidad de que el intervalo entre dos visitas sea mayor que 4
minutos si se sabe que su duración ya ha sido al menos 2 minutos.
d) Se observan de manera secuencial las duraciones (que se suponen independientes) de intervalos consecutivos entre visitas. ¿Cuál es la probabilidad de que
haya que observar 12 de estos intervalos para encontrar 3 que tengan una duración
mayor que 4 minutos?
27. En un centro de cálculo universitario se reciben programas a una tasa promedio de
λ = 0.1 programas por segundo. Suponiendo que el número de llegadas por unidad
de tiempo tiene distribución de Poisson, entonces el tiempo X transcurrido entre
dos llegadas consecutivas tiene distribución exponencial de parámetro λ. Calcular
la probabilidad de que en un intervalo de 10 segundos no llegue ningún programa
al centro de cálculo.
28. Supongamos que el tiempo de CPU requerido para ejecutar cierto tipo de programas sigue aproximadamente una distribución exponencial de parámetro 1/140
por milisegundo. El sistema está organizado de tal manera que si un trabajo no
se completa en un perı́odo de 100 milisegundos se envı́a a una cola de espera.
Calcular la probabilidad de que un programa que llega al ordenador sea enviado
a dicha cola de espera. Si a lo largo de un dı́a se envı́an 800 programas ¿cuál es
el número esperado de programas que se finalizarán dentro del primer perı́odo de
100 milisegundos?
8
29. Un sistema electrónico tiene n componentes idénticos y de funcionamiento independiente que están conectados en serie, de forma que el sistema falla tan pronto
como uno de los componentes falla. Supóngase que el tiempo de vida de cada componente, medido en horas, tiene una función de distribución F (t) = 1 − exp(−θt)
para t ≥ 0, F (t) = 0 para t < 0 (θ > 0). Sea la v.a. Tn = “tiempo transcurrido
hasta que falla el sistema”.
(a) Calcular P {Tn > 1} y la función de distribución de Tn .
(b) Demostrar que Tn −→ 0, en probabilidad, cuando n → ∞.
30. En un cierto sistema eléctrico el voltaje X es una variable aleatoria que tiene la
siguiente función de distribución: F (x) = 0, para x ≤ 0, F (x) = x/(1 + x), para
x ≥ 0. Demostrar que F es efectivamente una función de distribución. Calcular
su correspondiente densidad y la probabilidad del intervalo (3,5).
31. Un programa se divide en tres bloques que se compilan simultánea e independientemente por tres ordenadores en paralelo. El tiempo en minutos requerido por
cada ordenador es una variable aleatoria con función distribución F (t) = 1 − e−5t
(para t > 0). El programa está completo cuando los tres bloques están compilados.
(a) Calcular el tiempo medio requerido por cada ordenador para compilar el bloque
que le ha correspondido.
(b) Calcular la función de distribución del tiempo necesario para compilar el programa completo. ¿Cuál es la probabilidad de que este tiempo esté comprendido
entre 6 y 7 minutos?
32. Dos modelos probabilı́sticos que se utilizan en Economı́a para estudiar el reparto
de ingresos en una población son las distribuciones de Pareto y logarı́tmico normal
cuyas respectivas funciones de densidad son:
f (x) =
θxθ0
, para x > x0 ,
xθ+1
donde x0 y θ son parámetros positivos.
1
g(x) = √
exp[−(log x − µ)2 ]/2σ 2 ], para x > 0,
x 2πσ
donde µ ∈ IR y σ > 0 son parámetros.
(a) Demostrar que f es una función de densidad. Calcular la correspondiente
función de distribución y la media.
9
(b) Comprueba que si X es una variable aleatoria N (µ, σ), entonces Y = eX es
una variable aleatoria con función de densidad g.
33. El tiempo de CPU, T , requerido para realizar un trabajo, elegido aleatoriamente de
entre los que llegan a un centro de cálculo, sigue aproximadamente una distribución
hiperexponencial dada por
P {T ≤ t} = FT (t) = α(1 − e−λ1 t ) + (1 − α)(1 − e−λ2 t ),
donde α = 0.6, λ1 = 10, λ2 = 1. Calcular
(a) La función de densidad de T .
(b) El tiempo medio de servicio E(T ).
(c) La varianza del tiempo de servicio V (T ).
34. El tiempo de servicio (en dı́as) de una cierta máquina es una v.a. con función de
densidad f (t) = (1/α)e−t/α , para t > 0, (siendo α una constante mayor que cero).
Si η es la v.a. que expresa el número de dı́as en que la máquina funciona el dı́a
completo, obtener la distribución de η.
35. Una central hidroeléctrica tiene, en esquema, el siguiente funcionamiento desde el
punto de vista económico (durante el perı́odo de un año): hay un coste fijo anual
de c1 pesetas (destinado a gastos de personal y mantenimiento). Cada kw.-h. de
energı́a producida supone un coste de c2 pesetas y se vende a un precio de c3 .
Supongamos que la cantidad de energı́a producida (que depende de la cantidad
de lluvia caı́da en la zona) puede considerarse aproximadamente una v.a. X con
distribución absolutamente continua y densidad dada por f (x) = α2 x exp(−αx),
para x ≥ 0 (α > 0). Se pide:
(a) Calcular la ganancia esperada anual.
(b) Calcular la probabilidad de que al final del año la empresa que gestiona la
central tenga deudas, supuesto que dispone inicialmente de c4 pesetas (c4 < c1 ).
36. El tiempo de duración de los chips producidos por un fabricante de semiconductores es una variable aleatoria cuya distribución es aproximadamente normal con
µ = 5.106 horas y σ = 5.105 horas. Un fabricante de ordenadores está dispuesto a
comprar una gran cantidad de chips siempre que al menos el 95% del lote tenga
10
un tiempo de vida superior a 4.106 horas. ¿Qué decisión deberı́a tomar en vista
de la información disponible?
37. El valor absoluto V de la velocidad de una molécula de un gas sigue la distribución
de Maxwell cuya densidad es
q
f (v) =
2/π
σ3
v 2 e−v
2 /2σ 2
,
para v ≥ 0. El parámetro σ > 0 depende de la temperatura del gas. Calcular la
media de la v.a. ”energı́a cinética”, definida por X = 21 mV 2 (m es la masa).
38. Un fabricante vende un artı́culo a un precio fijo unitario. Si el peso del artı́culo es
inferior a 8 Kg. éste resulta no apto para la venta, lo cual representa la pérdida
total de su valor. El peso de un artı́culo se puede considerar como una v.a. con
distribución N (µ, 1). El coste de producción de un artı́culo es c = 0.05µ + 0.30.
Calcular el peso medio µ que maximiza el beneficio esperado por el fabricante.
39. (a) La probabilidad de que una componente de un cierto tipo tenga alguna averı́a
en las primeras 75 semanas es 0.9. Un sistema consta de seis de estas componentes
que funcionan en paralelo de manera independiente. ¿Cuál es la probabilidad de
que fallen exactamente cuatro de ellas en las primeras 75 semanas si se sabe que,
al menos, dos de las componentes han fallado en ese perı́odo?
(b) Supongamos ahora que el tiempo (en semanas) de funcionamiento sin averı́as
de cada componente es una v.a. absolutamente continua con función de densidad
−3/4
1 x
f (x) =
12 3
x 1/4
e−( 3 )
, para x > 0
Calcular la probabilidad de que una componente funcione más de 50 semanas sin
averiarse.
40. Supongamos que, para cada S > 0 prefijado, el número de árboles existentes
en cualquier zona de extensión S de un determinado bosque es una v.a. con
distribución de Poisson de parámetro θS, (con θ > 0 constante). Calcular la
distribución de la distancia entre cualquier punto dado y el árbol más próximo a
él.
11
41. Sea X una v.a. con distribución uniforme en el intervalo [0,1]. Sea U la v.a.
”primer dı́gito de X” y V el segundo dı́gito de X. Calcular las distribuciones de U
y de V y demostrar que ambas variables son independientes. Sugerir alguna posible interpretación o aplicación de este resultado, referida al problema de generar
números aleatorios en un ordenador.
42. Sea X una v.a. con función de distribución continua F . Demostrar que Y =
F (X) tiene distribución uniforme en el intervalo (0,1). Comentar el interés de este
resultado en relación con el problema de generar números aleatorios.
43. La función de densidad conjunta de dos variables aleatorias con distribución continua es:
(
k(x + xy) si x ∈ (0, 1) e y ∈ (0, 1)
f (x, y) =
0
en otro caso
(a) Obtener el valor de k.
(b) Funciones de densidad marginales.
(c) ¿Son independientes ambas marginales?
44. Sea (X, Y ) un vector aleatorio con función de densidad conjunta
(
f (x, y) =
ky
0
si 0 < x < y < 1
en otro caso
Calcular:
a) El valor de k.
b) E(Y ).
c) P (X > Y ).
45. Sean X1 y X2 variables aleatorias independientes e idénticamente distribuidas con
distribución uniforme en el intervalo (0,1).
Calcular E(X12 + X22 ) y P {X12 + X22 ≤ 1}.
12
46. Se tiran dos dados. Consideremos las variables aleatorias X = “n de puntos del
1er dado” e Y = “n máximo de los dos obtenidos”.
a) Hallar la funcion de masa conjunta y las marginales
b) Calcular las probabilidades de los distintos valores de X si sabemos que Y = 4.
c) Obtener la distribución de la variable aleatoria Z = suma de los puntos obtenidos.
d) Calcular la distribución condicionada de Z si sabemos que X = 1.
47. a) Dos personas llegan totalmente al azar e independientemente una de otra a
un lugar determinado, entre las 12 y la 1. Diseñar un modelo para sus posibles
llegadas mediante un par de variables aleatorias, indicando su densidad conjunta
y marginales.
b) Supongamos ahora que los instantes de llegada de las dos personas tienen como
función de densidad conjunta:
f (x, y) = 4xy
0 ≤ x ≤ 1,
si
0≤y≤1
¿Son independientes las llegadas de ambos? ¿Cuál es la distribución según la cual
llega ahora cada uno?
48. Sea (X, Y ) un vector aleatorio que tiene por función de densidad:
f (x, y) = 1
|y| < x,
0<x<1
a) Comprobar que es función de densidad.
b) Hallar las medias de X y de Y . Calcular las distribuciones condicionadas.
49. Un sistema tiene n componentes cuyos tiempos de vida X1 , ..., Xn son variables
aleatorias independientes e identicamente distribuidas con distribución exponencial de parámetro λ . Obtener la distribución de las variables aleatorias
M = max{X1 , ..., Xn }
N = min{X1 , ..., Xn }.
a) Supongamos que el sistema funciona mientras funciona al menos una de sus
componentes. Si λ = 1 dı́a, calcular la probabilidad de que el sistema se pare
antes de tres dı́as.
b) Supongamos que el sistema se para si falla una de sus componentes. Si λ = 1
dı́a, calcular la probabilidad de que el sistema funcione más de 2 dı́as.
13
50. A una centralita telefónica llegan simultáneamente tres clientes: los clientes 1 y
2 ocupan las dos cabinas disponibles y el cliente 3 queda esperando hasta que
quede libre una de las dos cabinas. Suponiendo que los tiempos de conversación,
T1 y T2 de los dos primeros clientes son variables aleatorias independientes con
distribución exponencial de parámetro λ, calcular la distribución y la media de la
v.a. T = ‘tiempo de espera (para acceder a una cabina) del cliente 3.
51. Un sistema electrónico consta de cuatro componentes. Sea Xj el tiempo de
funcionamiento de la componente j-ésima (j = 1, . . . , 4). Supongamos que las
variables Xj son independientes e idénticamente distribuidas con función de distribución continua F . Supongamos también que el sistema funciona mientras
funcione la componente 1 y al menos una de las otras tres componentes. Obtener
la función de distribución de la v.a. T =“tiempo de funcionamiento del sistema”.
52. Una empresa fabrica estructuras metálicas modulares. Se define la resistencia de
una estructura de este tipo, después de ser sometida a una carga, como X = ρ−C,
siendo ρ la resistencia a la tensión y C la carga. Se supone que ρ y C son v.a.
independientes con distribuciones ρ ∼ N (µρ = 800, σρ = 60), C ∼ N (µC =
550, σC = 70). Se entiende que una estructura puede soportar la carga a la que es
sometida si X > 0.
a) Calcular la probabilidad del suceso {X > 0}.
b) ¿Qué recomendación de carga máxima se hará al vender una de estas estructuras metálicas para que la pueda soportar con una probabilidad de 0.995?
c) Durante un año la empresa tiene previsto fabricar 1500 estructuras y, si la
probabilidad de que al menos 15 de ellas fallen es mayor que 0.95, decidirá
emprender un proyecto de modificación de la producción. ¿Qué decisión debe
tomar la empresa sobre este proyecto?
53. Un contador de partı́culas tiene un mecanismo imperfecto que detecta una partı́cula que llega al contador con probabilidad p. Si la distribución del número
de partı́culas que llegan al contador en una unidad de tiempo es una Poisson de
parámetro λ ¿Cuál es la distribución del número de partı́culas registradas por el
contador?
54. El número de partı́culas que llega a un contador en un tiempo t tiene una distribución de Poisson de parámetro λt. El contador sólo está abierto un tiempo
14
aleatorio t cuya distribución es exponencial de parámetro λ. Calcular la distribución de la v.a. N = número total de partı́culas registradas por el contador.
55. Sea f una función tal que 0 < f (x) < M , ∀x ∈ [a, b]. R Supongamos que se
quiere evaluar aproximadamente el valor de la integral I = ab f (x)dx. Esto puede
hacerse utilizando técnicas de simulación, por el siguiente procedimiento (Método
de Montecarlo):
A) Se simulan n observaciones (X1 , Y1 ), . . . , (Xn , Yn ) de una v.a. con distribución
uniforme en el rectángulo [a, b] × [0, M ].
B) Se aproxima el valor de I mediante
In = (b − a)M
A
,
n
donde A denota el número de observaciones (Xi , Yi ) para las que Yi < f (Xi ).
Demostrar, utilizando la ley de los grandes números, que In → I, (en prob.).
56. Un tren de circulación diaria se retrasa, independientemente de un dı́a a otro,
un tiempo aleatorio con distribución exponencial de parámetro 0.25 (el tiempo se
mide en minutos). Calcular la probabilidad de que, a lo largo de un año, el tren
se retrase 6 o más minutos en más de 50 ocasiones.
57. Una radióloga que trabaja en el servicio de traumatologı́a de un gran hospital
ha comprobado que el tiempo, en minutos, que tarda en atender a cada paciente
es una variable aleatoria con media 7 y desviación tı́pica 2. Durante su jornada
laboral trabaja 6 horas atendiendo pacientes sucesivamente y sin interrupción.
Calcular aproximadamente la probabilidad de que durante un dı́a pueda atender
a 55 pacientes dentro del horario de su jornada laboral. Se supone que todos los
pacientes están en la consulta con suficiente antelación, de manera que no hay
“tiempos vacı́os” entre dos pacientes consecutivos.
58. Las longitudes de los lados de un rectángulo son dos variables aleatorias X, Y
independientes normales de medias 4 y 7 y varianzas 9 y 16 respectivamente.
a) Calcular la probabilidad de que el perímetro del rectangulo sea mayor que 21.
b) Calcular la probabilidad de que Y ≥
15
3X
2
59. Se observa que el tiempo diario de estudio, además de las horas de clase, de un
alumno medio sigue una distribucion normal con media 2 y desviacion tı́pica 0.4
(en horas).
a) Se considera que ha tenido un dia de poco estudio si estudia menos de hora y
media. Calcular la probabilidad de que esto ocurra.
b) Se observa su comportamiento durante cinco dı́as consecutivos (de un lunes a
un viernes). Hallar la probabilidad de que en ese perı́odo tenga al menos 4 dias
de poco estudio.
c) Según la normativa europea, el curso académico tiene 200 dı́as de estudio. Hallar
la probabilidad de que a lo largo de un curso académico estudie mas de 350 horas
en total.
En los apartados b) y c) suponer que los tiempos que dedica al estudio en dias
distintos son independientes.
60. El tiempo (en meses) que tardan en sufrir una averı́a los ordenadores de un determinado modelo es una variable aleatoria con función de densidad f (t) = (1/4)e−t/4 ,
para t > 0.
(a) Calcular la probabilidad de que uno de estos ordenadores funcione sin averı́as
durante más de cinco meses.
(b) Si se seleccionan al azar 6 ordenadores nuevos de ese modelo ¿cuál es la probabilidad de que al menos 3 de ellos funcionen sin averı́as durante más de 5 meses?
(c) Si se seleccionan al azar 600 ordenadores nuevos de ese modelo, ¿cuál es la
probabilidad de que al menos 180 de ellos funcionen sin averı́as durante más de 5
meses?
61. La longitud de las varillas fabricadas en una factorı́a sigue una distribución normal
N (30, 2) (en cm).
a) Se eligen dos varillas al azar e independientemente. Calcula la probabilidad de
que la diferencia de sus longitudes sea menor que 1 cm.
b) De las dos varillas nos quedamos con la más larga. Calcula la probabilidad de
que su longitud sea menor que 31 cm.
62. El tiempo de permanencia de los coches en un gran aparcamiento es una variable aleatoria de media 176 minutos y desviación tı́pica 40 minutos. Calcular
aproximadamente la probabilidad de que el tiempo medio de permanencia en el
aparcamiento de 100 coches elegidos al azar sea superior a 180 minutos. Indicar
16
claramente las suposiciones previas y las aproximaciones en las que se basa la
validez del cálculo realizado.
63. Calcular la función generatriz correspondiente a la distribución de Poisson (λ)
k
(≡ P(λ)), cuya función de probabilidad es P {X = k} = e−λ λk! , k = 0, 1, . . . ,
Demostrar que si X1 , . . . , X1000 son v.a.i.i.d. con distribución P(1) entonces Z =
P1000
i=1 Xi ∼ P(1000)
64. El centro de cálculo de una universidad dispone de un servidor para gestionar las
páginas web personales de profesores y alumnos. Supongamos que la cantidad de
memoria ocupada por una de estas páginas puede considerarse como una variable
aleatoria con una media de 1.3 MB y una desviación tı́pica de 0.3. Si el servidor
va a gestionar un total de 500 páginas, calcular aproximadamente la probabilidad
de que la cantidad total de memoria necesaria supere los 660 MB.
65. Se han medido los tiempos de residencia en memoria de 13171 programas obteniéndose que la media muestral es 0.05 y la varianza muestral es 0.006724. Si el tiempo
de residencia es una variable aleatoria con distribución gamma de parámetros a
y p, calcular las estimaciones de estos parámetros obtenidas por el método de los
momentos.
66. El peso de las personas de una población sigue una distribución Normal con media
72 kg. y desviación tı́pica 10.
a) Cuatro personas elegidas al azar en esa población entran en un ascensor cuya
carga máxima es de 350 Kg. ÀCuál es la probabilidad de que entre los cuatro
superen esa carga máxima?
b) ÀCuál es la probabilidad de que dos personas, elegidas al azar en esa población,
puedan jugar en un balancı́n, si sólo pueden hacerlo cuando sus pesos difieren en
menos de 5 kg?
67. Cierto individuo valora como factor decisivo para la compra de un coche el consumo
de gasolina. Debe decidir entre dos modelos A y B.
El fabricante de A afirma que su consumo sigue una distribución N (8; 5) (en
litros/100 Km.), mientras que el de B dice que es N (8; 3).
17
a) Hallar la probabilidad de que el coche A consuma más de 9 litros y la probabilidad de que B consuma entre 7 y 8,5 litros.
b) Si decide comprar el modelo B, calcular la probabilidad de que ahorre más de
2 litros/100 Km.
68. En un examen se plantean 10 cuestiones a las que debe responderse verdadero
o falso. Un alumno aprobará el examen si al menos 7 respuestas son acertadas.
ÀQué probabilidad de aprobar tiene un estudiante que responde todo al azar? ÀY
uno que sabe el 30% de la asignatura?
69. Para llegar a una medida del ”pie”, en el siglo XVI en Alemania, se realizó la
siguiente operación. En un domingo se alinearon los 60 primeros hombres que
llegaron a la iglesia y se midió, en cada uno, la longitud de su pie izquierdo; a la
longitud media se le denominó ”pie legal”.
Si la longitud media del pie izquierdo de un hombre adulto en Alemania era µ
y la desviación tı́pica 12 mm., calcular la probabilidad de que dos ”pies legales”
definidos respecto a dos grupos distintos de hombres difieran en más de 5 mm.
ÀCuántos hombres deberı́an tomarse para que, con probabilidad 0’99, la dimensión
media de sus pies difiera de µ en menos de 0’5mm.?
ÀY si la desviación tı́pica es desconocida?
70. El coseno X del ángulo con el que se emiten los electrones en un proceso radiactivo
es una variable aleatoria con función de densidad
(
fθ (x) =
1+θx
2
0
si − 1 ≤ x ≤ 1 (−1 ≤ θ ≤ 1)
en el resto
Consideremos una muestra aleatoria (X1 , . . . , Xn ) de esta variable aleatoria.
(a) Obtener el estimador de θ por el método de los momentos.
(b) Calcular la varianza de este estimador y demostrar que es consistente para
estimar θ.
71. Una variable aleatoria X tiene un función de densidad f (x) = e−(x−θ) siendo x ≥ θ.
a) Calcular E(X) y obtener un estimador de θ basado en la media muestral (o
método de los momentos). Calcular la esperanza del estimador obtenido.
18
b) Obtener un estimador de Θ por el metodo de la máxima verosimilitud.
72. La lectura de voltaje dada por un voltı́metro conectado a un circuito eléctrico es
una variable aleatoria con distribución uniforme en el intervalo (θ, θ + 1), siendo θ
el verdadero valor (desconocido) del voltaje. Sea X1 , . . . , Xn una muestra aleatoria
de lecturas de dicho voltı́metro.
(a) Demostrar que la media muestral X̄ es un estimador sesgado de θ y calcular
el sesgo.
(b) Calcular el error cuadrático medio de X̄.
(c) Obtener, a partir de X̄, un estimador insesgado de θ.
73. Obtener el estimador de máxima verosimilitud, basado en muestras de tamaño n,
para el parámetro θ en una distribución uniforme en [0, θ]. Estudiar su comportamiento lı́mite. ¿Es un estimador insesgado de θ?
74. El error en la medida de una magnitud es una variable aleatoria con función de
2
1
densidad f (x) = √2πθ
exp(− x2θ ) para x ∈ (−∞, ∞) (θ > 0). Calcular el estimador
de máxima verosimilitud de Vθ (X) = θ. ¿Es consistente?
75. Un partido polı́tico que concurre a las elecciones municipales en una gran ciudad
quiere encargar una encuesta para estimar su porcentaje P de votación mediante
un intervalo de la forma P̂ ± 1.5 cuyo nivel de confianza sea 0.95. ¿Qué tamaño
muestral debe utilizarse en la encuesta para alcanzar aproximadamente este objetivo sabiendo que en un pequeño sondeo orientativo (muestra piloto) el porcentaje
de votación estimado fue del 15%?
76. El número de errores en el análisis de un cierto producto sigue una distribución
de Poisson de párametro λ. Una muestra de 400 datos ha dado los siguientes
resultados
No¯ errores 0
1
2 3 4 5
o
N¯ analisis 213 128 37 18 3 1
a) Obtener un estimador de λ basado en la media muestral. Calcular la esperanza
del estimador obtenido.
19
b) Hallar un intervalo de confianza de nivel 95% para el párametro λ
77. Se quiere comparar dos métodos, A y B para determinar el calor latente de fusión
del hielo. La siguiente tabla da los resultados obtenidos (en calorı́as por gramo de
masa para pasar de -0.72o¯ C a 0o¯ ) usando reiteradamente ambos métodos:
Método A: 79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04, 79.97, 80.05, 80.03, 80.02,
80.00, 80.02.
Método B: 80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95, 79.97.
Se supone que en ambos métodos el calor tiene una distribución normal.
Obtener un intervalo de confianza de coeficiente 0.95 para comparar las mediciones
medias obtenidas por ambos métodos. Comprobar primero si se puede suponer
que las varianzas son iguales.
78. Una caracteristica de los individuos de una población sigue una distribucion normal
de media µ y varianza σ 2 = 16. Dicha característica se observará en n individuos
elegidos al azar e independientemente. Sea X̄ la media que se obtendrá de las n
observaciones
a) Si n = 100 calcular A para que con probabilidad
90
100
se tenga que µ ≤ X̄ + A
b) Calcular el tamaño n que debe tener la muestra para que con probabilidad
se tenga que µ ≤ X̄ + 0.32
95
100
c) Si n = 64 x̄ = 15 σ es desconocida y s2 = 9 calcular un intervalo de confianza
del 98% para la media.
79. Las tensiones de rotura (en Kp.) de 5 cables de un determinado metal fueron 660,
460, 540, 580, 550. Suponiendo normalidad para las tensiones:
(a) Estimar la tensión media de rotura mediante un intervalo de confianza de
coeficiente 0.95.
(b) Estimar σ 2 mediante un intervalo de confianza de coeficiente 0.9.
80. Se desea estimar el tiempo medio de ejecución µ de un programa. Para ello se
ejecuta dicho programa 6 veces utilizando conjuntos de datos elegidos aleatoriamente, obteniéndose que la media muestral y la cuasi-desviación tı́pica muestral
son, respectivamente, x̄ = 230 ms. y s = 14 ms. Obtener un intervalo de confianza
al 98% para µ. (suponer normalidad).
20
81. (a) Se desea evaluar
aproximadamente, por el “método de Montecarlo”, la inR
tegral p = 01 f (x)dx de una función continua f : [0, 1] → [0, 1]. Para ello
se generan 500 observaciones independientes (Xi , Yi ), i = 1, . . . , 500 con distribución uniforme en el cuadrado [0, 1] × [0, 1] y se estima p mediante
p̂ =
500
X
Zi
i=1
500
,
donde Zi vale 1 si Yi ≤ f (Xi ) y 0 en caso contrario. ¿Qué distribución tienen
las Zi ?. Obtener un intervalo de confianza de nivel 0.99 para estimar p.
(b) SupongamosR ahora que se desea evaluar por el método de Montecarlo la
integral p = 01 x2 dx. ¿Cuántos puntos (Xi , Yi ) habrı́a que generar para tener
una probabilidad 0.99 de evaluar p con un error inferior a una centésima?
82. Los tiempos de ejecución (en segundos) de 40 trabajos procesados por un centro
de cálculo han resultado ser
10 19 90 40 15
23 13 36 101 2
27 1 57 17 3
9 11 20 13 38
11 32 17 4 152
14 2 23 34 15
30 50 4 62 48
54 46 12 5 26
Calcular la media y la cuasi-desviación tı́pica muestrales. Obtener intervalos de
confianza al 90% para la media y la varianza del tiempo de ejecución de un trabajo,
suponiendo que esta variable aleatoria tiene distribución normal.
83. En una ciudad se quiere hacer un estudio rápido para valorar el consumo de agua
en los domicilios particulares durante los meses de mayor sequı́a. Para ello se
seleccionaron al azar 15 domicilios y se midieron sus consumos (xi ) en metros
P
P
cúbicos durante el mes de agosto. Los resultados fueron xi = 280.5, x2i =
5308.35. En vista de estos datos ¿hay suficiente evidencia estadı́stica, al nivel 0.05,
a favor de la hipótesis de que el consumo medio de los particulares durante el mes
de agosto es mayor que 18 m3 (que es el consumo considerado como “sostenible”)?
84. La duración media de una muestra de 10 bombillas es x̄ = 1250 horas, con una
cuasidesviación tı́pica muestral de sX = 115. Se cambia el material del filamento
por otro nuevo y, entonces, de una muestra de 12 bombillas se obtuvo una duración
media de ȳ = 1340 horas, con una cuasidesviación tı́pica muestral de sY = 106.
a) ¿Puede aceptarse que las varianzas, antes y después del cambio de filamento,
son iguales? ¿Bajo qué hipótesis?
21
b) ¿Ha aumentado la duración media de las bombillas?
85. El consumo de gasolina (en litros por 100 Km.) de los coches de un determinado
modelo sigue una distribución normal con media 8. Se ha introducido una modificación en el motor con objeto de disminuir el consumo y se han probado 10 coches
con el motor modificado, obteniéndose los siguientes consumos por 100 Km: 7.8,
7.7, 8.1, 7.6, 8.0, 7.7, 7.6, 8.2, 7.3, 7.5.
Suponiendo que la modificación mantiene la normalidad, ¿hay suficiente evidencia
estadı́stica (al nivel de significación 0.05) para poder afirmar que la modificación
ha reducido el consumo medio?
NOTA: Denotando las observaciones por xi , se tiene
P
xi = 77.5,
P
x2i = 601.33.
86. En un proyecto de investigación se necesita resolver un gran número de ecuaciones
diferenciales por métodos numéricos. Para ello utilizan un programa FORTRAN
diseñado por uno de los investigadores del equipo. Una empresa de software ofrece
un nuevo programa de resolución de ecuaciones afirmando que es más rápido que
el antiguo. Antes de decidir la adquisición del nuevo programa, los responsables
del proyecto de investigación realizan una prueba, eligiendo al azar 12 ecuaciones
y resolviendo cada una de ellas con el programa antiguo y con el nuevo. Los
resultados fueron
12
X
i=1
xi = 51.6,
12
X
i=1
x2i
= 226.2,
12
X
yi = 46.8,
12
X
i=1
i=1
yi2
= 186.84,
12
X
xi yi = 205.36
i=1
donde xi e yi denotan, respectivamente, los tiempos (en minutos) empleados por
el programa antiguo y por el nuevo en resolver la ecuación i-ésima.
¿Proporcionan estos datos suficiente evidencia estadı́stica, al nivel 0.05, a favor
de la hipótesis de que el nuevo programa es más rápido que el antiguo? Indicar
claramente las suposiciones requeridas para la validez del procedimiento empleado.
87. La concentración media de dióxido de carbono en el aire en una cierta zona no
es habitualmente mayor que 355 p.p.m.v. (partes por millón en volumen). Se
sospecha que esta concentración es mayor en la capa de aire más próxima a la
superficie. Para contrastar esta hipótesis se analiza el aire en 20 puntos elegidos
aleatoriamente a una misma altura cerca del suelo. Resultó una media muestral de
580 p.p.m.v. y una cuasi-desviación tı́pica muestral de 180. Suponiendo normalidad para las mediciones, ¿proporcionan estos datos suficiente evidencia estadı́stica,
al nivel 0.01, a favor de la hipótesis de que la concentración es mayor cerca del
suelo?
22
88. Se han seleccionado al azar 500 usuarios de correo electrónico en Estados Unidos
y ha resultado que 22 de ellos han recibido virus informáticos a través del correo
lo largo del último año. Se ha realizado otro muestreo independiente eligiendo
al azar 300 usuarios en la Unión Europea resultando que 9 de ellos han tenido
problemas de este tipo en el mismo perı́odo. ¿Proporcionan estos datos suficiente
evidencia estadı́stica, al nivel 0.05, a favor de la hipótesis de que la incidencia de
los virus es mayor en Estados Unidos? El p-valor del contraste ¿es mayor o menor
que 0.01?
89. Se ha hecho un estudio para comparar los tiempos de acceso, en diferentes momentos del dı́a, a internet desde ordenadores domésticos con módem. Para ello se
cargan 8 páginas web por la tarde en el perı́odo de 14 a 15 h. y, con el mismo
ordenador, las mismas 8 páginas por la noche en el perı́odo de 22 a 23 h. Los
respectivos tiempos de acceso en minutos fueron
De 22 a 23 h.
De 14 a 15h.
2.9 1.4 1.2
2.3 1.5 1
3.4
2.7
1.3
1.4
2.5
1.9
1.6 1.8
0.8 1.1
¿Hay suficiente evidencia estadı́stica, al nivel 0.01, a favor de la hipótesis de que
el acceso es más lento en el horario nocturno?
90. El tiempo de acceso al disco duro en un cierto modelo de ordenadores es una
variable aleatoria con media 15 milisegundos. Se ha propuesto una modificación
técnica con objeto de disminuir este tiempo de acceso. Se prueba el nuevo sistema
en 10 ordenadores obteniéndose una media muestral x̄ = 14 ms. y una cuasidesviación tı́pica muestral s = 2.286.
(a) ¿Hay suficiente evidencia estadı́stica, al nivel 0.05, a favor de la hipótesis de
que el nuevo modelo disminuye el tiempo de acceso?
(b) Calcula aproximadamente el p-valor. Indica un par de valores de x̄ y de s que
hubiesen llevado a un p-valor de 0.005. ¿Qué decisión se deberı́a tomar en este
caso respecto al nuevo modelo?
91. Un método estadı́stico de reconocimiento de formas para distinguir entre la letra
B y el número 8 se basa en observar una v.a. X definida como el cociente de
la altura del sı́mbolo y la longitud del arco en el lado izquierdo y realizar un
test de hipótesis. Supongamos que la distribución de X cuando el sı́mbolo es
23
8 es N (0.8, 0.01) y la distribución de X cuando el sı́mbolo es B viene dada por
N (0.96, 0.01). El problema de reconocimiento de formas puede formularse entonces
como un problema de contraste de hipótesis del tipo
H0 : E(X) = 0.8
frente a
H1 : E(X) = 0.96
Si se decide rechazar H0 siempre que x > 0.90, calcular las probabilidades de
errores de tipo I y II.
92. Para determinar el precio de sus pólizas, una empresa de seguros tiene siempre en
cuenta el siguiente Principio básico (conocido desde hace años):
Como mucho un 2 por ciento de los vehı́culos asegurados sufre algún rasguño en
la chapa cada año.
Para ver si este dato sigue siendo correcto, decide hacer un estudio tomando una
muestra de 1000 asegurados. Obtiene que 30 de ellos ha tenido durante ese año
algún raguño en la chapa.
a) Determina el p-valor de este contraste.
b) Sabemos que en todo contraste de hipótesis hay un margen de error. Por
ejemplo, puede que el Principio básico sea correcto, pero nuestro contraste diga
que no lo es. Queremos que ese error sea pequeño, de modo que, si el Principio
básico es correcto, con un 99,9 por ciento de probabilidad nuestro contraste lo
corrobore. Planteando ası́ el contraste y con los datos anteriores, decide si hay
suficiente evidencia estadı́stica a favor de que el Principio básico es incorrecto.
93. Un método de tratamiento contra la leucemia mieloblástica aguda consiste en
someter al paciente a quimioterapia intensiva. Se sabe que este tratamiento proporciona un porcentaje de remisión de un 70%. Se aplica un nuevo método de
tratamiento a 50 voluntarios. ¿Cuál es el mı́nimo número de casos de remisión de
la enfermedad que debe observarse para poder afirmar (a un nivel de significación
del 0.025) que el nuevo método produce una tasa de remisión más alta que el
antiguo?
94. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia por
ordenador, se eligieron al azar 21 estudiantes de una clase para seguir el nuevo
programa (grupo piloto) mientras que los 23 restantes seguı́an el método habitual
(grupo control).
Finalizado el curso, se realizó un examen obteniendose los siguientes resultados:
Grupo piloto: Calificación media = 51,48 puntos, Cuasi-desviación tı́pica = 11,01.
Grupo control: Calificación media = 41,52 puntos, Cuasi-desviación tı́pica =
14,15
24
Suponiendo igualdad de varianzas, contrastar si hay evidencia estadı́stica (a nivel
α = 0, 05) de que el nuevo método piloto da mejores resultados que el método
habitual.
Indicar claramente el modelo probabilı́stico utilizado y todos los elementos el contraste realizado.
95. Dos empresas competidoras (A y B) en un mismo sector han puesto en marcha, casi
simultáneamente, páginas de internet para la venta electrónica. Se han elegido al
azar ocho clientes que han visitado la página A y, de manera independiente, otros
ocho que han visitado la B y se han medido el tiempo (en minutos) de la duración
de la visita de cada cliente. Los resultados fueron los siguientes:
Página A (x)
Página B (y)
2.3 3.5 4.2 3.2 4.4 2.1 1.6 5.3
1.3 2.3 4.4 3.7 2.8 6.5 3.6 4.5
¿Proporcionan estos datos suficiente evidencia estadı́stica (al nivel 0.05) para afirmar que los tiempos medios de duración de las visitas en ambas páginas son
diferentes? Indicar claramente las suposiciones en las que se basa la validez del
método empleado.
P
[
xi = 26.6,
P
yi = 29.1,
P
x2i = 99.84,
P
yi2 = 123.33]
96. En la fabricación de chips para circuitos integrados hay una variable, denominada
amplitud de ventana que está relacionada con los procedimientos de interconexión
entre los circuitos.
Se desea estudiar el efecto que tiene sobre la amplitud de ventana una determinada
reacción quı́mica que se produce durante el proceso de fabricación de los chips.
Para ello se ha medido dicha variable (Phadke et al. (1983) Bell System Tech. J.)
antes de la reacción quı́mica, en una muestra aleatoria de 10 lugares, obteniéndose
los siguientes resultados (en milimicras):
xi : 2.52, 2.50, 2.66, 2.73, 2.71, 2.67, 2.06, 1.66, 1.78, 2.56
Se midieron también las amplitudes de ventana, después de la reacción en una
nueva muestra independiente de la anterior, obteniéndose
yi : 3.21, 2.49, 2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91
Suponiendo normalidad e igualdad de las varianzas poblacionales (antes y después
de la reacción), ¿hay suficiente evidencia estadı́stica (al nivel de significación 0.01)
para poder afirmar que después de la reacción ha aumentado la amplitud media
P
P
P
P
de ventana? Indicación: xi =23.85, x2i =58.3231, yi =34.26, yi2 =120.5412.
25
97. El gasto telefónico medio bimensual en una muestra de 10 usuarios elegidos al azar
en una ciudad ha resultado ser 90 euros y la cuasi-desviación tı́pica, 11 euros. En
otra ciudad se ha tomado, de modo independiente, otra muestra de 12 usuarios
y los valores obtenidos para la media y la cuasi-desviación tı́pica muestrales han
sido, respectivamente, 80 y 10.
(a) ¿Proporcionan estos datos suficiente evidencia estadı́stica, al nivel 0.05, a
favor de la hipótesis de que el gasto medio en la primera ciudad es más alto
que el gasto medio en la segunda? Suponer que las varianzas de las variables
que indican los gastos telefónicos en ambas ciudades son iguales. Indicar
claramente las restantes suposiciones necesarias para garantizar la validez
del procedimiento empleado.
(b) El p-valor ¿es mayor o menor que 0.01? Razonar la respuesta.
98. Con objeto de averiguar si la estatura de las personas disminuye significativamente
a lo largo de la jornada se seleccionaron al azar diez mujeres de la misma edad de
las que se midió su estatura (en cm.) por la mañana al levantarse (Xi ) y por la
noche antes de acostarse (Yi ). Se obtuvieron los siguientes resultados:
Xi
Yi
169.7
168.2
168.5
166.4
165.9
166.7
177.8
177.2
179.6
177.9
168.9
168.0
169.2
169.5
167.9
166.7
181.8
182.5
163.3
161.1
¿Proporcionan estos datos suficiente evidencia estadı́stica, al nivel 0.05, a favor de
la hipótesis de que la estatura disminuye a lo largo de la jornada?
99. Se ha realizado un estudio comparando la cantidad media (en kilos/año) de desechos contaminantes (aceite de automóviles, baterı́as, pinturas,...) producidos por
casas particulares y pequeños negocios. Para ellos se han seleccionado dos muestras (de tamaños n1 = 1000 y n2 = 1500) en dos ciudades distintas (1 y 2). Las
medias muestrales obtenidas han sido x̄1 = 10.60 kilos/año y x̄2 = 13.4 kilos/año,
respectivamente. Las cuasi-varianzas muestrales han sido s21 = 14 y s22 = 16. ¿Proporcionan estos datos suficiente evidencia estadı́stica, al nivel 0.01, a favor de la
hipótesis de que en la ciudad 2 la cantidad media de desperdicios es más alta que
en la primera? Suponer que las varianzas de las variables que indican las cantidades de residuos en ambas ciudades son iguales. Indicar claramente las restantes
suposiciones necesarias para garantizar la validez del procedimiento empleado.
26
100. Un cierto programa de ordenador se supone que genera cifras de cero a nueve
totalmente al azar. De 200 cifras obtenidas se observaron las siguientes frecuencias:
0 1 2 3 4 5 6 7 8 9
Frecuencias 27 22 15 18 23 26 19 20 16 14
Con un nivel de significación de 0.05, ¿es bueno el programa?
101. Según los datos de un exhaustivo estudio de mercado que se realizó en una gran
ciudad, las ventas de impresoras para ordenadores personales de uso doméstico
se dividen entre cuatro marcas (A, B, C y D) cuyos porcentajes del total de las
ventas son 18%, 22%, 35% y 25%, respectivamente.
Un año después, se quiere analizar de nuevo la situación pero no se dispone de
dinero para repetir un estudio de mercado a gran escala. Se decide, por tanto,
observar la marca adquirida por 200 compradores de impresoras elegidos al azar,
obteniéndose que de ellos 28 habı́an elegido la marca A, 48 la B, 77 la C y 47 la
D. ¿Hay suficiente evidencia estadı́stica, al nivel 0.05, para afirmar que el reparto
del mercado ya no es el mismo que el año anterior?
102. En el transcurso de dos horas, el número de llamadas por minuto, solicitadas a
una centralita telefónica fue:
No¯ llamadas/minuto 0 1 2 3 4 5 6
Frecuencia
6 18 32 35 17 10 2
¿Se puede aceptar que el número de llamadas por minuto sigue una distribución
de Poisson?
103. Se quiere estudiar la relación entre la edad de los chicos y el tiempo T que ven
semanalmente la televisión. Con una muestra de 200 chicos se obtuvieron los
siguientes resultados
TIEMPO
CHICOS A
B
C
P
20
30
30
M
20
40
60
indicando por P el grupo formado por los chicos entre 6 y 10 años, M el grupo de
los chicos entre 11 y 15 años, A el grupo de chicos que ven la televisión menos de
14 horas, B entre 14 y 18 horas, C ven la televisión mas de 18 horas.
27
a) Indicar el tipo de contraste adecuado para esta situación, plantear la hipótesis
nula y decidir si hay evidencia estadística significativa con nivel α = 0.05 de que
existe relación entre la edad y el tiempo que ven la televisión. b) Preguntados 200
chicos del grupo P sobre el número de horas que ven la televisión en sábado se
obtuvieron los siguientes resultados
No¯ horas 0 1 2 3 4
No¯ chicos 30 50 50 30 40
Es admisible que el numero de horas que ven la televisión (con α = 0.05) sigue
una distribución de Poisson?
104. En un estudio sobre el uso de sistemas operativos se han seleccionado al azar 150
profesores universitarios (PU), 150 profesionales técnicos (PT) de grado medio que
trabajan en la industria y 150 personas con cargos directivos (CD) en empresas. A
cada uno de los seleccionados se le ha preguntado cuál es el sistema operativo (A,
B o C) que utiliza habitualmente en su trabajo con ordenadores. Los resultados
se resumen en la siguiente tabla:
A B C
PU 52 40 58
PT 42 45 63
CD 28 47 75
¿Hay suficiente evidencia estadı́stica, al nivel 0.05, para concluir que existe alguna
asociación entre el status profesional y la preferencia por un sistema operativo?
Formular con precisión la hipótesis que se contrasta. Indicar razonadamente si el
p-valor es mayor o menor que 0.01.
105. Una fábrica de automóviles quiere averiguar si la preferencia de modelo tiene
relación con el sexo de los clientes. Se toman dos muestras aleatorias de 1000
hombres y 1000 mujeres observándose las siguientes preferencias:
MODELO
SEXO
A
B
C
Mujer 340
400
260
Hombre 350
270
380
¿Son homogéneas las preferencias entre hombres y mujeres, al nivel de significación
0.01?
28
Supongamos ahora que los resultados de la tabla anterior correspondiesen a una
muestra aleatoria de 2000 personas, clasificadas de acuerdo con el doble criterio
sexo/preferencia de modelo. ¿En qué se modificarı́a el planteamiento o la interpretación de los resultados anteriores?
106. Un estudio sobre tabaquismo en tres comunidades, mediante tres muestras aleatorias de tamaño 100, proporciona los siguientes resultados:
Comunidad
A
B
C
fumadores
13
17
18
no fumadores
87
83
82
¿Pueden considerarse homogéneas las tres poblaciones en cuanto a sus hábitos
fumadores, al nivel 0.05?
107. Se ha realizado una encuesta en una ciudad con objeto de estudiar las posibles
relaciones entre el nivel educativo (educación superior, media o primaria) de las
personas y el nivel de consumo (bajo, medio o alto) de un determinado producto.
Los resultados, para 400 personas seleccionadas al azar, han sido:
SUPERIOR
MEDIA
PRIMARIA
BAJO MEDIO ALTO
31
41
44
28
79
125
16
17
19
Contrastar estadı́sticamente (al nivel 0.01) la independencia entre el nivel educativo y el nivel de consumo.
108. En un estudio (H. Behbahani, Universidad de Florida, 1977) acerca del efecto de
la tasa agua/cemento sobre la resistencia del material resultante al cabo de 28
dı́as, se obtuvieron los siguientes datos
X=Tasa agua/cemento
1.21 1.29 1.37 1.46 1.62 1.79
Y =Resistencia (100 pies/libra) 1.302 1.231 1.061 1.040 0.803 0.711
Ajustar un modelo lineal simple.
29
109. Se desea estudiar la relación entre la intensidad de regadı́o (x) y la productividad
(Y) de un cierto cultivo. Se han obtenido los siguientes resultados:
xi : 9 10 13 15 18 13
Yi : 36 44 48 63 70 45
Ajustar un modelo lineal simple.
110. K. Pearson estudió la relación entre la altura del padre (X) y la de su hijo (Y )
tomando 1078 casos de padres con uno o dos hijos (datos de 1903). Observó que
las variables X e Y se ajustaban bien a una Normal bivariante con parámetros
(en cm):
µ1 = 172,
σ1 = 6, 91,
µ2 = 174, 4,
σ2 = 6, 98,
ρ = 0, 51.
a) Hallar la altura esperada de un hijo cuyo padre mide 178 cm.
b) Si se elige una familia al azar, calcular la probabilidad de que la altura del hijo
supere en 5 cm la del padre.
c) Probabilidad de que la altura de un hijo supere los 180 cm.
d) Probabilidad de que la altura de un hijo supere los 180 cm, sabiendo que su
padre mide 176 cm.
111. Se ha realizado un experimento para medir la velocidad del sonido en el aire a
diferentes temperaturas. Los resultados obtenidos se indican en la siguiente tabla:
Temperatura en 0 C (x)
Velocidad en m/s (y)
-13
322
0
9
335 337
20
346
33
352
50
365
Estimar la función de regresión lineal de y sobre x.
P
[
xi = 99,
P
yi = 2057,
P
x2i = 4239,
P
30
yi2 = 706323,
P
xi yi = 35633]
112. En la siguiente tabla de datos la variable y representa la pureza (en porcentaje) del
oxı́geno producido en un cierto proceso quı́mico de destilación y x es el porcentaje
de hidrocarburos presentes en el condensador principal de la unidad de destilación.
N0 de observación
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nivel de hidrocarburo, x (%) Pureza, y (%)
0.99
90.01
1.02
89.05
1.15
91.43
1.29
93.74
1.46
96.73
1.36
94.45
0.87
87.59
1.23
91.77
1.55
99.42
1.40
93.65
1.19
93.54
1.15
92.52
0.98
90.56
1.01
89.54
1.11
89.85
1.20
90.39
1.26
93.25
1.32
93.41
1.43
94.98
0.95
87.33
Efectuado un análisis con el programa SPSS se obtiene:
Interpretar los resultados.
31
113. Una compañı́a productora de energı́a eléctrica está interesada en desarrollar un
modelo que relacione la “demanda pico” por hora (variable Y , en kw) con el uso
total de energı́a al mes (variable X, en kwh). La siguiente tabla muestra los
resultados obtenidos en una muestra de 50 clientes:
Cliente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Xi
679
292
1012
493
582
1156
997
2189
1097
2078
1818
1700
747
2030
1643
414
354
1276
745
795
540
874
1543
1029
710
Yi
0.79
0.44
0.56
0.79
2.70
3.64
4.73
9.50
5.34
6.85
5.84
5.21
3.25
4.43
3.16
0.50
0.17
1.88
0.77
3.70
0.56
1.56
5.28
0.64
4.00
Cliente
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Xi
Yi
1434 0.31
837 4.20
1748 4.88
1381 3.48
1428 7.58
1255 2.63
1777 4.99
370 0.59
2316 8.19
1130 4.79
463 0.51
770 1.74
724 4.10
808 3.94
790 0.96
783 3.29
406 0.44
1242 3.24
658 2.14
1746 5.71
895 4.12
1114 1.90
413 0.51
1787 8.33
3560 14.94
Efectuado un análisis con el programa SPSS se obtiene:
Interpretar los resultados.
32
Descargar