TERCER SEMESTRE DE LICENCIATURA EN INFORMÁTICA. CENTRO UNIVERSITARIO DE LOS ALTOS.

Anuncio
TERCER SEMESTRE DE LICENCIATURA EN INFORMÁTICA.
CENTRO UNIVERSITARIO DE LOS ALTOS.
CAPITULO I.
DESCRIPCION DE UN CONJUNTO DE DATOS.
CONCEPTOS.
• ESTADÍSTICA: Es una disciplina de las matemáticas cuyo objetivo es analizar la información obtenida a
fin de poder obtener un resultado mediante el método de análisis para la toma de decisiones.
• ESTADÍSTICAS: Son los resultados de los eventos que deberán ser sujetos a un análisis estadístico.
• POBLACIÓN: Es un conjunto entero de datos. Las poblaciones pueden ser de tipo finito o infinito.
Ejemplo:
Finito: Número de alumnos de un grupo.
Infinito: Los números.
• TOMA DE DATOS: Es un conjunto o una colección de datos que no han sido ordenados numéricamente.
Ejemplo:
Un edificio tiene 15 apartamentos con el siguiente número de inquilinos:
2,1,3,5,2,2,2,1,4,2,6,2,4,3,1
DISTRIBUCIONES DE FRECUENCIAS.
Estas pueden utilizarse cuando el número de datos es mayor que 30. Para ellos se recomienda utilizar el
siguiente procedimiento:
• Se calcula el rango, el cual es igual al dato mayor menos el dato menor.
Rango = Dato mayor − Dato menor.
• Se obtiene en forma aproximada el número de clases, el cual se divide el rango entre un valor arbitrario.
Número de clases = ___Rango_____
X = valor arbitrario.
• Se ordenan las clases y se calculan las frecuencias absolutas y frecuencias relativas.
MARCAS DE CLASE.
Estas se obtienen sumando el limite real inferior mas el limite real superior y el resultado se divide entre 2.
1
LIMITES REALES SUPERIORES E INFERIORES.
Estos se obtienen sumando 0.5 a los limites superiores y restando 0.5 a los limites inferiores.
LONGITUD TAMAÑO O ANCHURA DE CLASE (c).
Este se obtiene restando el limite real superior menos el limite real inferior para cada clase.
Ejemplo 1.
Supongamos que las temperaturas en grados Fahrenheit medidas a las 6 de la tarde durante un periodo de 35
días son las siguientes:
DATOS AGRUPADOS.
72
82
92
92
81
78
81
83
93
77
86
77
76
84
73
93
87
78
107
76
106
82
73
99
80
107
91
81
94
88
98
95
86
86
91
Hacer una distribución de frecuencias.
• Rango= 107 − 72 = 35
• Número de clases = Rango = 35 = 7 clases aproximadamente.
X=5 5
DISTRIBUCIÓN DE FRECUENCIAS.
Frecuencia
Frecuencia
Marca Limite
de
Real
Absoluta
Relativa
Clase
Inferior
Frecuencia
Limite
Real
Frecuencia
Superior
Acumulada
Relativa
Acumulada
35 99.6%
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
Clases
Es una representación gráfica mediante rectángulos cuyas bases corresponden a la longitud de la clase y las
alturas a las frecuencias absolutas.
HISTOGRAMAS: Se grafican en el eje horizontal las marcas de clase y en el eje vertical las frecuencias
absolutas.
POLÍGONO DE FRECUENCIAS: Es una representación gráfica que se obtiene en los puntos medios de los
techos de los rectángulos, se unen con líneas rectas.
2
POLÍGONO DE FRECUENCIAS RELATIVAS.
Es una representación gráfica que se obtiene mediante las marcas de clase y las frecuencias relativas.
DIAGRAMA DE PARETO.
Es una representación gráfica en base a rectángulos, con la característica de la mayor frecuencia absoluta
hasta la menor.
FRECUENCIAS ACUMULADAS.
Estas se obtienen para cada una de las clases sumando la frecuencia absoluta de la clase actual mas la
frecuencia o frecuencias absolutas anteriores. La gráfica se llama OJIVA y esta se obtiene con los límites
reales superiores y las frecuencias acumuladas.
MEDIDAS DE TENDENCIA CENTRAL.
Entre las medidas de tendencia central más comunes son:
• Media Aritmética ( x ).
• Moda.
• Mediana.
Las medidas de tendencia central son las que representan a un conjunto de datos.
• MEDIA ARITMÉTICA: Es aquella que se define como el promedio de un conjunto de datos.
La media Aritmética se obtiene tanto para datos agrupados como los no agrupados.
• DATOS NO AGRUPADOS:
Donde:
X = Datos.
N = Número total de datos.
Ejemplo:
66, 100, 98, 96, 58, 94, 90
= 66, 100, 98, 96, 58, 94, 90 = 602 = 86.
77
• DATOS AGRUPADOS:
3
Donde:
X = Número de datos
N = Número total de datos.
f = Frecuencias absolutas.
Ejemplo:
• MODA: Es la medida de tendencia central que se define como el valor que se presenta con mayor
frecuencia, es decir el más común.
La moda para datos no agrupados presenta los siguientes casos:
Caso 1:
2, 3, 3, 4, 4, 4, 5, 7, 8, 9. Moda = 4.
Caso 2:
2, 5, 5, 6, 6, 7, 9, 16. Moda = 6, 5.
Caso 3:
2, 4, 5, 6, 7, 8, 11. No existe Moda.
La moda para datos agrupados presenta la siguiente formula:
Donde:
L1 = Es el limite inferior de la clase que contiene la moda.
4
= Es la diferencia de la frecuencia modal menos la frecuencia de
la clase contigua inferior.
= Es la diferencia de la frecuencia de la clase menos la
frecuencia de la clase contigua superior.
C = Es el tamaño, longitud o anchura de clase.
Ejemplo:
=8−5=3 =8−7=1
3
Moda = 76.5 + 5 = 76.5 + 3 (5) = 76.5 + 3.75 = 80.25
3+1
Moda = 80.25.
• MEDIANA: Es la medida que se define como el valor que divide a un conjunto de datos en dos partes
iguales.
La moda presenta los siguientes casos:
Caso 1: (Conjunto impar).
2, 3, 4, 5, 7 , 7, 8, 9, 13
Mediana
Mediana = 7
Caso 2: (Conjunto par ).
1, 3, 3, 6, 7, 8, 9, 15
6 + 7 = 13 = 6.5
2
Mediana = 6.5
Para calcular la mediana para datos agrupados se aplica la siguiente fórmula:
Mediana = L + N _ f C
2
fm
5
Donde:
L = Es el límite real inferior de la clase que contiene la mediana.
N = Es el número total de datos en el conjunto.
f =Es la suma de las frecuencias acumuladas inferiores sin
contar la frecuencia de la clase que contiene la mediana.
C = Es el tamaño, longitud o anchura de la clase.
*NOTA: La clase que contiene la mediana se obtiene contando las frecuencias absolutas, de arriba hacia
abajo y viceversa localizándola donde nos de la mitad de N.
Ejemplo:
35 − 13
Mediana = 81.5 + 2 5 = 81.5 + (17.5 − 13 ) =
77
Mediana = 81.5 + 3.21 = 84.71
RELACION EMPÍRICA ENTRE MEDIA ARITMÉTICA, MODA Y MEDIANA.
86.57 − 80.25 " 3 (86.57 − 84.71)
6.32 " 5.58
MEDIDAS DE DISPERSIÓN.
DISPERSIÓN: Es el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio.
3 X 85
• Entre las medidas mas importantes de dispersión se tienen AMPLITUD DE VARIACIÓN (RANGO).
• DESVIACIÓN MEDIA ABSOLUTA (D.M): Es la media aritmética de los valores absolutos de las
desviaciones con respecto a la media aritmética.
Para calcular las desviación media para los datos no agrupados se utiliza la siguiente fórmula:
N
Donde:
6
X = Datos
= Media Aritmética.
| | = Valor absoluto.
N = Número Total de Datos.
Ejemplo:
D.M = |66−86| + |100−86| + |98−86| + 96−86| + |58−86| + |94−86| + |90−86|
7
D.M = |20| + |14| + |12| + |10| + |28| + |8| + |14| =13.71
7
Para calcular la desviación media para datos agrupados se utiliza la siguiente fórmula:
Donde:
X = Marcas de clase.
f = Frecuencias Absolutas.
= Media Aritmética.
N = Número total de datos en el conjunto.
Ejemplo:
D.M = 5|74−86.57|+8|79−86.57|+7|84−86.57|+4|89−86.57|+
6|94−86.57|+2|99−86.57|+1|104−86.57|+2|109−86.57| =
35
D.M =|62.85|+|60.56|+|17.99|+|9.72|+|44.58|+|24.86|+|17.43|+|44.86|=
35
D.M = 282.85 = 8.08
35
• DESVIACIÓN TIPICA O ESTÁNDAR: Se define como la raíz cuadrada de la varianza.
7
Para calcular las desviación típica para los datos no agrupados mayores de 30 se utiliza la siguiente
fórmula:
Para menores de 30:
Ejemplo:
Para calcular la desviación típica o estándar para datos agrupados se utiliza la siguiente fórmula:
Donde:
f1 = Frecuencia Absoluta.
Ejemplo:
8
= 9.66
• VARIANZA: Se define como la desviación típica o estándar elevada al cuadrado; su símbolo es .
Ejemplo:
= (9.66)2 = 93.31
• REGLA EMPÍRICA PARA UNA, DOS Y TRES DESVIACIONES TIPICAS:
• Para una desviación típica el porcentaje es del 68.27%
• El porcentaje para 2 desviaciones típicas es igual al 95.45%.
9
• El porcentaje para 3 desviaciones típicas es igual a 99.73%.
MODELO.
El presidente de Ocean Airlines intenta hacer una estimación de cuanto se tardará el Departamento de
Aeronáutica Civil en decidir acerca de la solicitud de la compañía sobre una nueva ruta entre la ciudad
de Charlotte y Los Angeles. Los asesores del presidente han conseguido los siguientes tiempos de espera
de las solicitudes hechas durante el año anterior. Los datos están en días desde la fecha de solicitud
hasta la respuesta del D.A.C.
34
49
29
24
29
40
34
40
44
22
23
38
31
37
28
28
31
30
39
44
31
33
34
32
51
40
42
31
36
31
25
26
38
34
44
35
35
35
36
28
47
27
37
41
47
32
31
33
39
31
a) Construya ana distribución de frecuencias utilizando 10 intervalos cerrados igualmente espaciados.
Rango = 51 − 22 = 29 = 9.66 " 10
3
Frecuencia
Frecuencia
Frecuencia
Marca Limite
de
Real
Limite
Real
Frecuencia
Absoluta
Relativa
Clase
Inferior
Superior
Acumulada
3
3
6
12
8
6
5
4
6%
6%
12%
24%
16%
12%
10%
8%
23
26
29
32
35
38
41
44
21.5
24.5
27.5
30.5
33.5
36.5
39.5
42.5
24.5
27.5
30.5
33.5
36.5
39.5
42.5
45.5
3
6
12
24
32
38
43
47
Clases
1
2
3
4
5
6
7
8
21 − 24
25 − 27
28 − 30
31 − 33
34 − 36
37 − 39
40 − 42
43 − 45
Relativa
Acumulada
6
12
24
48
64
76
86
94
10
9 49 − 48
10 49 − 51
2
1
4%
2%
47
50
45.5
48.5
48.5
51.5
49
50
98
100
50 100%
Longitud = 3.
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
DIAGRAMA DE PARETO.
POLÍGONO DE FRECUENCIAS RELATIVAS.
OJIVA.
• MEDIA.
3(23)+3(26)+6(29)+12(32)+8(35)+6(38)+5(41)+4(44)+2(47)+1(50)=
50
X = 34.76
• MODA.
6
Moda = 30.5 + 3 = 30.5 + 1.8 = 32.3
6+4
• MEDIANA.
Mediana = L + N _ f C
2
fm
50 24 3
Mediana = 33.5 + 2 = 33.5 + 0.375 = 33.875
11
• RELACION EMPÍRICA.
37.46 − 32.3 " 3 (34.76 − 33.875)
2.46 " 2.65
• DESVIACIÓN MEDIA.
3|23−34.76|+3|26−34.76|+6|29−34.76|+12|32−34.76|+8|35−34.76|+
6|38−34.76|+5|41−34.76|+4|44−34.76|+2|47−34.76|+1|50−34.76| =
50
35.28+26.28+34.56+33.12+1.92+19.44+31.2+36.96+24.48+15.24 =
50
D.M = 5.16
• DESVIACIÓN TÍPICA O ESTÁNDAR.
="3(23−34.76)2+3(26−34.76)2+6(29−34.76)2+12(32−34.76)2+8(35−34.76)2
+6(38−34.76)2+5(41−34.76)2+4(44−34.76)2+2(47−34.76)2+1(50−34.76)2
50
= 6.4298
• VARIANZA.
= (6.4298)2 = 41.3423
• REGLA EMPÍRICA PARA UNA, DOS Y TRES DESVIACIONES TÍPICAS.
Para una desviación típica:
X±.
34.76 ± 9.66
12
34.76 + 9.66=44.42
34.76 − 9.66= 25.1
Para dos desviaciones típicas:
X ± 2.
34.76 ± 2(9.66)
34.76 + 19.32=54.08
34.76 − 19.32= 15.44
Para tres desviaciones típicas:
X ± 3.
34.76 ± 3(9.66)
34.76 + 28.98=63.74
34.76 − 28.98= 5.78
CAPITULO II.
DESCRIPCIÓN DE DOS CONJUNTOS DE DATOS.
ANÁLISIS DE CORRELACIÓN.
Es el grupo de técnicas estadísticas empleado para medir la intensidad de la relación entre dos
variables.
Se deben identificar la variable dependiente y la independiente.
Ejemplo:
Se está efectuando un proyecto de investigación en una empresa para determinar si existe relación entre
los años de servicio y la eficiencia de un empleado. El objetivo de estudio fue predecir la eficiencia de un
empleado con base en los años de servicio. Los resultados de la muestra son:
x = 61 y = 30 xy=254 x2 =795 y2=128
DIAGRAMA DE DISPERSIÓN.
Es la gráfica que representa la relación entre dos variables de intereses.
COEFICIENTE DE CORRELACIÓN.
Es la medida de la intensidad de la relación entre dos conjuntos de variables.
Para calcular el coeficiente de correlación se utiliza la siguiente fórmula:
13
Ejemplo:
r = .3531
ANÁLISIS DE REGRESIÓN.
Es la técnica empleada para hacer predicciones. Para ello se emplea la ecuación de regresión mediante
el método de mínimos cuadrados; dicha ecuación se le conoce como la ecuación de estimación de o de
pronóstico la cual se expresa:
y' = a +bX
donde:
a = Coordenada de la intersección con el eje y.
b = Es la pendiente de la recta.
x = Cualquier valor seleccionado para la variable independiente.
y' = Es el valor pronosticado de la variable y para un valor
seleccionado de x.
Matemáticamente se obtiene de la siguiente manera:
Ejemplo:
b = 202 = .0765
14
2639
a = 3.75 − .0765 ( 7.625) = 3.16
COEFICIENTE DE DETERMINACIÓN (r2).
Se define como la proporción de la variación total en la variable dependiente y que se explica por o se
debe a la variación en la variable dependiente x.
El coeficiente de determinación se obtiene aplicando la siguiente fórmula:
r2 = Variación total − Variación no explicada.
Variación Total.
( y − y )2
5.0625
1.5625
0.5625
1.5625
3.0625
3.0625
0.0625
0.5625
( y − y´ )2
7.6729
0.0961
0.3721
1.5129
1.7161
1.5129
0.09
0.5929
15.5 13.5659
r2 = 15.5 − 13.5659 = 0.1247 = 0.1247
15.5
ERROR ESTÁNDAR DE ESTIMACIÓN.
Es aquel que mide la dispersión de los valores observados con respecto a la recta de regresión.
El error estándar de estimación se obtiene aplicando cualquiera de las siguientes fórmulas.
15
Ejemplo:
1. " 13.5659 = 1.5036
6
2. " 128 − 3.166(30) − 0.0765(254) = 1.5049
MODEL0.
Un analista de operaciones realiza un estudio para analizar la relación entre la producción y costos de
fabricación de la industria electrónica. Se toma una muestra de 10 empresas seleccionadas de la
industria y se dan los siguientes datos:
Miles de
Miles de
Unidades
40
42
48
55
65
79
88
100
120
140
$
150
140
160
170
150
162
185
165
190
185
Empresa
A
B
C
D
E
F
G
H
I
J
xy
y2
y2
6000
5880
7680
9350
9750
12798
16280
16500
22800
25900
1600
1764
2304
3025
4225
6241
7744
10000
14400
19600
22500
19600
25600
28900
22500
26244
34225
27225
36100
34225
777 1657 132,938 70,903 277,118
Determinar:
• Cual es la variable dependiente y cual la independiente.
• Hacer el diagrama de dispersión.
• El coeficiente de correlación.
• La recta de regresión mediante el método de mínimos cuadrados.
• El coeficiente de determinación.
• El error estándar de estimación.
• Determinar el costo que se tiene al producir 50,000 y 150,000 unidades.
• Variable dependiente: Miles de unidades.
Variable Independiente: Miles de pesos.
• DIAGRAMA DE DISPERSIÓN.
c)
16
r = 1´329,380 − 1´287,489 =
" [709030 − 603729][2771190 − 2745949]
r = ___41891 = _41891__ = 0.8078
" (105301)(25541) 51860.32
d) y´ = a + bX
b = 41891 = 0.3978
105301
a = 165.7 − (.3978) (77.7) = 134.7909
y´= 134.7909 + 0.3978 X
e) r2 = (0.8078)2 = 0.65254084
f)
Syx = (277119) − 134.7909 (1657) − (.3978) (132.938)
" 10 − 2
Syx = 10.53
g) 134.9909 + 0.3978(50) = 154.8809
134.9909 + 0.3978(150) = 199.6609
CAPITULO III.
VARIABLES ALEATORIAS Y FUNCIONES DE PROBALIDAD.
ESPACIO MUESTRAL: Es el conjunto de todos los resultados posibles de un experimento o muestra.
EVENTO: Es el resultado de un experimento.
Los eventos se clasifican en tres tipos:
• Simple.
• Múltiple.
• Imposible.
17
VARIABLE OPCIONAL: Es aquella que está en función valorada numéricamente, cuyo valor está
regido por factores en los que interviene el azar.
Las variables aleatorias se clasifican en dos tipos:
• Variables aleatorias continuas: Son aquellas en las que se considera si se puede asumir cualquier
valor dentro de un determinado intervalo.
• Variables aleatorias discretas: Son aquellas que se consideran si los valores que se asumen se pueden
contar.
Ejemplo:
Continua:
• Estatura de una persona.
• Número de litros de agua en un estanque.
Discreta:
• Número de muestra de un lote.
• Cantidad de alumnos de un grupo.
Las probabilidades se utilizan para expresar cuan probable es un determinado evento.
La probabilidad de que un evento ocurra está representada del 0 a 1.
Ejemplo:
Evento: Lanzamiento de una par de dados. ¿Qué número sumado puede dar?
• Hallar la variable aleatoria.
• El espacio muestral.
• La probabilidad.
• La gráfica en forma técnica.
• Hacer la gráfica de un experimento aleatorio con 100 lanzamientos. y compararla con la anterior.
Variable
Espacio
Probabilidad
Aleatoria
2
3
4
5
6
7
8
9
10
11
12
Muestral
(1,1)
(2,1),(1,2)
(3,1),(2,2),(1,3)
(4,1),(3,2),(2,3),(1,4)
(5,1),(4,2),(3,3),(2,4),(1,5)
(6,1),(5,2),(4,3),(3,4),(2,5),(1,6)
(6,2),(5,3),(4,4),(3,5),(2,6)
(6,3),(5,4),(4,5),(3,6)
(6,4),(5,5),(4,6)
(6,5),(5,6),
(6,6)
Clásica.
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
Probabilidad en el
experimento
1.66
6.66
10
12.5
15
17.5
11.66
10
9.3
4.16
2.5
18
d) Gráfica en forma clásica.
e) Gráfica del experimento de 100 lanzamientos.
FACTORIAL DE N.
Para calcular el factorial de un número positivo se aplican la siguiente fórmula:
n! = n(n − 1) (n − 2) . . . 1
Ejemplos:
0! = 1
1! = 1
2! = 2
3! = 6
4! = 24
PERMUTACIONES Y COMBINACIONES.
Una permutación se representa nPr, es una ordenación de n objetos tomados de r en r.
Una permuta aplica la siguiente fórmula:
nPr = n!
(n − r)!
Ejemplo:
r = 2 6P2 = 6! = 720 = 30
n = 6 (6− 2)!
Una combinación es una selección de n objetos o cosas seleccionadas de r en r.
Una combinación se obtiene con la siguiente fórmula:
nCr =_ n!___
r! (n − r)!
Ejemplo:
r=2
n=6
19
6C2 = 6!___ = 6!__ = 6 . 5. 4. 3. 2. 1 = 30 = 15
2!(6−2)! 2!.4! 2. 1 4. 3. 2. 1 2
Ejemplo:
En cuantas formas puede una sucursal local en una sociedad programar a 3 conferencistas en 3
diferentes congresos, si los primeros están disponibles en cualquiera de 5 fechas posibles.
n = 5 nPr = n!__
r = 3 (n − r)!
5. 4. 3. 2. 1 = 60 Formas
2. 1
En cuantas formas diferentes puede un superior seleccionar un equipo de 5, de 8 personas que trabajan
para el.
n = 8 nCr =_ n!___
r = 5 r! (n − r)!
8!__ = 8. 7. 6. 5. 4. 3. 2. 1 = 336 = 56 Formas.
5!(8−5)! (5. 4. 3. 2. 1)(3. 2. 1)
PRINCIPIO FUNDAMENTAL.
Si un suceso o evento puede presentarse con cualquiera de las n1 formas distintas y si otro suceso ha
ocurrido relacionado con el primero de las n2 distintas, entonces el número de formas en que ambos
sucesos en orden específico pueden presentarse será n1 . n2 formas.
Ejemplo:
¿De cuantas formas pueden ordenarse 7 libros en un estante?
• Si es posible cualquier ordenación.
• 3 libros determinados deben estar juntos.
• 2 libros determinados deben ocupar los extremos.
a) 7P7 = 7!__ = 7. 6. 5. 4. 3. 2. 1 = 5040
(7−7)! 1
b) 5P4 . 3P3 = 5!_ 3!_ = 5. 4. 3. 2. 1 3 .2. 1 = 120 x 6=720
(5−5)! (2−2)! 1 1
c) 5P2 . 2P2 = 5!_ 2!_ = 5. 4. 3. 2. 1 2. 1 = 120 x 2=240
20
(5−5)! (2−2)! 1 1
Una clase de 9 niños y 3 niñas.
• Hallar el número de posibilidades que tiene un profesor de elegir un comité de 4 integrantes.
• Tiene que haber 2 niños y 2 niñas.
• Tiene que haber exactamente una niña.
a) 12C4 = 12!_ = 12. 11. 10. 9. 8. 7. 6. 5. 4. 3. 2. 1 = 495 Formas.
4!(12−4)! (4. 3. 2. 1) (8. 7 .6 .5 .4 .3. 2. 1)
b) 3C2 . 9C2 = (3) (36) = 108 Formas.
c) 3C1 . 9C3 = (3) (84) = 252 Formas.
Un granjero compra 3 vacas, 2 cerdos, 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos y 8 gallinas.
¿Cuántas elecciones puede hacer?
6C3 . 5C2 . 8 C4 = (20) (10) (70) = 14,000 formas.
ESPERANZA MATEMÁTICA.
Es la cantidad que un jugador espera ganar como media cada vez que juega. Si el valor de E es positivo
se dice que el juego está a favor del jugador, si E es negativo esta en su contra y se dice que es una
perdida.
Para calcular la esperanza matemática de un cierto evento se aplica:
E = W1P1 + W2P2 + . . . +WnPn
Ejemplo:
1. Un jugador tira 2 dados, si la suma es de 7 ó 11 gana 7 dólares, con cualquier otro resultado pierde 2
dólares.
Determine el valor esperado del juego.
E=?
W1 = $7 E = (7) (8/36) − (2) (28/36)
P1 = 6 + 2 = 8
36 36 56 − 56 = 0
36 36
W2 =−$2
P2 = 28
21
36
2. Si un hombre compra una papeleta de rifa en la que puede ganar un primer premio de 5,000 dólares
ó un segundo premio de 2,000 dólares con probabilidades de .001 y .003. ¿Cuál sería el precio justo a
pagar por la papeleta?
E=?
W1 = $5,000 E = (5000) (.001) − (2000) (.003)
P1 = .001
W2 =−$2,000
P2 = .003 E = $5 + $6 = $11
3. Un juego consiste en tirar una moneda no−truncada 4 veces. Un jugador gana 3 dólares si sale 2 o
mas veces cara, de cualquier otra forma el jugador pierde 4 dólares.
Hallar el valor esperado E del juego.
E=?
W1 = $3 E = (3)(11/16) − (4)(5/16)
P1 = 11/16
W2 =−$4 E = 33 − 20 = 13
P2 = 5/16 16 16 16
CAPITULO IV.
FUNCIONES DE PROBABILIDAD.
DISTRIBUCIÓN DE PROBABILIDAD: Es la distribución de frecuencias relativas respecto a
resultados del espacio muestral, señala la proporción de veces en que la variable aleatoria tiende a
obtener diversos valores.
Considerando que la probabilidad de que un evento suceda o no suceda es igual a 1, para ello se aplica
la siguiente fórmula:
1 = p + q p = 1 − q q = 1 −p
p = Probabilidad de éxito.
q = Probabilidad de no éxito.
Las distribuciones de probabilidad se clasifican de 2 tipos:
Binomial.
22
• LAS DISCRETAS. Poison.
Hipergeométrica.
• CONTINUAS. Normal.
• Distribuciones de probabilidad discretas:
1. Distribución Binomial: Para calcular la probabilidad mediante esta distribución de acuerdo a las
características, se aplica la siguiente fórmula.
P(x) = _ n!___ px qn−x
x! (n−x)!
Donde:
n = Número de ensayos.
p = Proporción de éxito que se tiene en el evento.
q = Proporción de no−éxito o de fracaso que se tiene en el evento.
x = Es el número de veces que se obtiene al obtener éxito.
Ejemplo:
1. El 8% de las hamburguesas que se venden en un estadio de béisbol, se piden sin mayonesa. Si 7
personas ordenan hamburguesas encuentre la probabilidad de que:
• Todas las quieran con mayonesa.
• Solo 1 la quiera con mayonesa.
Datos:
p = .92%
q = .08%
n=7
• x = 7 P(7) = 7!___ (.92)7 (.08)7−7 = 0.5578
7!(7−7)!
• x = 1 P(1) = 7!___ (.92)1 (.08)7−1 = 0.000001688
1!(7−1)!
2. El 90% de probabilidades de que un tipo particular de complemento funcione adecuadamente en
condiciones de alta temperatura. Si el dispositivo en cuestión incluye 4 de esos componentes, determine
la probabilidad de que:
23
• Todos los componentes funcionen adecuadamente y por lo tanto el dispositivo es operante.
• El dispositivo es inoperante por que falla exactamente 1 de los 4 componentes.
• El dispositivo es inoperante por que falla 1 o mas de los componentes.
Datos:
p = .90%
q = .10%
x=4
a) x = 4 P(4) = 4!___ (.90)4 (.10)4−4 = 0.6561
4!(4−4)!
b) p = 0.10% P(1) = 4!___ (.10)1 (.90)4−3 = .2916
q = 0.90% 1!(4−1)!
x=1
c) p = 0.10%
q = 0.90%
x = 1, 2, 3,4
P(1, 2, 3, 4) = 4!___ (.10)1 (.90)3+ 4!___ (.10)2 (.90)4−2+
1!(4−1)! 2!(4−2)!
4!__ (.10)3 (.90)4−3+ 4!__ (.10)4 (.90)4−4=
3!(4−3)! 4!(4−4)!
0.2916 +0.0486 + 0.0036 +0.0001 = 0.3439
Una familia tiene 6 hijos. Hallar la probabilidad de que sean:
• 3 niños y 3 niñas.
• Menos niños que niñas. Tomaremos 0.5 como la probabilidad de que un hijo sea niño.
Datos:
p = 0.5% niños.
q = 0.5% niñas.
n = 6 hijos.
a) x = 3 P(3)= 6!__ (0.5)3 (0.5)6−3= 0.3125
24
3!(6−3)!
b) x =0, 1, 2
P(0,1, 2) = 6!___ (0.5)0 (0.5)6−0+ 6!___ (0.5)1 (0.5)6−1+
0!(6−0)! 1!(6−1)!
6!__ (0.5)2 (0.5)6−2= .0152 + .09375 + .2343 = .3436
2!(6−2)!
2. Distribución de probabilidad Poison: Esta distribución tiene muchas aplicaciones y se utiliza como
modelo para describir fenómenos, por ejemplo el número de errores en captura de datos, las
imperfecciones en piezas recientemente pintadas, el número de partes defectuosas en ciertos
embarques, el número de clientes que llegan a un banco a solicitar servicio, el número de errores que
una secretaria comete por página, el número de accidentes que ocurren en un determinado tiempo, etc.
Esta probabilidad utiliza la siguiente fórmula:
P(x) = e− . x
x!
= Promedio de ocurrencia del suceso o evento.
x = Número pedido de acuerdo a la probabilidad.
e = Número de Euter ( 2.7172).
Cuando la probabilidad es muy pequeña se debe de contar el número de la población, para ello el
promedio de ocurrencia se obtiene:
=N.P
Ejemplo:
1. La señora García esta encargada de los préstamos de un banco. Con base en sus años de experiencia,
estima que la probabilidad de que un solicitante no sea capaz de pagar oportunamente sus préstamo es
de .025, el mes pasado realizo 40 préstamos:
• ¿Cuál es la probabilidad de que 3 préstamos no se paguen oportunamente?
• ¿Cuál es la probabilidad de que al menos 3 préstamos se liquiden a tiempo?
Datos:
P = .025
N = 40
= (40)(.025)=1 cliente.
25
• x = 3 P(3)= e−1.13 = (.3678)(1) = .0613
3! 6
• x = 3 o más. P(0,1,2) = e−1. 10 + e−1. 11 + e−1 . 12 =
0! 1! 2!
.3679+ .3679+ .3679 = .3679 + .3679 + .1839 = 0.9197
112
P(3 o más) = 1 − q
= 1 − 0.9197 = 0.0803 % Probabilidad pedida.
2. Los automóviles que llegan a una salida de una carretera a razón de 2 por minuto.
• ¿Cuál es la probabilidad que en un minuto dado no lleguen automóviles?
• ¿Cuál es la probabilidad e que al menos 1 automóvil llegue durante un minuto especifico?
Datos:
= 2 autos / minuto.
Probabilidad
a) x = 0 P(0)= e−2.20 = (0.1353)(1) = 0.1353 pedida.
0! 1
b) x = 1 o más. P(1 o más) = 1 − q
= 1 − 0.1353% Probabilidad pedida.
3. Supongamos que el 2% de la población es zurda. Hallar la probabilidad de encontrar 3 o más zurdos
en 100 personas.
Datos:
P = 2% = .02
N = 100
= (100)(.02) = 2 P(0,1,2) = e−2. 20 + e−2. 21 + e−2 . 22 =
0! 1! 2!
.1353(1) + .1353(2)+ .1353(4) = .1353 + .2706 + .3706 = 0.6765
112
26
Probabilidad
1 − q = 1 − .6765 = .3234 pedida.
4. A una construcción llegan camiones de carga a razón media de 2.8 camiones por hora. Obtenga la
probabilidad de tener 3 o más camiones que lleguen en un:
• Lapso de 30 minutos.
• Lapso de 1 hora.
• Lapso de 2 horas.
Datos:
P = 2.8 Camiones / minuto
a) x = 0, 1,2 P(0,1,2) = e−1.4. 1.40 + e−1.4. 1.41 + e−1.4 . 1.42 =
= 1.4 0! 1! 2!
.2465(1) + .2465(1.4)+ .2465(1.96)=.2465 + .3451 + .2415 = .8331
112
Probabilidad pedida = 1 − .8331 = .1669
b) x = 0, 1,2 P(0,1,2) = e−2.8. 2.80 + e−2.8. 2.81 + e−2.8 . 2.82 =
= 2.8 0! 1! 2!
.0608(1) + .0608(2.8)+ .0608(7.84)= .0608 + .1702 + .2383 = .4693
112
Probabilidad pedida = 1 − .4693 = .5307
c) x = 0, 1,2 P(0,1,2) = e−5.6. 5.60 + e−5.6. 5.61 + e−5.6 . 5.62 =
= 5.6 0! 1! 2!
.0036(1) + .0036(5.6)+ .0036(31.36) =.0036 + .0207 + .0596 = .0823
112
Probabilidad pedida = 1 − .0823 = .9177
3. Distribución de probabilidad Hipergeométrica: Cuando la población es finita y el muestreo se hace
sin reemplazo, la probabilidad cambiará para cada nueva observación, en tales circunstancias se tendrá
una distribución Hipergeométrica, está debe estar formada por 2 grupos de individuos u objetos. Un
primer grupo constituido por aquellos individuos que poseen las característica de estudio; se
representará N1; y el otro grupo estará conformado por los que no poseen la característica y el número
de sus elementos se representará con N2.
27
La probabilidad mediante una distribución Hipergeométrica se obtiene:
Donde:
x = Número de éxitos el los n ensayos donde el muestreo es sin
repetición.
Ejemplo:
1. Una empresa produce 100 unidades de las cuales 90 son buenas y 10 son defectuosas. Se toman 20
unidades sin remplazo; halle la probabilidad de que resulten 5 defectuosas.
Datos:
N1 = 10
N2 = 90 P(5) = 10C5 . 90C15 = (252)(4.58 x 1016) = 0.0215
N = N1 + N2 = 100 100C20 5.36 x 1020
n = 20
x=5
2. 15 de los 20 estudiantes de una grupo escolar están insatisfechos con el texto que se emplea. Si una
muestra aleatoria de 4 estudiantes es interrogada sobre el libro de texto. Determine la probabilidad:
• Exactamente 3.
• Al menos 3 estudiantes.
Se muestren insatisfechos con el libro.
Datos:
N1 = 15
N2 = 5
N = N1 + N2 =20
n=4
28
Probabilidad
a) x = 3 P(3) = 15C3 . 5C1 = (455)(5) = 0.4695 pedida
20C4 4845
Probabilidad
b) x = 3, 4 P(4) = 15C4 . 5C0 = (1365)(1)= 0.2817 pedida
20C4 4845
3. Una caja contiene 30 baterias para radio de las cuales 5 son defectuosas. De la caja se escogen al azar
6 baterias; halle la probabilidad de que:
• 2 sean defectuosas.
• Ninguna sea defectuosa.
• Menos de 3 sean defectuosas.
Datos:
N1 = 5
N2 =25
N = N1 + N2 = 30
n=6
a) x = 2 P(2) = 5C2 . 25C4 = (10)(12650) = 0.2130 P.P
30C6 593775
b) x = 0 P(0) = 5C0 . 25C6 = (1)(177100) = 0.2982 P.P
30C6 593775
b) x = 0,1,2 P(1) = 5C1 . 25C5 = (5)(53130) = 0.4473
30C6 593775
P(0,1,2) = 0.2982 + 0.4473 + 0.2130 = 0.9585 P.P
4. Distribucion Normal: Esta distrbucion se aplica en muchos fenómenos naturales, los cuales para el
cálculo de la probabilidad se utiliza la curva simétrica llamada campana, la cual se expresa a
continuación:
.5000 .5000
Para calcular la probabilidad mediante una distribución normal se utiliza la siguiente fórmula:
Z=X−M
29
Donde:
M = Es la media aritmética o promedio.
= Desviación típica o estándar de la población.
X = Valor buscado de acuerdo a la probabilidad pedida.
Z = Es el valor típificado (Área bajo la curva).
Ejemplo.
1. El número de días entre la facturación y el pago de las cuentas a crédito en una gran tienda de
departamentos, tiene uyna distribución aproximadamente normal con una media de 18 días y una
desviación estándar de 4 días:
• ¿Qué población de las cuentas serán pagadas entre 12 y 19 días?
• Entre 20 y 23 días.
• En menos de 8 días.
• En 12 días o más.
Datos:
M = 18
=4
• x = Entre 12 y 19 . 0.5319
Z1 = 12 − 18 = −1.5
4
.4332 .0987
Z1 = 19 − 18 = 0.25
4 Z1= −1.5 Z2=0.25
P.P = 0.5319
• x= Entre 20 y 23
0.2029
Z1 = 20 − 18 = 0.5
4
0.1915 0.3944
30
Z2 = 23 − 18 = 1.25
4 Z1= 0.5 Z2=1.25
P.P = 0.1915 − 0.3944 = 0.2029
0.9938
• x= Menos de 8
0.0062
Z = 8 − 18 = −2.5 0.4938 .5000
4 Z= −2.5
P.P = 1 − 0.9938 = 0.0062
0.9332
• x= 12 o mas
Z = 12 − 18 = −1.5 0.4332 .5000
4
Z= −1.5 12 días o mas
2. El tiempo requerido para instalar un motor nuevo de un avión es distribuido con una media de 20
horas y una desviación típica de 1 hora. ¿Cuál es la probabilidad de que la siguiente instalación toma:?
• 19 o menos y 22 o más horas.
• Entre 17 y 18 horas.
Datos:
M = 20 horas.
= 1 hora.
• x= 19 o menos y 22 o más. 0.8115
Z1 = 19 − 20 = −1
1
Z2 = 22 − 20 = 2 0.3413 0.4772
1
P.P=1 − 0.8185 = 0.1815 Z1 =−1 Z2 = 2
31
• x = 17 y 18
0.0215
Z1 = 17 − 20 = −3
1
0.4987 0.4772
Z2 = 18 − 20 = −2 Z1= −3 Z2= −2
1
P.P = 0.4987 − 0.4772 = 0.0215
3. Suponga que se diseña una prueba de inteligencia que tenga una distribución normal con una media
de 100 y una desviación estándar de 15.
• ¿Qué proporción de personas tienen resultados inferiores a 115.
• ¿Mayores a 130?
• ¿Entre 85 y 115?
• ¿Entre 70 y 130?
Datos.
M = 100
= 15
0.8413
• x = menores a 115.
Z = 115 − 100 = 1 .5000 .3413
15
Z=1
P.P=0.3413 0.9772
• x = Más de 130
Z = 130 − 100 = 2 .5000 .4772
15
Z=2
P.P = .9772 .6826
32
• x = Entre 85 y 115
Z1 = 85 − 100 = 1
15 .3413 .3413
Z2 = 115 − 100 = 1
15 Z1=−1 Z2=1
P.P = .3413 + .3413 =.6826
• x = Entre 70 y 130 .9544
Z1 = 70 − 100 = −2
15
.4772 .4772
Z2 = 130 − 100 = 2
15 Z1= −2 Z2= 2
P.P = .4772 + .4772 = .9544
El gerente de un club de natacion sabe por experiencia de años pasados que el número de niños que
cada miembro trae a la alberca en una sesión dada es una variable aleatoria con media de 3.1 y
desviación típica de 0.56. Entre 200 miembros ¿Cuántos se pueden esperar que traigan de 2 a 4 niños a
las piscina en una sesión?
Datos:
M = 3.1
= 0.56
x = 2 a 4 .9213
N = 200 miembros.
Z1 = 2 − 31 = −1.96
.56 .4750 .4463
Z2 = 4 − 31 = 1.61 Z1 = −1.96 Z2 = 1.61
.56
P.P = .4750 + .4463 = .9213
Número de niños = (200)(.9213) = 184.26 " 184 Niños.
33
CAPITULO V
DISTRIBUCIONES DERIVADAS DEL MUESTREO.
ESTIMACIÓN DE PARÁMETROS.
La estimación de parámetros puede ser de 2 formas:
• Estimación por intervalo.
• Estimación por punto.
Estimación por punto: Es la estimación de un valor único de un parámetro de la población.
Estimación por intervalo: Es la estimación que incluye un intervalo de valores posibles en el que se
considera que está comprendido un parámetro de la poblacióon.
Para calcular el nivel de confianza deseado con respecto al Zc se tiene:
ESTIMACIÓN PARA MEDIAS ARITMÉTICAS DE ACUERDO AL TAMAÑO DE LA MUESTRA.
Para calcular los intervalos de confianza para muestras grandes se utiliza la siguente fórmula:
X ± Zc _
"n
Donde:
X = Es la media aritmética o promedio muestral.
= Es la desviación típica o estándar de la población (muestra).
n = Es el tamaño de la muestra.
Zc = Es el valor buscado en la tabla de acuerdo al nivel de confianza
deseado.
Para calcular la estimacion de intervalos para muestras pequeñas (menores de 30), se utiliza la
siguiente fórmula:
X ± tc S_
"n
Donde:
X = Es la media aritmética o promedio muestral.
tc = Es el valor buscado en la tabla (t de student) y esta se busca de
acuerda a los grados de libertad.
34
S = Desviación típica o estándar de la muestra.
n = Tamañ de la muestra.
En el caso de utilizar la tabla T de student se utilizan los grados de libertad aplicando la soguiente
fórmula:
V=n−1
Ejemplo:
1. Una psicóloga de una industria, desea estimar la media de edad de cierta población de empleadas.
Extrae una muestra de de 60 mujeres de la población. La muestra da como resultado una media de
edad de 23.67 años. Sabe que la población de edades tiene una desviación típica de 15 años. Construya
un intervalo de confianza:
• 96%
• 99%
Datos:
X =23.67 años.
=15 años.
n = 60
NC.
a) 96% Zc= 2.05
27.6398
23.67 ± 2.05 (15) = 23.67 ± 30.75 = 23.67 ± 3.9698 =
"60 7.7459 19.70
b) 99% Zc= 2.58
28.6661
23.67 ± 2.58 (15) = 23.67 ± _38.7 = 23.67 ± 4.9961 =
"60 7.7459 18.6739
2. Al final de cada llamada en una estación teléfonica se hace un reporte en el que se indica la duración
de la llamada. Una muestra aleatoria simple de 9 reportes da como resultado una media de duración de
llamada de 1.2 minutos con uan desviación típica o estándar de 0.6 minutos. Construya un intervalo de
confianza:
• 95%
• 99% para la media de la población.
35
Datos:
X =1.2 minutos.
s =0.6 minutos
n=9
V = 9 − 1 =8
Tc.
a) 95% tc = 2.306
1.6612
1.2 ± 2.306 (.6) = 1.2 ± _1.3836 = 1.2 ± 0.4612 =
"9 3 0.7388
2.5% 2.5%
95%
0 .025 .95 .975 1
b) 99% tc = 3.355
1.871
1.2 ± 3.355 (.6) = 1.2 ± _2.013 = 1.2 ± 0.671 =
"9 3 0.529
.5% .5%
99%
0 .005 .99 .995 1
3. Las alturas de una muestra de 50 estudiantes mostraron una media de 174.5 cm y una desviación
típica de 6.9 cm. determine un intervalo de confianza:
• 90%
• 98%
Para la altra promedio de todos los estudiantes.
Datos:
X =174.5 cm.
36
=6.9 cm.
n = 50
NC.
a) 90% Zc= 1.645
27.6398
174.5 ± 1.645 (6.9) = 23.67 ± 11.3505 = 23.67 ± 1.0652=
"50 7.0710 19.70
b) 98% Zc= 2.33
176.77
174.5 ± 2.33 (6.9) = 23.67 ± 16.077 = 23.67 ± 2.2736 =
"60 7.0710 172.23
Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos
diámetros son:
1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03 centímetros.
Encuentre:
• Un intervalo de confianza del 90%.
• Un intervalo de confianza del 99%.
Para el diámetro promedio de piezas de esta máquina.
Datos:
X =1.0055
Sn−1 =0.02455
n=9
V = 9 − 1 =8
Tc.
a) 90% tc = 1.860
1.0207
1.0055 ± 1.860 (.02455) = 1.0055 ± 0.0456 = 1.0055 ± 0.0152=
37
"9 3 .9903
5% 5%
90%
0 .05 .90 .95 1
b) 99% tc = 3.355
1.03296
1.0055 ± 3.355 (.02455) = 1.0055 ± 0.0824 = 1.0055 ± 0.02746=
"9 3 .97804
.5% .5%
99%
0 .005 .99 .995 1
47
HISTOGRAMA
POLÍGONO DE
FRECUENCIAS
8
7
6
5
1
2
3
4
38
79
84
94
74
89
99
109
104
MARCA DE CLASE
74
79
84
89
94
32
35
99
104
109
114
0
MARCA DE CLASE
X
23
26
29
38
41
44
47
50
MARCA DE CLASE
32
35
29
38
41
44
23
26
47
50
39
8
1/36
2/36
3/36
4/36
5/36
1/36
, x = 0, 1, . . . n
si n " N1
40
Descargar