08 Estadística y Probabilidad Patricia de Pavía Iturralde

Anuncio
Estadística y Probabilidad
Patricia de Pavía Iturralde
08
2
Cuatrimestre
CENTRO DE ESTUDIOS AVANZADOS DE LAS
AMÉRICASLICENCIATURA EN NEGOCIOS
INTERNACIONALES
ESTADÍSTICA Y
PROBABILIDAD
1
ESTADÍSTICA Y PROBABILIDAD
ANTOLOGÍA
Esta reproducción se realiza para uso interno exclusivo como un apoyo a los profesores y alumnos del Centro de Estudios Avanzados de las
Américas y no persigue fines de lucro, la compilación está hecha por personal de la institución y supervisada por el representante legal de la
misma en estricto apego a la Ley Federal de derechos de autor; por ello, y en apego al título 5°, capítulo 3°, artículos 123, 124, 125, 126, 127 y
128 a la página última en esta compilación se menciona para dar crédito al autor original de la obra así como a la casa editorial que la ha
publicado, en concordancia con esta idea se sugiere de manera amplia al lector de esta antología y si así lo considera conveniente adquiera la
.
obra original pues esta reproducción solo tiene un fragmento de la misma
 CENTRO DE ESTUDIOS AVANZADOS DE LAS AMÉRICAS
Río Tíber 12 Col. Cuauhtémoc, Del. Cuauhtémoc c.p. 06500
México D.F. Tel. 52 07 91 01
México, 2008
Tabla de contenido
UNIDAD 1
UNIDAD 8
NOCIONES FUNDAMENTALES DE ESTADÍSTICA
Clasificación de Estadística
DISTRIBUCIÓN NORMAL.
2
Continua
UNIDAD 2
UNIDAD 9
ESTADÍSTICA DESCRIPTIVA
TEORÍA BÁSICA DEL MUESTREO.
Distribución de Frecuencias
UNI DAD
8
3
78
UNIDAD 10
MEDIDAS DE TENDENCIA CENTRAL
Estadística Descriptiva
Muestreo
71
ESTIMACIÓN E INTERVALOS DE CONFIANZA
26
Intervalos de confianza
93
UNIDAD 4
MEDIDAS DE DISPERSIÓN
Estadística Descriptiva
35
UNIDAD 5
PRINCIPIOS DE PROBABILIDAD
Probabilidad
42
UNIDAD 6
DISTRIBUCIONES DE PROBABILIDAD
Discreta
55
UNIDAD 7
DISTRIBUCIONES DE PROBABILIDAD
Discreta
63
BIBLIOGRAFÍA
101
UNIDAD
1
1. NOCIONES FUNDAMENTALES DE
ESTADÍSTICA
Estadística descriptiva e inferencial
Concepto de variable
Aplicaciones de la estadística
2
ESTADÍSTICA
Introducción
La palabra "estadística" suele utilizarse bajo dos significados distintos, a saber:
1º Como colección de datos numéricos.- Esto es el significado más vulgar de la
palabra estadística. Se sobrentiende que dichos datos numéricos han de estar
presentados de manera ordenada y sistemática. Una información numérica
cualquiera puede no constituir una estadística, para merecer este apelativo, los
datos han de constituir un conjunto coherente, establecido de forma sistemática y
siguiendo un criterio de ordenación.
Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico
publicado por el Instituto Nacional de Estadística, El Anuario de Estadísticas del
Trabajo,…
2º Como ciencia.- La Estadística es una rama de la matemática que se refiere a la
recolección, estudio e interpretación de los datos obtenidos en un estudio. Es
aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma
de decisiones en áreas de negocios e instituciones gubernamentales.
En este significado, La Estadística estudia el comportamiento de los fenómenos
de masas. Como todas las ciencias, busca las características generales de un
colectivo y prescinde de las particulares de cada elemento. Así por ejemplo al
investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo
numeroso de nacimientos para obtener después la proporción de varones. Es muy
frecuente enfrentarnos con fenómenos en los que es muy difícil predecir el
resultado; por ejemplo, no podemos dar una lista de las personas que van a morir
3
a una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado
tiempo de embarazo,…
Por lo tanto, el objetivo de la Estadística es hallar las regularidades que se
encuentran en los fenómenos de masa.
La Estadística cuenta con procedimientos para recoger, organizar y presentar
información acerca de un problema determinado, y con métodos para establecer la
validez de las conclusiones obtenidas a partir de la información recogida.
CLASIFICACIÓN DE LA ESTADISTICA
La Estadística se clasifica en: Estadística descriptiva y Estadística Inferencial.
La Estadística descriptiva, se encarga de los métodos de recolección, descripción,
visualización y resumen de datos originados a partir de los fenómenos en estudio.
Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de
descriptores numéricos son: la media y la desviación estándar. Resúmenes
gráficos incluyen varios tipos de figuras y gráficos.
La Estadística descriptiva presenta la información en forma cómoda, utilizable y
comprensible.
La Estadística Inferencial se dedica a la generación de los modelos, deducciones y
predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo
aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en
los datos y extraer inferencias acerca de la población de estudio, es decir, se
ocupa de la generalización de esa información haciendo deducciones acerca de
las poblaciones.
POBLACIÓN Y DATOS.
Al aplicar estadística a un problema científico, industrial o social, se comienza con
un proceso o población a ser estudiado. Esta puede ser una población de
personas en un país, de granos cristalizados en una roca o de bienes
manufacturados por una fábrica en particular durante un periodo dado. También
4
podría ser un proceso observado en varios instantes y los datos recogidos de esta
manera constituyen una serie de tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera,
usualmente se estudia un subconjunto seleccionado de la población, llamado
muestra. Datos acerca de la muestra son recogidos de manera observacional o
experimental. Los datos son entonces analizados estadísticamente lo cual sigue
dos propósitos: descripción e inferencia.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es finito, por
ejemplo el número de alumnos de un centro de enseñanza, o grupo clase.
Población infinita: cuando el número de elementos que la forman es infinito, o tan
grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un
estudio sobre los productos que hay en el mercado. Hay tantos y de tantas
calidades que esta población podría considerarse infinita.
CLASIFICACIÓN DE VARIABLES
Los datos pueden ser de muy diversos tipos, por lo que los podemos clasificar en
dos grandes clases:
Variables Cuantitativas.
Variables Cualitativas, Atributos o nominales.
Las variables cuantitativas son las que se describen por medio de números, como
por ejemplo el peso, Altura, Edad, Número de Alumnos…
A su vez este tipo de variables se puede dividir en dos subclases:
Cuantitativas discretas. Aquellas a las que se les puede asociar un número entero,
es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la
unidad, por ejemplo número de hermanos, páginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número
entero, es decir, aquellas que por su naturaleza admiten que entre dos valores
cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso,
tiempo. etc.
5
No obstante en muchos casos el tratamiento estadístico hace que a variables
discretas las trabajemos como si fuesen continuas y viceversa.
Los atributos son aquellos caracteres que para su definición precisan de palabras,
es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado
Civil, etc.
NIVELES DE MEDICIÓN
Hay cuatro tipos de mediciones o escalas de medición en estadística. Los cuatro
tipos de niveles de medición (nominal, ordinal, intervalo y razón) tienen diferentes
grados de uso en la investigación estadística. Las medidas de razón, en donde un
valor cero y distancias entre diferentes mediciones son definidas, dan la mayor
flexibilidad en métodos estadísticos que pueden ser usados para analizar los
datos. Las medidas de intervalo tienen distancias interpretables entre mediciones,
pero un valor cero sin significado (como las mediciones de coeficiente intelectual o
temperatura en grados Celsius). Las medidas ordinales tienen imprecisas
diferencias entre valores consecutivos, pero un orden interpretable para sus
valores. Las medidas nominales no tienen ningún rango interpretable entre sus
valores.
La escala de medida nominal, puede considerarse la escala de nivel más bajo. Se
trata de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la
propiedad de “orden” de los números. La escala de intervalos iguales está
caracterizada por una unidad de medida común y constante. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta
escala, además de poseer las características de la escala ordinal, permite
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. La escala de coeficientes o Razones es el nivel de medida más elevado y
se diferencia de las escalas de intervalos iguales únicamente por poseer un punto
cero propio como origen; es decir que el valor cero de esta escala significa
ausencia de la magnitud que estamos midiendo. Si se observa una carencia total
6
de propiedad, se dispone de una unidad de medida para el efecto. A iguales
diferencias entre los números asignados corresponden iguales diferencias en el
grado de atributo presente en el objeto de estudio.
APLICACIONES
En la actualidad, México se encuentra en un proceso de apertura e
internacionalización, por tal motivo es de suma importancia estar inmerso a través
de diferentes tratados comerciales con diferentes países, creando con esto nuevas
oportunidades de negocios. La Estadística es una rama de la ciencia en pleno
desarrollo y cuya aplicación en todos los ámbitos de la sociedad amplía las
posibilidades de integración en el mundo laboral. La Estadística en los negocios
ha tenido crecientes, continuas e innovadoras aplicaciones de sus métodos en
esta área y una constante investigación en Estadística se lleva a cabo a partir de
problemas que surgen en diversas áreas de los Negocios como Investigación de
Mercados, Finanzas, Administración de Riesgos, entre otras.
En los negocios y la industria la Estadística esta presente, por ejemplo, en la
fabricación de productos ayudando a incrementar la satisfacción de los clientes
aplicando técnicas de control de calidad y mejorando los procesos de producción,
de bienes y servicios o el sustento de toma de decisiones en las empresas de los
más diversos giros. En el área de Mercadotecnia permite el diseño de
experimentos para determinar la viabilidad de los productos en el mercado, y
predice la respuesta de los consumidores ante su venta. En el área de Economía,
se ha logrado el desarrollo de indicadores e índices econométricos. Estudios de
comportamiento de mercado, de la bolsa y análisis de inversiones. Empleo de
estadística actuarial de riesgos y seguros. En consultoría trabajando en proyectos
con las más importantes empresas del país en diferentes áreas. En Ingeniería
utilizando técnicas de optimización que minimicen costos de producción y
maximicen la eficiencia, detectando posibles problemas de fabricación.
7
2
UNIDAD
2.
ESTADÍSTICA DESCRIPTIVA
Distribución de frecuencias
Representaciones gráficas
8
DESCRIPCIÓN DE LOS
DATOS
Para estudiar el comportamiento de un fenómeno se requiere información y
¿Cómo recopilarla?
1)
Por medio de encuestas (interrogatorio oral o escrito que se aplica a varias
personas acerca del problema).
2)
Por medio del registro de las observaciones que se hacen de él.
DISTRIBUCIÓN DE FRECUENCIAS
La información obtenida debe presentarse en forma organizada. ¿Cómo?
Se puede utilizar una distribución de frecuencias (o también llamada tabla de
frecuencias), en donde se asocia a cada dato o subgrupo de datos (llamado
intervalo de clase o clase) una frecuencia (número de observaciones que
corresponden a cada dato o a cada grupo de datos).
La presentación de los datos puede hacerse en forma ordenada, si son datos:
Cualitativos
Cuantitativos
- Orden alfabético
- Forma creciente (menor al mayor).
- Escribir, primero el que más
se repite, luego el que sigue y
así sucesivamente.
-
Forma
menor)
9
decreciente
(mayor
al
EJEMPLO:
A)
Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia
preferida.
Distribución de frecuencia
Respuestas obtenidas
datos
frecuencia
Administración
6
Ingeniería Económica
5
Ingeniería Industrial
11
Investigación de operaciones.
6
Matemáticas
12
Probabilidad y Estadística
10
Total
50
N=
¿Observaste que los datos se colocaron en orden alfabético?
10
B)
Se preguntó a un grupo de alumnos su estatura en centímetros.
Distribución de frecuencia
Respuestas obtenidas
datos
f
152
163
154
170
164
154
166
151
1
163
162
168
168
172
170
160
152
1
161
158
165
165
151
161
157
154
2
160
155
158
158
170
169
168
155
2
155
156
162
162
166
168
160
156
1
157
1
158
2
160
4
161
2
162
2
163
2
164
1
11
165
2
166
2
168
5
169
1
170
3
172
1
Tot N = 35
¿Observaste que los datos al ser cuantitativos se ordenaron en forma creciente?
Pero, ¿cuándo los datos son cuantitativos y se presentan más de 15 valores
diferentes, se recomienda resumir la información? ¿Y cómo?
Acomodándolos en grupos (llamados clases o intervalos de clase).
12
Grupos
(clases)
Frecuencia
151-155
6
156-160
8
161-165
9
166-170
11
171-175
1
N=
35
Los grupos deben formarse de
igual tamaño.
(tamaño de clase : c)
El total de grupos o clases no
deben ser menor a 5 ni mayor
a 15
A los límites extremos de cada clase se les llama límite Inferior y límite superior de
clase respectivamente. En la clase 151, ese es el límite inferior y 155 es el límite
superior.
Marca de clase es el punto medio de cada clase y se obtiene sumando los límites
de clase y dividiéndolos entre dos.
El tamaño o anchura de clase es la diferencia entre los límites de clase.
Por ejemplo:
En la distribución de frecuencias anterior se tiene:
13
Clases
LI LS
Marcas de
f
Tamaño
Clase X
de
Clase
151-155
6
153
156-160
8
158
161-165
9
163
166-170
11
168
171-175
1
173
c=4
N=35
Pero, ¿cómo se calcula el tamaño de clase? ¿Cómo saber cuántas clases se
deben manejar?
Para determinar el número de clases óptimo, existe una regla que sugiere utilizar
como el número de clases el menor número (k) tal que k2 sea mayor que el
número de observaciones.
En el ejemplo anterior hay 35 observaciones (N=35).
Dos elevado a la quinta potencia es 32.
Entonces debemos tener al menos 5 clases. Eventualmente utilizaríamos 6.
Para determinar el tamaño, intervalo o amplitud de clase, que generalmente debe
ser el mismo, y deben cubrir al valor menor y al mayor, se recomienda el uso la
siguiente expresión:
i
H L
k
14
En donde H es el valor mayor observado, L es el menor y k es el número de
clases.
Para el ejemplo anterior: H= 172, L= 151 y k=5, entonces tenemos:
i
172  151
 4.2
5
En el ejemplo se usó 4. Si en lugar de 4.2 se hubiese tenido 4.5 o más se hubiera
redondeado a 5.
También se pueden hallar:
Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia de la
clase contigua superior.
Frecuencias relativas.- Dividiendo cada frecuencia entre el número total de
observaciones y multiplicándolas por l00 para tenerlas en forma de porcentaje.
Frecuencias relativas acumuladas.- La suma de cada frecuencia relativa con la
frecuencia relativa de la clase contigua superior. También se pueden obtener
dividiendo cada frecuencia acumulada entre el total de frecuencias por l00.
Entonces en nuestro ejemplo tenemos:
15
Clases
frecuencia
Frecuencia
Frecuencia
acumulada
relativa (%)
151-155
6
6
156-160
8
14
161-165
9
23
166-170
11
34
171-175
1
35
Frecuencia
relativa
acumulada (%)
(6/35)100=
(6/35)100=
17.1
17.1
(8/35)100=
22.9
(14/35)100= 40
(9/35)100=
(23/35)100=
25.7
65.7
(11/35)100=
(34/35)100=
31.4
97.1
(1/35)100= 2.9
(35/35)100=
100
¿Y para qué nos sirven estas frecuencias?
Para contestar preguntas tales como:
1) ¿Cuántos alumnos tienen estatura entre 156 y 160 centímetros?
R = Se busca en la columna de frecuencia y la respuesta es 8.
2) ¿Cuántos alumnos tienen estatura de l65 o menos?
R = Se busca en la columna de frecuencia acumulada y la respuesta es 23.
3) ¿Qué porcentaje de alumnos tienen estatura entre 166 y 170 centímetros?
R = Se busca en la columna de frecuencia relativa y la respuesta es 31.4%.
4) ¿Qué porcentaje de alumnos tienen estatura menor o igual que l60?
16
R = Se busca en la columna de frecuencia relativa acumulada y la respuesta es
40%.
PRESENTACIÓN DE LA INFORMACIÓN A TRAVÉS DE GRÁFICAS.
En dos grupos de una escuela se realizó un examen de matemáticas y los
resultados se presentaron de la manera siguiente:
Reporte de calificaciones del Grupo1
Calificación
Frecuencia
5
3
6
8
7
14
8
9
9
4
10
2
Total
40
17
Reporte de calificaciones del Grupo2
¿Cuál de los dos reportes te pareció mejor y porqué?
Realmente se observa mejor la gráfica, llama más la atención y se puede
interpretar mejor y más rápido. Es por ello que se utilizan las gráficas para la
representación de la información. Existen una serie de gráficas como son:
-DIAGRAMA DE BARRAS Ó GRÁFICA DE BARRAS.
-HISTOGRAMA.
-POLÍGONO DE FRECUENCIAS.
-GRÁFICA CIRCULAR O GRÁFICA DE PASTEL.
-PICTOGRAMA.
-OJIVA Ó POLÍGONO DE FRECUENCIAS ACUMULADAS.
-OJIVA
PORCENTUAL
Ó
POLÍGONO
ACUMULADAS.
18
DE
FRECUENCIAS
RELATIVAS
DIAGRAMA DE BARRAS
Se utilizan rectángulos separados, que tienen como base a cada uno de los datos
y como altura la frecuencia de ese dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas durante el
verano de l991 en un estado de la República Mexicana.
Datos
(vacunas)
frecuencia
miles)
(en
Frecuencia
relativa
(%) (redondeado)
BCG
47
17
SABIN
111
41
DPT
73
27
SARAMPION
41
15
TOTAL
272
100
19
El diagrama de barras o gráfica de barras suele elaborarse con algunas variantes;
por ejemplo, se pueden utilizar líneas en vez de rectángulos ó barras, ó líneas
horizontales en vez de verticales.
Si se tienen datos cuantitativos se grafica en el eje de las x los valores centrales
(marcas de clase), cuyas alturas son proporcionales a sus frecuencias. Así en la
distribución de frecuencias de las alturas de 35 alumnos se tiene:
20
HISTOGRAMA.
Se utiliza para datos cuantitativos representados en distribuciones de frecuencia.
La gráfica son rectángulos verticales unidos entre sí, en donde sus lados son los
límites reales inferior y superior de clase y cuya altura es igual ala frecuencia de
clase.
Con la distribución de frecuencia anterior se tiene:
21
POLÍGONO DE FRECUENCIAS:
Consiste en una serie de segmentos que unen los puntos cuyas abscisas (valores
de x) son los valores centrales de cada clase y cuyas ordenadas (valores de y)
son proporcionales a sus frecuencias respectivas.
GRÁFICA CIRCULAR:
Se forma al dividir un círculo en sectores circulares de manera que:
a)
Cada sector circular equivale al porcentaje correspondiente al
dato o grupo que representa.
b)
La unión de los sectores circulares forma el círculo y la suma de
sus porcentajes es 100.
22
Datos
(vacunas)
Frecuencia en
miles
Frecuencia
Grados
relativa(%)
(redondeados)
BCG
47
17
.17 x 360 = 61
SABIN
111
41
.41 x 360 = 148
DPT
73
27
.27 x 360 = 97
SARAMPION
41
15
.15 x 360 =54
TOTAL
272
100
360
23
PICTOGRAMA:
Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de
frecuencias.
Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se
lee en forma aproximada.
Ejemplo:
En una biblioteca de una escuela se tienen los siguientes libros:
Libros
frecuencia
Biología
25
Matemáticas
30
Física
43
Química
20
Filosofía
10
Total
128
24
OJIVA O POLÍGONO DE FRECUENCIAS ACUMULADAS:
Una gráfica de distribución de frecuencias acumuladas es llamada una ojiva. Se
trazan los límites reales inferiores (límite inferior menos 0.5) contra las frecuencias
acumuladas.
OJIVA
PORCENTUAL
Ó
POLÍGONO
DE
FRECUENCIAS
ACUMULADAS.
Se trazan los límites reales superiores contra las frecuencias relativas
acumuladas.
25
RELATIVAS
3
UNIDAD
3. Medidas de tendencia central
Media
Mediana
Moda
26
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia se desea describir el grupo
con un solo número. Para tal fin, desde luego, no se usará el valor más elevado ni
el valor más pequeño como único representante, ya que solo representan los
extremos más bien que valores típicos. Entonces sería más adecuado buscar un
valor central. Las medidas que describen un valor típico en un grupo de
observaciones suelen llamarse medidas de tendencia central. Es importante tener
en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un
promedio es una característica de grupo, no individual.
Entre las medidas de tendencia central tenemos: La media, la mediana, la moda y
los percentiles.
MEDIA
La medida de tendencia central mas ampliamente usada es la media aritmética,
usualmente abreviada como media ó promedio.
La media aritmética de un conjunto de n valores es el resultado de la suma de
todos ellos dividido entre n.
Propiedades de la media aritmética
1. Puede ser calculada en distribuciones con escala de razón y de intervalo.
2. Todos los valores son incluidos en el cómputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy útil para comparar dos o más poblaciones.
5. Es la única medida de tendencia central donde la suma de las desviaciones de
cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a
la media como el punto de balance de una serie de datos.
Desventajas de la media aritmética
27
1. Si alguno de los valores es extremadamente grande o extremadamente
pequeño, la media no es el promedio apropiado para representar la serie de datos.
2. No se puede determinar si en una distribución de frecuencias hay intervalos de
clase abiertos.
Las siguiente expresión es útil para el cálculo de la media con datos agrupados
(tablas de frecuencia) y datos no agrupados.
xi representa el valor de la variable o en su caso la
marca de clase.
Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos
corresponden al kilometraje de cada uno de ellos:
56,000 23,000 42,000 73,000
Encuentre la media aritmética del kilometraje de los autos:
µ = (56,000 + … + 73,000)/4 = 48,500
El ejemplo anterior es con datos no agrupados. Para calcular la media se han
utilizado todos los datos, por esta razón se representa a la media con la letra µ. En
caso de trabajar con una muestra de los datos se representará la media con 𝑥̅ .
Ejemplo 2: La siguiente tabla muestra los resultados de una muestra de 10 cines
en una gran área metropolitana, que contó el número total de películas en
exhibición la última semana. Calcule el número medio de películas en exhibición.
28
Películas
cartelera
en
Frecuencia (f)
Marca de clase (X)
(f)(X)
1–3
1
2
2
4–6
2
5
10
7–9
3
8
24
10 – 12
1
11
11
13 – 15
3
14
42
Total
10
X 
 f x= 89
fX 89

 8.9
n
10
El anterior es un ejemplo con datos agrupados (distribución de frecuencia)
Otros métodos para calcular la media son:
Media geométrica:
La media geométrica de N observaciones es la raíz de índice N del producto de
todas las observaciones. La representaremos por G.
Solo se puede calcular si no hay observaciones negativas. Es una medida
estadística poco o nada usual.
Media armónica:
La media armónica de N observaciones es la inversa de la media de las inversas
de las observaciones y la denotaremos por H
Al igual que en el caso de la media geométrica su utilización es bastante poco
frecuente.
29
MEDIANA
La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o
continua.
Cálculo de la mediana en el caso discreto:
Tendremos en cuenta el tamaño de la muestra.
Si N es Impar hay un término central el término,
𝑥𝑛+1
mediana.
Si N es Par, hay dos términos centrales,
𝑥𝑛
de esos dos valores
2
,
𝑥𝑛+2
2
2
será el valor de la
la mediana será la media
Veamos un ejemplo.
N par
N Impar
1,4,6,7,8,9,12,16,20, 24,25,27 N=12
𝑥𝑛 12
𝑥𝑛+2 14
=
= 6,
=
=7
2
2
2
2
1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13
𝑥𝑛+1 14
=
=7
2
2
Términos Centrales el 6º y 7º= 9 y 12
Términos Centrales el 7º =12
Me =
9+12
= 10.5
2
Me=12
30
Cálculo de la mediana en el caso continuo:
Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la
siguiente forma:
Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas.
De donde la mediana vale:
Me = 𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 +
𝑁
−𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
2
𝑓 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
(𝑐)
c es la amplitud del intervalo
Veámoslo por medio de un ejemplo.
Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente
forma:
31
Intervalo de clase
Frecuencia
Frecuencia acumulada
45 hasta 55
6
6
55 hasta 65
10
16
65 hasta 75
19
35 >25
75 hasta 85
11
46
85 hasta 95
4
50
N=50
Como el tamaño de la muestra es N=50, buscamos el intervalo en el que la
Frecuencia acumulada es mayor que 50/2=25, que en este caso es el 3º y
aplicamos la fórmula anterior.
𝐿𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 65
𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 16
𝑓𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎
𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
= 19
c = 75 – 65 = 10
Luego la Mediana será
Me = 65 +
50
−16
2
19
(10) = 69.74
MODA
MODA.- La moda es el valor de la variable que tenga mayor frecuencia absoluta,
la que más se repite, es la única medida de centralización que tiene sentido
estudiar para una variable cualitativa, pues no precisa la realización de ningún
cálculo.
32
Por su propia definición, la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia siendo esta máxima. En
cuyo caso tendremos una distribución bimodal o polimodal según el caso.
Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75,
81, 87
Dado que 81 es el dato que aparece con más frecuencia, éste es la moda.
Cuando se desea hacer el cálculo de la moda para distribuciones cuantitativas
continuas tendremos que:
Apoyándonos en el gráfico podemos llegar a la determinación de una expresión
para la Moda que es:
Mo = 𝐿𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 +
𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 −𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
(
(𝑐)
)−(
)
𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙−
𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙−
𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del
apartado anterior
33
Intervalo de clase
Frecuencia
Frecuencia acumulada
45 hasta 55
6
6
55 hasta 65
10
16
65 hasta 75
19
35
75 hasta 85
11
46
85 hasta 95
4
50
N=50
𝐿𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 65
𝑓𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 19
𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 10
𝑓𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 = 11
c = 75 – 65 = 10
19−10
Mo = 65 + (19−10)−(19−11) (10) = 70.29
34
4
UNIDAD
4. Principales medidas de dispersión
Rango
Desviación media
Varianza
Desviación estándar
35
MEDIDAS DE DISPERSIÓN
Hasta el momento hemos estudiado los valores centrales de la distribución, pero
también es importante conocer si los valores en general están cerca o alejados de
estos valores centrales, es por lo que surge la necesidad de estudiar medidas de
dispersión.
RANGO
Se define como la diferencia existente entre el valor mayor y el menor de la
distribución. Lo notaremos como R. Realmente no es una medida muy significativa
en la mayoría de los casos, pero indudablemente es muy fácil de calcular. Rango.Dato mayor menos dato menor.
DESVIACIÓN
Desviación: Es la diferencia que se observa entre el valor de la variable y la media
aritmética. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable lleva
asociada su correspondiente desviación, por lo que precisaremos una medida que
resuma dicha información.
La primera solución puede ser calcular la media de todas las desviaciones, es
decir, si consideramos como muestra la de todas las desviaciones y calculamos su
media. Pero esta solución no es la adecuada ya que siempre el resultado da cero,
pues las desviaciones positivas se contrarrestan con las negativas.
36
Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviación media
Elevar al cuadrado las desviaciones. Varianza.
DESVIACIÓN MEDIA
Es la media de los valores absolutos de las desviaciones, y la denotaremos por
d m.
Ejemplo: Los pesos de una muestra de canastas con libros en una librería (en
libras) son:
103, 97, 101, 106, 103
Encuentre el rango y la desviación media.
Rango = 106 – 97 = 9
Para la desviación media el primer paso es encontrar la media:
X
X 510

 102
n
5
La desviación media es:
MD 
XX

103 102  ...  103 102
n
1 5 1 4  5

 2.4
5
5
37
VARIANZA
Es la media de los cuadrados de las desviaciones, y la denotaremos por
también por
o
.
Aunque también es posible calcularlo como:
Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en
el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en
cm. La varianza vendrá en cm2.
Ejemplo:
Las edades de la familia González son:
2, 18, 34, 42
¿Cuál es la varianza poblacional?

X 96
  24
n 4
( X   ) 2 2  242  ...  42  242

N
4
944

 236
4
2 
DESVIACIÓN TÍPICA
Es la raíz cuadrada de la varianza, se denota por Sx o  x.
38
Este estadístico se mide en la misma unidad que la variable por lo que se puede
interpretar mejor.
Ejemplo:
Calcule la desviación estándar o típica del ejemplo anterior:
   2  236  15.36
La fórmula para la varianza muestral para datos agrupados es:
(fX ) 2
fX 
n

n 1
2
s2
donde f es la frecuencia de clase y X es la marca de clase.
Ejemplo: Obtén la varianza y la desviación estándar de la siguiente tabla:
Películas en
Frecuencia
cartelera
(∑ 𝒇𝒙)𝟐
𝒏
Frecuencia Marca de  f x 2
acumulada
clase (x)
1–3
1
1
2
1(2)2=4
(1x2)=2
4–6
2
3
5
2(5)2=50
(2x5)=10
7–9
3
6
8
3(8)2=192
(3x8)=24
10 – 12
1
7
11
1(11)2=121
(1x11)=11
13 – 15
3
10
14
3(14)2=588
(3x14)=42
Total
10
955
(89)2/10=792.1
(fX ) 2
fX 
955  792.1
2
n
s 

 18.1
n 1
10  1
2
Varianza:
39
Desviación estándar:
𝑠 = √18.1 = 4.25
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR
Regla empírica: Se aplica solamente en una distribución de frecuencias simétrica,
con forma de campana:

Aproximadamente 68% de las observaciones estarán entre más una y
menos una s desde la media;

Aproximadamente 95% de las observaciones se encontrarán entre más dos
y menos dos s desde la media;

Prácticamente todas las observaciones se hallarán entre más tres y menos
tres s a partir del valor medio.
COEFICIENTE DE VARIACIÓN
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada
ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que
presenta mayor dispersión. La denotaremos por C.V.
Ejemplo:
Un estudio sobre los bonos pagados y los años de servicio de varios empleados
se muestra en la siguiente tabla:
40
Bonos pagados
Años de servicio
Media
$200.00
20 años
Desviación estándar
$40.00
2 años
Coeficiente de variación
CV 
40
(100)  20%
200
41
CV 
2
(100)  10%
20
5
UNIDAD
5.
PRINCIPIOS DE PROBABILIDAD
Introducción
Probabilidad clásica de frecuencia relativa
y
subjetiva
Reglas para el cálculo de probabilidades
42
PROBABILIDAD
Introducción
Muchos de los eventos que ocurren en la vida diaria no pueden ser predichos con
exactitud desde antes por diversas razones, pues la mayoría de los hechos están
influidos por factores externos. Además, existen aquellos sucesos que están
directamente influidos por el azar, es decir, por procesos en los que no se está
seguro de lo que va a ocurrir. Sin embargo, la probabilidad nos permite acercarnos
a esos sucesos y estudiarlos, ponderando las posibilidades de su ocurrencia y
proporcionando métodos para tales ponderaciones.
Precisamente, algunos de esos métodos proporcionados por la probabilidad nos
llevan a descubrir que algunos sucesos tienen una mayor o menor probabilidad de
ocurrir que la ponderación asignada a través del sentido común. Nuestros
sentidos, la información previa que poseemos, nuestras creencias o posturas,
nuestras inclinaciones, son algunos de los factores que intervienen para no
permitirnos hacer ponderaciones reales y sistemáticas. La probabilidad nos
permitirá estudiar los eventos de una manera sistemática y más cercana a la
realidad, retribuyéndonos con información más precisa y confiable y, por tanto,
más útil para las disciplinas humanas.
EVENTOS
Cuando se realiza un experimento, que es cualquier proceso que produce un
resultado o una observación, se van a obtener un conjunto de valores. A este
conjunto de valores que puede tomar una variable se le denomina espacio
muestral.
Por ejemplo: Si se tiene un dado cualquiera, el espacio muestral (EM) es EM =
{1,2,3,4,5,6}.
43
Si existen más de una variable, el espacio muestral está formado por las
combinaciones de valores de cada una de las variables.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se
denomina un evento, y si éste consta de un solo elemento entonces es un evento
elemental.
Como se puede uno imaginar, existen eventos que siempre, no importa el número
de experimentos o su situación, ocurren, y en cambio existen otros que nunca
ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son
los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es
cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor.
Por esta razón, se define como experimento aleatorio al proceso en el que no se
pueden predecir con certeza la ocurrencia de sus eventos, con excepción del
seguro o del imposible. Hay que hacer la observación que esta definición habla en
términos generales y no específicamente sobre algún experimento en particular.
A aquélla variable que está asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinístico.
DEFINICIÓN DE PROBABILIDAD
A través de la historia se han desarrollado tres enfoques conceptuales diferentes
para definir la probabilidad y determinar los valores de probabilidad:
El enfoque clásico
Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z
posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son
igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo
tiempo), entonces la probabilidad de que ocurra A es:
número de resultados asociados con el evento A
P(A)=
número total de resutlados posibles
44
El enfoque clásico de la probabilidad se basa en la suposición de que cada
resultado sea igualmente posible.
Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda
aplicarse) calcular el valor de probabilidad antes de observar cualquier evento de
muestra.
Ejemplo:
Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de
sacar una piedra roja en un intento es:
El enfoque de frecuencia relativa
También llamado Enfoque Empírico, determina la probabilidad sobre la base de la
proporción de veces que ocurre un evento favorable en un número de
observaciones. En este enfoque no ese utiliza la suposición previa de
aleatoriedad. Porque la determinación de los valores de probabilidad se basa en la
observación y recopilación de datos.
Ejemplo:
Se ha observado que 9 de cada 50 vehículos que pasan por una esquina no
tienen cinturón de seguridad. Si un vigilante de transito se para en esa misma
esquina un día cualquiera ¿Cuál será la probabilidad de que detenga un vehículo
sin cinturón de seguridad?
La probabilidad es de 9/50=0.18
Tanto el enfoque clásico como el enfoque empírico conducen a valores objetivos
de probabilidad, en el sentido de que los valores de probabilidad indican a largo
plazo la tasa relativa de ocurrencia del evento.
El enfoque subjetivo
Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por
parte de un individuo de que un evento ocurra, basado en toda la evidencia a su
disposición. Bajo esta premisa se puede decir que este enfoque es adecuado
cuando sólo hay una oportunidad de ocurrencia del evento. Es decir, que el evento
ocurrirá o no ocurrirá esa sola vez. El valor de probabilidad bajo este enfoque es
un juicio personal.
45
Concepto de Probabilidad
Se define como cálculo de probabilidad al conjunto de reglas que permiten
determinar si un fenómeno ha de producirse, fundando la suposición en el cálculo,
las estadísticas o la teoría.
EL VALOR DE LA PROBABILIDAD
El valor más pequeño que puede tener la probabilidad de ocurrencia de un evento
es igual a 0, el cual indica que el evento es imposible, y el valor mayor es 1, que
indica que el evento ciertamente ocurrirá.
EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS NO EXCLUYENTES
Dos o más eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir
simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente la
ocurrencia del otro evento (o eventos).
Ejemplo:
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a
la vez, esto quiere decir que estos eventos son excluyentes.
Dos o más eventos son no excluyentes, o conjuntos, cuando es posible que
ocurran ambos. Esto no indica que necesariamente deban ocurrir estos eventos
en forma simultánea.
Ejemplo:
Si consideramos en un juego de domino sacar al menos un blanco y un seis, estos
eventos son no excluyentes porque puede ocurrir que salga el seis blanco.
REGLAS DE LA ADICIÓN
Las reglas de la Adición expresan que la probabilidad de ocurrencia de al menos
dos sucesos A y B es igual a:
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente
46
P(A o B) = P(A) + P(B) – P(A y B) si A y B son no excluyentes
Siendo: P(A) = probabilidad de ocurrencia del evento A
P(B) = probabilidad de ocurrencia del evento B
P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B
Ejemplos:
1. Eventos mutuamente excluyentes: Una máquina automática tiene bolsas de
plástico que contienen frijoles, brócoli y otras verduras. Aunque se procuró que
todas las bolsas tuvieran el mismo peso, algunas tienen un peso ligeramente
menor y otras un peso ligeramente mayor. Una revisión de 4 000 bolsas arrojó los
siguientes resultados:
PESO
EVENTO
Número de
Probabilidad de
paquetes
ocurrencia
Peso más bajo
A
100
100/4000=0.025
Peso correcto
B
3600
3600/4000=0.90
Peso más alto
C
300
300/4000=0.075
4000
1.00
¿Cuál es la probabilidad de que un paquete determinado tenga un peso
ligeramente más bajo?
P(A o C) = P(A) U P(C) = P(A) + P(C)=0.025+0.075=0.10
2. Eventos no excluyente: ¿Cuál es la probabilidad de que una carta escogida al
azar de una baraja americana sea un rey o un corazón?
47
CARTA
PROBABILIDAD
EXPLICACIÓN
DE OCURRENCIA
Rey
P(A)=4/52
Hay 4 reyes en una baraja de 52 cartas
Corazón
P(B)=13/52
Hay 13 corazones en una baraja de 52
cartas
Rey de corazones
P(A y B)=1/52
Hay 1 rey de corazones en una baraja de 52
cartas
P(A o B) = P(A) + P(B) – P(A y B)=
4
52
+
13
52
−
1
52
=
16
52
= 0.3077
Un diagrama de Venn representa estos resultados:
Corazones
Reyes
Ambos
EVENTOS INDEPENDIENTES
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de
un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o
eventos). Un caso típico de eventos independiente es el muestreo con reposición,
es decir, una vez tomada la muestra se regresa de nuevo a la población donde se
obtuvo.
Ejemplo:
48
Lanzar al aire dos veces una moneda son eventos independientes por que el
resultado del primer evento no afecta sobre las probabilidades efectivas de que
ocurra cara o sello, en el segundo lanzamiento.
EVENTOS DEPENDIENTES
Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de
uno de ellos afecta la probabilidad de ocurrencia del otro (u otros). Cuando
tenemos este caso, empleamos entonces, el concepto de probabilidad condicional
para denominar la probabilidad del evento relacionado. La expresión P(A|B) indica
la probabilidad de ocurrencia del evento A sí el evento B ya ocurrió.
Se debe tener claro que A|B no es una fracción.
P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)
Ejemplo:
Un estudio de la lealtad hacia una compañía de sus ejecutivos. La pregunta que
se les hizo fue, ¿si otra compañía le ofreciera un puesto igual ó ligeramente mejor
al que tiene ahora, se quedaría en la compañía? Las repuestas de 200 ejecutivos
se clasificaron de acuerdo con su tiempo de servicio en la compañía. ¿Cuál es la
probabilidad de seleccionar un ejecutivo de la compañía que sea leal y que tenga
más de 10 años de servicio?
TIEMPO DE SERVICIO
LEALTAD
Menos de un año 1-5 años 6-10 años Más de 10 años Total
Se quedaría
10
30
5
75
120
No se quedaría
25
15
10
30
80
200
P(A | B) = P(A y B) / P(B) o P(B | A) = P(A y B) / P(A)=
120
75
9000
( )( ) = (
) = 0.375
200
120
24000
REGLAS DE MULTIPLICACIÓN
49
Se relacionan con la determinación de la ocurrencia conjunta de dos o más
eventos. Es decir la intersección entre los conjuntos de los posibles valores de A y
los valores de B, esto quiere decir la probabilidad de que ocurran conjuntamente
los eventos A y B es:
P(A y B) = P(A B) = P(A) P(B) si A y B son independientes
P(A y B) = P(A B) = P(A) P(B|A) si A y B son dependientes
Ejemplos:
1. Eventos independientes: Se lanzaron dos monedas. ¿Cuál es la probabilidad de
que las dos monedas caigan en sol?
P(A y B) = P(A B) = P(A) P(B)= (1/2)(1/2)=0.25
2. Eventos dependientes: Suponga que hay diez rollos de película en una caja, se
sabe que tres están defectuosos. Se toman dos rollos de la caja, uno después del
otro. ¿Cuál es la probabilidad de que ambos sean defectuosos?
P(A y B) = P(A B) = P(A) P(B|A)=(3/10)(2/9)=0.07
TEOREMA DE BAYES
El Teorema de BAYES se apoya en el proceso inverso al que hemos visto en el
Teorema de la Probabilidad Total:
Teorema de la probabilidad total: a partir de las probabilidades del suceso A
(probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad
del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un
accidente) deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía
buen tiempo?).
La fórmula del Teorema de Bayes es:
P(A1 )P(BIA1 )
P(A1 )P(BIA1 )+P(A2 )P(BIA2 )
P(A  B)=
50
Vamos a explicar la fórmula con un ejemplo.
El parte meteorológico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Según estos posibles estados meteorológicos, la posibilidad de que ocurra un
accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad
no sabemos que tiempo hizo (llovió, nevó o hubo niebla). El teorema de Bayes nos
permite calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un
accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el
30% y niebla con el 20%).
Una vez que incorporamos la información de que ha ocurrido un accidente, las
probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B),
que se denominan "probabilidades a posteriori".
Vamos a aplicar la fórmula:
a) Probabilidad de que estuviera lloviendo:
(0.5)(0.2)
P(A  B)=
=0.714
(0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05)
La probabilidad de que efectivamente estuviera lloviendo el día del accidente
(probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
P(A  B)=
(0.3)(0.1)
(0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05)
51
=0.214
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
(0.2)(0.05)
P(A  B)=
=0.071
(0.5)(0.2)+(0.3)(0.1)+(0.2)(0.05)
La probabilidad de que hubiera niebla es del 7,1%
Otro ejemplo.
En una etapa de la producción de un artículo se aplica soldadura y para eso se
usan tres diferentes robots. La probabilidad de que la soldadura sea defectuosa
varía para cada uno de los tres, así como la proporción de artículos que cada uno
procesa, de acuerdo a la siguiente tabla.
ROBOT
DEFECTUOSOS
ART. PROCESADOS
A
0.03
45%
B
0.04
30%
C
0.05
25%
Tomamos al azar una pieza y resulta ser defectuosa, ¿calcula la probabilidad de
que haya sido producida por el robot B?
(0.3)(0.04)
P(B  D)=
=0.316
(0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05)
¿Qué robot tiene la mayor probabilidad de haber producido la pieza defectuosa?
(0.45)(0.03)
P(A  D)=
=0.355
(0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05)
(0.25)(0.05)
P(C  B)=
=0.329
(0.45)(0.03)+(0.3)(0.04)+(0.25)(0.05)
El robot con mayor probabilidad de haber producido la pieza defectuosa es el
robot A.
52
DIAGRAMA DE ÁRBOL
Supongamos que en el problema de los robots seleccionamos una pieza al azar y
queremos calcular la probabilidad de que sea defectuosa.
Para calcular la probabilidad de que la pieza elegida sea defectuosa, P (D), por la
propiedad de la probabilidad total,
P (D)=P(A) P (D A)+P (B) P (D B)+P(C) P (D C)=
(0.45)(0.03)+ (0.30) (0.04)+ (0.25) (0.05)=0.038
Con un diagrama de árbol tenemos:
A
0.03
D
0.097
N
0.45
0.04
D
0.30 B
0.25
C
0.96
N
0.05
D
0.95
N
AXIOMAS DE LA PROBABILIDAD
Recordemos primero que las frecuencias relativas de una distribución tenían las
siguientes propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
Si dos eventos son mutuamente excluyentes, es decir que no ocurren
simultáneamente, entonces la frecuencia relativa de su unión es la suma de las
frecuencias relativas de cada uno.
53
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definición
ya expuesta, es la frecuencia relativa cuando se aumenta el tamaño de la muestra,
se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E,
entonces se satisfacen los axiomas de la probabilidad:
0  P(E)  1.
P(S) = 1.
Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces
54
6
UNIDAD
6. DISTRIBUCIONES DE
PROBABILIDAD: DISCRETAS
Concepto de distribución de probabilidad
para variables discretas
Media, varianza y desviación estándar de
una distribución de probabilidad
Análisis combinatorio
55
DISTRIBUCIONES DE
PROBABILIDAD
VARIABLES ALEATORIAS
Se denominan variables porque cambian de valor y aleatorias porque su valor
depende del azar, es impredecible. Las variables aleatorias pueden ser discretas y
continuas.
Variable discreta: Es aquella que sólo puede tomar valores enteros.
Variable continua: Es aquella que puede tomar cualquier valor en algún intervalo.
Cuando una de estas variables aleatorias toma diversos valores, la probabilidad
asociada a cada uno de tales valores puede ser organizada como una distribución
de probabilidad.
Las distribuciones de probabilidad pueden representarse a través de una tabla,
una gráfica o una fórmula, en donde a la regla de correspondencia se le denomina
función de probabilidad.
Consideraremos las distribuciones de probabilidad para variables discretas.
Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de águilas
observadas cuando se lanzan dos volados. El espacio muestral es el conjunto
{AA, AS, SA, SS} y se puede ver que la variable X puede tomar como valores 0, 1
y 2.
Calculando las probabilidades tenemos:
P (de no observar águilas) = P (SS) = P(X=0) = ¼
P (de observar una águila) = P (SA  AS) = P (X=1) = 2/4
P (de observar dos águilas) = P (AA) = P(X=2) = ¼
Si ahora se organizan estos resultados con el siguiente formato
56
X
P (X=x)
0
¼
1
½
2
¼
Se podrá explicar por qué se usa el nombre "distribución de probabilidad". E
incluso, con esta información se puede construir una gráfica de barras o un
histograma como el que sigue:
Las propiedades de las distribuciones de variables discretas son dos:
0  P(X=x)  1.
P(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de los
eventos posibles de una variable aleatoria es igual a la unidad.
Hay que hacer notar que estas propiedades se enuncian suponiendo que
conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir
que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones.
Precisamente esto nos lleva a modelos teóricos que estiman los resultados, los
principales son los que a continuación se presentan.
57
MODELOS
DE
DISTRIBUCIONES
DE
PROBABILIDAD
DE
VARIABLES
DISCRETAS
Uniforme: Es la distribución donde todos los eventos elementales tienen la misma
probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)=1/6 para valores
de x=1, 2, 3, 4, 5,6.
Binomial: Es la que maneja la distribución de la probabilidad de obtener cierta
cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de
éxito constante y con ensayos independientes.
Geométrica: Es la distribución de la probabilidad de realizar cierto número de
experimentos antes de obtener un éxito.
Hipergeométrica: Es similar a la binomial, pero con un tamaño de muestra grande
en relación al tamaño de la población. La función de Excel que proporciona sus
valores es DISTR.HIPERGEOM
De Poisson: Es la distribución de la probabilidad de que ocurra un evento raro en
un periodo de tiempo, un espacio o un lugar.
MEDIA
Y
DESVIACIÓN
ESTÁNDAR
DE
UNA
DISTRIBUCIÓN
PROBABILIDAD PARA VARIABLES DISCRETAS
En una distribución de frecuencias para datos agrupados se calculaba la media
utilizando la fórmula:
También puede expresarse como:
58
DE
Si consideramos que la definición de probabilidad de un evento P(X) es el cociente
de la frecuencia entre el número total de eventos, la media de una distribución de
probabilidad de una variable discreta es:
Por ejemplo: Consideremos la variable X del ejemplo de águilas observadas en
dos lanzamientos de monedas. Es decir, X tal que su distribución de probabilidad
sea:
X
P (X=x)
0
¼
1
½
2
¼
Entonces, para calcular su media m se realiza:
Similarmente, la varianza se definió como:
Haciendo un tratamiento análogo al anterior tenemos que
para que, finalmente, la varianza de una distribución de probabilidad de una
variable discreta sea:
Consecuentemente, la desviación estándar de una distribución de probabilidad de
una variable discreta es:
59
Por ejemplo: Considerando la misma distribución de probabilidad que en el
ejemplo anterior, su desviación estándar se calcula:
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS
Hasta el momento se han considerado las distribuciones de probabilidad para
variables discretas, donde se podía asignar el valor que toma la función de
probabilidad cuando la variable aleatoria tomaba un valor en concreto. Sin
embargo, al considerar las variables continuas se encuentra uno el problema de
que, lo más probable, los datos que se puedan recabar no sean completamente
exactos, o dos o más de ellos no coincidan, por lo que se tienen que trabajar en
intervalos y, en ese momento, modelar una función se convierte en un problema
serio.
Sin embargo, se pueden realizar aproximaciones y describir la probabilidad a
través de modelos teóricos de probabilidad cuya gráfica es una línea continua, a
diferencia de las variables discretas que le corresponde un histograma.
ANÁLISIS COMBINATORIO
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una
situación dada se convierte en algo difícil de lograr o, simplemente, tedioso. El
análisis combinatorio, o cálculo combinatorio, permite enumerar tales casos o
sucesos y así obtener la probabilidad de eventos más complejos.
En el caso de que existan más de un suceso a observar, habría que contar el
número de veces que pueden ocurrir todos los sucesos que se desean observar,
para ello se utiliza el principio fundamental de conteo:
60
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2
formas, entonces el número de formas en que ambos sucesos pueden
presentarse en ese orden es de n1·n2.
En otras palabras, basta multiplicar el número de formas en que se pueden
presentar cada uno de los sucesos a observar.
En el análisis combinatorio se definen las permutaciones, con o sin repetición, y
las combinaciones.
PERMUTACIONES (U ORDENACIONES) CON REPETICIÓN
Las permutaciones son también conocidas como ordenaciones, y de hecho toman
este nombre porque son ordenaciones de r objetos de n dados.
Por ejemplo: Sea A = {a, b, c, d}, ¿cuántas "palabras" de dos letras se pueden
obtener?
Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras
es 4. En este caso r =2 y n =4.
Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db,
dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u
ordenaciones con repetición obtenidas son:
ORnr = nORr = n r
PERMUTACIONES (U ORDENACIONES) SIN REPETICIÓN
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n
dados atendiendo a la situación de cada objeto en la ordenación. Su
representación será Pnr ó nPr.
En general, si se toman r objetos de un total de n, la cantidad de permutaciones
Pnr = nPr =
61
Por ejemplo: Sea el mismo conjunto A = {a, b, c, d}, ¿cuántas ordenaciones sin
repetición se pueden obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
COMBINACIONES
Es una selección de r objetos de n dados sin atender a la ordenación de los
mismos. Es decir, es la obtención de subcojuntos, de r elementos cada uno, a
partir de un conjunto inicial de n elementos. La denotaremos con C n r, n C r ó
.
Por ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, ¿cuántos
subconjuntos de 2 elementos cada uno se pueden obtener?
Haciéndolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los
subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una,
el número de combinaciones obtenidas son:
C nr =
nC r
=
o, que es lo mismo,
C nr = nC r =
En donde n  =(n-1)(n-2)8n-3)… 1
Ejemplo:
Calcular 5  =(5)(4)(3)(2)(1)=120
62
7
UNIDAD
7. DISTRIBUCIONES DE PROBABILIDAD
Distribución Binomial
Distribución de Poisson
63
Un modelo es una simplificación de la realidad. Un modelo probabilístico es un
modelo matemático que describe el comportamiento de una variable aleatoria. Es
una función que depende de los valores de la variable aleatoria, y de otras
cantidades que caracterizan a una población en particular y que se denominan
parámetros del modelo.
En el proceso de modelación es necesario seguir los siguientes pasos:
1. Seleccionar el modelo más apropiado.
2. Ajustar el modelo (calcular el valor de sus parámetros).
3. Verificar el modelo.
4. Decidir su aceptación o volver al paso 1.
Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de
probabilidad, desarrollados para representar distintos tipos de variables y
diferentes fenómenos aleatorios. Por lo tanto, el problema se reduce a elegir el
modelo más apropiado para el caso en estudio.
Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la
población en estudio y calcular las cantidades necesarias como para evaluar los
parámetros del modelo.
LA DISTRIBUCIÓN BINOMIAL
Esta distribución describe una variedad de procesos de interés para los
administradores y describe datos discretos, no continuos, que son resultado de un
experimento conocido como proceso de Bernoulli.
Podemos describir el proceso de Bernoulli de la manera siguiente:
1. Cada intento tiene sólo dos resultados posibles.
2. La probabilidad del resultado de cualquier intento permanece fijo con
respecto al tiempo.
3. Los intentos son estadísticamente independientes.
Fórmula binomial:
64
P(x)=n C x (p)x (1-p)n-x
Ejemplo: Cada día American Airlines viaja de Pittsburgh a Pensilvania.
Supongamos que la probabilidad de que un vuelo se retrase es de 0.20. ¿Cuál es
la probabilidad de que ninguno de los vuelos se retrase el día de hoy? ¿Cuál es la
probabilidad de que uno de los vuelos se retrase el día de hoy?
P=0.20
n =5
x se refiere a éxito, o sea x = 0 (ningún vuelo se atrase)
P (0) = 5C0 (0.2)0 (1-0.20)5-0 = (1)(1)(0.3277)=0.3277
5!
5!
= =1
5C0 =
0!(5−0)!
5!
Nota:
Recuerda que cualquier cantidad elevada a la cero es igual a la unidad.
0 =1
Para:
P=0.20
n =5
x se refiere a éxito, o sea x = 1 (un vuelo se atrase)
P (1) = 5 C1 (0.2)1 (1-0.20)5-1 = (5)(0.20)(0.4096)=0.4096
5!
5!
= =5
5C 1=
1!(5−1)!
4!
Distribución de probabilidad binomial para P=0.20 y n =5
0.4
0.3
0.2
0.1
0
1
2
3
4
5
65
Generalizaciones:

Cuando p es pequeña (0,1), la distribución binomial está sesgada hacia la
derecha.

Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable.

Cuando p = 0,5, la distribución binomial es simétrica.

Cuando p es mayor que 0,5, la distribución está sesgada hacia la izquierda.

Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7, excepto
que los valores de p y q están invertidos. Esto es cierto para cualquier
pareja de valores p y q complementarios.
MEDIDAS
DE
TENDENCIA
CENTRAL
Y
DE
DISPERSIÓN
PARA
LA
DISTRIBUCIÓN BINOMIAL.
La distribución binomial tiene un valor esperado o media y una desviación
estándar.

Valor esperado o media: 

Varianza:  2 =
= n
n
CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE BERNOULLI.
Necesitamos ser cuidadosos en el uso de la distribución binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias, en
particular las condiciones 2 y 3. La condición 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo. La condición 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadísticamente independientes, es decir, que el resultado de un intento no
puede afectar de ningún modo el resultado de cualquier otro intento.
66
LA DISTRIBUCIÓN DE POISSON.
La distribución de Poisson se utiliza para describir cierto tipo de procesos, entre
los que se encuentran la distribución de llamadas telefónicas que llegan a un
conmutador, la demanda (necesidades) de los pacientes que requieren servicio en
una institución de salud, las llegadas de camiones a una caseta de cobro y el
número de accidentes registrados en una cierta intersección de calles. Estos
ejemplos tienen en común un elemento: pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0, 1, 2...).
CARACTERÍSTICAS
DE
LOS
PROCESOS
QUE
PRODUCEN
UNA
DISTRIBUCIÓN DE PROBABILIDAD DE POISSON.
1. El promedio (la media) del número de eventos que se producen por hora,
puede estimarse a partir de datos que se tengan disponibles.
2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno,
encontraremos que las siguientes afirmaciones son verdaderas:

La probabilidad de que exactamente un evento ocurra por segundo es muy
pequeña y es constante para cada intervalo de un segundo.

La probabilidad de que dos o más eventos ocurran en un intervalo de un
segundo es tan pequeña que le podemos asignar un valor cero.

El número de eventos que ocurren en un intervalo de un segundo es
independiente del tiempo en que dicho intervalo se presente en la hora
pico.

El número de eventos en un intervalo de un segundo no depende del
número de ocurrencias en cualquier otro intervalo de un segundo.
CÁLCULO DE LA PROBABILIDAD DE POISSON.
67
La letra X por lo general representa a una variable discreta y puede tomar valores
enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x
para señalar un valor específico que esta variable pueda tomar. La probabilidad de
tener exactamente x presentaciones en una distribución de Poisson se calcula con
la fórmula:
P(x) =

μx e−μ
x!
es el número medio de ocurrencias(éxitos) durante un intervalo específico de
tiempo.
x es el número de ocurrencias (éxitos)
e es la constante 2.71828…
Ejemplo: Supongamos que Mexicana de Aviación es raro que pierda el equipaje.
Algunos vuelos tienen una maleta perdida; en unos casos se pierden dos maletas
y es muy raro que se pierdan tres o más. En una muestra aleatoria de 1000
vuelos se perdieron 300 maletas. La media aritmética de maletas pérdidas es de
0.3 (se encuentra dividiendo 300/1000). Si el número de maletas perdidas sigue
una distribución de Poisson con =0.30. ¿Cuál es la probabilidad de no perder
ninguna maleta?
P (0)=
μx e−μ
x!
=
(0.3)0 (e−0.3)
0!
= 0.7408
En el 74% de los vuelos no habrá maletas perdidas.
En el siguiente cuadro se muestran las probabilidades para diferentes valores de
“x”.
X
P(x)
0
0.7408
1
0.2222
2
0.0333
3
0.0033
4
0.0003
5
0.0000
68
LA DISTRIBUCIÓN DE POISSON COMO UNA APROXIMACIÓN A LA
DISTRIBUCIÓN BINOMIAL.
La distribución de Poisson puede ser una razonable aproximación a la binomial,
pero sólo bajo ciertas condiciones. Tales condiciones se presentan cuando n es
grande y p es pequeña, esto es, cuando el número de ensayos es grande y la
probabilidad binomial de tener éxito es pequeña. La regla que utilizan con más
frecuencia los estadísticos es que la distribución de Poisson es una buena
aproximación de la distribución binomial cuando n es igual o mayor que 20 y p es
igual o menor que 0,05. En los casos en que se cumplen estas condiciones,
podemos sustituir la media de la distribución binomial (n) en lugar de la media de
la distribución de Poisson ().
El uso de una distribución para aproximar a otra es una práctica bastante común
en probabilidad y estadística. La idea consiste en buscar situaciones en las que
una distribución (como la de Poisson), cuyas probabilidades son relativamente
fáciles de calcular, tiene valores que se encuentran razonablemente cercanos a
las de otra distribución (como la binomial) cuyas probabilidades implican cálculos
más complicados.
RECOMENDACIONES PRÁCTICAS:

Frente a un problema concreto, analice detenidamente todas sus
características, y al elegir el modelo apropiado, verifique que se cumplan
todos los supuestos del mismo.

Habitúese a utilizar las tablas provistas por la bibliografía para calcular
probabilidades. Ahorrará tiempo y evitará errores de cálculo.

No olvide emplear la distribución de Poisson a la binomial en aquellos
casos en que p es pequeño y n es grande.
69

Para calcular probabilidades acumuladas, del tipo P(X > x), P(X < x) o P(x <
X < x), también existen valores tabulados en textos especializados.

En el caso de variables aleatorias discretas, es importante diferenciar si la
probabilidad deseada incluye o no el valor particular de la variable. Es decir,
que P(X > x) no es lo mismo que P(X > x) y P (X < x) es distinto de P(X < x).
70
8. DISTRIBUCIÓN NORMAL
Concepto de distribución continua de
probabilidad
Distribución normal
Distribución
normal
estandarizada,
cálculos de áreas bajo la curva
71
DISTRIBUCIÓN
NORMAL
LA DISTRIBUCIÓN NORMAL: DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA
CONTINUA.
La variable puede tomar cualquier valor que esté en un intervalo de valores dado,
y la distribución de probabilidad es continua.
Las razones básicas de la importancia de la distribución normal son:
1. Tiene algunas propiedades que la hacen aplicable a un gran número de
situaciones en las que es necesario hacer inferencias mediante la toma de
muestras. La distribución normal es una útil distribución de muestreo.
2. La distribución normal casi se ajusta a las distribuciones de frecuencias
reales observadas en muchos fenómenos, incluyendo características
humanas (pesos, alturas), resultados de procesos físicos (dimensiones y
rendimientos) y muchas otras medidas de interés para los administradores.
CARACTERÍSTICAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD.
1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de
campana.
2. La media de una población distribuida normalmente cae en el centro de su
curva normal.
3. Debido a la simetría de la distribución normal de probabilidad, la mediana y
la moda se encuentran también en el centro; en consecuencia, para una
curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Los dos extremos de la distribución normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.
72
La mayor parte de las poblaciones reales no se extienden de manera indefinida en
ambas direcciones; pero en estas poblaciones, la distribución normal es una
aproximación conveniente. No hay una sola distribución normal, sino una familia
de curvas normales. Para definir una distribución normal de probabilidad
necesitamos definir sólo dos parámetros: la media y la desviación estándar.
La curva normal puede describir un gran número de poblaciones, diferenciadas
solamente por la media, la desviación estándar o por ambas.
ÁREAS BAJO LA CURVA NORMAL.
No importa cuáles sean los valores de  y  para una distribución de probabilidad
normal, el área bajo la curva es 1,00, de manera que podemos pensar en áreas
bajo la curva como si fueran probabilidades. Matemáticamente:
1. Aproximadamente el 68% de todos los valores de una población
normalmente distribuida se encuentran dentro de + 1 desviación estándar
de la media.
73
2. Aproximadamente 95,5% de todos los valores de una población
normalmente distribuida se encuentran dentro de + 2 desviaciones estándar
de la media.
3. Aproximadamente 99,7% de todos los valores de una población
normalmente distribuida se encuentran dentro de + 3 desviaciones estándar
de la media.
Las tablas estadísticas indican porciones del área bajo la curva normal que están
contenidas dentro de cualquier número de desviaciones estándar (más, menos) a
partir de la media.
No es posible ni necesario tener una tabla distinta para cada curva normal posible.
En lugar de ello, podemos utilizar una distribución de probabilidad normal estándar
para encontrar áreas bajo cualquier curva normal. Con esta tabla podemos
determinar el área o la probabilidad de que la variable aleatoria distribuida
normalmente esté dentro de ciertas distancias a partir de la media. Estas
distancias están definidas en términos de desviaciones estándar.
Para cualquier distribución normal de probabilidad, todos los intervalos que
contienen el mismo número de desviaciones estándar a partir de la media
contendrán la misma fracción del área total bajo la curva para cualquier
distribución de probabilidad normal.
ÁREAS BAJO LA CURVA NORMAL.
74
El área total bajo la curva normal será de 1.00 por lo cual podemos considerar
que las áreas bajo la curva son probabilidades.
DEFECTOS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD.
Los extremos de la distribución normal se acercan al eje horizontal, pero nunca
llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser
muy pequeña) de que la variable aleatoria pueda tomar valores demasiado
grandes. No perderemos mucha precisión al ignorar valores tan alejados de la
media. Pero a cambio de la conveniencia del uso de este modelo teórico,
debemos aceptar el hecho de que puede asignar valores empíricos imposibles.
DISTRIBUCIÓN DE PROBABILIDD NORMAL ESTÁNDAR
Existe una familia de distribuciones normales. Cada una de las distribuciones
puede tener una media distinta o una desviación estándar distinta. Por tanto, el
número de distribuciones normales es ilimitado.
Es posible utilizar un solo miembro de la familia de las distribuciones normales
para todos los problemas en los que se aplica la distribución normal. La que tiene
una media de cero y una desviación de uno y se le conoce como distribución
75
normal estándar. Todas las distribuciones pueden convertirse a distribuciones
normal estándar restando la media de cada observación y dividendo entre la
desviación estándar.
Primero se convierte o estandariza, la distribución real a una distribución normal
utilizando un valor z.
En términos de una fórmula:
𝑥−𝜇
z=
𝜎
Ejemplo:
Los ingresos semanales de los gerentes medios tienen una distribución
aproximadamente normal con una media de 1000 dólares y una desviación
estándar de 100 dólares ¿Cuál es el valor z para un ingreso x de 1100
dólares?¿Para uno de 900 dólares?
1100−1000
z=
100
900−1000
z=
100
=1
=-1
El valor de 1 indica que un ingreso semanal de $1100.00 para un gerente medio
está una desviación estándar arriba de la media. El valor de -1 indica que un
ingreso semanal de $900.00 para un gerente medio está una desviación estándar
abajo de la media.
LA
DISTRIBUCIÓN
NORMAL
COMO
UNA
APROXIMACIÓN
DE
LA
DISTRIBUCIÓN BINOMIAL.
Aunque la distribución normal es continua, resulta interesante hacer notar que
algunas veces puede utilizarse para aproximar a distribuciones discretas.
La aproximación normal a la distribución binomial resulta muy conveniente, pues
nos permite resolver el problema sin tener que consultar grandes tablas de la
distribución binomial. Pero se necesita tener algo de cuidado al utilizar esta
76
aproximación, que es bastante buena, siempre que n y n( sean al menos de
cinco.
IDENTIFICACIÓN DEL MODELO APROPIADO.
La selección depende, entre otros, de los siguientes factores:

Un adecuado análisis del problema considerado: qué tipo de variable se
estudia, qué fenómeno se desea modelar, etc.

Los resultados de la descripción de los datos disponibles: forma de la
distribución, propiedades de la variable.

La disponibilidad y manejo de un buen número de modelos de probabilidad
que permitan describir diferentes tipos de situaciones.
Una vez identificado el modelo apropiado, hay que calcular sus parámetros, en
base a las observaciones que se dispongan de la variable en estudio.
Si planeamos utilizar una probabilidad para describir una situación, debemos
escoger con cuidado la correcta. La distribución binomial se aplica cuando el
número de ensayos está fijo antes de que empiece el experimento, y cada ensayo
es independiente y puede tener sólo dos resultados mutuamente excluyentes. Al
igual que la distribución binomial, se aplica cuando cada ensayo es independiente
de los demás. Pero, aunque la probabilidad de Poisson se aproxima a cero
después de los primeros valores, el número de valores posibles es infinito. No se
conoce el límite de dos resultados mutuamente excluyentes. En ciertas
condiciones, la distribución de Poisson se puede utilizar como aproximación de la
binomial, pero no siempre es posible hacerlo. Todas las suposiciones que
conforman la base de una distribución deben cumplirse, si la intención del uso de
dicha distribución es producir resultados significativos.
77
9
UNIDAD
9. TEORÍA BÁSICA DEL MUESTREO
Diferentes tipos de muestreo
Etapas de un estudio por muestreo
Distribuciones muestrales
78
TEORÍA BÁSICA
DEL MUESTREO
Actividad en la que se toman ciertas muestras de una población de elementos. El
muestreo es importante porque a través de él podemos hacer análisis de diversas
situaciones de una empresa o de algún campo de la sociedad.
Un estadístico es una medida usada para describir alguna característica de una
muestra, tal como una media aritmética, una mediana o una desviación estándar
de una muestra.
Una parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar
de una población. El proceso de estimación en inferencia estadística puede ser
descrito como el proceso de estimar un parámetro a partir del estadístico
correspondiente, tal como usar una media muestral
Distribución en el muestreo: Cuando el tamaño de la muestra (n) es más pequeño
que el tamaño de la población (N), dos o más muestras pueden ser extraídas de la
misma población. Un cierto estadístico puede ser calculado para cada una de las
muestras posibles extraídas de la población. Una distribución del estadístico
obtenido de las muestras es llamado la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra tiene 2 elementos y la población 3 elementos (A, B, C),
es posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la
media para cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3
muestras. Las 3 medias muéstrales forman una distribución. La distribución de las
medias es llamada la distribución de las medias muéstrales, o la distribución en el
muestreo de la media. De la misma manera, la distribución de las proporciones (o
79
porcentajes) obtenida de todas las muestras posibles del mismo tamaño, extraídas
de una población, es llamada la distribución en el muestreo de la proporción.
Error Estándar: La desviación estándar de una distribución, en el muestreo de un
estadístico, es frecuentemente llamada el error estándar del estadístico. Por
ejemplo, la desviación estándar de las medias de todas la muestras posibles del
mismo tamaño, extraídas de una población, es llamada el error estándar de la
media. De la misma manera, la desviación estándar de la población de todas las
muestras posibles del mismo tamaño, es llamada el error estándar de la población.
La diferencia entre los términos "desviación estándar" y "error de estándar" es que
la primera se refiere a los valores originales, mientras que la última está
relacionada con valores calculados. Un estadístico es un valor calculado, obtenido
con los elementos incluidos en una muestra.
Error muestral o error de muestreo La diferencia entre el resultado obtenido de
una muestra (un estadístico) y el resultado que deberíamos haber obtenido de la
población (el parámetro correspondiente) se llama el error muestral o error de
muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la
encuesta completa de la población, sino que se toma una muestra para estimar las
características de la población. El error muestral es medido por el error estadístico,
en términos de probabilidad, bajo la curva normal. El resultado de la media indica
la precisión de la estimación de la población basada en el estudio de la muestra.
Mientras más pequeño es el error muestral, mayor es la precisión de la
estimación. Deberá hacerse notar que los errores cometidos en una encuesta por
muestreo, tales como respuestas inconsistentes, incompletas o no determinadas,
no son considerados como errores muéstrales. Los errores no muéstrales pueden
también ocurrir en una encuesta completa de la población.
MÉTODOS DE SELECCIÓN DE MUESTRAS.
Una muestra debe ser representativa si va a ser usada para estimar las
características de la población. Los métodos para seleccionar una muestra
representativa son numerosos, dependiendo del tiempo, dinero y habilidad
80
disponibles para tomar una muestra y la naturaleza de los elementos individuales
de la población. Los métodos de selección de muestras pueden ser clasificados de
acuerdo a:

El número de muestras tomadas de una población dada para un estudio
y

La manera usada en seleccionar los elementos incluidos en la muestra.
Los métodos de muestreo basados en los dos tipos de clasificaciones son
expuestos en seguida.
MÉTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON EL NÚMERO
DE MUESTRAS TOMADAS DE UNA POBLACIÓN.
Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos
son, muestreo simple, doble y múltiple.
Muestreo simple
Este tipo de muestreo toma solamente una muestra de una población dada para el
propósito de inferencia estadística. Puesto que solamente una muestra es tomada,
el tamaño de muestra debe ser lo suficientemente grande para extraer una
conclusión. Una muestra grande muchas veces cuesta demasiado dinero y
tiempo.
Muestreo doble
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra
no es decisivo, una segunda muestra es extraída de la misma población. Las dos
muestras son combinadas para analizar los resultados. Este método permite a una
persona principiar con una muestra relativamente pequeña para ahorrar costos y
tiempo. Si la primera muestra arroja un resultado definitivo, la segunda muestra
puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la
primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una
calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja
una calidad intermedia, será necesaria la segunda muestra. Un plan típico de
81
muestreo doble puede ser obtenido de la Military Standard Sampling Procedures
and Tables for Inspection by Attributes, publicada por el Departamento de Defensa
y también usado por muchas industrias privadas. Al probar la calidad de un lote
consistente de 3,000 unidades manufacturadas, cuando el número de defectos
encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es
considerado bueno y es aceptado; si el número de defectos es 9 o más, el lote es
considerado pobre y es rechazado; si el número está entre 5 y 9, no puede
llegarse a una decisión y una segunda muestra de 80 unidades es extraída del
lote. Si el número de defectos en las dos muestras combinadas (incluyendo 80 +
80 = 160 unidades) es 12 o menos, el lote es aceptado si el número combinado es
13 o más, el lote es rechazado.
Muestreo múltiple
El procedimiento bajo este método es similar al expuesto en el muestreo doble,
excepto que el número de muestras sucesivas requerido para llegar a una
decisión es más de dos muestras.
MÉTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON LAS
MANERAS USADAS EN SELECCIONAR LOS ELEMENTOS DE UNA MUESTRA.
Los elementos de una muestra pueden ser seleccionados de dos maneras
diferentes:
a. Basados en el juicio de una persona.
b. Selección aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son
seleccionados mediante juicio personal. La persona que selecciona los elementos
de la muestra, usualmente es un experto en la medida dada. Una muestra de
juicio es llamada una muestra probabilística, puesto que este método está basado
en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no
puede ser empleada para medir el error de muestreo, Las principales ventajas de
82
una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es
bajo.
Muestreo Aleatorio
Una muestra se dice que es extraída al azar cuando la manera de selección es tal,
que cada elemento de la población tiene igual oportunidad de ser seleccionado.
Una muestra aleatoria es también llamada una muestra probabilística. Son
generalmente preferidas por los estadísticos porque la selección de las muestras
es objetiva y el error muestral puede ser medido en términos de probabilidad bajo
la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de
conglomerados.
Muestreo aleatorio simple
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra
posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la
población. Para obtener una muestra aleatoria simple cada elemento en la
población debe tener la misma probabilidad de ser seleccionado. El plan de
muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia,
este método pude ser reemplazado por una tabla de números aleatorios. Cuando
una población es infinita, es obvio que la tarea de numerar cada elemento de la
población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio
simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado
son sistemático, estratificado y de conglomerados.
Muestreo sistemático.
Una muestra sistemática se obtiene cuando los elementos son seleccionados en
una manera ordenada. La manera de la selección depende del número de
elementos incluidos en la población y el tamaño de la muestra. El número de
elementos en la población es, primero, dividido por el número deseado en la
muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo
elemento en la población va a ser seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemática puede dar la misma precisión de estimación acerca de la
83
población, que una muestra aleatoria simple cuando los elementos en la población
están ordenados al azar.
Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la población en
grupos, llamados estratos, que son más homogéneos que la población como un
todo. Los elementos de la muestra son entonces seleccionados al azar o por un
método sistemático de cada estrato. Las estimaciones de la población, basadas en
la muestra estratificada, usualmente tienen mayor precisión (o menor error
muestral) que si la población entera es muestreada mediante muestreo aleatorio
simple. El número de elementos seleccionado de cada estrato puede ser
proporcional o desproporcional al tamaño del estrato en relación con la población.
Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero se divide la población en
grupos que son convenientes para el muestreo. En seguida, se selecciona una
porción de los grupos al azar o por un método sistemático. Finalmente, se toman
todos los elementos o parte de ellos al azar o por un método sistemático. Bajo
este método, aunque no todos los grupos son muestreados, cada grupo tiene una
igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisión de las estimaciones acerca de la población) que
una muestra aleatoria simple del mismo tamaño. Los elementos individuales
dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la
gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir
en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La
variación entre los elementos obtenidos de las áreas seleccionadas es, por lo
tanto, frecuentemente mayor que la obtenida si la población entera es muestreada
mediante muestreo aleatorio simple. Esta debilidad puede reducirse cuando se
incrementa el tamaño de la muestra de área.
El incremento del tamaño de la muestra puede fácilmente ser hecho en el área.
Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área
84
para entrevistar más familias. Por lo tanto, una muestra grande puede ser obtenida
dentro de un corto período de tiempo y a bajo costo en un área determinada.
Por otra parte, una muestra de conglomerados puede producir la misma precisión
en la estimación que una muestra aleatoria simple, si la variación de los elementos
individuales dentro de cada conglomerado es tan grande como la de la población.
Muestreo aleatorio
Consideremos una población finita, de la que deseamos extraer una muestra.
Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos
de la población tengan la misma oportunidad de ser incluidos en dicha muestra,
denominamos al proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:

Sin reposición de los elementos;

Con reposición.
Muestreo aleatorio sin reposición
Consideremos una población E formada por N elementos. Si observamos un
elemento particular, e E en un muestreo aleatorio sin reposición se da la
siguiente circunstancia:

La probabilidad de que e sea elegido en primer lugar es 1/N

Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de
(N-1)/N), la probabilidad de que sea elegido en el segundo intento es de
1/(N-1).

en el (i+1) ésimo intento, la población consta de N-i elementos, con lo cual
si e no ha sido seleccionado previamente, la probabilidad de que lo sea en
este momento es de 1/(N-i).
Si consideramos una muestra de n  N elementos, donde el orden en la elección
de los mismos tiene importancia, la probabilidad de elección de una muestra
cualquiera es
85
Lo que corresponde en el sentido de la definición de probabilidad de Laplace a un
caso posible entre las VN, n posibles n-uplas de N elementos de la población.
Si el orden no interviene, la probabilidad de que una muestra
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus nuplas, tantas veces como permutaciones en el orden de sus elementos sea
posible, es decir
Muestreo aleatorio con reposición
Sobre una población E de tamaño N podemos realizar extracciones de n
elementos, pero de modo que cada vez el elemento extraído es repuesto al total
de la población. De esta forma un elemento puede ser extraído varias veces. Si el
86
orden en la extracción de la muestra interviene, la probabilidad de una cualquiera
de ellas, formada por n elementos es:
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma
de la anterior, repitiéndola tantas veces como manera de combinar sus elementos
sea posible. Es decir,
Sea n1 el número de veces que se repite cierto elemento e1 en la muestra;
Sea n2 el número de veces que se repite cierto elemento e2;
Sea nk el número de veces que se repite cierto elemento ek,
de modo que
. Entonces la probabilidad de obtener la
muestra es
es decir,
87
El muestreo aleatorio con reposición es también denominado muestreo aleatorio
simple, que como hemos mencionado se caracteriza por que

cada elemento de la población tiene la misma probabilidad de ser elegido, y

las observaciones se realizan con reemplaza miento. De este modo, cada
observación es realizada sobre la misma población (no disminuye con las
extracciones sucesivas).
Sea X una variable aleatoria definida sobre la población E, y f(x) su ley de
probabilidad.
En una muestra aleatoria simple, cada observación tiene la distribución de
probabilidad de la población:
Además todas las observaciones de la variable aleatoria son independientes, es
decir
TABLAS DE NÚMEROS ALEATORIOS: LOTERÍA NACIONAL
Un ejemplo de una tabla de números aleatorios consiste en la lista de los números
de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por
que cada dígito tiene la misma probabilidad de ser elegido, y su elección es
independiente de las demás extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de
números aleatorios de k=5 cifras (00000-99.999), una población de N=600
individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso
ordenamos a toda la población (usando cualquier criterio) de modo que a cada
88
uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar
nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto
extraemos un número t, y tomamos como primer elemento de la muestra al
elemento de la población:
El proceso se repite tomando los siguientes números de la tabla de números
aleatorios, hasta obtener la muestra de 10 individuos.
Las cantidades
pueden ser consideradas como observaciones de una variable aaleatoria U, que
sigue una distribución uniforme en el intervalo [0,1]
MÉTODO DE MONTECARLO
El método de Montecarlo es una técnica para obtener muestras aleatorias simples
de una variable aleatoria X, de la que conocemos su ley de probabilidad (a partir
de su función de distribución F). Con este método, el modo de elegir
aleatoriamente un valor de X es siguiendo su ley de probabilidad:
1. Usando una tabla de números aleatorios se toma un valor u de una variable
aleatoria
89
.
2. Si X es continua, tomar como observación de X, la cantidad x=F-1(u). En el caso
en que X sea discreta se toma x como el percentil
de X, es decir el valor
más pequeño que verifica que
.
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.
Ejemplo
Si queremos extraer n=10 muestras de una distribución N(0, 1) podemos recurrir a
una tabla de números aleatorios de k=5cifras, en las que observamos las
cantidades (por ejemplo)
A partir de ellas podemos obtener una muestra de
de la distribución normal:
90
usando una tabla
Números aleatorios Muestra
Muestra
ti
xi = F-1(ui)
76.293
0'76
0'71
31.776
0'32(=1-0'68)
-0'47
50.803
0'51
0'03
71.153
0'71
0'55
20.271
0'20(=1-0'80)
-0'84
33.717
0'34(=1-0'66)
-0'41
17.979
0'18(=1-0'82)
-0'92
52.125
0'52
0'05
41.330
0'41(=1-0'59)
-0'23
95.141
0'95
1'65
Obsérvese que como era de esperar, las observaciones xi tienden a agruparse
alrededor de la esperanza matemática de
. Por otra parte,
esto no implica que el valor medio de la muestra sea necesariamente
. Sin
embargo como sabemos por el teorema de Fisher que
su dispersión con respecto al valor central es pequeña, lo que implica que
probablemente el valor medio
estará muy próximo a 0, como se puede calcular:
91
Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos
las observaciones xi y que el mecanismo que generó esos datos hubiese sido una
distribución normal de parámetros desconocidos, con
obtenida hubiésemos
tenido una buena aproximación del ``parámetro desconocido''
. Sobre esta
cuestión volveremos más adelante al abordar el problema de la estimación puntual
de parámetros.
92
10
UNIDAD
10. ESTIMACIÓN E INTERVALOS DE
CONFIANZA
Características
Determinación del intervalo de
confianza para la media, el total y la
proporción
Muestras grandes. Distribución
normal
Muestras pequeñas
93
ESTIMACIÓN E
INTERVALOS DE
CONFIANZA
INTERVALO DE CONFIANZA.
El tema a desarrollar es intervalo de Confianza y haciendo referencia a Richard I.
Levin & David S. Rubin, en su libro de “Estadística para Administradores”,
establecen el concepto de Intervalo de Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real
del parámetro de población.
Para entender mas claramente este concepto, es necesario comentar de inicio
otros que al estar relacionados con el, facilitan su comprensión.
Algunos de estos conceptos a revisar son:

Estimación.

Estimación Puntual.

Estimación de intervalo.

Nivel de confianza.

Limites de confianza
ESTIMACIÓN
Aprecio y valor que se da y en que se tasa y considera algo. || 2. Der. La que se
realiza en ciertos tributos para determinar el valor de la base imponible.
Este es el concepto que podemos encontrar en un diccionario. Pero es además un
concepto que en nuestra vida diaria aplicamos de forma recurrente.
Todo el mundo hace estimaciones. Para cruzar una calle, y vemos venir un auto,
estimamos la velocidad de este y la distancia que hay entre nosotros y el
automóvil a fin de decidir si esperamos a cruzar o echaremos a correr para cruzar
la calle.
94
Implícito esta en este ejemplo una de la razones para hacer estimaciones como
administradores, jefes o lideres de equipo: Tomar decisiones en base a un cálculo,
una estimación.
Los administradores deben hacer estimaciones rápidas, el resultado de estas
incide en la organización por medio de la decisión tomada a partir de la
estimación. Se hacen estimaciones en:

Una universidad para determinar el nivel de inscripciones año con año.

En un buró de crédito, a fin de determinar si un cliente puede terminar de
pagar su deuda en un determinado tiempo, a partir de sus hábitos de
crédito previos, lo que vendría a ser el historial.

Para fijar presupuestos, con base a información del pasado.
En cada uno de estos casos se esta tratando de inferir, saber algo de una
población a partir de una muestra, como tomadores de decisiones, nos veremos
muchas veces forzados a tomar decisiones confiando en nuestro instinto en
nuestros presentimientos, pero lo ideal cada uno en su posición, seria que estas
decisiones estuvieran tomadas a partir de la disposición de información y aplicar
conocimientos de estadística para desempeñarnos mejor.
Concluimos de inicio para el Concepto de Estimación que las razones para su
aplicación son las siguientes:
1. Con el fin de tomar decisiones racionales, para el beneficio de la organización.
2. Inferir algo, acerca a partir de la información de la muestra., a partir de métodos
con precisión razonable, todo este proceso debe ser capaz de proveer de
información para desempeñarnos de la mejor manera en la toma de decisiones.
Existen dos tipos de estimación, en lo que se refiere a una población.

Estimación puntual.

Estimación de Intervalo.
95
Este último concepto nos ayudara a entender el concepto objetivo de nuestra
exposición que es Intervalo de Confianza.
ESTIMACIÓN PUNTUAL
Una estimación puntual es un solo número que se utiliza para estimar un
parámetro (dato) de población desconocido.
Ejemplo: El jefe de una Universidad estaría haciendo una estimación puntual al
afirmar: “Para el siguiente año escolar por nuestros datos actuales se indica que
en la materia de Filosofía y letras tendremos 350 estudiantes”.
La afirmación es similar a lanzar una moneda al aire: o es cierta o es falsa, solo
tiene dos opciones. Por lo tanto una estimación puntual resulta a menudo
insuficiente, debido a que solo tiene dos opciones: es correcta o esta equivocada.
Además si se nos dice que el jefe de departamento esta equivocado en su
estimación, se generarla la siguiente pregunta. ¿Que tan distante esta la
estimación de la real? Es decir que estimación de error posee. No es lo mismo
decir que la estimación esta errada por 10 estudiantes que por 90, la diferencia lo
establece un concepto: CONFIABILIDAD.
Ejemplo de Estimación Puntual: La media de la muestra es un estimador de la
media de la población confiable, sobre todo cuando la muestra es lo
suficientemente grande. Pero es una estimación puntual pues solo arroja un
resultado.
Para explicarlo, aun cuando ya es un tema visto, haremos revisión de la formula:
X = ∑x
n
Donde: ∑x, es la sumatoria de todos los elementos de la muestra.
Y n, es el numero de elementos.
Observemos el ejemplo de una compañía de suministros clínicos que produce
jeringas hipodérmicas desechables. Cada jeringa viene en una envoltura estéril
que a su vez viene empacada en grandes cajas de cartón corrugado. Debido a la
96
forma en que empacan las jeringas en las cajas de cartón, están manejan una
cantidad de contenido diferente, debido a que las jeringas se venden por pieza, la
compañía necesita una estimación del número de pieza que hay por caja, para
propósitos de facturación.
Se tomo la muestra aleatoria de 35 cajas, y se registro el número de jeringas
contenido en dicha muestra:
101
103
112
102
98
97
93
105
100
97
107
93
94
97
97
100
110
106
110
103
99
93
98
106
100
112
105
100
114
97
110
102
98
112
99
Utilizando la formula, tendremos: 3570/35=102 jeringas.
Así pues al usar la media de la muestra, como nuestro estimador, la estimación
puntual de la media es de 102 jeringas.
La conclusión a la que llegaríamos con el anterior ejemplo seria:
Así al usar la media de la muestra como un estimador, la estimación puntual de la
jeringa hipodérmica desechable es de 102 jeringas por caja. El precio de
fabricación es bastante bajo (alrededor de 25 centavos), de modo que tanto el
comprador como el vendedor aceptarían esta estimación puntual como la base
para hacer la facturación, y el fabricante puede ahorrarse tiempo y el gasto de
contar cada una de las jeringas contenidas en las cajas.
El propósito de tomar muestras es para conocer mas acerca de una población, ya
sea, los estudiantes de ingreso al próximo ciclo escolar, o el total de un embarque
de jeringas hipodérmicas, como en el ejemplo anterior, cuyo análisis partió de una
muestra de 35 cajas.
Para hacerlo, podemos basarnos en estimaciones puntuales, como lo es la media
de la muestra, o con Estimaciones de intervalo, nuestro siguiente tema.
97
ESTIMACIÓN DE INTERVALO.Una estimación de Intervalo, describe un intervalo de valores dentro del cual es
posible que este un parámetro de población.
Dentro de sus características encontramos:

Dentro de las estimaciones de Intervalo, se maneja un concepto adicional,
que implica la incertidumbre que acompañara dicha estimación.

Una afirmación acerca del intervalo dentro del cual es probable que este la
media de población desconocida.

Para proporcionar dicha afirmación, se necesita encontrar el error estándar
de la media.
Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:
Suponga que el director de investigaciones de mercado de una fábrica de
refacciones automotrices necesita hacer una estimación de la vida promedio de
las baterías para automóvil que su compañía produce. Se selecciona una muestra
aleatoria de 200 baterías, se registro en nombre de los propietarios de los
automóviles y su dirección, de la misma manera se entrevisto a estas personas
con respecto a la duración de la batería de su automóvil. Después de realizar la
aplicación de la formula de la media de la muestra, tenemos como resultado: 36
meses de vida promedio.
Si se utiliza la estimación puntual de la media de la muestra como el mejor
estimador de la media de la población µ se informaría que la vida media de las
baterías de la empresa es de 36 meses.
Pero supongamos que el director también conocer acerca de la incertidumbre que
probablemente acompañara a la estimación, es decir una afirmación acerca del
intervalo dentro de lo cual es posible que este la media de la población
desconocida. Eso se determina calculando el error estándar de la media.
Para esto se utiliza la formula de cálculo de error estándar de la media:
𝜎
𝜎𝑥 =
√𝑛
Donde  es la desviación estándar y n el número de observaciones.
98
Supongamos que previamente se hizo el cálculo de la desviación estándar de las
200 baterías, y se ha determinado que es de 10 meses. Utilizando dicho dato y la
formula que indicamos en el recuadro anterior. Resultaría así: =0.707 meses
Ahora se puede concluir que la estimación de la vida útil de un las baterías de la
compañía es de 36 meses, y el error estándar que acompaña a dicha estimación
es .707. En otras palabras, la vida útil real para todas las baterías puede estar en
alguna parte de esta estimación de intervalo comprendida entre 35.293 y 36.707
meses.
Nos hemos acercado ya entonces al concepto inicial de la exposición, Intervalo de
confianza, a fin de entender Estimación de Intervalo, marcando su diferencia con
Estimación Puntual.
Recordemos el concepto de Richard I. Levin & David S. Rubin, en su libro de
“Estadística para Administradores”, establecen el concepto de Intervalo de
Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real
del parámetro de población.
Porque hacemos esto, para entender el concepto de Nivel de confianza de un
Intervalo, esto es la probabilidad de que el verdadero parámetro de la estimación
este dentro de la estimación de intervalo.
Es decir apoyándonos en el ejemplo de las 200 baterías, cuantas de estas caerían
dentro del intervalo en donde se encuentra la media de la muestra., con los limites
que hemos establecidos con la formula de Error estándar de la media.
NIVEL DE CONFIANZA.En la estadística la probabilidad que asociamos o relacionamos con una
estimación de intervalo es conocida como Nivel de Confianza.
Que tanta confianza tenemos que la estimación que hicimos de un intervalo,
incluya la mayor parte de la muestra, es decir los casos analizados.
Analicemos un caso práctico:
Considere por ejemplo el caso de un cliente de una tienda de electrodomésticos
que pregunta sobre el tiempo de espera para la entrega de una lavadora de ropa
nueva. En la tabla se aprecia las preguntas que el cliente puede hacer y las
99
probables respuestas. Si se observa se puede ver que existe una relación directa
entre el nivel de confianza y el intervalo de confianza de cualquier estimación.
Pregunta del
Respuesta del
Nivel de
Cliente
Empleado.
Confianza
¿Llegara la
lavadora en un
año?
Tengo la certeza de Mayor a
ello.
99%
¿Me entregaran la
Estoy casi seguro
lavadora dentro de
de que llegara en
un mes?
un mes.
¿Me entregaran la
lavadora en una
semana?
Al menos
95%
Estoy bastante
Alrededor
seguro.
de 80%
¿Me entregaran la No tengo la certeza Cerca de

lavadora mañana?
de poder hacerlo.
¿Llegara la
Hay una mínima
lavadora antes de
posibilidad de
que llegue a casa?
poder lograrlo.
40%
Cerca de
1%
Intervalo de
Confianza
Implicado
Un año.
Un mes
Una semana
Un día
Una hora.
Se nota que cuando el intervalo de confianza es más amplio o extenso,
como en el caso de la entrega que tarda un año, la estimación toma un
valor muy poco real, a pesar de que el administrador le da un nivel de
confianza de 99% a dicha estimación.

A medida que el cliente estable un intervalo mas estrecho (el tiempo de
entrega), el administrador de la tienda consiente un nivel de confianza mas
bajo, ¿llegara la lavadora antes que llegue yo a casa?, la estimación de
confianza tiene un nivel muy bajo (1%).
Encontramos de esta forma el intervalo de confianza del anterior ejemplo:
100
N.C.
Intervalo
Mayor a
99%
Un año.
Al menos
95%
Un mes
LIMITES DE CONFIANZA.A menudo el intervalo de confianza se expresa en términos de errores estándar,
más que con valores numéricos. De la siguiente forma.
x ± 1.64 σ x en la que:
x + 1.64 σ x = limite superior del intervalo.
x - 1.64 σ x = limite inferior del intervalo.
A estos límites se les conoce como limites de Confianza del intervalo de
Confianza. (LIC)
BIBLIOGRAFÍA
-
Larios Osorio, Víctor. Probabilidad. México, 1999.
-
Lind, Douglas A.
Estadística aplicada a los negocios
y la economía.
México, Mc. Graw Gill, 2005
-
Lind, Marchal, Mason. Estadística para administración y economía. México,
Alfa omega, 2006
-
Newbold, P. Estadística para los negocios y la Economía. México, Pearson,
2005
-
Rodas, Olger. Teoría básica del Muestreo. México, 2003.
-
Stevenson, J. William Estadística para administración y economía. México,
Alfa omega, 2006
101
-
Universidad de Málaga. Muestreo Aleatorio. México, 2002.
-
Vega Trujillo, María del Pilar. Distribución de Frecuencias. México, 2005.
-
Zadu, Inés. Distribuciones de Probabilidad. México, 2004.
102
Descargar