TecnicasCuatitativasClase 7 - Muestreo y Estimación

Anuncio
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Técnicas
Cuantitativas para el
Management y los
Negocios
Mag. María del Carmen Romero – 2014
[email protected]
Módulo II
Módulo II: ESTADÍSTICA INFERENCIAL
Contenidos
Unidad 4. Probabilidad
Conceptos básicos de probabilidad: experimento aleatorio, espacio muestral y evento. Probabilidad.
Definición. Enfoques de la probabilidad: clásico, de la frecuencia relativa y subjetivo. Probabilidad simple.
Cálculo de probabilidades: regla de la adición y de la multiplicación. Conceptos de exclusión e
independencia. Probabilidad condicional. Teorema de Bayes.
Unidad 5. Variables Aleatorias
Variables aleatorias discretas y continuas. Función de probabilidades. Indicadores de posición y dispersión.
Esperanza matemática. Varianza y desviación estándar. Interpretación y aplicaciones de la esperanza y la
desviación estándar.
Unidad 6. Algunas distribuciones de probabilidad especiales
Distribuciones discretas. Ensayos Bernoulli. Distribución Binomial, hipergeométrica y Poisson
Distribuciones continuas. Distribución Normal. Distribución estandarizada. Aproximación Normal de las
distribuciones Binomial y Poisson. Distribución t de Student, Chi-cuadrado y F de Fisher. Aplicaciones.
Unidad 7. Muestreo y Estimación
Nociones básicas de muestreo. Distribuciones muestrales en poblaciones infinitas y finitas. Teorema central
del límite. Estimación y estimador. Estimación puntual. Propiedades deseables de los estimadores.
Principales estimadores puntuales. Estimación por intervalos. Intervalos de confianza para la media,
proporción y varianza. Cálculo del tamaño muestral. Aplicaciones.
Unidad 8. Prueba de hipótesis
Conceptos básicos. Hipótesis estadística. Hipótesis nula y alternativa. Estadígrafo de contraste. Región
crítica y región de aceptación. Error de Tipo I y de Tipo II. Nivel de significación y potencia. Tipo de
contraste. p-valor. Contrastes de hipótesis referentes a media, proporción y varianza poblacional.
Aplicaciones.
Mag. María del Carmen Romero
1
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo y Estimación
Contenidos
Nociones básicas de muestreo. Distribuciones
muestrales en poblaciones infinitas y finitas.
Teorema central del límite. Estimación y
estimador. Estimación puntual. Propiedades
deseables de los estimadores. Principales
estimadores puntuales. Estimación por intervalos.
Intervalos de confianza para la media, proporción
y varianza. Cálculo del tamaño muestral.
Aplicaciones.
Muestreo y Estimación
Etapas de una investigación
Formulación o definición del problema
Diseño de la investigación
Recolección de los datos
Organización y descripción de los datos
Decisión o inferencia final
Mag. María del Carmen Romero
2
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo y Estimación
Decisión o inferencia final
Consiste en responder la pregunta original
planteada en la formulación del problema (que
siempre se refiere a la población).
Si se trabajó con toda la población, pueden
tomarse decisiones acerca del problema.
Si se trabajó con una muestra, es necesario
realizar inferencias acerca de la población
basándose en la información contenida en una
muestra
extraída
de
ella.
ESTADÍSTICA
INDUCTIVA o INFERENCIAL
Muestreo y Estimación
Decisión o inferencia final
Se emplean los estadísticos (muestra) para
estimar los parámetros (población). ESTIMACIÓN
Los datos de la muestra se usan para corroborar o
rechazar
alguna
hipótesis
planteada.
COMPROBACIÓN DE HIPÓTESIS
Mag. María del Carmen Romero
3
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Muestreo
La inferencia estadística se define como la
colección de técnicas que permiten formular
inferencias inductivas y que proporcionan una
medida del riesgo de éstas.
Si se obtiene una muestra técnicamente buena, puede
contener información útil con respecto al estado de la
naturaleza y a partir de ello se podrán formular inferencias.
(se está sujeto a riesgo dado que representan un
razonamiento que va de lo particular a lo general)
Mag. María del Carmen Romero
4
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Selección de una muestra
Para poder generalizar los valores muestrales a la
población, es necesario tener en cuenta:
• Tamaño de la muestra (n)
• Método de selección de la muestra
Muestreo
Selección de una muestra
“Buena muestra”
El proceso proporciona, a cada objeto de la
población, una oportunidad igual e independiente
de ser incluido en la muestra.
Debe asegurar que cada muestra de tamaño n
tenga la misma probabilidad de ser seleccionada.
Muestra aleatoria
simple
Mag. María del Carmen Romero
5
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Situación 1
Población: Constituida por un número infinito de posibles
resultados (objetos no tangibles)
Variables: nivel de concentración de un contaminante,
demanda de un producto, tiempo de espera de un servicio.
Muestreo aleatorio con reemplazo
Cada una de las observaciones X1, X2, …, Xn es una variable
aleatoria cuya distribución de probabilidad es igual a la de la
población
Muestreo
Situación 2
Población: Constituida por un número finito de objetos
tangibles (seres humanos, animales, componentes
mecánicos o eléctricos, etc.).
Variables: opinión de una persona, tiempo de duración de
un componente, etc.
Muestreo aleatorio con reemplazo.
X1, X2, …, Xn conjunto de variables aleatorias independientes
e idénticamente distribuidas (IID).
(la distribución de probabilidad es igual a la de la población)
Mag. María del Carmen Romero
6
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Situación 3
Muestreo aleatorio sin reemplazo
Cada una de las observaciones X1, X2, …, Xn es una variable
aleatoria cuya distribución de probabilidad es igual a la de la
población pero no son independientes
Muestreo
La Situación 2 es un caso particular de la
Situación 1.
Si el tamaño de la población es pequeño,
puede preferirse el muestreo aleatorio sin
reemplazo.
Si la población es muy grande, es irrelevante si
el muestreo se hace con o sin reemplazo.
Mag. María del Carmen Romero
7
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Muestra aleatoria
(base teórica necesaria para la inferencia)
Todo muestreo probabilístico (sistemático,
estratificado, conglomerados) se basa en el
concepto de muestra aleatoria.
Muestreo
Parámetro
Caracterización numérica de la distribución de
población de manera que describe, parcial
completamente, la función de densidad de
característica de interés (µ, σ2, σ, p).
la
o
la
Estadístico
Variable aleatoria.
Cualquier función de las variables aleatorias que
observaron en la muestra de manera que esta función no
contiene cantidades desconocidas (x, s2, s, proporción
estimada).
Mag. María del Carmen Romero
8
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Los parámetros o sus funciones se estiman
con base en estadísticos que, a su vez, se
obtienen a partir de la información
contenida en una muestra aleatoria
Muestreo
Muestra de n variables aleatorias IID
Función de densidad que depende de un parámetro
desconocido θ
Estadísticos
Si se emplea un estadístico T para estimar un
parámetro desconocido θ , T es el estimador de
θ y el valor específico de t como un resultado de
los datos muestrales es la estimación de θ
Mag. María del Carmen Romero
9
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Ejemplo
Duración promedio de cierta clase de batería
Idénticos procesos de manufactura y materiales
Se seleccionan aleatoriamente cinco pilas diarias
durante 20 días
Prueba de duración (se registra el tiempo de
operación)
20 muestras aleatorias distintas donde cada una
contiene 5 variables aleatorias IID (independientes
idénticamente distribuidas)
Cada muestra diaria proporciona una estimación de la
duración promedio de las baterías
Muestreo
Estadístico: variable aleatoria
Variabilidad
Mag. María del Carmen Romero
10
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
La distribución en el muestreo de un estadístico
es la distribución de probabilidad del estadístico
que puede obtenerse como resultado de un
número
infinito
de
muestras
aleatorias
independientes, cada una de tamaño n,
provenientes de la población de interés.
Hace posible realizar un análisis de probabilidad
para valorar el riesgo inherente cuando se
formulan inferencias.
Muestreo
Distribución en el muestreo de la media
Muestreo con reemplazo
Muestreo sin reemplazo
Mag. María del Carmen Romero
11
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Distribución en el muestreo de la media
Si la distribución de la variable poblacional es
normal
Distribución normal de las medias
muestrales
Si no se conoce la distribución de la variable
Si n ≥ 30
Distribución normal de
las medias muestrales
Si 15 ≤ n < 30 y la distribución es
aproximadamente simétrica
Distribución normal de
las medias muestrales
Si n < 15 …
Muestreo
Teorema central del límite
Mag. María del Carmen Romero
12
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Muestreo
Distribución en el muestreo de la varianza
Distribución en el muestreo de la proporción
Distribución en el muestreo de la diferencia entre
dos medias muestrales
Distribución en el muestreo de poblaciones finitas
…
Muestreo
Distribución en el muestreo de la varianza
Mag. María del Carmen Romero
13
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación
Estimación
Los estadísticos se emplean para estimar los
valores de parámetros desconocidos o funciones
de éstos.
La estimación de un parámetro involucra el uso de
los datos muestrales en conjunción con algún
estadístico.
Estimación puntual
Estimación por intervalos
Mag. María del Carmen Romero
14
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación
Estimación puntual
¿Cómo seleccionar un buen estimador de θ?
¿Con qué criterios puede decirse si un estimador
es “bueno” o “malo”?
El problema es encontrar una función que
proporcione la “mejor” estimación del parámetro θ
El estimador de un parámetro debe tener una
distribución de muestreo concentrada alrededor del
parámetro y la varianza debe ser la menor posible
Estimación puntual
Propiedades deseables de los estimadores
Insesgado
Es deseable que un estimador tenga una media
igual a la del parámetro que se está estimando
Consistente
Es razonable esperar que un buen estimador de un
parámetro sea cada vez mejor conforme crece el
tamaño de la muestra
Insesgado de mínima varianza
Eficiente
Debe buscarse aquél
estimador insesgado
con mínima varianza
Una estadística suficiente para un parámetro es
aquélla que utiliza toda la información contenida en
la muestra aleatoria con respecto al parámetro
Mag. María del Carmen Romero
15
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación puntual
Algunos métodos de estimación puntual
Máxima verosimilitud
En general, proporciona estimadores que
son funciones de estadísticas suficientes,
estimadores eficientes y sesgados.
Momentos
Mínimos cuadrados
Estimación puntual
Ejemplo
Interesa conocer el ingreso promedio de nuestros
potenciales compradores y se toma una muestra de n
individuos aletoriamente seleccionados: {X1,... Xn}
Dos estimadores de la media podrían ser:
µˆ1 = x1
n
µˆ 2 = ∑ X i
i =1
1
n
Ambos son insesgados
Pero
var( µˆ1 ) = σ 2
var( µˆ 2 ) = σ 2 / n
El segundo es más eficiente que el primero
Mag. María del Carmen Romero
16
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación puntual
Estimador de la media poblacional
Sea X una v.a. con E(X)=µ (media poblacional)
desconocida
∞
µ = ∑ xi pi
i =1
Un estimador de µ es la “media muestral” (n
tamaño muestral, muestra aleatoria IID)
n
µˆ = X = ∑ X i
i =1
¿Parámetro?
¿Estadístico?
¿Estimador?
¿Estimación?
1
n
Estimación puntual
Estimador de la varianza poblacional
Sea X una v.a. con var(X)=σ2 (varianza poblacional)
desconocida
∞
σ = ∑ ( X i − µ )2 pi
2
i =1
Un estimador de σ2 es la “varianza muestral”
N
∑ ( X − X)
i
S=
i=1
n −1
Mag. María del Carmen Romero
2
¿Parámetro?
¿Estadístico?
¿Estimador?
¿Estimación?
¿Por qué el denominador de S
es (n-1)?
17
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación puntual
Estimador de la proporción poblacional
Si se tiene una población con Distribución Binomial
(1: éxito, 0: fracaso) la probabilidad de éxito
puede ser estimada como:
pˆ =
n: tamaño muestral
# exitos
n
¿Parámetro?
¿Estadístico?
¿Estimador?
¿Estimación?
Estimación puntual
Problemas de la estimación puntual
El valor obtenido sólo da una idea aproximada del
verdadero valor del parámetro a estimar
No se conoce el grado de bondad de la
aproximación, esto es, en qué medida el valor
obtenido se aproxima al verdadero valor del
parámetro estimado.
Estimación por intervalos
Mag. María del Carmen Romero
18
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Una tienda mantiene muy buenos registros con
respecto al número de unidades de cierto producto que
vende mensualmente. Para la tienda es muy importante
conocer la demanda promedio ya que con base a ésta
se lleva a cabo el mantenimiento del inventario.
Suponer que la demanda del producto no se ve
afectada por fluctuaciones en la temporada.
Media muestral de la demanda (calculada en base a los
últimos 36 meses) = 200 unidades
¿Implica que la demanda media desconocida no es
mayor de 250 ni menor de 150?
No se tiene indicación del posible error en el estimador
puntual.
Estimación por intervalos
Estimación por intervalos
Para la estimación del intervalo se consideran, tanto el
estimador
puntual
del
parámetro
como
su
distribución de muestreo, con el objetivo de
determinar
un
intervalo
que
con
cierta
seguridad/confianza (1-α) contiene al parámetro (θ).
El intervalo de confianza se construye teniendo en
cuenta:
• Estimador
• Desviación estándar del estimador
• Confianza
Mag. María del Carmen Romero
19
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Notación:
P (xinf < θ < xsup) = (1-α)
IC (xinf ; xsup) con una confianza (1-α)
El parámetro u es fijo, xinf y xsup son variables
aleatorias
Estimación por intervalos
IC para µ cuando se muestrea
de una distribución normal con varianza conocida
(distribución normal)
Mag. María del Carmen Romero
20
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
P (xinf < θ < xsup) = (1-α)
IC (xinf ; xsup) con una confianza (1-α)
Interpretación
La probabilidad de que el intervalo planteado contenga al
parámetro θ es (1-α)
Si se obtienen muestras aleatorias del mismo tamaño en
forma repetida de una población, y cada vez que se
seleccionan se calculan los valores específicos, debe
esperarse que el (1-α)% contengan el valor del parámetro
desconocido.
La probabilidad que el parámetro desconocido tome
valores entre xinf y xsup es (1-α)
Estimación por intervalos
Si se repitiera muchas veces el experimento con
muestras extraídas al azar, se verificaría que:
el 100 (1-α)% de las
ocasiones, se
obtendrían xinf y xsup
de los intervalos de
confianza
correspondientes
que contendrían al
verdadero valor del
parámetro µ,
mientras que el
100α% restante, no
lo contendrían
Mag. María del Carmen Romero
21
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Estimación por intervalos
Intervalo de confianza para la media µ de
una distribución normal de varianza
conocida
Mag. María del Carmen Romero
22
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Intervalo de confianza para la media µ de
una distribución normal de varianza
conocida
Estimación por intervalos
Intervalo de confianza para la media µ de
una distribución desconocida de varianza
conocida
n es lo suficientemente
grande (n ≥30)
Mag. María del Carmen Romero
23
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Intervalo de confianza para la media µ de
una distribución normal de varianza
desconocida
Si n es lo suficientemente grande (n ≥30), se
aproxima a una distribución normal
Estimación por intervalos
Intervalo de confianza para la varianza y el
desvío estándar de una distribución normal
Mag. María del Carmen Romero
24
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Intervalo de confianza para la proporción
Con reemplazo
Sin reemplazo
IC para la proporción considerando que las
proporciones se distribuyen normalmente?
Estimación por intervalos
IC para la diferencia de medias cuando se muestrean dos
distribuciones normales independientes:
con varianzas conocidas (distribución normal)
con varianzas desconocidas e iguales (distribución t-student)
IC para el cociente de dos varianzas cuando se muestrean
dos distribuciones normales independientes
(distribución F)
Mag. María del Carmen Romero
25
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Tamaño muestral
Cálculo del tamaño muestral
Depende de qué parámetro se quiere estimar.
Tiene en cuenta el error máximo que se está
dispuesto a “tolerar”, el nivel de confianza y la
variabilidad.
Estimación de la
media (con varianza
conocida y
distribución normal)
¿Si se quiere estimar la proporción?
Ejemplo
Mag. María del Carmen Romero
26
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Problema:
El dueño de una librería que está localizada cerca
del campus de una universidad quiere iniciar una
campaña de marketing. Para ello, necesita conocer
el promedio del dinero que gastan anualmente sus
clientes en la librería.
Se supone, a partir de estudios anteriores, que el
desvío estándar de los gastos de los clientes es
$11.5 (en cientos).
Estimación por intervalos
a) Calcular los intervalos de confianza para la
media poblacional considerando los siguientes
niveles de confianza – para un tamaño de muestra
de 64 con una media muestral de $28 (en cientos):
i. 0.90
ii. 0.95
iii. 0.99
¿Qué sucede con la amplitud de los intervalos a
medida que se incrementa el nivel de confianza?
¿Qué justificación encuentra a esto?
Mag. María del Carmen Romero
27
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Datos:
Variable: “Gasto mensual de los clientes en la
librería”
Forma de la distribución: desconocida
n = 64
σ = $ 11.5
x = $ 28
Estimación de un intervalo de confianza para la
media poblacional:
Varianza conocida
n ≥ 30
Por T. Central del Límite:
LI = x − z c σ / n y LS = x + zc σ / n
Estimación por intervalos
(1-α)
0.90
0.95
0.99
zc
1.64
1.96
2.58
LI
$ 25.64
$ 25.18
$ 24.29
LS
$ 30.36
$ 30.82
$ 31.71
0.28
0.28
0.28
0.21
0.21
0.21
0.14
0.14
0.14
0.07
0.07
0.07
0.00
20.75
24.38
28.00
31.62
Medias Mues trales
Mag. María del Carmen Romero
35.25
0.00
20.75
24.38
28.00
31.62
Med ias Mu es tra le s
35.25
0.00
20.75
24.38
28.00
31.62
35.25
Medias Mues trales
28
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
b) Calcular los intervalos de confianza para la
media poblacional considerando los siguientes
tamaños de muestra – para un nivel de confianza
del 95% y una media muestral de $28:
i. 64
ii. 100
iii. 1000
¿Qué sucede con la amplitud de los intervalos a
medida que se incrementa el tamaño de muestra?.
¿Qué justificación encuentra a esto?.
Estimación por intervalos
n
64
100
1000
zc
1.96
1.96
1.96
LI
$ 25.18
$ 25.75
$ 27.64
LS
$ 30.82
$ 30.25
$ 28.36
Amplitud del
interv.
$ 5.64
$ 4.5
$ 0.72
Mag. María del Carmen Romero
29
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
c) Presentar un informe al dueño de la librería con
la estimación de un intervalo de confianza para la
media poblacional considerando un riesgo del 5%.
En dicho se informe se debe incluir información
acerca:
Límites del intervalo
Tamaño de muestra
Nivel de confianza y riesgo
Explicación
sencilla
de
los
anteriores y del método empleado
términos
Estimación por intervalos
Debido a la cercanía que tiene la librería al campus
estatal y a que la mayoría de sus clientes son
estudiantes de la universidad, el dueño está
pensando en vender CDs educativos relacionados
con cursos como estadística, cálculo y contabilidad.
Para ello, a los mismos 64 clientes seleccionados,
se les preguntó - además del gasto promedio
mensual en la librería - si considerarían la compra
de dichos CDs (48 de ellos respondieron que sí la
considerarían).
Estimar un intervalo de confianza del 90% de
confianza para la proporción de la población de
clientes que considerarían la compra de los CDs.
Mag. María del Carmen Romero
30
Técnicas Cuantitativas para el
Manag. y los Negocios - Clase 7
Segundo cuatrimestre - 2014
Estimación por intervalos
Datos:
Variable: “Proporción de clientes que tendrían en
cuenta la compra de CDs”
n = 64
p̂ = 48/64 = 0.75
Forma de la distribución: desconocida
Estimación de un intervalo de confianza para la
proporción poblacional:
n ≥ 30
Por T. Central del Límite:
ˆ ˆ /n y LS = pˆ + z c pq
ˆ ˆ /n
LI = pˆ − z c pq
Mag. María del Carmen Romero
31
Descargar