Fundamentos de Estadística

Anuncio
0.5 setgray0 0.5 setgray1
Fundamentos de Estadística
Introducción a la Estadística
Prof.
Dr.
Eduardo Valenzuela Domı́nguez
[email protected]
Universidad Técnica Federico Santa Marı́a
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 1/6
Introducción
Modelación
Realidad versus Modelo
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6
Introducción
Modelación
Realidad versus Modelo
•
Modelos Deterministicos
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6
Introducción
Modelación
Realidad versus Modelo
•
Modelos Deterministicos
•
Modelos no-Deterministicos
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6
Introducción
Modelación
Realidad versus Modelo
•
Modelos Deterministicos
•
Modelos no-Deterministicos
Toma de decisiones bajo Incertidumbre
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
•
Compañías de Seguros
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
•
Compañías de Seguros
•
Estudios de Mercado
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
•
Compañías de Seguros
•
Estudios de Mercado
•
Control de Calidad
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
•
Compañías de Seguros
•
Estudios de Mercado
•
Control de Calidad
•
Instrumentos Financieros
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Definición
Estadistica: Mezcla entre ciencia y arte que
entrega herramientas para modelar fenómenos
no-deterministicos
Algunas aplicaciones:
•
Ingeniería
•
Compañías de Seguros
•
Estudios de Mercado
•
Control de Calidad
•
Instrumentos Financieros
•
Medicina
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6
Algunos Términos
•
Población: Colección completa de todas los
individuos de interes para el investigador.
•
Parámetro: Valor que caracteriza un aspecto
de la población.
•
Muestra: Subconjunto de la población y que
es representativa de esta.
•
Estadistico: Medida descriptiva de la muestra
que se utiliza para estimar al respectivo
parámetro poblacional.
•
Variable: Caracteristica de la población que
se analiza en el estudio estadistico.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 4/6
Técnicas de Muestreo
•
Muestreo Aleatorio simple: Procedimiento
mediante el cuál todas las muestras de un
determinado tamaño, poseen la misma
"chance" de ser extraidas.
•
Muestreo Aleatorio Estratificado: Esquema
de muestreo que primero particiona a la
población en diversos "estratos" y
posteriormente extrae una mustra aleatoria
simple en cada uno de ellos.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 5/6
Muestreo
•
Error muestral: Diferencia entre el valor del
parámetro poblacional y el producido por el
estadistico o estadigrafo basado en una
muestra.
•
Sesgo muestral: Tendencia a favorecer la
selección de determinados individuos de la
población.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 6/6
Muestreo
•
Población vs Muestra
•
Muestreo implica Error muestral
•
Acotar la probabilidad de cometer errores
Estadistica
•
Descriptiva
•
Inferencial
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 7/6
Tipos de Variables
•
Variables cualitativas: Caracteristica que
representa una cualidad de los individuos
poblacionales.
•
Variables cuantitativas: Caracteristica que
corresponde a una magnitud asociada a los
individuos de la población.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 8/6
Escalas de Medición
•
Escala nominal: Nombres o clases que se
utilizan para organizar los datos en
categorias separadas y distintas.
•
Escala ordinal: Mediciones que jerarquizan
los datos en categorias, ordenadas en virtud
de un determinado criterio.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 9/6
Escalas de Medición
•
Escala de intervalos: Mediciones respecto de
una escala numerica en la cual la diferencia
entre valores tiene interpretación y la
ubicación del cero es arbitrario.
•
Escala de proporciones: Mediciones respecto
de una escala numerica en la cual tanto la
diferencia como los cuocientes tienen
interpretación y la ubicación del cero es
absoluto.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 10/6
Estadistica Descriptiva
Proporciona procedimientos que permiten
organizar, procesar y presentar los datos
muestrales con el fin de extraer información
relevante que este contenida en ellos.
Datos Muestrales
Clasificación
A1 , A2 , . . . , Ak : clases
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 11/6
Número de clases
Si se dispone de n datos muestrales, se suele
usar la regla de “Sturges”:
k = [3, 3 · log n] + 1
Ejemplo: Para n = 1000, usar:
k = [3, 3 · log 1000] + 1 = [3, 3 · 3] + 1 = 9 + 1 = 10
clases
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 12/6
Observaciones y Preguntas
•
Las clases deben ser excluyentes y todo
elemento muestral debe pertenecer a una de
ellas.
•
¿Existen clases que concentren mas datos?.
•
¿Se presenta un comportamiento uniforme?.
•
¿Se visualiza mas de un punto de
concentración?.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 13/6
Construcción de clases
Si los datos muestrales estan medidos por lo
menos al nivel de intervalos y si los
representamos por:
x1 , x2 , . . . , xn
entonces la amplitud de las clases es de:
max xi − min xi
c=
k
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 14/6
Construcción de clases
con esto se determinan los limites superior e
inferior de cada clase:
clase limites
relacin
A1 [a1 → b1 ] b1 = a1 + c
A2 ]a2 → b2 ] b2 = a2 + c
..
..
..
.
.
.
Ak ]ak → bk ] bk = ak + c
en donde a1 = min xi y ak+1 = bk
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 15/6
Ejemplo
Consideremos una muestra de n = 50 datos:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
numero de clases: k = [3, 3 log 50] + 1 = 6
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 16/6
Continuación Ejemplo
min xi = 50 y max xi = 102, por lo que
c = 102−50
= 8, 7 redondeando, tomaremos c = 9,
6
con lo que las clases quedan:
clase
A1
A2
A3
A4
A5
A6
limites marca de clase
[50 → 59]
54, 5
]59 → 68]
63, 5
]68 → 77]
72, 5
]77 → 86]
81, 5
]86 → 95]
90, 5
]95 → 104]
99, 5
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 17/6
Gráfico de Tallo y Hoja
Una forma alternativa de visualizar los datos, es
mediante el gráfico de tallo y hoja:
La coma decimal esta un digito a
la derecha de los dos puntos:
5
6
7
8
9
10
:
:
:
:
:
:
079
0567899
001122344567788999
001233344456
01233457
12
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 18/6
Distribuciones de Frecuencias
Para descubrir como se “reparten” los datos
entre las clases, consideraremos las frecuencias
•
Frecuencia absoluta: Es el número de
observaciones muestrales que caen en cada
clase: ni , para i = 1, . . . , k.
•
Frecuencia relativa: Es la proporción de
datos con respecto a toda la muestra que
pertenecen a cada clase: fi , para i = 1, . . . , k.
•
Se tiene que: fi =
ni
n
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 19/6
Distribuciones de Frecuencias
•
•
•
Frecuencia absoluta acumulada: Es la suma
acumulada de las frecuencias absolutas
hasta cada clase: Ni , para i = 1, . . . , k. con
Pi
Ni = j=1 nj , para i = 1, . . . , k
Frecuencia relativa acumulada: Es la suma
acumulada de las fercuencias relativas hasta
cada clase: Fi , para i = 1, . . . , k. con
Pi
Fi = j=1 fj , para i = 1, . . . , k
Se tiene que: Fi =
Ni
n
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 20/6
Ejemplo
clase
A1
A2
A3
A4
A5
A6
total
limites
[50 → 59]
]59 → 68]
]68 → 77]
]77 → 86]
]86 → 95]
]95 → 104]
ni
3
5
15
17
7
3
50
Ni
3
8
23
40
47
50
fi
0, 06
0, 10
0, 30
0, 34
0, 14
0, 06
1, 00
Fi
0, 06
0, 16
0, 46
0, 80
0, 94
1, 00
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 21/6
Representaciones Gráficas
Otra forma de representar la información
muestral, es mediante gráficos
•
Histograma: Se grafican las frecuencias con
respecto a las diversas clases.
•
Poligono de frecuencias: Representa las
frecuencias en las marcas de clases unidas
por segmentos de rectas.
•
Distribucion de frecuencias acumuladas: Aqui
se representan las frecuencias acumuladas
hasta cada clase.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 22/6
Representaciones Gráficas
•
Ojiva: Poligonal que une las frecuencias
acumulativas en cada clase.
•
Gráfico de barras: Las frecuencias se
representan por barras proporcionales a
ellas.
•
Gráficos circulares: Las frecuencias se
muestran como sectores circulares.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 23/6
Histograma
0.0
0.01
0.02
0.03
Histograma de x
50
60
70
80
90
100
110
x
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 24/6
Ojiva
0.0
0.2
0.4
Frec
0.6
0.8
1.0
Ojiva de x
50
60
70
80
90
100
x
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 25/6
Pastel
Grafico circular de x
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 26/6
Estadistica descriptiva bivariada
Analisis descriptivo conjunto de dos o mas
variables. Si (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) es una
muestra bivariada de las variables X e Y . Si k
es el número de clases para X y l, para Y , se
definen:
•
Frecuencia absoluta conjunta: El número de
observaciones muestrales que caen en la
clase Ai segun X y en la clase Bj segun Y .
ni,j , i = 1, . . . , k, j = 1, . . . , l
•
Frecuencia relativa conjunta: Proporción
muestral de ni,j .
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 27/6
Tablas de contingencia
Se definen las frecuencias marginales de X e Y
respectivamente por:
ni,. =
l
X
j=1
ni,j , n.,j =
k
X
ni,j
i=1
y las respectivas frecuencias relativas conjuntas
y marginales por:
fi,j
ni,.
n.,j
ni,j
, fi,. =
, f.,j =
=
n
n
n
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 28/6
Ejemplo
[1000;2000]
]2000;3000]
]3000;4000]
]4000;5000]
n.,j
[10;30] ]30;50] ]50;70]
15
8
4
5
12
9
2
13
10
1
16
18
ni,.
113
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6
Ejemplo
[1000;2000]
]2000;3000]
]3000;4000]
]4000;5000]
n.,j
[10;30] ]30;50] ]50;70]
15
8
4
5
12
9
2
13
10
1
16
18
ni,.
27
26
25
35
113
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6
Ejemplo
[1000;2000]
]2000;3000]
]3000;4000]
]4000;5000]
n.,j
[10;30] ]30;50] ]50;70] ni,.
15
8
4
5
12
9
2
13
10
1
16
18
23
49
41
113
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6
Ejemplo
[1000;2000]
]2000;3000]
]3000;4000]
]4000;5000]
n.,j
[10;30] ]30;50] ]50;70] ni,.
15
8
4
27
5
12
9
26
2
13
10
25
1
16
18
35
23
49
41
113
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6
Medidas de tendencia central
Son estadisticos que proporcionan valores
representativos de la muestra, de tal manera que
todos los datos muestrales caen en torno a estos
valores.
•
Moda
•
Mediana
•
Media ( geométrica )
•
Media ( aritmética )
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 30/6
Si los datos muestrales han sido agrupados en
clases y estas marcas de clase son x1 , . . . , xk
con frecuencias relativas fi . Se define la media
de x por
x̄ =
k
X
i=1
f i xi =
k
X
1
n
n i xi
i=1
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 31/6
Medidas de variabilidad
Las medidas de variabilidad o de dispersión,
pretenden cuantificar el grado de homogeneidad
presente en la muestra; determinan que tan
concentrados o dispersos estan los datos.
Algunas medidad de dispersión son:
•
Rango
•
Desviación media
•
Rango intercuartílico
•
Varianza y Desviación estandar
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 32/6
La varianza se define por:
Sx2 =
k
X
i=1
fi (xi − x̄)2 =
k
X
1
n
i=1
ni (xi − x̄)2
y la desviación estandar por:
p
Sx = + Sx2
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 33/6
Observación
Cabe hacer notar que cuando la varianza
muestral se usa como un estimador de la
varianza poblacional, su definición se modifica
levemente en la forma:
1
S =
n−1
2
k
X
i=1
ni (xi − x̄)2
Esta varianza modificada es preferible como
estimador, pues posee mejores propiedades que
Sx2 .
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 34/6
Desigualdad de Tschebyscheff
Una interpretación interesante de la desviacion
estandar es la proporcionada por la
“Desigualdad de Tschebyscheff”, que plantea
intuitivamente que:
En todo conjunto de observaciones y para todo
numero real r > 1, se tiene que al menos 1 − r12
de ellas caen en el intervalo:
[x̄ − rSx ; x̄ + rSx ]
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 35/6
Gráficamente:
•
•
•
•
•
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 36/6
Resumen
Las principales medidas descriptivas de la
muestra son:
•
Resumen de $x$
Min. 1st Q. Med. Mean 3rd Q. Max.
50.00 71.00 78.50 78.36 84.00 102.00
N = 50
Median = 78.5
Quartiles = 71; 84
Que pueden representarse gráficamente por:
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 37/6
-1.0
-0.5
0.0
0.5
1.0
Gráfico de Cajón
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 38/6
Elementos de Inferencia Estadística
Al modelar un fenómeno en la vida real, las
variables que nos interesan generalmente son de
naturaleza no-deterministica y en consecuencia
pueden representarse por variables aleatorias.
Para poder obtener probabilidades asociadas a
estas variables aleatorias X, podemos ocupar su
funcion de distribucion FX :
FX (x) = P [X ≤ x]
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 39/6
Problema
Pero en la mayoria de los casos, esta función,
dependerá de parámetros desconocidos θ, es
decir tenemos:
FX (x; θ) = P [X ≤ x]
y para que estos modelos sean de alguna
utilidad, se requiere previamente estimar estos
parametros a partir de informacion empírica
recopilada a partir de una muestra aleatoria de
X.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 40/6
Problemas
Esto nos lleva a los principales problemas de la
inferencia estadistica:
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6
Problemas
Esto nos lleva a los principales problemas de la
inferencia estadistica:
•
Estimacion puntual.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6
Problemas
Esto nos lleva a los principales problemas de la
inferencia estadistica:
•
Estimacion puntual.
•
Estimacion por intervalos de confianza.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6
Problemas
Esto nos lleva a los principales problemas de la
inferencia estadistica:
•
Estimacion puntual.
•
Estimacion por intervalos de confianza.
•
Prueba de hipotesis.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6
Estimacion puntual
En el ámbito de la estimacion puntual se han
desarrollado diversos metodos para “construir”
estimadores puntuales, entre ellos:
Lo que hace necesario definir cualidades de los
estimadores, para asi poder seleccionar el
“mejor” entre varios posibles.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6
Estimacion puntual
En el ámbito de la estimacion puntual se han
desarrollado diversos metodos para “construir”
estimadores puntuales, entre ellos:
•
Método de momentos.
Lo que hace necesario definir cualidades de los
estimadores, para asi poder seleccionar el
“mejor” entre varios posibles.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6
Estimacion puntual
En el ámbito de la estimacion puntual se han
desarrollado diversos metodos para “construir”
estimadores puntuales, entre ellos:
•
Método de momentos.
•
Método de minimos cuadrados.
Lo que hace necesario definir cualidades de los
estimadores, para asi poder seleccionar el
“mejor” entre varios posibles.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6
Estimacion puntual
En el ámbito de la estimacion puntual se han
desarrollado diversos metodos para “construir”
estimadores puntuales, entre ellos:
•
Método de momentos.
•
Método de minimos cuadrados.
•
Método de máxima verosimilitud.
Lo que hace necesario definir cualidades de los
estimadores, para asi poder seleccionar el
“mejor” entre varios posibles.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
•
Insesgamiento
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
•
Insesgamiento
•
Varianza minima
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
•
Insesgamiento
•
Varianza minima
•
Error cuadratico minimo
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
•
Insesgamiento
•
Varianza minima
•
Error cuadratico minimo
•
Eficiencia
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Propiedades
Entre las principales propiedades de los
estimadores se cuentan:
•
Insesgamiento
•
Varianza minima
•
Error cuadratico minimo
•
Eficiencia
•
Consistencia
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6
Ejemplo
Supongamos que la variable aleatoria X esta
distribuida normalmente:
X ∼ N (µ, σ 2 )
Se dice que X1 , . . . , Xn es una Muestra aleatoria
de X, si:
•
Los X1 , . . . , Xn son independientes
•
Cada Xi posee la misma ditribucion que X
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 44/6
Ejemplo
Usando estos “datos” se pueden obtener
estimadores puntuales de los parametros µ y σ 2 ,
los cuales poseen varias de las propiedades
anteriores; ellos son:
X̄n =
2
Sn
1
=
n−1
n
X
1
n
Xi
i=1
n
X
2
(Xi − X̄n )
i=1
que son la media y varianza muestral.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 45/6
Ejemplo
Notemos que los valores que estos estimadores
producen, dependen de los valores muestrales y
en consecuencia cambiaran de una a otra
muestra.
Esto nos lleva a considerar las distribuciones
muestrales de estos estimadores.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 46/6
Distribuciones muestrales
Bajo la suposicion de que:
X ∼ N (µ, σ 2 )
se puede verificar que la distribucion empirica de
la media muestral a partir de una muestra
aleatoria de tamaño n es:
σ2
X̄n ∼ N (µ, )
n
que es nuevamente una normal.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 47/6
Distribuciones muestrales
Analogamente la distribucion empirica de la
varianza muestral es:
(n − 1)Sn2
2
∼ χ (n − 1)
2
σ
que se denomina Chi cuadrado con n − 1 grados de
libertad y que para usarla al igual que la normal,
hay que recurrir a tablas estadisticas
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 48/6
Otras distribuciones
Ademas de estas distribuciones, es necesario
considerar otras mas que aparecen en los
procesos de estimacion y prueba de hipotesis,
ellas son:
•
La distribucion t de student con k grados de
libertad, que se simboliza por t(k).
•
La distribucion Fisher con k y l grados de libertad,
que se representa por F (k, l).
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 49/6
Otras distribuciones
Analogamente a la distribucion normal y
chi-cuadrado, para evaluar probabilidades
asociadas a ellas, es necesario obtener los
valores usando una tabla estadistica, una
calculadora que las tenga implementadas o un
programa computacional adecuado.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 50/6
Observación
Cabe hacer notar que si bien es cierto estos
estimadores puntuales, al evaluarlos en los
datos muestrales, nos proporcionan una
estimacion puntual, que sirve para aproximar el
valor desconocido del parametro en estudio;
ellos no entregan idea alguna sobre el error que
se produce en este proceso de estimacion.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 51/6
Observación
Para poder cuantificar este error, se requeriria
estimar los parametros por medio de un intervalo
de confianza, que nos indique una region que
pudiera contener al parametro buscado, mas una
evaluacion de la proporcion de veces que
tomaremos una decision correcta al usar este
procedimiento, para estimar los parametros; esto
se conoce como el coeficiente de confianza
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 52/6
Estimacion por intervalos de confianza
Llamaremos un intervalo de confianza para el
parametro θ con coeficiente de confianza γ, a un
intervalo del tipo:
[T1 (X1 , . . . , Xn ); T2 (X1 , . . . , Xn )]
que cumpla:
P [T1 ≤ θ ≤ T2 ] ≥ γ
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 53/6
Estimacion por intervalos de confianza
Se puede ver que si X ∼ N (µ, σ 2 ), entonces el
intervalo de confianza para µ con coeficiente de
confianza γ esta dado por:
Sn
Sn
[X̂n − √ · t(1+γ)/2 (n − 1); X̂n + √ · t(1+γ)/2 (n − 1)]
n
n
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 54/6
Observación
Existen algunas situaciones en las cuales la
varianza σ 2 se conoce y por lo tanto no se
requiere previamente estimarla.
Tambien en aquellos casos en que el tamaño
muestral n crece tendiendo a infinito n → ∞, se
puede verificar que la distribucion t de student se
aproxima en un cierto sentido a la distribucion
normal.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 55/6
Observación
Para estas situaciones, que se denominan
muestras grandes, el intervalo de confianza para
la media muestral X̂n se transforma en:
σ
σ
[X̂n − √ · z(1+γ)/2 ; X̂n + √ · z(1+γ)/2 ]
n
n
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 56/6
Continuación
Analogamente se puede obtener el intervalo de
confianza para σ 2 con coeficiente de confianza
γ, resultando:
2
2
(n − 1) · Sn
(n − 1) · Sn
;
χ(1+γ)/2 (n − 1) χ(1−γ)/2 (n − 1)
El uso de estos intervalos de confianza nos
permite estimar los parametros de interes,
indicando la “precision” que permiten obtener los
datos disponibles.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 57/6
Prueba de Hipótesis
Existen situaciones en las cuales se tiene algun
conocimiento previo sobre los parametros de
una distribución ( Hipotesis ) y se desea analizar
si este supuesto es consecuente con los datos
muestrales. Esto lleva a una Prueba de
Hipótesis, para lo que se necesita:
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 58/6
Prueba de Hipótesis
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Prueba de Hipótesis
•
Una hipotesis nula H0 .
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Prueba de Hipótesis
•
Una hipotesis nula H0 .
•
Una hipotesis alternativa H1 .
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Prueba de Hipótesis
•
Una hipotesis nula H0 .
•
Una hipotesis alternativa H1 .
•
Una funcion de los datos T (X1 , . . . , Xn ), cuya
distribución bajo H0 se conozca.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Prueba de Hipótesis
•
Una hipotesis nula H0 .
•
Una hipotesis alternativa H1 .
•
Una funcion de los datos T (X1 , . . . , Xn ), cuya
distribución bajo H0 se conozca.
•
Un nivel de significancia 0 < α < 1.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Prueba de Hipótesis
•
Una hipotesis nula H0 .
•
Una hipotesis alternativa H1 .
•
Una funcion de los datos T (X1 , . . . , Xn ), cuya
distribución bajo H0 se conozca.
•
Un nivel de significancia 0 < α < 1.
•
Una región de rechazo.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6
Acciones
Al tomar la decisión de rechazar o no la hipótesis
nula sobre la base de los datos muestrales, se
producen las siguientes posibilidades:
acción ; realidad H0 verdadera H0 falsa
rechazar H0
Error I
Correcto
no rechazar H0
Correcto
Error II
La idea es limitar a valores pequeños las
probabilidades de estos errores.
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 60/6
•
•
•
•
•
Dr. Eduardo Valenzuela D.; MEE 2005 – p. 61/6
Descargar