DISTRIBUCIÒN NORMAL - Universidad Nacional de Tumbes

Anuncio
UNIVERSIDAD NACIONAL DE TUMBES
ESCUELA DE POST GRADO
CURSO ESTADÌSTICA
SEGUNDA UNIDAD:- ESTIMACIÒN DE PARÀMETROS Y PRUEBA DE
HIPÒTESIS
INTRODUCCIÒN
La inferencia estadística comprende dos partes principales, a saber: la
estimación de parámetros y la prueba o docimasia de hipótesis.
La inferencia estadística está basada en el supuesto de que tomaremos
muchas muestras, todas con igual probabilidad de ser seleccionadas; y a
través de una muestra obtenida sabremos algo acerca de la población,
mediante el cálculo de estimadores.
Estos métodos se basan en la aplicación de técnicas de muestreo, para lo cual
se requiere de un buen diseño, además de la aplicación de métodos aleatorios
de selección, siendo las probabilidades iguales para cada elemento de la
población.
Estimación de Parámetros:Es un método inferencial. Se basa en el estudio de una muestra que
representa adecuadamente a la población. Producto de dicho estudio
obtenemos una medida que se denomina estimador; mediante la inferencia o
inducción de este valor obtenemos la medida poblacional esperada
denominada parámetro. Se realiza esta inferencia obteniendo en cada caso el
margen de error que corresponda.
Prueba de Hipótesis:Denominada también prueba de significación, tiene como objetivo
principal evaluar suposiciones o afirmaciones acerca de los valores estadísticos
de la población, denominados parámetros.
La palabra docimar significa probar, cuando se hace indispensable tomar una
decisión sobre la validez de la representación de una población, con base en
los resultados obtenidos a través de una muestra, se dicen que se toman
decisiones estadísticas. Para tomar una decisión es necesario, ante todo
plantear posibilidades acerca de la característica o características a estudiar
en una población determinada. La suposición puede ser cierta o falsa. Estas
suposiciones se llaman hipótesis estadísticas.
Hipótesis Estadística:Es un supuesto acerca de un parámetro o de algún valor estadístico de
una población. Con esta definición encontramos que no todas las hipótesis son
hipótesis estadísticas. Se debe tomar con referencia a un parámetro, ya sea
una media aritmética, una proporción (porcentaje) o varianza para que sea
hipótesis estadística.
1
Una hipótesis estadística también puede considerarse, como la afirmación de
una característica ideal de una población sobre la cual hay inseguridad en el
momento de formularla y que, a la vez, es expresada de tal forma que puede
ser realizada.
Tipo de error:En la decisión de aceptar o rechazar una hipótesis pueden cometerse
dos tipos de error:
a)
b)
Error tipo II.- Aceptar la hipótesis cuando ha debido rechazarse.
Error tipo I.- Rechazar la hipótesis cuando ha debido aceptarse.
Existe por lo tanto, dos posibles decisiones: aceptar o rechazar la hipótesis la
que, a la vez, puede ser cierta o falsa.
Tipos de error
ACEPTAR
desicones
RECHAZAR
-
Verdadera
decisión
correcta
error de tipo I
Falsa
error de tipo II
decisión
correcta
Si se acepta una hipótesis verdadera la decisión es correcta.
Si se acepta una hipótesis falsa, cometemos error de tipo II.
Si rechazamos una hipótesis verdadera, encontramos error de tipo I.
Si rechazamos una hipótesis falsa, la decisión es correcta.
El ejemplo más indicado y más utilizado para comprender mejor lo enunciado
en forma precedente es el siguiente: supongamos que se detiene a una
persona por robo y se le envía al juez quien podrá declararlo inocente o
culpable. Al juez se le presentan los pro y contra y, con base en toda la
información, decide dejarlo libre o condenarlo. El juez, no sabrá si hubo error
en su decisión, solo lo podrá saber la persona que ha sido juzgada.
del juez
Persona Juzgada
Inocente
Culpable
desicones
Libre
decisión
correcta
Condenado
error de tipo I
2
error de tipo II
decisión
correcta
Hipótesis nula y alternativa:Corresponde a un enunciado acerca del valor estadístico poblacional
(parámetro).
La hipótesis se debe formular en forma correcta o lógica y debe ser enunciada
antes de obtener los datos muestrales.
Hay dos tipos de hipótesis que se deben formular: la hipótesis nula,
simbolizada por H 0 y la hipótesis alternativa por H a
La hipótesis nula, es aquella por medio de la cual se hace una afirmación
sobre un parámetro, que se va a constatar con el resultado muestral.
La hipótesis alternativa, es toda aquella hipótesis que defiere de la hipótesis
nula, es decir, ofrece una alternativa, afirmando que la hipótesis nula es falsa.
Cuando el fabricante dice que su producto tiene una duración de 6000 horas,
se le considera como hipótesis nula, pues es lo que se quiere probar. H0 :
  6000hrs. Las hipótesis alternativas prodian ser:
a. El fabricante ha exagerado la duración de su producto.
H a :  < 6000hrs. (prueba unilateral izquierda)
b. El producto tiene una duración superior al señalado por el fabricante.
H a :  > 6000 hrs. (prueba unilateral derecha)
c. La duración del producto no es la señalada por el fabricante.
H a :   6000hrs. (Prueba bilateral)
La prueba unilateral y bilateral:La prueba de hipótesis unilateral, es aquella en la cual la zona de
rechazo o zona crítica está completamente comprendida en uno de los
extremos de la distribución. H a :  < a, región crítica ubicada al lado izquierdo.
H a :  >a, región crítica ubicada al lado derecho. H a :   A, región crítica
ubicada al lado izquierda y derecha de la distribución
Nivel de significación y puntos críticos:Se entiende por nivel de significación, la máxima probabilidad que se
especifique, con el fin de hacer mínimo el primer tipo de error. Generalmente
esta probabilidad se fija antes de escoger la muestra.
El nivel de significación se simboliza por alfa (  ), siendo generalmente del 1%,
5%, o 10%, pero se puede usar cualquier nivel. Existe la costumbre de trabajar
con el nivel de 0.05 o sea del 5%, especialmente cuando el enunciado del
problema no lo brinda.
3
Cuando se trabaja con un nivel del 5%, el resultado es significativo, y si se
emplea 1% el resultado es altamente significativo, y si es del 10%, se considera
poco significativo.
El valor del nivel de significación corresponde a un área bajo la curva de
probabilidad o normal, denominado región crítica o zona de rechazo.
Procedimientos a seguir en las pruebas de hipótesis:
1. Formular la hipótesis nula y la alternativa.
2. Seleccionar el nivel de significación.
3. Elegir la estadística de prueba, entre las características existentes en la
población y muestra.
4. Definir las regiones de aceptación y de rechazo.
5. Calcular el valor de la estadística de prueba.
6. Calcular los valores experimental y tabular.
7. Decidir la aceptación o rechazo de H 0
8. Toma de decisiones.
ESTIMACIÒN DE PARÀMETROS
Ecuación general para estimar parámetros
 : ˆ  k / 2ˆˆ
Donde:

= Parámetro
ˆ
= Estimador

k / 2 = Valor crítico que corresponde a la distribución con la cual
trabajamos.
ˆˆ = Error estándar del estimador
( ˆˆ = ̂ / n )
 : ˆ  d
d = margen de error
  ˆ  d
4
ˆ  d    ˆ  d
Li    Ls
P ( ˆ  d    ˆ  d )= ‫ﻻ‬.
Interpretación:
-
la probabilidad de que el parámetro (  ) en estudio asuma valores de
( ˆ  d ) a ( ˆ  d ) es de ‫ ﻻ‬de probabilidad.
Interpretación equivalente:
-
- Al ‫ ﻻ‬de probabilidad, el parámetro en estudio (  ), asume valores de
( ˆ  d ) a ( ˆ  d ).
Objetivo: en base a variables en estudio estimar un parámetro determinado o
probar una hipótesis en referencia a un determinado comportamiento
paramètrico.
Estimación Promedio Poblacional:Aplicación:- Dada la información referida a pedidos por día a una empresa xyz
de un determinado artículo, durante el segundo semestre del año 2006 en la
ciudad de Tumbes.
Se trabajará con una muestra aleatoria de 34 días se pide estimar el promedio
poblacional de pedidos por día confiabilidad del 95%.
xi  pedidospordia
xi  120, 130, 115, 136, 121, 151, 90, 132, 123, 107, 104, 128, 92, 86, 105, 96,
100, 88, 103, 71, 104, 102, 100, 86, 96, 93, 125, 128, 76, 97, 90, 122, 126.
Solución:
N = 180 días.
La ecuación:  : x  k / 2 ̂ / n
N  n / n 1
 = promedio poblacional.
x = promedio muestral
 = desviación poblacional
N = tamaño poblacional
n = tamaño muestral
k / 2 = valor crítico que corresponde a la confiabilidad con la que se
trabaja.
̂  s  desviación muestral
5
Siendo n= 34 > 30, usamos la distribución normal,
 : x  Z / 2
s
n
N n
N 1
En base a la muestra calcular x y s.
x  106 .85
,
s = 18.83
Se evalúa el tamaño muestral y si se conoce o no la varianza poblacional.
Entonces: n = 34 > 30 y  2 no es conocida.
Siendo n > 30, k / 2  Z / 2 (sigue la normal)
Se pide realizar la estimación para ‫ = ﻻ‬0.95

2

0.95
 0.4750 . Para 0.4750 en la tabla normal, Z / 2  1.96
2
Datos:
:
x  106 .85 ,
s = 18.83,
N = 180,
n = 34
106.85  (1.96)
18.83
34
z = 1.96
180  34
180  1
106.85  5.72
106.85 – 5.72,
106.85 + 5.72
101.13
112.57
P ( 101.13    112.57 ) = 0.95
Al 0.95 de confiabilidad la empresa xyz espera ser demandada por un
promedio poblacional diario, de 101 a 113 artículos, durante el último semestre
del año 2006.
Aplicación de prueba de hipótesis
Prueba de hipótesis promedio poblacional
Hipótesis científica:- La empresa xyz de la ciudad de Tumbes, durante el
último semestre del año 2006, despachó en promedio 98 artículos por día,
¿Puede dudarse de lo sustentado por la compañía?
6
Trabajor para ‫ = ﻻ‬0.90
Procedimiento: Para evaluar la hipótesis si es verdadera o falsa.
-
esta evaluación se realizará en base a la muestra que corresponde a las
ventas realizadas en 34 días (datos precedentes)
Solución:
1. Planteamiento de hipótesis
H0    98
Ha    98
2. Nivel de significación:   0.10
3. Estadística de prueba
Condiciones de la N y n
N = 180, n = 34 y  2  ?
Usamos la normal (Z)
4. Regiones de aceptación y rechazo de
  0.10
H0
RA/ H 0
H a : “>” Z
RR/ H 0
0
Para 0.4000
RA/ H 0 =
RR/ H 0 =
z  1.28
0  z  1.28
z  1.28
Z=
x
z/ n
s = 18.83
Zc 
106.85  98
 2.74
18.83/ 34
  98
Zc  2.74
5. Cálculos
x  106 .85
n = 34
7
z  1.28
6. Ztabla vs Zc
1.645 < 2.74
2.74 e RR / H 0
7. Rechazamos H 0 aceptamos H a significa, el promedio diario en pedidos
demandado la empresa xyz, ciudad de Tumbes, semestre seguido 2006, es
superior a 98.
8. la empresa xyz debe estar preparando para brindar la mejor respuesta al
mundo.
ESTIMACIÒN PROPORCIONAL POBLACIONAL
Se elige una muestra de la producción fitoplanctònica en un estanque, durante
el mes de mayo de 1999 (fertilizada con nutrilake y superfosfato triple de
fósforo SPT) estime la proporción de días cuya producción de clorofila oscila de
12500 a 37250. Para ‫ = ﻻ‬98.
La información es la siguiente: n = 24; N = 50
15000, 37500, 50000, 37250, 25000, 12500, 37250, 37500, 25000, 43750, 37500,
25000, 6250, 12500, 15000, 43750, 32500, 25000, 10000, 43750, 37500, 25000, 12500,
6250.
Calculamos la proporción muestral: p =
x
donde x = nº de elementos que cumplen con
n
la característica en estudio.
p=
16
 0.67
24
x= nº de días cuya producción de clorofila oscila de
12500 a 37250.
P: p  z / 2
N n
N 1
Pˆ  p  0.67
Q= 1- p = 1 – 0.67 = 0.33
Z / 2
P: 0.67  2.33

2

0.98
 0.7900
2
Tabla normal = z = 2.33
(0.67)(0.33) 50  24
24
50  1
0.67  0.16
0.67 – 0.16
,
0.67 + 0.16
8
0.51
,
0.83
P ( 0.51  p  0.83) = 0.98
Al 0.98 de confiabilidad, la proporción de días cuya producción de clorofila oscila de
12500 - 37250 oscila de 0.51 - 0.83
PRUEBA DE HIPOTESIS PROPORCION
Hipótesis Científica:- la proporción de días cuya producción de clorofila oscila
de 600 – 25000 es igual a 0.50
Hipótesis Estadística:Solución:
H 0 P = 0.50
trabajar para: ‫ = ﻻ‬0.98
1. H 0 P = 0.50
H 0 P  0.50
2.   0.05
RR/ H 0
pP
PQ
n
3. Z 
RR/ H 0
 z / 2  2.33
z / 2  2.33
0
RA/ H 0
4. H1 :
  0.05
Z
‫ = ﻻ‬0.9800
0.9800
 0.4900
2
Para 0.4900
Normal = Z / 2 = 2.33
‫=ﻻ‬
RA/ H 0 : -2.33 <z < 2.33
RR/ H 0 : z  2.33 ò z  2.33
5. En base a la información de la muestra anterior
p
x nº dediascuya produccion oscilade 600  2500

24 dìas
n
p=
13
 0.5417
24
9
Zc 
p  P 0.5417 05000
=
 0.41
PQ
(0.50)(0.50)
n
24
6. Ztabla vs Zc
2.33 >0.41
7. Se acepta H 0
Zc e RA/ H 0
8. la proporción de días cuya producción de clorofila oscila de 6000 – 25000 es
igual a 0.50.
ESTIMACION Y PRUEBA DE HIPOTESIS DE UN PROMEDIO
POBLACIONAL CUANDO n <30 y  2 DESCONOCIDA
La empresa Eléctrica Pizza estaba considerada la distribución a nivel Nacional
de su producto que ha tenido éxito a nivel local, y para ello recabó datos de
venta proforma. Las ventas mensuales promedio (en miles de dólares) de sus
20 de 60 distribuidores actuales. En base a esta información y para un ‫= ﻻ‬
0.99.
a) Estime el promedio poblacional.
b) Pruebe la hipótesis estadística referida a que el promedio poblacional es:
  5.8 ;   7 . Ambos para ‫ = ﻻ‬0.95
Ventas por distribuidor:
5.8, 3.8, 7.7, 3.7, 5.0, 4.5, 6.5, 5.8, 6.6, 7.5, 8.5, 3.4, 6.8, 7.5, 5.8, 5.2, 9.8, 8.0, 8.7, 6.4.
x  6.35 ,
s = 1.7656
n = 20,
N= 60, varianza poblacional =  2 , desconocida
Si n = 20 < 30 y  2  ? , se usa, la distribución “t de student”
s
3
 : x  t( / 2, n 1)
t( / 2, n 1)  t 0.01, 20 1
(
2
N n
N 1
)
= t(0.005,19)  2.861(tabla “t”, Pág. 18)
10
 : 6.35  (2.861)
1.7656 60  20
60  1
20
6.35  0.93
6.35 – 0.93
,
6.35 + 0.93
5.42
,
7.28
P ( 5.42    7.28)  0.99
La posibilidad de que el promedio de ventas por distribuidor en la empresa
Electric Pizza asuma valores de 5.42 – 7.28, es de 0.99.
Prueba de hipótesis para   5.8 , ‫ = ﻻ‬0.95
1 H 0 :   5.8
H a :   5.8
2   0.05
3 n = 20 < 30 y  2 desconocido, usamos “t”
4   0.05
Ha : 
RA/ H 0
RR/ H 0
RR/ H 0
t
t( / 2, n 1)
0
t( / 2, n 1)
 t( / 2, n 1)
-2.093
2.093
= t 0.05, 20 1) = t(0.025,19)  2.093 (tabla t” de student” Pág. 18)
(
21
x
6.35  5.8

 1.39
x / n 1.7656/ 20
5
tc 
6
ttabla vs t c
2.093 > 1.39
tc E RA/ H 0
7 Aceptamos H 0
8 El promedio de ventas por distribuidor es de 5800 dólares
11
Prueba de hipótesis para   70 , ‫ = ﻻ‬0.95
1 H 0 :   7.0
H a   7.0
2   0.05
3 n = 20 < 30 y  2 desconocido, usamos “t”
4   0.05
RA/ H 0
RR/ H 0
RR/ H 0
t
 t ( / 2,n1)
-2.093
0
t( / 2, n 1)
2.093
t( / 2, n 1) = t 0.05, 20 1) = 1.729 (tabla t” de student” Pág. 18)
(
5 tc 
6
7
8
21
x
6.35  7.0

 1.65
s / n 1.7656/ 20
ttabla vs t c
1.729 > -1.65
tc E RA/ H 0
Aceptamos H 0
El promedio de ventas por distribuidor en la empresa Electric Pizza es
inferior o igual a 7000 dólares.
DIFERENCIAS DE MEDIAS
Estimación y Prueba de Hipótesis:La información siguiente muestra la producción fitoplanctònica (clorofila)
por estanques ( E1, E2 ) fertilizados con Nutrilake y superfosfato triple de fósforo
(SPT). Se desea estudiar la diferencia de medias poblacionales, contando con
muestras n1  15
( E1  Es tanque1) Y n2  19 ( E2  es tanque2 ).
Para ‫ = ﻻ‬0.90
12
La información es:
N1  26
n1  15 ;
6250, 25000, 25000, 37250, 30000, 125000, 37500,
37250, 43750, 50000, 12500, 43750,37500, 250000,
28400.
N 2  26
n2  19
25600, 10000, 12500, 50000, 30000, 37500, 10000,
26100, 30000, 350000, 43750, 57500, 12500, 6250,
10000, 12500, 12500, 6250, 32500.
n1  15  30, 2  ? ;
n2  18  30, 2  ?
usamos “t”
1  2 : ( x1  x2 )  ( t / 2 , n1  n2  2 ) ˆx1  x2
 x1 x 2 =
2
sc (
1 1
 )
n1 n2
(n1  1)sc  (n2  1)sc
n1  n2  2
2
sc 
2
En n1 ,
2
x1  30110.00000
s1  12676.44328,
En n2 ,
2
2
x2  24234.21053
s2  15614.92389,
ss 
s1  160692214
.2
s2  243825848
2
(15  1)(160692214 .2)  (19  1)( 243825848 )
15  19  2
sc  840180476
.6
2
1 1
 )  10011.596
15 19
 x1 x 2  840180476
.6(
13
1  2  (30110.00000 24234.21053)  (0.6944)(10011.596)
  0.10
‫ = ﻻ‬0.90,
t( / 2, n1  n2  2)  t
0.10
,15  19  2)  (0.05,32)  0.6944
2
: 5875.79

6952.05
5875.798 – 6952.05 ,
-1076.26
5875.79 + 6952.05
12827.84
P (  1076.26  1  2  12872.84)  0.90
La probabilidad de la diferencia en producción de clorofila en los dos estanques
fertilizados oscila de 0 – 12872.84, al 0.90.
Prueba de hipótesis comparativo de varianzas poblacionales
Comparar las varianzas que corresponde a la producción de clorofila en dos
estanques fertilizados
2
2
1. H 0 : 1   2
H a : 1   2
2
2
2.   0.05
3. n1  15  30 y 1  ?
2
n2  19  30 Y  2  ?
Usamos la prueba F( / 2;v1,v 2)
2
4. calculamos las regiones de acepción y de rechazo de la H 0
H a :
  0.05
F
RR/ H 0
RA/ H 0
0
F(1 / 2;v1,v 2)
FI
RR/ H 0
F( / 2;v1,v 2)
Fs
FS  F(0.025;15,19)  2.62
14
FI 
1
F(0.025;19)
1
 0.43 ;
2.78

Explicación del F1
F(0.025;15,15)  2.86
F(0.025;20,15)  2.76
5
0.10
4
x
2.86-0.08 = 2.78
F(0.025;19,15)  0.43
1
FI 
 0.43
2.78
RR/ H 0
RA/ H 0
FI  0.43
RR/ H 0
FS  2.62
n S (n  1) 15(160692214
.2)(15  1)
5) Fc  1 1 2 1

 0.40
)(19  1)
n2 S2 (n2  1) 19(243825848
2
Fc  0.40
6) Fc  FI
0.40 < 0.43
Fc e RR/ H 0
7) Se acepta H a
8) Existe diferente variabilidad en la producción de clorofila en los estanques 1 y 2
fertilizados al 0.95 de confiabilidad
PRUEBA DE HIPOTESIS COMPARATIVO DE MEDIAS
POBLACIONALES
Se toman como muestras 6 mujeres y 10 hombres fumadores. Se desea saber
si el número de cigarrillos que consumen los hombres diariamente es superior
al de las mujeres. Los datos brindaron en promedio 8 cigarrillos en el grupo de
mujeres y 11 en el de los hombres; las desviaciones típicas son 2.1 y 1.8
respectivamente. Al nivel del 5% ¿Se puede llegar a la conclusión de que los
hombres fuman más que las mujeres?
15
x = mujeres
y = hombres
H0 : x   y
Ha : x  y
Para probarlas, de primera intención se realiza el comparativo de varianzas
poblacionales.
Si dichas varianzas son iguales, procedemos a realizar el comparativo de
medias poblacionales.
Comparativo de varianzas poblacionales para el ejercicio precedente
1)
H0 :  x   y
2)
Ha : x  y
  0.05
2
2
2
2
3)
nx  6 ,
 x  ? n y  10
y ?
Usamos la distribución F, donde:
2
n x S x (n x  1)
F
2
n y S y (n y  1)
4)
  0.05
H a :""
F
2
2
RR/ H 0
RA/ H 0
FS  4.07
FI  0.18
FS  f (6,10;0.025)  4.07
FI 
1
F(10,6;0.025)

1
 0.18
5.46
RA/ H 0 : 0.18 < F < 4.07
RR/ H 0 : F  0.18 ò
5)
Fc 
RR/ H 0
F  4.07
6(2.1) 2 (6  1)
 0.45
10(1.8) 2 (10  1)
16
6)
Ftabla vs Fc
RA: 0.18 < F < 4.07 VS 0.45
FC e RA/ H 0
7)
Se acepta H 0
8)
Las varianzas son estadísticamente iguales (no existe diferencia
significativa entre ellas) con una confiabilidad del 95%
Dado que las varianzas son iguales, realizaremos el comparativo de medias.
Solución:
2)
H0 : x   y
H a : x   y
  0.05
3)
nx  6 ,
1)
 x2  ?
n y  10
Se usa la t ( ,n1n22)
t (0.05,6102)  t (0.05,14)  1.761
  0.05
H a :""
F
4)
RR/ H 0
RA/ H 0
 t (0.05,14)
- 1.761
tc 
5)
( x x  x y )  ( x   y)
s2c (
1
1
 )
nx n y
(n x  1) s x  (n y  1) s y
2
sy 
2
Sc
2
2
nx  n y  2
(6  1)(2.1) 2  (10  1)(1.8) 2

 3.66
6  10  2
17
 y2  ?
Datos:
Xx 8
tc 
(8  11)  0
 3.04
1 1
3.66( 
6 10
s y  2.1
X y  11
s y  1.8
6)
t tabla vs t c
-1.761 < - 3.04
Se acepta H 0
t c e RA/ H 0
7)
Se rechaza H a
8)
Al 0.95 de confiabilidad, no existe diferencia significativa entre el
promedio de cigarrillos que fuman hombres y mujeres, en el estudio
realizado.
MUY IMPORTANTE
Hay muchos casos en que las varianzas poblacionales son desiguales o no se
puede comprobar su igualdad. En estos casos se ha elaborado procedimientos
aproximados, entre ellos la “t” de student con ciertos grados de laboral,
mediante la aplicación de la siguiente fórmula:

S
2
x
 
/ n1  S y / n 2
2

2
 S x 2 / n1   S y / n 2 



 n 1   n 1 
 1
  2

APLICACIÓN
Consideremos los datos sobre dos tipos de amortiguadores para vehículos
MAZDA, las pruebas de duración resultaron en dos muestras aleatorias, de
tamaño 16 y 12 respectivamente, las primeras con una duración de 22.6
meses , y su desviación típica de 7 meses, mientras que en el segundo es de
18.2 meses y desviación típica de 5.2 meses.
No hay ninguna prueba de que las varianzas respecto a la duración sean
iguales. Probar que la duración no presenta diferencia significativa, al nivel del
5%.
Solución
18
Calcularemos en primer lugar los grados de libertad.
 7 2 5(2) 2 
 

12 
 16
 2
 13
(7 / 16) (5(2) 2 / 12)

16  1
12  1
Con un nivel de significación del 5%, el valor de t (0.025,13)  2.16
1)
H0 : x   y
Ha : x   y
2)
  0.05
3)
nx  6 ,
4)
  0.05
H a :""
F
 x2  ?
n y  12
RR/ H 0
 y2  ?
RA/ H 0
 t (0.025,13)
- 2. 16
RA/ H 0 : - 2.16 < t < 2.13
RR/ H 0 : t  - 2.16
5)
6)
tc 
( xx  x y )  (  x   y )
2
2
Sy
Sx

n1
n2
t ( 0.025 ,13)
2. 16
ò

t  2.16
(22.6  18.2)  0
 1.91
79 27.04

16
12
t(0.025,13)  2.16 vs tc  1.91
= 1.91 < 2.16
RR/ H 0
t c e RA/ H 0
7)
Se rechaza H a
8)
La diferencia no es significativa al nivel del 5%
19
PRUEBA DE HIPOTESIS CON RESPECTO A LA VARIANZA
POBLACIONAL
En gran parte, por no decir en su totalidad, las unidades dedicadas a la
inferencia estadística van encaminadas hacia el promedio; sin embargo las
inferencias realizadas con la varianza pueden constituirse en medidas más
importantes que el promedio, pues este último, vale la pena recordar, es un
punto de estimación, siendo aquel valor que consideramos típico, porque no
siempre lo va a ser, dado que depende del grado de variabilidad para ser
representativa del conjunto de observaciones.
Se hace referencia a la prueba de hipótesis de una varianza con base en una
muestra aleatoria. Partimos suponiendo que se tiene una población normal con
media uy varianza  2 desconocida.
La simbología que se usa en el proceso será:
2
H0 :    0 Lo que equivale H 0 : 2  1
0
2
2
2
Ha :  2   0 , H a :  2   0 ; H a :  2   0
Que también pueden ser presentados como:
Ha :
 02
2
2
,
:
,
:

1
H
H

1
1
a
a
2
 02
 02
Para la realización de esta prueba se emplea la estadística Chi-cuadrado con
n -1 grados de libertad y la variante estadística está dada de la siguiente
manera:
(n  1)2 S 2
2
X 
2
0
Aplicación:
Docimar (probar) la hipótesis de que   8 dado que S  10 para una muestra
de tamaño 20.
Solución:
1)
H0 :
2
1
 02
H0 :
2
82
1
Ha :
20
2
64
2
64
1
1
2)
  0.05
3)
La muestra es aleatoria, la población es normal
cuadrado con n-1 grados de libertad.
usamos
la
Chi-
2
Usamos la Chi-cuadrado con n- 1, X n 1
4)
RA/ H 0 y RR/ H 0
RR/ H 0
RA/ H 0
 X2


   / 2 ,
0.469
RR/ H 0
X2


  1 / 2,
1.73
RA/ H 0 = 0.469 <   1.73
2
RA/ H 0 : ( )  0.469 o ( )  1.73
2
5)
x2

=
2
s2
100

 1.56
64
64
6)
 x2 
  e RA/ H 0
 
7)
Aceptamos H 0
8)
Se puede afirmar al nivel del 5% que la varianza de la muestra, puede
corresponder a una población cuya varianza es 64.
ESTIMACION DE PARAMETROS
Establezca los límites para  con una confianza de 95%
Siendo:
s = 10
s 2  100
Solución:
 x2 
 
 0.469
  0.025 ,119
  19
n = 20
x




 1.73
 00.97519
21
0.469 
x2

 1.73
Tenemos: 0.469 
siendo
S
2

2


S2
2
 1.73
1
2
1


0.469 100 1.73
14.60 >  >7.60
x2
0.469 <
100
100
2 
0.469
1.73
100
2
<1.73
100
>
0.469
100
1.73
7.60 <   14.60
 1 Asume valores de 7.60 – 14.60 al 95% de la confiabilidad.
DIFERENCIA DE PROPORCIONES
ESTIMACION DE PARÀMETROS Y PRUEBA DE HIPÒTESIS
Se realizó un estudio sobre la cantidad de plomo en sangre en mujeres
puérperas – ciudad de México, años 2005 y 2006, se trabajó con una población
de 102 mujeres en el año 2005( N1  102) y con 120 mujeres en el año 2006
( N2  120 ). Para efectos de estudio comparativo sobre la cantidad de plomo en
sangre superior a 11 g / dl en mujeres puérperas, se trabaja con una muestra
de 30 mujeres puérperas ( n1  30 ) en el año 2005 y con una muestra aleatoria
de 38 mujeres ( n2  38 ) en el año 2006.
Sobre esta investigación. ¿Será diferente la proporción de mujeres puérperas
con cantidad de plomo en sangre superior a 11 g / dl en los dos años de
realizada la investigación en ciudad México?
La información está dada por:
n1  30 (Año 2005)
n2  38 (Año 2006)
10.0, 12.9, 6.9, 6.4, 11.6, 9.1,
17.0, 23.3, 10.0, 11.5, 11.7,
7.2, 5.6, 12.4, 4.6, 8.8, 15.9,
8.2, 7.6, 7.9, 10.3, 5.3, 5.1,
12.3, 11.5, 20.0, 4.9, 5.1,
11.4, 5.9
9.2, 10.5, 6.4, 12.4, 14.2, 9.7,
6.8, 7.8, 5.2, 9.2, 5.9, 10.5,
6.8, 5.1, 13.3, 21.0, 12.7,
23.1, 9.8, 2.9, 7.4, 18.9, 9.8,
8.5, 21.0, 7.1, 8.5, 13.1, 10.7,
5.5, 14.5, 14.4, 6.9, 8.8, 9.4,
7.4, 12.9, 11.0
22
ESTIMACIÒN PARA LA DIFERENCIA DE PROPORCIONES
x = mujer puérpera con plomo en sangre superior a 11 g / dl
p1 
x1 11

 0.37
n1 30
p2 
x2 11

 0.29
n2 38
Para un ‫ = ﻻ‬94%
p1  p2 : p1  p2  Z / 2
0.37 – 0.29  1.88
Si ‫ = ﻻ‬0.94,

2
: 0.08  0.22

P1Q1 P2Q2

n1
n2
(0.37)(0.63) (0.29)(0.71)

30
38
0.94
 0.4700
2
z= 1.88 (tabla normal Pág. 19)
P (  0.14  P1  P2  0.30 ) = 0.94
Al 0.94 de confiabilidad la diferencia de proporciones de mujeres puérperas en
la ciudad de México en los años 2005 – 2006 de plomo en sangre es superior
a 11 g / dl , oscila de 0 – 0.30
Prueba de hipótesis Diferencia de Proporciones
1. H 0 : P1  P2
H a P1  P2
2.   0.02 ,
‫ = ﻻ‬0.98
3. n1  30 , n2  38
Se usa la normal
p 2  ?
4.   0.02
H a :
Z
 p 22  ?
1
RR/ H 0
‫ = ﻻ‬0.98
 z / 2
- 2.33
0.98
 0.4900
‫ﻻ‬/2 =
2
RA/ H 0 : - 2.33 < z < 2.33
23
RA/ H 0
0
RR/ H 0
z / 2
2.33
2.33 tabla normal
RR/ H 0 : z  -2.33
5. Zc 
z  2.33
o
( p1  p2 )  ( P1  P2 )
=
P1Q1 P2Q2

n1
n
(0.37  0.29)  0
 6.07
(0.37)(0.63) (0.29)(0.71)

30
38
6. Ztabla vs Zc
2.33 < 6.07
Zc E RR/ H 0
7. Se rechaza H 0 . Se acepta H a
8. la proporción de mujeres puérperas cuya concentración de plomo en sangre
superior a 11 g / dl ciudad de México 2005 es diferente de la proporción
de mujeres con igual característica en el año 2006, al 98% de confiabilidad.
DISTRIBUCIÒN NORMAL
Es sin duda la más conocida y usada de todas. Corresponde a una distribución
de variable continua que se extiende sobre un campo de variabilidad infinito y
está dado por la función de densidad normal.
F(x)=
1
e
1
/ 2 x   x /  x
2
(I)
2 2 x
Donde:
x  media
;  x  Ex   , talque     
 2 x  varianza
; x  0
e = 2.71828
;   3.14159
2
La gráfica de la expresión (I) es la siguiente:
24
 x  3 x
 x  2 x
x   x
x
x   x
 x  2 x
 x  3 x
68 %
95 %
99 %
Área bajo la curva o probabilidad. Esta se calculará por medio de tablas
estadísticas.
x
N (  x , x )
x
Distribución Normal Estandarizada (Z)
Z
Z
= x  x
x
N ( z  0, z  1)
2
;
25
z  1
0.34135 0.34135
-3
-2
-1
0
+1
68.27%
95.45%
+2
+3
99.73%
‫=ﻻ‬Confiabilidad o probabilidad
  Error o nivel de significación
Calcularemos algunos tipos de probabilidades para usarlos al realizar
estimación de parámetros y prueba de hipótesis.
1.
Dada el área o probabilidad calcular el valor Z.
Un área o probabilidad bajo la curva normal, se define:
z1
0
P ( 0  z  z, )= ‫ﻻ‬/2
Calcular el valor de Z, dadas las áreas: 0.3413, 0.4788, 0.4969.
Para determinarlas:
P ( 0  z  z, )= 0.3413, v a la tabla normal
26
(Pág. 19) tablas estadísticas, encontramos:
x
1.0
.00---------------------------------------------------.09
0.3413
En la tabla, para 0.3413, a la izquierda del valor z = 1.0,  para 0.3413,
z1  1.0
P ( 0  z  z1 )= 0.4788
Para determinar z, ubicamos el área en la tabla y luego observamos al
lado izquierda que existe 2.0 y hacia arriba (en la misma columna de
0.4788) encontramos .03  el valor de z1 es 2.03.
P ( 0  z  z1 ) = 0.4969
Con el mismo procedimiento precedente, Z1  2.74.
¿Si tenemos el área o probabilidad total, como determinamos el valor de
z1 ?
Para ‫ =ﻻ‬0.95 cuánto vale Z1 .
Tenemos: P (  z1  z  z1 )=‫=ﻻ‬0.95
De acuerdo al mensaje de la tabla, responde a P ( 0  z  z1 ) =  / 2 , por
tanto, para esta cara, tenemos P ( 0  z  z1 ) = ‫ﻻ‬/2=0.95/2; P ( 0  z  z1 )
= 0.4750; para 0.4750 en la tabla, Z1  1.96
Para ‫ﻻ‬,=0.98, z1  ?
P ( 0  z  z1 )= 0.98 / 2  0.4900
Podemos advertir que 0.4900 no la encontramos en la tabla, ¿Cómo se
actúa? Se toma el área que más cercana esté a la buscada. Por defecto
o por exceso.
En este caso los más cercanos son: 0.4901 (defecto) y 0.4904 (exceso),
de las dos áreas, la más cercana es 0.4901, para esta área el valor de
z1  2.33 , el cual será asignado como valor de z1  0.4900
 Para 0.98, z1  2.33
27
Z
.00
.03
0.0
1.0
2.0
.
.
.
2.
0.4788
Dado Z calcular el área o probabilidad.
Calcular la probabilidad, dado los valores de z.
P ( 0  z  2.09 )  ? En la tabla el área es: 0.4817
Para P ( 0  z  0.97 )= cual es el área, tabla, área = 0.3340. Que es el
valor de  / 2 Donde el valor de  / 2 ; si deseamos el valor  , el área
obtenida se multiplicará por 2, así, 0.3340*2 = 0.6680.
z1  0.97 ,   0.6680
P (  2.58  z  0 ) = ¿cuál es el área?
P (  2.58  z  0 ) = P ( 0  z  2.58 ) =, en la tabla  / 2 = 0.4951,
P (  2.58  z  0 )= 0.4951.
Si deseamos el área total baja la curva: P (  2.58  z  2.58 )=
0.4951*2=0.9902 (área total).
Para: (  2.90  z  0 )= 0.4981 encontramos en la tabla
total: 0.4981*2= 0.9972= P (  2.90  z  2.90 )
28
0.4981. Área
Descargar