Subido por Vladimir Milian Nuñez

Resumen Tema IV

Anuncio
Resumen de Pruebas de Hipótesis
Procedimiento para realizar cualquier prueba de Hipótesis
Tipos de pruebas de hipótesis:
1. Párametricas
2. Comparación Múltiple
3. Análisis de Varianza (ANOVA)
4. De Ajuste a distribuciones de probabilidad (bondad de ajuste)
5. De Homogeneidad de los datos (dependencia entre características)
Pasos para realizar la prueba (contraste):
Antes de examinar los datos muestrales:
1. Identificar el parámetro o parámetros de interés.
2. Establecer la Hipótesis Nula.
3. Especificar una Hipótesis Alternativa adecuada.
4. Seleccionar un Nivel de Significación α.
Usando los datos muestrales:
5. Establecer un estadígrafo de prueba adecuado.
6. Establecer una región de rechazo.
7. Calcular todas las cantidades muestrales necesarias para el estadígrafo.
8. Dar la conclusión Estadística y Práctica.
Pruebas Paramétricas:
Parámetro
Casos


 conocida)
  0
  0
(con
Bilateral
(de 2colas)
Caso 1
Ho:    0
H1:    0
Región C:
Z  Z1
2
 conocida)
  0
  0
2
p
 2   02
pˆ  pˆ 0
pˆ  pˆ 0
T  T
 2  12
( sin
; n1
2
 2  02
  
2
Unilateral
(de 1 cola)
Caso 2
Unilateral
(de 1 cola)
Caso 3
Ho:    0
H1:    0
Región C:
Ho:    0
H1:    0
Región C:
; n1
Z  Z1
2
; n 1
  0
  0
 2  02
Z  Z1
T  T ; n1
 2  2; n1
Z  Z1
  0
  0
  0
  0
T  T ; n1
 2  02
pˆ  pˆ 0
pˆ  pˆ 0
Z   Z1
x  0
Sx
donde S x es:

ó es:
n
S
n
T 
 
2
pˆ  pˆ 0
pˆ  pˆ 0
2
0
 2  02
 2  12 ; n1
x  0
Sx
2 
Sx
donde
donde
S
n
es:
2
2
  0
  0
Z 
Estadígrafo
2
(n  1) S 2
0
2
n = tamaño de
muestra
Z   Z1
Z
pˆ  pˆ 0
S pˆ
donde
S pˆ es:
pˆ 0 (1  pˆ 0 )
n
y n  30
Todas las magnitudes  0 , pˆ 0 ,02 se extraen de la afirmación (Hipótesis) que se quiere contrastar, y
las demás ( x , S , n, k ) se extraen de la muestra dada
o de los datos de la población (  2 , ) .
Pruebas de Comparaciónes Múltiples
(con  conocida)
1 , 2
( sin  conocida)
1 2 ,2 2
H1: 1   2  
Región C:
1   2  
1   2  
Z  Z1
1   2  
1   2  
1  
Ho: 1   2  
1   2  
1   2  
Parámetros
Casos
Bilateral
(de 2colas)
Caso 1
Unilateral
(de 1 cola)
Caso 2
Unilateral
(de 1 cola)
Caso 3
Ho: 1   2  
1 , 2
T  T
2
1  
1  2  
Z  Z1
T  T ; n1
Ho: 1   2  
1   2  
1   2  
donde S x es:

ó es:
Estadígrafo
n
S
n
y n  30
T 
x1  x2  
Sx
donde
Sx
1 2  22
F  F ;V 1,V 2
1 2  22
n = tamaño
x  x2  
Z  1
Sx
2
2
1 2  22
1  2  
T  T ; n1
Z   Z1
F  F ;VM ,Vm
2
1  2  
1  2  
2
2
12  22
H1: 1   2  
Región C:
H1: 1   2  
Región C:
(n>29)
2
; n1
2
es:
(n1  1) S12  (n2  1) S 22
 n1n2 (n1  n2  2) 


n1  n2


p1 , p 2
F  F ;V 2,V 1
S M2
S m2
donde M es:
F
la muestra de
mayor varianza
p1  p2  
p1  p2  
Z  Z1
p1  p2  
p1  p2  
Z  Z1
p1  p2  
p1  p2  
Z   Z1
Z
pˆ 1  pˆ 2  
S pˆ
donde
S pˆ es:
1 1
p(1  p)  
 n1 n2 
y
p
x1  x2
n1  n2
ANOVA
Modelo general de ANOVA:
medias
Muestra 1 y11 , y12 ,..., y1n
y1
Muestra 2 y 21 , y 22 ,..., y 2n
y2

Muestra k


y k1 , y k2 ,..., y kn
yk
y
Hipótesis:
H 0 : 1   2 ...   k
H1 : i   j ,
para i  j
Las medias son iguales o difieren
Ó
H 0 : 1   2 ...   k  0
H1 :  i  0,
2
para un i
El factor afecta o no afecta por igual las muestras
F  F ;k 1; N  k
Región crítica:
F
Estadígrafo:
SCR /( k  1)
SCE /( N  k )
Donde
k
cantidad de muestras
Tamaño de la muestra i
ni
k
N   ni
Total de datos observados
i 1
n
Ti   yij
Suma de los datos de la muestra i
j 1
k
T   Ti
Suma de todos los datos de las muestras
i 1
C
T2
N
Constante
k
n
SCT   yij2  C
Suma de cuadrados totales
k
T 2 
SCR    i   C
i 1  ni 
Suma de cuadrados de los residuos
SCE  SCT  SCR
Sumas de los cuadrados de los errores
i 1 j 1
Tabla ANOVA:
Fuente de
variación
G.L
S.C.
C.M.
Residuos
k-1
SCR
MSCR =SCR/(k-1)
Error
N-k
SCE
MSCE =SCE/(N-k)
Totales
N-1
SCT
F
MSCR / MSCE
Pruebas No paramétricas
Ho: Oi  Ei
Ha: Oi  Ei
Región C:
Estadígrafo
Contraste de Bondad de ajuste
Oi  Ei
Oi  Ei
Prueba de homogeneidad
Oij  Eij ( A y B son Independientes)
 2  2; k r 1
 2  2; ( m1)( n1)
Donde:
k = número de clases
r=0
Donde:
m = número de filas
n = número de columnas
k
 
2
Oij  Eij ( A y B son Dependientes)
Oi  Ei 2
i 1
k
 
2
Ei
i 1
j 1
ij
 Eij 
2
Eij
2
Clases
Oi
Pi
Ei=n*Pi Oi-Ei
Intervalo 1
O1
P1
E1
Intervalo 2
O2
P2
E2
Intervalo 3
.
.
.
Intervalo k
O3
.
.
.
Ok
P3
.
.
.
Pk
E3
.
.
.
Ek
(Oi-Ei)2
(Oi-Ei)2/Ei
(chi-cuadrado)
2
2
Segunda porción de 
Primera porción de
.
.
.
.
.
.
n es la suma de las Oi, o total de datos observados.
P1 = p(Intervalo 1) = pasos lógicos = valor de probabilidad 1
P2 = p(Intervalo 2) = pasos lógicos = valor de probabilidad 2
…
Pk = p(Intervalo k) = pasos lógicos = valor de probabilidad k
2 

O
se usa tabla de contingencia para calcular  2
se usa tabla de frecuencias para
calcular  2
Tabla de frecuencias para cálculo de
n
(O1  E1)2 (O2  E 2)2
(Ok  Ek )2

 ... 
E1
E2
Ek
k-ésima porción de
2
Tabla de Contingencia para cálculo de
a1
a2
.
.
.
am
totales
2
b1
b2
b3
…
bn
totales
O11
(E11)
O21
(E21)
.
.
.
Om1
(Em1)
Tb1
O12
(E12)
O22
(E22)
.
.
.
Om2
(Em2)
Tb2
O13
(E13)
O23
(E23)
.
.
.
Om3
(Em3)
Tb3
…
O1n
(E1n)
O2n
(E2n)
.
.
.
Omn
(Emn)
Tn
Ta1
…
.
.
.
…
Ta2
Tm
T
(O11  E11) 2 (O12  E12) 2
(O1n  E1n) 2
 

 ... 

E11
E12
E1n
(O 21  E 21) 2 (O 22  E 22) 2
(O 2n  E 2n) 2


 ... 

E 21
E 22
E 2n
(Om1  Em1) 2 (Om 2  Em2) 2
(Omn  Emn) 2
 ... 

 ... 
Em1
Em2
Emn
2
En estos casos, se puede calcular los valores esperados como Ei = Tm*Tn/T, por ejemplo:
E13 = Ta1*Tb3/T
Descargar