Tema II. Las muestras y la teoría paramétrica Ejemplo de muestra?

Anuncio
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.1. Muestras y muestreos:
- La muestra:
. Subconjunto de elementos de la población
. Necesidad práctica:
. Motivos económicos
. Imposibilidad (práctica/teórica) de estudiar TODA la población
. Inconveniencia práctica o ética (al destruir o afectar la muestra)
. Representativa de la población
- Estrategias de muestreo:
. Muestreo aleatorio (conocemos la p de la población en la muestra)
. Muestreo opinático (criterios subjetivos; experiencia del investigador)
. Muestreo piloto (previo a un estudio)
Ejemplo de muestra?
1
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.1. Muestras y muestreos:
- Tipos de muestreo aleatorio (representativo):
. Simple con reemplazamiento (o con N grande)
. Simple sin reemplazamiento
. Estratificado (en función de la estructura de la población)
. Por áreas (geográficas, por ejemplo)
Ejemplo de estratificación
2
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.2. Muestras, estadísticos y estimadores:
- Normalmente SIEMPRE se trabaja con muestras (estadísticos y estimadores):
. Estadístico: cualquier función que resume propiedades de la muestra
. Estimador: cuando un estadístico pretende inferir el valor de la población:
. μ (x)
. σ2 (s2)
- Estimación puntual (por intervalos)
x=
∑xi
n
s2 =
∑(xi-x)2
(n-1)
3
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.3. Las muestras y la distribución muestral:
- La distribución de probabilidad del estadístico (estimador) cambia en la muestra
- El procedimiento de inferencia parámetrico (empírico):
- Se obtiene una muestra
- Se mide el estadístico
- Se imagina uno ∞ muestras idénticas sobre las que se calcula el estadístico
- Se obtiene la distribución muestral (ejemplo Excel)
Distribución Población
1.2
Población
1
2
3
4
5
6
7
8
9
10
Muestra 1 = 2, 6, 9
(5,67)
Muestra 2 = 1, 3, 6
(3,33)
1
0.8
0.6
0.4
0.2
Muestra 3 = 4, 5, 5
(4,67)
Muestra 4 = 7, 7, 8
(7,33)
Muestra 5 = 1, 7, 9
(5,67)
Muestra 6 = 1, 5, 5
(3,67)
Muestra 7 = 6, 6, 8
(6,67)
Muestra 8 = 1, 2, 3
(2,00)
Muestra 9 = 8, 9, 10
(9,00)
Muestra 10 = 4, 5, 5
(4,67)
¡¡La distribución muestral ES normal!!
0
1
2
3
4
5
6
7
8
9
10
Distribución de Frecuencias
Clase 1-2:
Clase 3-4:
Clase 5-6:
Case 7-8:
Clase 9-10:
1
2
4
2
1
Distribución muestral
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
4
1
2
3
4
5
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.3. Las muestras y la distribución muestral:
- Obtención de la distribución muestral de la media:
. Procedimiento inferencial teórico
N1 = 10
. Tamaño de muestra (N)
. Media muestral (xs)
. Varianza muestral (s2s)
1
Distribución de la Población
M
a
str
e
u
σ2
μ
Fórmula General
xs1 = μ
S2
Varm =
N2 = 100
N
xs2 = μ
s2
S2s1 =
10
s2
S2s2 =
100
5
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.3. Las muestras y la distribución muestral:
- El uso de tablas de referencia (distribución t):
- Obtención de IC
- Test de Hipótesis
±
×
6
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.3. Las muestras y la distribución muestral:
- Aplicación a muestras, la distribución t:
. Ejemplo de muestra (IC)
±
×
Ejemplo de Muestra (N = 8)
ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9
Estadística descriptiva:
Media de muestra (μ)
Varianza de muestra (σ2)
Desviación típica de muestra (σ)
= 10,07
= 0,571
= 0,755
s2 =
∑(xi-x)2
(n-1)
OBTENCIÓN DE INTERVALO DE CONFIANZA
N NC
8
8
CÁLCULO
95% 10,07 ± 0,63 (2,36 x 0,755/√8)
99% 10,07 ± 0,93 (3,50 x 0,755/√8)
80 95% 10,07 ± 0,17 (1,99 x 0,755/√80)
80 99% 10,07 ± 0,22 (2,64 x 0,755/√80)
INT1
INT2
9,4
9,1
10,7
11,0
9,9
9,8
10,2
10,3
Este intervalo se refiere al de la media de nuestra muestra
7
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.3. Las muestras y la distribución muestral:
- Aplicación a muestras, la distribución t:
. Ejemplo de muestra (Test de hipótesis)
Ejemplo de Muestra (N = 8)
ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9
Estadística descriptiva:
Media de muestra (μ)
Varianza de muestra (σ2)
Desviación típica de muestra (σ)
Método General
= 10,07
= 0,571
= 0,755
x – μ (H0)
σ/√n
Nivel significación 5% (p una cola 0.025)
N = 8, si X = 10,5; H0 = pertenece a la población; H1 =no
(10,5 – 10,07)/(0,755/√8) = 1,61 : p en tabla t > 0.05; (>0,1 dos colas)
Según NS del 5% se acepta H0
8
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
Método General
2.4. Aplicación del test t en muestras:
- Diferencias entre dos muestras:
. Ejemplo en el Hospital
. Análisis descriptivo
. Test t (H0 y H1)
- Con comparaciones múltiples se usa ANOVA
t=
x1 – x2 – (μ1- μ2; H0=0)
σ2p 1
√
n1
1
n2
Porcentage de HDL en sangre
Muestra 1 (10 enfermos): 120, 107, 110, 116, 114, 111, 113, 117, 114, 112
Muestra 2 (10 sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111
Estadística descriptiva:
Media (μ)
Varianza (σ2)
Desviación típica (σ)
σ2ponderada =
(n1-1) σ21 + (n2-2) σ22
n1 + n2 – 2
t = 3,484
GL = n1 + n2 -2 = 18
Muestra 1
113,4
13,822
3,72
Muestra 2
108,6
5,155
2,27
(9x13,822) + (9x5,155)
=
= 9,488 (3,08)
18
Valor de probabilidad asociado a dicha t < 0.01
Valor de t al límite del 5% = 2,109
9
por ello se puede rechazar la h0
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
Método General
2.5. Aplicación del test t en muestras:
- Diferencias entre dos muestras apareadas:
. Ejemplo en el Hospital
. Test t (H0 y H1)
t=
D – δ (H0=0)
√(σ2p/nparejas)
Porcentage de HDL en sangre
Muestra 1 (10 enfermos):
120, 107, 110, 116, 114, 111, 113, 117, 114, 112
Muestra 2 (los mismos sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111
Diferencia:
10,
-4, 3, 8, 4, 6, 6, 11, 3, 1
Estadística descriptiva:
Media (μ)
Varianza (σ2)
Desviación típica (σ)
H0 = D no es distinto de 0;
t = 3,42
GL = n -1 = 9
D
4,8
19,73
4,44
H1 = Si lo es
Valor de probabilidad asociado a dicha t < 0.01
Valor de t al límite del 5% = 2,26
por ello se puede rechazar la h0
10
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.6. Estimación y test de hipótesis con otros estadísticos:
- Diferencias entre dos varianzas:
. La razón de varianzas (s21/s22)
. La distribución F:
. GL1 (numerador-1) y GL2 (denominador-1)
. Puede ser asimétrica o no
. Test de una cola
Casos de la distribución F:
F(1, ∞) = Distribución Normal
F(1, n2) = Distribución t
F(n1, ∞) = Distribución χ2
11
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.6. Estimación y test de hipótesis con otros estadísticos :
- Diferencias entre dos varianzas:
. Uso de la distribución F:
. Se elige NS
. Se busca valor F GL1 y GL2
. Se determina rechazo o no de H0
NS = 5%
Ejemplo: F = 3,45
GL1 = 3
GL2 = 17
Como 3,45 < 3,59
No significativo
Se acepta H0
12
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.6. Estimación y test de hipótesis con otros estadísticos :
- Diferencias entre dos varianzas:
. Ejemplo en el Hospital
. Conclusión
Porcentage de HDL en sangre
Muestra 1 (10 enfermos): 120, 107, 110, 116, 114, 111, 113, 117, 114, 112
Muestra 2 (10 sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111
Estadística descriptiva:
Media (μ)
Varianza (σ2)
Desviación típica (σ)
Muestra 1
113,4
13,822
3,72
Muestra 2
108,6
5,155
2,27
H0 = no hay diferencias en varianzas
H1 = si las hay
F = Mayor/Menor = 2,68
F5%(9,9) = 3.18
Fprueba < Ftabla = se acepta H0
13
Muestra 1 y 2 con iguales varianzas
Tema II. Las muestras y la teoría paramétrica
UNIVERSIDAD DE VIGO
2.6. Estimación y test de hipótesis con otros estadísticos :
- Diferencias entre dos varianzas:
. La razón de varianzas (s21/s22)
. La distribución F:
. GL1 (numerador-1) y GL2 (denominador-1)
. Asimétrica
. Test de una cola
Casos de la distribución F:
F(1, ∞) = Distribución Normal
F(1, n2) = Distribución t
F(n1, ∞) = Distribución χ2
14
UNIVERSIDAD DE VIGO
Tema II. Las muestras y la teoría paramétrica
2.7. Otros tests de hipótesis:
- Evaluación de proporciones, frecuencias, etc:
. Métodos no paramétricos (análisis de frecuencias):
. Χ2 (conjunto de distribuciones; asimétricas; de una cola)
. Test G
- Métodos NO-Paramétricos de aleatorización/remuestreo empírico, etc.
df\upper tail area
0.99
0.95
0.90
0.10
0.05
0.01
1
0.00016
0.0039
0.016
2.706
3.841
6.635
2
0.020
0.103
0.211
4.605
5.991
9.210
3
0.115
0.352
0.584
6.251
7.815
11.34
4
0.297
0.711
1.064
7.779
9.488
13.28
5
0.554
1.145
1.610
9.236
11.07
15.09
10
2.558
3.940
4.865
15.99
18.31
23.21
15
5.229
7.261
8.547
22.31
25.00
30.58
20
8.260
10.85
12.44
28.41
31.41
37.57
25
11.52
14.61
16.47
34.38
37.65
44.31
df > 30: use z = sqrt(2chi2)-sqrt(2df-1)
15
Referencias Bibliográficas
UNIVERSIDAD DE VIGO
LIBROS:
Daniel, W.W. 1989. Bioestadística. Base para el análisis de las
ciencias de la salud. Limusa, México.
Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York
PÁGINAS WEB:
http://www.statsoft.com/textbook/sttable.html
(tablas en línea para ver probabilidades de la distribución t)
http://home.ubalt.edu/ntsbarsh/excel/excel.htm
(programación de cálculos estadísticos en EXCEL)
http://statpages.org/
(Página que permite análisis estadísticos interactivos)
16
Descargar