Document

Anuncio
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
TEMA V
ESTADIGRAFOS DE DISPERSION Y DISTRIBUCION NORMAL
ESTANDAR
1. Estadígrafos de dispersión. Rango, desviación media, varianza y desviación
estándar, coeficiente de variación.
2. Distribución normal estándar.
OBJETIVOS DE UNIDAD
¾ GENERALES.
Proporcionar elementos que permitan apreciar y evaluar la forma en que se
dispersan los valores originales con respecto a la media y la evaluación de
valores con el auxilio de la curva normal
¾ ESPECÍFICOS.
Al concluir la unidad, el estudiante estará capacitado para calcular, identificar e
interpretar los estadígrafos de dispersión.
Con el auxilio de la curva normal, el estudiante podrá determinar el rango
percentil de cualquier va1or de una distribución de frecuencia normal.
58
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
LECCIÓN Nº 11
ESTADIGRAFOS DE DISPERSION
1. MEDIDAS DE DISPERSIÓN
La dispersión se refiere a la variabilidad o amplitud en los datos.
Las medidas más importantes de dispersión son:
(1) la desviación media
(2) la varianza, y
(3) la desviación estándar.
Las usaremos para poblaciones y muestras, así como para datos agrupados y no
agrupados.
a) La Desviación Media (DM)
¾ Para Datos No Agrupados
DM =
DM =
∑
X −µ
N
∑X−X
n
para poblaciones
para muestras
Donde las barras verticales indican el valor absoluto, o los valores que
omiten el signo, con los otros símbolos que tienen el mismo significado.
¾ Para Datos Agrupados
DM =
∑f
DM =
∑f
X −µ
N
X −X
n
para poblaciones
para muestras
Donde f se refiere a la frecuencia de cada clase y X a las marcas de
clase.
59
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
b) Varianza
La varianza de población
σ 2 (la letra griega sigma al cuadrado)
¾ Para Datos No Agrupados
σ
2
∑ (X − µ )
=
2
∑ (X − X )
=
2
N
y
s
2
n −1
¾ Para Datos Agrupados
σ
2
∑ f (X − µ )
=
2
∑ f (X − X )
=
2
N
s
y
2
n −1
c) Desviación Estándar
La desviación de la población σ y la desviación estándar de la muestras s son
las raíces cuadradas positivas de sus varianzas respectivas.
¾ Para Datos No Agrupados
σ=
∑ (X − µ )
2
∑ (X − X )
2
y
N
s=
n −1
¾ Para Datos Agrupados
σ =
∑ f (X − µ )
2
N
∑ f (X − X )
2
y
s =
n −1
La desviación estándar es la medida de dispersión (absoluta) más utilizada.
Otras medidas (además de la varianza y la desviación media) son el rango.
2. EL COEFICIENTE DE VARIACIÓN (CV)
Mide la dispersión relativa:
CV =
σ
µ
para poblaciones
y
CV =
s
X
para muestras
Ejemplo 1: La desviación media, varianza, desviación estándar, y el coeficiente de
variación para los datos no agrupados dados en la tabla 1 se pueden encontrar por
medio de los cálculos correspondientes: Tabla (1) ( µ = 7)
60
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
DM =
∑ X − u = 12 = 1.2
N
10
∑( X − µ )
=
2
σ
2
σ
2
N
∑( X − µ)
=
22
10
2
N
CV =
=
Puntos cuadrados
22
= 2.2 ≅ 1.48 puntos
10
σ
≅ 0.21ó21%
µ
Cálculos sobre los datos Notas: Tabla (1)
µ
Nota
=
Puntos
X −µ
7
7
7
7
7
7
7
7
7
7
6
7
6
8
5
7
6
9
10
6
X −µ
( X − µ )2
-1
0
-1
1
-2
0
-1
2
3
1
0
1
1
2
0
1
2
3
1
0
1
1
4
0
1
4
9
1
∑ (X − µ) = 0
1
∑ X − µ = 12
1
∑ (X − µ)
2
= 22
Ejemplo 2. La desviación media, la varianza, la desviación estándar, y el
coeficiente de Variación para la distribución de frecuencia de los pesos (datos
agrupados) dados en la tabla (2) ( X = 20.08).
DM =
∑ fX − X
n
s
2
=
6.36
= 0.318
20
∑ f (X − X )
=
n −1
onzas
2
=
2.9520
≅ 0.1554
19
onzas cuadradas
61
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
s=
CV =
∑ f (X − X )
n −1
2
=
2.9520
= 0.1554 ≅ 0.3942
19
onzas
s 0.3942oz
≅
≅ 0.0196, o 1.96%
20.08oz
X
Nótese que en la formula para s2 y s, se usan n-1 en vez de n en el
denominador.
σ
,
De las formulas σ ,
s2, y s presentadas en esta sección, se pueden
derivar otras para simplificar los cálculos en un grupo grande de datos.
2
Tabla (2)
Cálculos sobre los datos.
Peso onz.
19.20-19.40
19.50-19.70
19.80-20.00
20.10-20.30
20.40-20.60
20.70-20.90
62
Marca
de
clase
x
19.30
19.60
19.90
20.20
20.50
20.80
Frecuencia Media X - X
F
x
X- X
1
2
8
4
3
0.78
0.48
0.18
0.12
0.42
0.72
∑
2
f = n = 20
20.08
20.08
20.08
20.08
20.08
20.08
-0.78
-0.48
-0.18
0.12
0.42
0.72
∑ fX − X
0.78
0.96
1.44
0.48
1.26
∑
f ( X − X )2
(X - X )2
1.44
fX − X = 6.36
0.6084
0.2304
0.0324
0.0144
0.1764
0.5184
0.6084
0.4608
0.2592
0.0576
0.5292
∑
1.0368
f ( X − X ) 2 = 2.9520
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
LECCIÓN Nº 12
DISTRIBUCION NORMAL ESTANDAR
1. DISTRIBUCION NORMAL
La distribución normal es muy importante por lo siguiente:
¾ Es la distribución a la que se aproximan la mayoría de los fenómenos: físicos,
químicos, biológicos.
¾ Se ha tomado como base en la inferencia estadística paramétrica
¾ Otras distribuciones bajo ciertas circunstancias se pueden aproximar a la
normal
¾ Es la base para definir otras distribuciones de importancia tales como la Chi
cuadrada, t de Student y F de Fisher.
2. CARACTERISTICAS DE LA DISTRIBUCION NORMAL
Forma
¾ Es una campana simétrica con respecto a su centro.
¾ La curva tiene un solo pico; por tanto, es unimodal.
¾ La media de una población distribuida normalmente cae en el centro de su
curva normal.
¾ Debido a la simetría de la distribución normal de probabilidad, la mediana y la
moda de la distribución se encuentran también en el centro; en consecuencia,
para una curva normal, la media, la mediana y la moda tienen el mismo valor.
¾ Los dos extremos de la distribución normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal
Parámetros
Está caracterizada por dos parámetros
a).- Parámetro de localización: La media
63
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
b).- Parámetro de forma: La varianza
DISTRIBUCION NORMAL ESTANDAR.
Z=
x−µ
σ
Su fórmula es:
Ejemplo: La altura media que alcanza el maíz es de 2.75 m con una desviación
estándar de 0.63m.
1. ¿Cuál es la probabilidad o proporción de carrizos con una altura mayor a
3.50m?
P( x > 350
. ) = 0.500 − 0.3830 = 0117
.
2. Si seleccionamos unos carrizos al azar, cuál es la probabilidad que midan
entre 2 y 3 m.
P( x = 2 y 3) = 0.3830 + 01517
.
= 0.5347
2 − 2.75 − 0.75
=
= −11904
.
0.63
0.63
3 − 2.75 0.25
=
= 0.3968
Z=
0.63
0.63
Z=
3. Cúal es la probabilidad o proporción de carrizos de maíz con altura mayor
de 1.75m?
P( x > 175
. ) = 0.500 + 0.4429 = 0.9429
3. AREAS BAJO LA CURVA NORMAL
No importa cuáles sean los valores de la µ y σ para una distribución de
probabilidad normal, el área total bajo la curva es 1.00, de manera que podemos
pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es
verdad que:
2
¾ Aproximadamente 68% de todos los valores de una población normalmente
distribuida se encuentra dentro de ±1 desviación estándar de la media.
¾ Aproximadamente 95.5 % de todos los valores de una población normalmente
distribuida se encuentra dentro de ± 2 desviación estándar de la media.
64
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
¾ Aproximadamente 99.7 % de todos los valores de una población normalmente
distribuida se encuentra dentro de ± 3 desviación estándar de la media.
USO DE LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR
Observe en esta tabla la localización de la columna identificada con z. El valor de z
está derivado de la formula:
X = valor de la variable aleatoria que nos preocupa
µ = media de la distribución de la variable aleatoria
σ = desviación estándar de la distribución
Z = número de desviaciones estándar que hay desde x a la media de la distribución
Utilizamos Z en lugar del ‘número de desviaciones estándar’ porque las variables
aleatorias normalmente distribuidas tienen muchas unidades diferentes de medición:
dólares, pulgadas, partes por millón, kilogramos, segundos. Como vamos a utilizar una
tabla, la tabla I, hablamos en términos de unidades estándar (que en realidad significa
desviaciones estándar), y denotamos a éstas con el símbolo z.
µ = 50
X
125
-25 0 25 50 75 100
-----------------------------------------3 -2 -1 0
1
2
3
Z=
σ = 25
x−µ
σ
La tabla representa las probabilidades o áreas bajo la curva normal calculadas desde
la µ x hasta los valores particulares de interés X. Usando la ecuación de Z, esto
corresponde a las probabilidades o áreas bajo la curva normal estandarizada desde la
media ( µ z = 0) hasta los valores transformados de interés Z.
Sólo se enumeran entradas positivas de Z en la tabla, puesto que para una
distribución simétrica de este tipo con una media de cero, el área que va desde la
media hasta +Z (es decir, Z desviaciones estándar por encima de la media) debe ser
idéntica al área que va desde la media hasta –Z (es decir, Z desviaciones estándar por
debajo de la media).
También podemos encontrar la tabla que indica el área bajo la curva normal estándar
que corresponde a P(Z < z) para valores de z que van de –3.49 a 3.49.
65
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
Al usar la tabla observamos que todos los valores Z deben registrarse con hasta dos
lugares decimales. Por tanto, nuestro valor de interés particular Z se registra como +.2.
para leer el área de probabilidad bajo la curva desde la media hasta Z = +.20,
podemos recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor
de interés Z. Así pues, nos detenemos en la fila Z = .2. A continuación, leemos esta fila
hasta que intersecamos la columna que contiene el lugar de centésimas del valor Z.
Por lo tanto, en la tabla, la probabilidad tabulada para Z = 0.20 corresponde a la
intersección de la fila Z = .2 con la columna Z = .00 como se muestra.
Z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
66
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR
DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR
Áreas bajo la distribución de probabilidad Normal Estándar entre la media y valores
positivos de Z
µ = 0 y σ²=1
Z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
4.0
.00
0.00000
0.03983
0.07926
0.11791
0.15542
0.19146
0.22575
0.25804
0.28814
0.31594
0.34134
0.36433
0.38493
0.40320
0.41924
0.43319
0.44520
0.45543
0.46407
0.47128
0.47725
0.48214
0.48610
0.48928
0.49180
0.49379
0.49534
0.49653
0.49744
0.49813
0.49865
0.49903
0.49931
0.49952
0.49966
0.49977
0.49984
0.49989
0.49993
0.49995
0.49997
.01
0.00399
0.04380
0.08317
0.12172
0.15910
0.19497
0.22907
0.26115
0.29103
0.31859
0.34375
0.36650
0.38686
0.40490
0.42073
0.43448
0.44630
0.45637
0.46485
0.47193
0.47778
0.48257
0.48645
0.48956
0.49202
0.49396
0.49547
0.49664
0.49752
0.49819
0.49869
0.49906
0.49934
0.49953
0.49968
0.49978
0.49985
0.49990
0.49993
0.49995
0.49997
.02
0.00798
0.04776
0.08706
0.12552
0.16276
0.19847
0.23237
0.26424
0.29389
0.32121
0.34614
0.36864
0.38877
0.40658
0.42220
0.43574
0.44738
0.45728
0.46562
0.47257
0.47831
0.48300
0.48679
0.48983
0.49224
0.49413
0.49560
0.49674
0.49760
0.49825
0.49874
0.49910
0.49936
0.49955
0.49969
0.49978
0.49985
0.49990
0.49993
0.49996
0.49997
.03
0.01197
0.05172
0.09095
0.12930
0.16640
0.20194
0.23565
0.26730
0.29673
0.32381
0.34849
0.37076
0.39065
0.40824
0.42364
0.43699
0.44845
0.45818
0.46638
0.47320
0.47882
0.48341
0.48713
0.49010
0.49245
0.49430
0.49573
0.49683
0.49767
0.49831
0.49878
0.49913
0.49938
0.49957
0.49970
0.49979
0.49986
0.49990
0.49994
0.49996
0.49997
.04
0.01595
0.05567
0.09483
0.13307
0.17003
0.20540
0.23891
0.27035
0.29955
0.32639
0.35083
0.37286
0.39251
0.40988
0.42507
0.43822
0.44950
0.45907
0.46712
0.47381
0.47932
0.48382
0.48745
0.49036
0.49266
0.49446
0.49585
0.49693
0.49774
0.49836
0.49882
0.49916
0.49940
0.49958
0.49971
0.49980
0.49986
0.49991
0.49994
0.49996
0.49997
.05
0.01994
0.05962
0.09871
0.13683
0.17364
0.20884
0.24215
0.27337
0.30234
0.32894
0.35314
0.37493
0.39435
0.41149
0.42647
0.43943
0.45053
0.45994
0.46784
0.47441
0.47982
0.48422
0.48778
0.49061
0.49286
0.49461
0.49598
0.49702
0.49781
0.49841
0.49886
0.49918
0.49942
0.49960
0.49972
0.49981
0.49987
0.49991
0.49994
0.49996
0.49997
.06
0.02392
0.06356
0.10257
0.14058
0.17724
0.21226
0.24537
0.27637
0.30511
0.33147
0.35543
0.37698
0.39617
0.41308
0.42785
0.44062
0.45154
0.46080
0.46856
0.47500
0.48030
0.48461
0.48809
0.49086
0.49305
0.49477
0.49609
0.49711
0.49788
0.49846
0.49889
0.49921
0.49944
0.49961
0.49973
0.49981
0.49987
0.49992
0.49994
0.49996
0.49998
.07
0.02790
0.06749
0.10642
0.14431
0.18082
0.21566
0.24857
0.27935
0.30785
0.33398
0.35769
0.37900
0.39796
0.41466
0.42922
0.44179
0.45254
0.46164
0.46926
0.47558
0.48077
0.48500
0.48840
0.49111
0.49324
0.49492
0.49621
0.49720
0.49795
0.49851
0.49893
0.49924
0.49946
0.49962
0.49974
0.49982
0.49988
0.49992
0.49995
0.49996
0.49998
.08
0.03188
0.07142
0.11026
0.14803
0.18439
0.21904
0.25175
0.28230
0.31057
0.33646
0.35993
0.38100
0.39973
0.41621
0.43056
0.44295
0.45352
0.46246
0.46995
0.47615
0.48124
0.48537
0.48870
0.49134
0.49343
0.49506
0.49632
0.49728
0.49801
0.49856
0.49896
0.49926
0.49948
0.49964
0.49975
0.49983
0.49988
0.49992
0.49995
0.49997
0.49998
.09
0.03586
0.07535
0.11409
0.15173
0.18793
0.22240
0.25490
0.28524
0.31327
0.33891
0.36214
0.38298
0.40147
0.41774
0.43189
0.44408
0.45449
0.46327
0.47062
0.47670
0.48169
0.48574
0.48899
0.49158
0.49361
0.49520
0.49643
0.49736
0.49807
0.49861
0.49900
0.49929
0.49950
0.49965
0.49976
0.49983
0.49989
0.49992
0.49995
0.49997
0.49998
67
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
PRUEBA AUTOEVALUATIVA
V UNIDAD
1. El estudio de los estadígrafos de dispersión es importante:
a. Porque nos define con más claridad la estadística y sus métodos.
b. Porque nos permite tener una información auxiliar para definir el verdadero
comportamiento de los valores que toma la variable.
c. Porque nos permite concentrar en un concepto los dispersos temas
estadísticos.
d. Porque la dispersión se profundiza a medida que avanza el curso.
e. Ninguna de las anteriores.
2. Hallar la desviación media de la información proporcionada en la pregunta (6)
de la autoevaluación de la segunda unidad.
a) 6,36
d) 11,8
b) 9,8
c) 12
e) Ninguna de las anteriores
3. Se tiene la siguiente información sobre el número de docentes por C.E: 12,
14, 16, 18, 20. Calcular la desviación media (DM) y la varianza (S2).
a) DM = 3
S2 = 10
b) DM = 3.5
S2 = 9
c) DM = 2,4
S2 = 8
d) DM = 5
S2 = 2
e) Ninguna de las anteriores
4. Calcular la varianza (S2) y la desviación estándar (S) para los daros
proporcionados en la pregunta (6) de la autoevaIuación de la segunda
unidad. Ten preseme el numero de datos.
a) S2 = 66,98
S = 8,18
d) S2 = 36
S=6
b) S2 = 6,7
S = 2,59
a) S2 = 32,82
S = 5,73
e) Ninguna de las anteriores
5. Calcular la varianza (S2) y la desviación estándar (S) para la información
proporcionada en la pregunta (6) de la autoevaIuación de la tercera unidad.
Fíjate bien en el número de observaciones.
a) S2 = 46,17
S = 6,79
d) S2 = 25
S=5
68
b) S2 = 64,71
S = 8,04
c) S2 = 71,64
S = 8,46
e) Ninguna de las anteriores
EDUCA INTERACTIVA
UNIVERSIDAD “JOSE CARLOS MARIATEGUI”
6. Hallar el coeficiente de variación para la distribución planteada en la
pregunta (6) de la autoevaluacion de la tercera unidad:
a) CV = 25%
d) CV = 22,49%
b) CV = 49,15%
c) CV = 49%
e) Ninguna de las anteriores
7. En una muestra de 100 alumnos, se observa con mucha preocupación que el
calificativo promedio es de 44.3 puntos con una desviación estándar de
16.94. El alumno Vásquez ha obtenido un calificativo de 60. Con ayuda de la
curva normal, hallar su rango percentil y además indicar cuántos alumnos
están por debajo de él.
a) 32%
32
b) 60%
60
c) 82.38%
82
d) 52%
22
e) Ninguna de las anteriores
8. Con los datos de la pregunta anterior evaluar el calificativo del alumno
Olivares quien ha obtenido la nota de 30, indicar además, debajo de cuántos
alumnos está ubicado el referido alumno.
a) 20,05%
80
b) 30%
70
c) 30%
50
d) 35%
70
e) Ninguna de las anteriores
9. Con la información de la pregunta 7 Y 8 de la presente evaluación, hallar qué
tanto por ciento de alumnos están comprendidos entre el calificativo de
Vásquez y el de Olivares y a cuántos alumnos equivale este %.
a) 50%
25
b) 63,33%
62
c) 70%
70
d) 55%
55
e) Ninguna de las anteriores
10. El coeficiente de variación se define como:
a. El indicador que mide la variación de las variables.
b. La forma en que varía una muestra de otra.
c. El indicador que mide el grado de dispersión de los valores respecto a la
media.
d. a y b.
e. Ninguna de las anteriores.
69
EDUCA INTERACTIVA
Descargar