TEMA 1: ESTADISTICA DESCRIPTIVA

Anuncio
ESTADÍSTICA, CURSO 2008–2009
1
TEMA 1: ESTADISTICA DESCRIPTIVA
1
FUNDAMENTOS
1.1
VARIABLES ESTADISTICAS
• Población: conjunto completo de elementos, con alguna caracterı́stica común, objeto del estudio
estadı́stico (finita o infinita).
• Muestra: subconjunto de elementos de la población.
• Caracteres cuantitativos o cualitativos.
• Variable estadı́stica: sı́mbolo que representa al dato o carácter objeto de estudio de los elementos
de la muestra y que puede tomar un conjunto de valores (discreta o continua).
• Variables unidimensionales, bidimensionales y n–dimensionales.
1.2
1.2.1
DISTRIBUCIONES DE FRECUENCIAS
Tabla de frecuencias de una variable discreta
Valores de la
variable
Frecuencias
absolutas
Frecuencias
relativas
fi
Frecuencias
absolutas
acumuladas
Ni
Frecuencias
relativas
acumuladas
Fi
xi
ni
x1
x2
x3
..
.
n1
n2
n3
..
.
f1
f2
f3
..
.
N1
N2
N3
..
.
F1
F2
F3
..
.
xk
nk
fk
Nk
Fk
• Frecuencia absoluta ni : número de veces que aparece repetido el valor xj de la variable estadı́stica.
0 ≤ ni ≤ N
k
X
;
ni = N
i=1
• Frecuencia relativa fi :
fi =
0 ≤ fi ≤ 1
k
X
;
ni
N
fi =
i=1
k
X
ni
i=1
N
Pk
i=1
=
N
ni
=1
• Frecuencia absoluta acumulada Ni :
Ni =
i
X
nj
j=1
Ni = Ni−1 + ni
;
N1 = n 1
;
Nk = N
ESTADÍSTICA, CURSO 2008–2009
2
• Frecuencia relativa acumulada Fi :
Fi =
1.2.2
1.3
1.3.1
Ni
=
N
Pi
j=1
nj
=
N
i
X
nj
j=1
N
=
i
X
fi
j=1
Agrupamiento en intervalos de clase
Intervalos
Marcas de
clase
Frecuencias
absolutas
Frecuencias
relativas
fi
Frecuencias
absolutas
acumuladas
Ni
Frecuencias
relativas
acumuladas
Fi
ai − ai+1
ci
ni
a1 − a2
a2 − a3
..
.
c1
c2
..
.
n1
n2
..
.
f1
f2
..
.
N1
N2
..
.
F1
F2
..
.
ak − ak+1
ck
nk
fk
Nk
Fk
REPRESENTACIONES GRAFICAS
Representaciones gráficas para datos sin agrupar
• Diagrama de barras
• Polı́gono de frecuencias
• Diagrama de frecuencias acumuladas
1.3.2
Representaciones gráficas para datos agrupados
• Histograma de frecuencias
• Polı́gono de frecuencias
• Polı́gono de frecuencias acumuladas
1.3.3
Representaciones gráficas para variables cualitativas
• Diagrama de rectángulos
• Diagrama de sectores
2
2.1
2.1.1
MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION
MEDIDAS DE CENTRALIZACION
Media aritmética
PN
x=
Pk
x=
i=1
N
i=1
xi
N
xi ni
=
k
X
i=1
xi fi
ESTADÍSTICA, CURSO 2008–2009
3
Pk
x=
i=1 ci ni
N
N
N
X
X
(xi − x) =
xi − N x = 0
i=1
i=1
• Transformación lineal:
y = a + bx
P
yi
y=
=
N
P
P
(a + bxi )
aN + b xi
=
= a + bx
N
N
x=
2.1.2
y−a
b
Medias geométrica, armónica y cuadrática
• Media geométrica xG
xG =
√
N
x1 x2 . . . xN
;
xG =
q
N
xn1 1 xn2 2 . . . xnk k
• Media armónica xA
N
xA = PN
;
1
i=1 xi
N
xA = Pk
ni
i=1 xi
• Media cuadrática xQ
s
xQ =
s
PN
2
i=1 xi
N
;
xQ =
Pk
x2i ni
N
i=1
xA ≤ xG ≤ x ≤ xQ
2.1.3
Mediana
Me : Medida central tal que, con los datos ordenados de menor a mayor, el 50% de los datos son inferiores a
su valor y el 50% de los datos tienen valores superiores.
1. Valores de la variable no repetidos: Valor central, si N is impar, o la media aritmética de los dos valores
centrales, si N es par.
2. Variable discreta con valores repetidos: Si N/2 = Nj ⇒ Me = (xj + xj+1 )/2. Si N/2 6= Nj ⇒ primer
valor de xj con Nj > N/2.
2.1.4
Moda
Mo : valor de la variable que tiene una frecuencia máxima.
ESTADÍSTICA, CURSO 2008–2009
2.1.5
4
Cuartiles, deciles y percentiles
• Cuartiles: divididen la muestra en cuatro partes iguales ( Q1/4 , Q1/2 , Q3/4 )
• Deciles: Dk , con k = 1, 2, . . . , 9.
• Percentiles: Pk , con k = 1, 2, . . . , 99.
2.2
2.2.1
MEDIDAS DE DISPERSION
Recorridos
• Recorrido intercuartı́lico:
RI = Q3/4 − Q1/4
• Recorrido semiintercuartı́lico:
RSI =
2.2.2
Q3/4 − Q1/4
2
Varianza y desviación tı́pica
• Varianza:
Pk
2
− x)2 ni
N −1
i=1 (xi
s =
PN
;
− x)2
N −1
i=1 (xi
2
s =
• Desviación tı́pica:
√
s=
s
Pk
−
N −1
i=1 (xi
s2 =
x)2 n
s
i
;
PN
− x)2
N −1
i=1 (xi
s=
•
s
Pk
−
N
i=1 (xi
x)2 ni
r
=
N −1
N
s
Pk
− x)2 ni
N −1
i=1 (xi
•
s2 =
2
Pk
s =
− x)2 ni
=
N −1
i=1 (xi
P
x2i ni − 2 N1
P
P
x2i ni − 2
P
xi xni +
N −1
P
xi ni xi ni +
N −1
N
N2 (
P
P
x2 ni
xi ni ) 2
P
=
Pk
=
i=1
P
x2i ni − 2x xi ni + N x2
N −1
Pk
x2i ni − N1 ( i=1 xi ni )2
N −1
• Mı́nima desviación cuadrática:
2
D =
Pk
− a)2 ni
N −1
i=1 (xi
P
−2 (xi − a)ni
∂D2
=0=
∂a
N −1
X
X
X
⇒
(xi − a)ni = 0 ⇒
xi ni − a
ni = 0
P
X
xi ni
⇒
xi ni − aN = 0 ⇒ a =
=x
N
ESTADÍSTICA, CURSO 2008–2009
5
• Transformación lineal: y = a + bx
rP
rP
r P
(yi − y)2
(a + bxi − a − bx)2
b2 (xi − x)2
sy =
=
=
= bsx
N −1
N −1
N −1
sx =
2.2.3
sy
b
Coeficientes de variación
• Coeficiente de variación de Pearson:
CV =
2.3
2.3.1
s
x
ASIMETRIA Y CURTOSIS
Coeficientes de asimetrı́a
• Coeficiente de asimetrı́a de Fisher:
Pk
m3
g1 = 3
s
donde
− x)3 ni
N
i=1 (xi
m3 =
• Coeficiente de asimetrı́a de Pearson:
AP =
2.3.2
Coeficiente de curtosis
m4
g2 = 4
s
(g2 > 3: leptocúrtica;
3
3.1
3.1.1
x − Mo
s
Pk
donde
m4 =
− x)4 ni
N
i=1 (xi
g2 = 3: mesocúrtica;
g2 < 3: platicúrtica)
VARIABLES ESTADISTICAS BIDIMENSIONALES
DISTRIBUCIONES DE FRECUENCIAS DE UNA VARIABLE BIDIMENSIONAL
Tabla de frecuencias de doble entrada
x \ y
x1
x2
x3
..
.
xi
..
.
xk
Suma
y1
n11
n21
n31
..
.
ni1
..
.
nk1
ny1
y2
n12
n22
n32
..
.
ni2
..
.
nk2
ny2
y3
n13
n23
n33
..
.
ni3
..
.
nk3
ny3
···
···
···
···
..
.
···
..
.
···
···
yj
n1j
n2j
n3j
..
.
nij
..
.
nkj
nyj
···
···
···
···
..
.
···
..
.
···
···
yl
n1l
n2l
n3l
..
.
nil
..
.
nkl
nyl
Suma
nx1
nx2
nx3
..
.
nxi
..
.
nxk
N
ESTADÍSTICA, CURSO 2008–2009
6
fij =
k X
l
X
nij
N
nij = N
i=1 j=1
k X
l
X
fij =
i=1 j=1
3.1.2
k X
l
X
nij
i=1 j=1
N
Pk
=
Pl
i=1
j=1
nij
N
=1
Distribuciones marginales
Frecuencias marginales
nxi =
l
X
nij
;
nyj =
j=1
k
X
;
nxi = N
;
fyj =
l
X
fxi = 1
l
X
;
i=1
Pk
s2x
3.1.3
Pk
=
nyj = N
fyj = 1
j=1
xi nxi
N
i=1
x=
nyj
N
j=1
i=1
k
X
nij
i=1
nxi
N
fxi =
k
X
− x)2 nxi
N −1
i=1 (xi
Pl
j=1
yj nyj
;
y=
;
s2y
;
n(yj |x = xi ) = nij
N
Pl
=
j=1 (yj
− y)2 nyj
N −1
Distribuciones condicionadas
n(xi |y = yj ) = nij
x
x1
x2
..
.
n(x|y = yj )
n1j
n2j
..
.
xi
..
.
nij
..
.
xk
nkj
ESTADÍSTICA, CURSO 2008–2009
f (xi |y = yj ) =
n(xi |y = yj )
nij
=
nyj
nyj
k
X
n(xi |y = yj ) = nyj
7
;
;
i=1
k
X
l
X
n(yj |x = xi )
nij
=
nxi
nxi
n(yj |x = xi ) = nxi
j=1
f (xi |y = yj ) = 1
i=1
3.1.4
f (yj |x = xi ) =
;
l
X
j=1
Representaciones gráficas
• Diagrama de barras e histograma tridimensional.
• Diagrama de dispersión.
f (yj |x = xi ) = 1
Descargar