ESTADÍSTICA, CURSO 2008–2009 1 TEMA 1: ESTADISTICA DESCRIPTIVA 1 FUNDAMENTOS 1.1 VARIABLES ESTADISTICAS • Población: conjunto completo de elementos, con alguna caracterı́stica común, objeto del estudio estadı́stico (finita o infinita). • Muestra: subconjunto de elementos de la población. • Caracteres cuantitativos o cualitativos. • Variable estadı́stica: sı́mbolo que representa al dato o carácter objeto de estudio de los elementos de la muestra y que puede tomar un conjunto de valores (discreta o continua). • Variables unidimensionales, bidimensionales y n–dimensionales. 1.2 1.2.1 DISTRIBUCIONES DE FRECUENCIAS Tabla de frecuencias de una variable discreta Valores de la variable Frecuencias absolutas Frecuencias relativas fi Frecuencias absolutas acumuladas Ni Frecuencias relativas acumuladas Fi xi ni x1 x2 x3 .. . n1 n2 n3 .. . f1 f2 f3 .. . N1 N2 N3 .. . F1 F2 F3 .. . xk nk fk Nk Fk • Frecuencia absoluta ni : número de veces que aparece repetido el valor xj de la variable estadı́stica. 0 ≤ ni ≤ N k X ; ni = N i=1 • Frecuencia relativa fi : fi = 0 ≤ fi ≤ 1 k X ; ni N fi = i=1 k X ni i=1 N Pk i=1 = N ni =1 • Frecuencia absoluta acumulada Ni : Ni = i X nj j=1 Ni = Ni−1 + ni ; N1 = n 1 ; Nk = N ESTADÍSTICA, CURSO 2008–2009 2 • Frecuencia relativa acumulada Fi : Fi = 1.2.2 1.3 1.3.1 Ni = N Pi j=1 nj = N i X nj j=1 N = i X fi j=1 Agrupamiento en intervalos de clase Intervalos Marcas de clase Frecuencias absolutas Frecuencias relativas fi Frecuencias absolutas acumuladas Ni Frecuencias relativas acumuladas Fi ai − ai+1 ci ni a1 − a2 a2 − a3 .. . c1 c2 .. . n1 n2 .. . f1 f2 .. . N1 N2 .. . F1 F2 .. . ak − ak+1 ck nk fk Nk Fk REPRESENTACIONES GRAFICAS Representaciones gráficas para datos sin agrupar • Diagrama de barras • Polı́gono de frecuencias • Diagrama de frecuencias acumuladas 1.3.2 Representaciones gráficas para datos agrupados • Histograma de frecuencias • Polı́gono de frecuencias • Polı́gono de frecuencias acumuladas 1.3.3 Representaciones gráficas para variables cualitativas • Diagrama de rectángulos • Diagrama de sectores 2 2.1 2.1.1 MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION MEDIDAS DE CENTRALIZACION Media aritmética PN x= Pk x= i=1 N i=1 xi N xi ni = k X i=1 xi fi ESTADÍSTICA, CURSO 2008–2009 3 Pk x= i=1 ci ni N N N X X (xi − x) = xi − N x = 0 i=1 i=1 • Transformación lineal: y = a + bx P yi y= = N P P (a + bxi ) aN + b xi = = a + bx N N x= 2.1.2 y−a b Medias geométrica, armónica y cuadrática • Media geométrica xG xG = √ N x1 x2 . . . xN ; xG = q N xn1 1 xn2 2 . . . xnk k • Media armónica xA N xA = PN ; 1 i=1 xi N xA = Pk ni i=1 xi • Media cuadrática xQ s xQ = s PN 2 i=1 xi N ; xQ = Pk x2i ni N i=1 xA ≤ xG ≤ x ≤ xQ 2.1.3 Mediana Me : Medida central tal que, con los datos ordenados de menor a mayor, el 50% de los datos son inferiores a su valor y el 50% de los datos tienen valores superiores. 1. Valores de la variable no repetidos: Valor central, si N is impar, o la media aritmética de los dos valores centrales, si N es par. 2. Variable discreta con valores repetidos: Si N/2 = Nj ⇒ Me = (xj + xj+1 )/2. Si N/2 6= Nj ⇒ primer valor de xj con Nj > N/2. 2.1.4 Moda Mo : valor de la variable que tiene una frecuencia máxima. ESTADÍSTICA, CURSO 2008–2009 2.1.5 4 Cuartiles, deciles y percentiles • Cuartiles: divididen la muestra en cuatro partes iguales ( Q1/4 , Q1/2 , Q3/4 ) • Deciles: Dk , con k = 1, 2, . . . , 9. • Percentiles: Pk , con k = 1, 2, . . . , 99. 2.2 2.2.1 MEDIDAS DE DISPERSION Recorridos • Recorrido intercuartı́lico: RI = Q3/4 − Q1/4 • Recorrido semiintercuartı́lico: RSI = 2.2.2 Q3/4 − Q1/4 2 Varianza y desviación tı́pica • Varianza: Pk 2 − x)2 ni N −1 i=1 (xi s = PN ; − x)2 N −1 i=1 (xi 2 s = • Desviación tı́pica: √ s= s Pk − N −1 i=1 (xi s2 = x)2 n s i ; PN − x)2 N −1 i=1 (xi s= • s Pk − N i=1 (xi x)2 ni r = N −1 N s Pk − x)2 ni N −1 i=1 (xi • s2 = 2 Pk s = − x)2 ni = N −1 i=1 (xi P x2i ni − 2 N1 P P x2i ni − 2 P xi xni + N −1 P xi ni xi ni + N −1 N N2 ( P P x2 ni xi ni ) 2 P = Pk = i=1 P x2i ni − 2x xi ni + N x2 N −1 Pk x2i ni − N1 ( i=1 xi ni )2 N −1 • Mı́nima desviación cuadrática: 2 D = Pk − a)2 ni N −1 i=1 (xi P −2 (xi − a)ni ∂D2 =0= ∂a N −1 X X X ⇒ (xi − a)ni = 0 ⇒ xi ni − a ni = 0 P X xi ni ⇒ xi ni − aN = 0 ⇒ a = =x N ESTADÍSTICA, CURSO 2008–2009 5 • Transformación lineal: y = a + bx rP rP r P (yi − y)2 (a + bxi − a − bx)2 b2 (xi − x)2 sy = = = = bsx N −1 N −1 N −1 sx = 2.2.3 sy b Coeficientes de variación • Coeficiente de variación de Pearson: CV = 2.3 2.3.1 s x ASIMETRIA Y CURTOSIS Coeficientes de asimetrı́a • Coeficiente de asimetrı́a de Fisher: Pk m3 g1 = 3 s donde − x)3 ni N i=1 (xi m3 = • Coeficiente de asimetrı́a de Pearson: AP = 2.3.2 Coeficiente de curtosis m4 g2 = 4 s (g2 > 3: leptocúrtica; 3 3.1 3.1.1 x − Mo s Pk donde m4 = − x)4 ni N i=1 (xi g2 = 3: mesocúrtica; g2 < 3: platicúrtica) VARIABLES ESTADISTICAS BIDIMENSIONALES DISTRIBUCIONES DE FRECUENCIAS DE UNA VARIABLE BIDIMENSIONAL Tabla de frecuencias de doble entrada x \ y x1 x2 x3 .. . xi .. . xk Suma y1 n11 n21 n31 .. . ni1 .. . nk1 ny1 y2 n12 n22 n32 .. . ni2 .. . nk2 ny2 y3 n13 n23 n33 .. . ni3 .. . nk3 ny3 ··· ··· ··· ··· .. . ··· .. . ··· ··· yj n1j n2j n3j .. . nij .. . nkj nyj ··· ··· ··· ··· .. . ··· .. . ··· ··· yl n1l n2l n3l .. . nil .. . nkl nyl Suma nx1 nx2 nx3 .. . nxi .. . nxk N ESTADÍSTICA, CURSO 2008–2009 6 fij = k X l X nij N nij = N i=1 j=1 k X l X fij = i=1 j=1 3.1.2 k X l X nij i=1 j=1 N Pk = Pl i=1 j=1 nij N =1 Distribuciones marginales Frecuencias marginales nxi = l X nij ; nyj = j=1 k X ; nxi = N ; fyj = l X fxi = 1 l X ; i=1 Pk s2x 3.1.3 Pk = nyj = N fyj = 1 j=1 xi nxi N i=1 x= nyj N j=1 i=1 k X nij i=1 nxi N fxi = k X − x)2 nxi N −1 i=1 (xi Pl j=1 yj nyj ; y= ; s2y ; n(yj |x = xi ) = nij N Pl = j=1 (yj − y)2 nyj N −1 Distribuciones condicionadas n(xi |y = yj ) = nij x x1 x2 .. . n(x|y = yj ) n1j n2j .. . xi .. . nij .. . xk nkj ESTADÍSTICA, CURSO 2008–2009 f (xi |y = yj ) = n(xi |y = yj ) nij = nyj nyj k X n(xi |y = yj ) = nyj 7 ; ; i=1 k X l X n(yj |x = xi ) nij = nxi nxi n(yj |x = xi ) = nxi j=1 f (xi |y = yj ) = 1 i=1 3.1.4 f (yj |x = xi ) = ; l X j=1 Representaciones gráficas • Diagrama de barras e histograma tridimensional. • Diagrama de dispersión. f (yj |x = xi ) = 1