Estadística Básica Para Datos Á. G. Muñoz S. Centro de Modelado Científico (CMC) de La Universidad del Zulia. Quito, 21 de Abril 2010 Esperanza Matemática y medias. Varianza y Desviación Estándad. Varianza y Covarianza. Matriz de Varianza-Covarianza. IDEAS NECESARIAS • Un rápido repaso de estadística elemental: Medidas de Tendencia Central. Medidas de Dispersión. Medidas de Asimetría (y simetría). “Puntiagudez” ejemplo). de las distribuciones (curtosis, por ESTADÍSTICA ELEMENTAL 1-D La Estadística básica está interesada en los siguientes aspectos: Esperanza Matemática de variables discretas Caso partircular: media artimética simple. Caso partircular: media artimética ponderada. ESTADÍSTICA ELEMENTAL 1-D No es más que una medida general de tendencia central para variables aleatorias. Intentamos representar el todo por una única magnitud. Nos indican qué tanto varía el conjunto de datos con respecto a un cánon determinado, por ejemplo: la media aritmética simple. Una medida por excelencia de dispersión con respecto a la media es la varianza: ESTADÍSTICA ELEMENTAL 1-D Medidas de Dispersión Medidas de Dispersión A menudo, por conveniencia de unidades, empleamos la desviación estándard: ESTADÍSTICA ELEMENTAL 1-D ¿Unidades al cuadrado? Covarianza Si deseamos estudiar si dos conjuntos cualesquiera de datos varían conjuntamente con respecto a la media, podemos emplear la covarianza. Es una medida de tendencia de variación conjunta. Se efectúa siempre, en general, entre dos conjuntos de datos (o dimensiones). VARIANZA Y COVARIANZA 2-D Hemos visto hasta ahora parámetros unidimensionales. Covarianza VARIANZA Y COVARIANZA 2-D Notemos que si se calcula para el mismo conjunto de datos, obtendremos la varianza: Si deseamos estudiar la covarianza entre varios grupos de datos (a menudo se dice que en tales casos se trata la covarianza para múltiples grados de libertad), resulta útil escribir cada una como elemento de una matriz cuadrada, denominada matriz de varianza-covarianza: Naturalmente, los elementos de la diagonal principal corresponden a las distintas varianzas para cada grado de libertad. Por otra parte, de la definición, vemos que se trata de una matriz simétrica: MATRIZ DE VARIANZA-COVARIANZA 3-D Covarianza en múltiples grados de libertad Consideremos varias medidas de largo, ancho y alto de un objeto particular. Coloquémosmas en la forma matricial siguiente: Podemos calcular ahora el vector media asociado a las 5 observaciones tomadas. Asimismo calcularemos la matriz de varianza-covarianza asociada. MATRIZ DE VARIANZA-COVARIANZA Un ejemplo simple Apreciamos que: • 0.025 es la varianza de la longitud, • 0.007 es la varianza del ancho, • 0.00043 es la varianza de la altura. • 0.0075 es la covarianza entre la longitud y el ancho • 0.00175 es la covarianza entre la longitud y altura, y • 0.00135 es la covarianza entre el alto y ancho. MATRIZ DE VARIANZA-COVARIANZA Empleando las ecuaciones consabidas, obtenemos trivialmente: Correlación Puede verse como el grado de relación entre dos conjuntos de datos: CORRELACIÓN Correlación Puede verse como el grado de relación entre dos conjuntos de datos: CORRELACIÓN Correlación CORRELACIÓN Auto-Correlación La correlación del campo con él mismo... AUTO-CORRELACIÓN Auto-Correlación AUTO-CORRELACIÓN • Estadística: Tendencias Centrales. Esperanza y medias. Vector medio. Interpretación de la Covarianza. Matriz de Varianza-Covarianza. Correlaciones Auto-Correlaciones RESUMEN Dispersión: Varianza y Desviación Estándard.