Contenidos 1 Introducción al paquete estadı́stico S-PLUS 1.1 Introducción a S-PLUS . . . . . . . . . . . . . 1.1.1 Cómo entrar, salir y consultar la ayuda 1.2 Conjuntos de datos . . . . . . . . . . . . . . . 1.3 Manipulación de datos . . . . . . . . . . . . . 1.3.1 Operaciones . . . . . . . . . . . . . . . 1.3.2 Vectores . . . . . . . . . . . . . . . . . 1.3.3 Secuencias . . . . . . . . . . . . . . . . 1.3.4 Operadores lógicos y valores perdidos . 1.3.5 Arrays . . . . . . . . . . . . . . . . . . 1.3.6 Listas . . . . . . . . . . . . . . . . . . 1.3.7 Matrices . . . . . . . . . . . . . . . . . 1.3.8 Data.frames . . . . . . . . . . . . . . . 1.3.9 Tablas . . . . . . . . . . . . . . . . . . 1.3.10 Lectura de datos . . . . . . . . . . . . 1.4 Distribuciones . . . . . . . . . . . . . . . . . . 1.5 Funciones estadı́sticas . . . . . . . . . . . . . . 1.6 Creación de funciones . . . . . . . . . . . . . . 1.7 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . en S-PLUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Introducción a la inferencia estadı́stica 2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . 2.2 Teorı́a de conteo . . . . . . . . . . . . . . . . . . . . 2.2.1 Variaciones sin repetición . . . . . . . . . . 2.2.2 Variaciones con repetición . . . . . . . . . . 2.2.3 Permutaciones . . . . . . . . . . . . . . . . . 2.2.4 Permutaciones con repetición . . . . . . . . 2.2.5 Combinaciones . . . . . . . . . . . . . . . . 2.3 Probabilidad . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Espacio muestral y sucesos . . . . . . . . . . 2.3.2 Definiciones de probabilidad . . . . . . . . . 2.3.3 Probabilidad condicionada . . . . . . . . . . 2.3.4 Fórmula de Bayes y sucesos independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 21 21 22 23 23 23 24 26 27 28 28 32 33 33 36 36 40 41 . . . . . . . . . . . . 45 47 47 48 48 48 49 49 50 50 51 52 53 2.4 2.5 2.6 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Distribución de una variable aleatoria . . . . . . . . . 2.4.2 Transformación de una variable aleatoria . . . . . . . 2.4.3 Distribución conjunta de variables aleatorias . . . . . 2.4.4 Distribución condicionada de variables aleatorias . . . 2.4.5 Transformación de variables . . . . . . . . . . . . . . 2.4.6 Valores esperados de funciones de variables aleatorias 2.4.7 Momentos, varianza, covarianza y propiedades . . . . 2.4.8 Función generatriz de momentos . . . . . . . . . . . . 2.4.9 Desigualdad de Tchebychev y ley débil de los grandes Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . 2.5.1 Distribución uniforme discreta . . . . . . . . . . . . . 2.5.2 Distribución binomial . . . . . . . . . . . . . . . . . . 2.5.3 Distribución de Poisson . . . . . . . . . . . . . . . . . 2.5.4 Procesos de Poisson . . . . . . . . . . . . . . . . . . . 2.5.5 Distribución geométrica . . . . . . . . . . . . . . . . 2.5.6 Distribución hipergeométrica . . . . . . . . . . . . . . 2.5.7 Distribución binomial negativa . . . . . . . . . . . . . 2.5.8 Distribución multinomial . . . . . . . . . . . . . . . Distribuciones continuas . . . . . . . . . . . . . . . . . . . . 2.6.1 Distribución uniforme continua . . . . . . . . . . . . 2.6.2 Distribución normal o Gaussiana . . . . . . . . . . . 2.6.3 Distribución exponencial (negativa) . . . . . . . . . . 2.6.4 Distribución gamma . . . . . . . . . . . . . . . . . . 2.6.5 Distribución de Weibull . . . . . . . . . . . . . . . . 2.6.6 Distribución beta . . . . . . . . . . . . . . . . . . . . 2.6.7 Distribución normal bivariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . números . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Muestreo y distribuciones asociadas al muestreo 3.1 Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . 3.1.2 Muestreo estratificado . . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Muestreo aleatorio sistemático . . . . . . . . . . . . . . . . . . . 3.1.4 Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . 3.2 Parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Parámetros en poblaciones infinitas . . . . . . . . . . . . . . . . 3.2.2 Parámetros en poblaciones finitas . . . . . . . . . . . . . . . . . 3.3 Estadı́sticos o estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Distribución muestral de un estadı́stico en poblaciones infinitas . . . . . 3.4.1 Distribución en el muestreo de la media muestral . . . . . . . . 3.4.2 Distribución en el muestreo de la proporción muestral . . . . . . 3.4.3 Esperanza y varianza de la varianza y cuasivarianza muestrales . 3.5 Distribuciones asociadas a la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 55 60 61 63 64 68 72 80 81 84 84 85 86 90 91 92 93 95 95 95 97 103 106 111 113 115 . . . . . . . . . . . . . . 117 119 121 122 123 123 123 124 125 126 128 128 136 138 140 3.6 3.7 3.5.1 La distribución ji-cuadrado χ2 . . . . . . . . . . . . . . . . . . . . 3.5.2 Distribución F de Fisher . . . . . . . . . . . . . . . . . . . . . . . 3.5.3 Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . Introducción al muestreo en poblaciones finitas . . . . . . . . . . . . . . . 3.6.1 Distribuciones muestrales de la media y la varianza en poblaciones finitas. Muestreo sin reposición . . . . . . . . . . . . . . . . . . . 3.6.2 Distribuciones muestrales de la media y la varianza muestral en poblaciones finitas. Muestreo con reposición . . . . . . . . . . . . 3.6.3 Estimadores de la varianza poblacional y de la varianza de la media muestral. Muestreo sin reposición . . . . . . . . . . . . . . . . . . 3.6.4 Estimadores de la varianza poblacional y de la varianza de la media muestral. Muestreo con reposición . . . . . . . . . . . . . . . . . . Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Estimación Paramétrica 4.1 Estimación puntual . . . . . . . . . . . . . . . . . . . . 4.2 Propiedades de los estimadores puntuales . . . . . . . . 4.2.1 Error cuadrático medio . . . . . . . . . . . . . . 4.2.2 Estimadores centrados o insesgados . . . . . . . 4.2.3 Eficiencia o precisión . . . . . . . . . . . . . . . 4.2.4 Estimadores consistentes . . . . . . . . . . . . . 4.2.5 Estimadores robustos . . . . . . . . . . . . . . . 4.3 Métodos de estimación puntual . . . . . . . . . . . . . 4.3.1 Verosimilitud y estimadores máximo-verosı́miles 4.3.2 Método de los momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Intervalos de confianza 5.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 I.C. de la media de una población normal con varianza conocida . . . . . 5.2.1 Determinación del tamaño muestral . . . . . . . . . . . . . . . . . 5.3 I.C. de la media de una población normal con varianza desconocida . . . 5.4 I.C. de la diferencia de medias en poblaciones normales independientes con varianzas conocidas e iguales . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 I.C. de la diferencia de medias en poblaciones normales independientes con varianzas conocidas pero diferentes . . . . . . . . . . . . . . . . . . . . . 5.6 I.C. de la diferencia de medias en poblaciones normales independientes con varianzas desconocidas pero supuestamente iguales . . . . . . . . . . . . 5.7 I.C. de la diferencia de medias en poblaciones normales independientes con varianzas desconocidas y distintas . . . . . . . . . . . . . . . . . . . . . . 5.8 I.C. de la diferencia de medias en poblaciones normales dependientes . . 5.9 I.C. de la varianza en una población normal . . . . . . . . . . . . . . . . 5.10 I.C. del cociente de varianzas en poblaciones normales independientes . . 5.11 Intervalos de confianza basados en muestras grandes . . . . . . . . . . . . 140 150 152 155 155 160 164 165 166 169 171 172 172 172 173 177 179 180 180 197 203 205 206 210 213 215 217 220 223 226 228 232 235 5.11.1 5.11.2 5.11.3 5.11.4 I.C. de la proporción poblacional . . . . . . . . . . . I.C. de la diferencia de proporciones poblacionales . . I.C. de la media de una variable aleatoria de Poisson Determinación del tamaño muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 238 239 241 6 Contrastes de hipótesis 243 6.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.2 Test uniformemente más potente . . . . . . . . . . . . . . . . . . . . . . 248 6.2.1 Lema de Neyman-Pearson. Hipótesis simples. . . . . . . . . . . . 250 6.3 Hipótesis compuestas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 6.3.1 Función de potencia . . . . . . . . . . . . . . . . . . . . . . . . . 255 6.4 Contrastes de significación . . . . . . . . . . . . . . . . . . . . . . . . . . 256 6.4.1 P-valor o nivel crı́tico . . . . . . . . . . . . . . . . . . . . . . . . . 258 6.4.2 Relación entre los contrastes de hipótesis y los intervalos de confianza258 6.4.3 De la media de una población normal con varianza conocida . . . 259 6.4.4 De la media de una población normal con varianza desconocida . 262 6.4.5 De la diferencia de medias en poblaciones normales con varianzas conocidas: muestras independientes . . . . . . . . . . . . . . . . . 266 6.4.6 De la diferencia de medias en poblaciones normales con varianzas desconocidas pero supuestamente iguales: muestras independientes 268 6.4.7 De la diferencia de medias en poblaciones normales independientes con varianzas desconocidas y distintas: muestras independientes . 270 6.4.8 De la diferencia de medias en dos poblaciones normales con varianzas desconocidas: muestras relacionadas . . . . . . . . . . . . . . . . . 273 6.4.9 De la varianza en una población normal . . . . . . . . . . . . . . 279 6.4.10 De la igualdad de varianzas en poblaciones normales: muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 6.4.11 De una proporción . . . . . . . . . . . . . . . . . . . . . . . . . . 288 6.4.12 De la diferencia de proporciones en dos poblaciones: muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 6.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298 7 Métodos no paramétricos 7.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Test de rachas . . . . . . . . . . . . . . . . . . . . . . . 7.3 Test de Mann-Whitney para 2 muestras independientes 7.4 Test de Wilcoxon de rangos con signos . . . . . . . . . 7.4.1 Una única muestra . . . . . . . . . . . . . . . . 7.4.2 Muestras relacionadas . . . . . . . . . . . . . . 7.5 Test de Kruskal-Wallis . . . . . . . . . . . . . . . . . . 7.6 Test de Friedman para muestras relacionadas . . . . . . 7.7 Tests de la bondad del ajuste . . . . . . . . . . . . . . 7.7.1 Test ji-cuadrado (χ2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 307 308 310 313 313 317 320 322 324 324 7.8 7.9 7.7.2 Test de Kolmogorov-Smirnov . . . . Tablas de contingencia . . . . . . . . . . . . 7.8.1 Contraste de independencia en tablas 7.8.2 Test exacto de Fisher . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . I ×J . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Diseño de experimentos 8.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Estructuras básicas de un diseño de experimentos . . . . . 8.2.1 Estructura del diseño . . . . . . . . . . . . . . . . . 8.2.2 Estructura del tratamiento . . . . . . . . . . . . . . 8.3 Experimentos factoriales con un único factor . . . . . . . . 8.4 Modelo de efectos fijos . . . . . . . . . . . . . . . . . . . . 8.4.1 Análisis de varianza . . . . . . . . . . . . . . . . . . 8.4.2 Coeficiente de determinación . . . . . . . . . . . . . 8.4.3 Estimación de los parámetros del modelo . . . . . . 8.5 Diagnosis del modelo . . . . . . . . . . . . . . . . . . . . . 8.5.1 El efecto de las desviaciones de las hipótesis básicas 8.5.2 Test de homogeneidad de varianzas. Test de Levene 8.6 Modelo de efectos aleatorios . . . . . . . . . . . . . . . . . 8.7 Diseño completamente aleatorizado por bloques . . . . . . 8.7.1 Coeficientes de determinación parcial . . . . . . . . 8.8 Comparación múltiple de medias . . . . . . . . . . . . . . 8.8.1 Test de Scheffé . . . . . . . . . . . . . . . . . . . . 8.8.2 Test de Tukey . . . . . . . . . . . . . . . . . . . . . 8.8.3 Diferencia significativa mı́nima (LSD) . . . . . . . . 8.8.4 Contrastes ortogonales . . . . . . . . . . . . . . . . 8.9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 336 338 345 349 . . . . . . . . . . . . . . . . . . . . . 363 365 366 366 367 369 371 372 376 376 378 380 381 398 404 408 416 416 418 423 424 429 9 Regresión Lineal 9.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 El modelo de regresión lineal simple . . . . . . . . . . . . . . . . . . . . . 9.3 El modelo de regresión lineal múltiple . . . . . . . . . . . . . . . . . . . . 9.4 Estimadores de los coeficientes por mı́nimos cuadrados ordinarios (MCO, OLS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4.1 Modelo de regresión lineal simple . . . . . . . . . . . . . . . . . . 9.4.2 Modelo de regresión lineal múltiple . . . . . . . . . . . . . . . . . 9.5 Estimadores de los coeficientes por máxima verosimilitud . . . . . . . . . 9.6 Estimador máximo verosı́mil restringido (REML) de σ 2 . . . . . . . . . . 9.7 Propiedades de los estimadores . . . . . . . . . . . . . . . . . . . . . . . 9.7.1 Insesgadez de los estimadores de los coeficientes . . . . . . . . . . 9.7.2 Insesgadez del estimador máximo-verosı́mil restringido (REML) de σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 449 450 453 454 454 455 456 458 461 461 461 9.8 9.9 9.10 9.11 9.12 9.13 9.14 9.15 9.7.3 Matriz de varianzas y covarianzas de los estimadores de los coeficientes462 9.7.4 Estimador BLUE . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 9.7.5 Modelo de regresión múltiple estandarizado . . . . . . . . . . . . 464 Intervalos de confianza de los coeficientes de regresión . . . . . . . . . . . 466 9.8.1 Modelo de regresión lineal simple . . . . . . . . . . . . . . . . . . 466 9.8.2 Modelo de regresión lineal múltiple . . . . . . . . . . . . . . . . . 467 Contraste de hipótesis de los coeficientes de regresión . . . . . . . . . . . 468 ANOVA de la regresión . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 9.10.1 Modelo de regresión lineal simple . . . . . . . . . . . . . . . . . . 469 9.10.2 Modelo de regresión lineal múltiple . . . . . . . . . . . . . . . . . 471 2 9.10.3 Coeficientes de determinación R2 y Rajustado . . . . . . . . . . . . 472 Multicolinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473 9.11.1 Detección de multicolinealidad . . . . . . . . . . . . . . . . . . . . 474 9.11.2 Número de condición de una matriz . . . . . . . . . . . . . . . . . 475 El mejor conjunto de regresión . . . . . . . . . . . . . . . . . . . . . . . . 476 9.12.1 Criterio del coeficiente de determinación múltiple RP2 . . . . . . . . 477 9.12.2 Criterio CP de Mallows . . . . . . . . . . . . . . . . . . . . . . . . 477 9.12.3 Selección Paso a Paso (Stepwise) . . . . . . . . . . . . . . . . . . 478 Diagnosis del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478 9.13.1 Puntos de nivel y puntos influyentes . . . . . . . . . . . . . . . . . 479 9.13.2 Residuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482 9.13.3 Residuales de Student estandarizados internamente . . . . . . . . 486 9.13.4 Residuales de Student estandarizados externamente . . . . . . . . 487 9.13.5 Medidas de influencia . . . . . . . . . . . . . . . . . . . . . . . . . 488 Intervalos de confianza y de predicción . . . . . . . . . . . . . . . . . . . 496 9.14.1 Intervalo de confianza del valor esperado de la respuesta . . . . . 496 9.14.2 Intervalo de confianza simultáneo al nivel de confianza 1 − α . . . 499 9.14.3 Intervalo de predicción de un valor particular . . . . . . . . . . . 502 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527 Tablas Estadı́sticas Tabla 1. Valores de la función de distribución acumulativa normal estándar . . Tabla 2. Valores de cuantiles de la distribución t de Student . . . . . . . . . . Tabla 3. Valores cuantiles de χ2 con ν grados de libertad . . . . . . . . . . . . Tabla 4. Valores de Fν1 ,ν2 ;0.95 . P (Fν1 ,ν2 < x0 ) = 0.95 . . . . . . . . . . . . . . . Tabla 5. Valores de Fν1 ν2 ;0.99 . P (Fν1 ,ν2 < x0 ) = 0.99 . . . . . . . . . . . . . . . Tabla 6. Valores µde ¶ la función de distribución acumulativa binomial B(x; n, p). n x (X ≤ x) = p (1 − p)n−x . . . . . . . . . . . . . . . . . . . . . . . . . x Tabla 7. Valores de la función de distribución acumulativa de Poisson P (x, λ). e−λ λx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . P (X ≤ x) = x! Tabla 8. Valores crı́ticos del test de rachas . . . . . . . . . . . . . . . . . . . . 537 539 540 541 542 542 543 544 545 Tabla Tabla Tabla Tabla Tabla Tabla Tabla Tabla 9. Valores crı́ticos del test de Kruskal-Wallis . . . . . . . . . . . . . 10. Valores crı́ticos del test de Kolmogorov-Smirnov . . . . . . . . . 11. Valores crı́ticos del test de Lilliefors para contrastar normalidad 12. Valores crı́ticos del test de Friedman para c = 3 . . . . . . . . . 13. Valores crı́ticos del test de Friedman para c = 4 . . . . . . . . . 14. Cuantiles del estadı́stico de Wilcoxon de rango con signos . . . . 15. Cuantiles del estadı́stico del test de Mann-Whitney . . . . . . . 16. Cuantiles de la distribución del rango estudiantizado . . . . . . . . . . . . . . . . . . . . . . . 545 546 546 547 548 549 550 551 Bibliografı́a 553 Lista de Figuras 559 Lista de Tablas 565 Índice 569