E^sr.AOis^ric.^,A FsP.^!'vc^^..^ L. LEBART , A. MORINEAU, J . P. FENELON . Tratamiento Estadístico de Datos. M étodos y programas. Ed . Marcombo, Barcelona . 1985, 520 + XI páginas. Tablas, anexos y ap éndices. por C. M. CUADRAS Universidad de Barcelona La obra que reseñamos es traducción de "Traitement des données statistiques. Méthodes et programmes", Bordas, París. Vista en conjunto, constituye una buena sintesis de las técnicas clásicas y recientes de la estadística y la informática. Como advierten los autores, el lector de "Tratamiento Estadístico de Datos" debe tener conocimientos de cálculo de probabilidades, estadística aplicada ^e informática (a nivel de conocer uno o varios lenguajes de programación). Por lo tanto se trata de una obra para profesionales o usuarios conscientes de la estadística o para estudiantes de un segundo ciclo de estadística aplicada. La obra incorpora las técnicas recientes de la estadística (análisis de datos multidimensionales, análisis exploratoríos de datos, estimador jacknife, clasificación automática, ete.), junto con otras técnicas clásicas (pruebas no paramétricas, análisis de la ^arianza, etc.). Di^^idida en cinco grandes capítulos, en el capítulo 1 se presentan los aspectos esenciales de la teoria de la probabilidad, en forma condensada pero bastante completa (probabilidad en álgebras de sucesos, variables aleatorias finitas y generales, distribuciones bivariantes y multivariantes, teoremas límites}, junto con algunas nociones de estadística (muestras, estadísticos, estimadores) y aplicaciones de las mismas (métodos de Montecarlo, simulación, método "jacknife"). La introducción al razonamiento estadístico se hace por la via no paramétrica, contrariamente a lo que sería usual. Así, los métodos no paramétricos, de uso más general y explicación relativamente sencilla, son debidamente explicados en el capítulo 2. La exposición es bastante didáctica y rica en ejemplos. Además de las pruebas clásicas (de los signos, de Wilcoxon - Mann-Whitney, binomiales) se presentan otras menos habituales en la literatura sobre el tema. Las técnieas de regresión y análisis de la varianza se explican en el capítuio 3, como una consecuencia del modelo lineal, que se define y estudian sus propiedades, primero sin hipótesis de normalidad y a continuación suponiendo normalidad sobre la variable dependiente o endógena. En el primer caso se estudia la estimación de 1os parámetros C'RITIC'A D£ LIBRC)5 199 del modelo y en el segundo caso se Ilega al test F y sus aplicaciones. Todo ello permite enfocar con comodidad el análisis de la varianza (de un criterio o varios) y el análisis de la covarianza. Es de destacar, que el clásico test t de Student no se explica como tal, y que sólo se aborda el modelo lineal con matriz de diseño de rango máximo, lo que permite evitar las matrices inversas generalizadas, pero impide abordar el caso general. E1 análisis de datos, en sentido rnultidimensional, es decir, el tratamiento estadístico simultáneo de varias variables, se inicia en el capítuio 4. En realidad es a partir de aqui donde los autores aportan sus contribuciones más originales al tema, pues son acreditados especialistas. Distinguen {muy acertadamente} entre las " métodos factoriales" o representación a través de modelos continuos, casi siempre a lo largo de uno o dos ejes de coordenadas, y los "métodos de clasificación", que consiste en agrupar los datos a clasificar, en clases o familias de clases, y que en algunos casos se representan mediante grafos. Los "métodos factoriales" son objeto del capítulo 4. Los autores ( muy influidos por las ideas subyacentes en el análisis de correspondencias) inician el tema con un ajuste de una matriz n x^ de datos (n filas y^ columnas} en el espacio R^ (representación de ^^ f^las a través de >> calumnas), y en el espacio R" (problema inverso) para, seguidamente, relacionar ambos tipos de representaciones. Este enfoque es bastante interesante, pues permite abordar, bajo un punto de vista común, el análisís de componentes pi-incipales, el análisis en componentes principales normalizados, el análisis de los rangos, el análisis de las correlaciones parciales y el análisis de correspondencias. Todos estos métodos son explicados con detalle y debidamente ilustrados con ejemplos. Seguidamente, en el mismo capítulo, pero formando una sección independiente de los anteriores métodos (pues obedecen a un esquema teórico diferente) se hace una breve exposición del análisis factorial, la regresión ortogonal, la regresión sobre componentes principales, el análisis canónico (o de carrelación canónica) y el análisis discriminante. aunque sin ejemplos ilustrativos. No se aborda el análisis de coordenadas principales. La clasificación automátíca (capítulo 5) se expone de una manera concisa pero suficientemente clara. La clasiticación ascendente jerárquica se plantea a través de la noción de distancia ultramétrica y su relación con el concepto de jeraryuía indexada. Se describe entonces con detalle la construcción de la rnétrica subdominante, también llamado método del mínimo. A continuación se describen algunos algoritmos de construcción de grafos parciales mínimos, es decir, grafos conexos sin ciclos cuyos vertices son los objetos a rcpresentar, y que reciben el nornbre de árboles. En este apartado se encuentra a faltar una referencia a la desigualdad aditiva, también llamado axioma de los cuatro puntos, generalización de la desigualdad ultramétrica, que daría soporte teórico a las representaciones mediante árboles. Tras tratar algunos aspectos, se describe la clasificación no jerárquica, con especial énfásis en el método de clasiticación alrede- '()() E=sT,4D1ST1(',4 E.SPAÑC)l_.4 d^r de centros móviies, sobre el cual los autores hacen algunas observaciones respecto a I^^ obtención de óptimos locales, y como resolver, aunque parcialmente, el problema de ^.^nconirar particiones óptimas. La literatura citada sobre este tema no es muy reciente. La obra contiene varios apéndices. El primero se dediea a presentar el lenguaje FORTRAN y una relación de los principales paquetes de pragramas estadísticos. E1 segundo es una breve presentación del lenguaje APL y el tercero es un repaso de 1os principales conceptos del cálculo matricial. Contiene también las eorrespondientes tablas estadísticas. Por otra parte, cada capítulo contiene un anexo con diversos programas escritos en FORTRAN y APL, con f nalidad de proporcionar al lector la facilidad de poder tratar informáticamente el material estadístíco de acuerdo con las técnicas expiicadas previamente. Se trata de una biblioteca de programas modular, con finalidad pedagógica, pensada para que pueda ser adaptada por el usuario a sus propias necesidades. Contiene algunos programas del SPAD (Systéme Portabie pour ['Analyse des Données), y otros programas propios (pruebas fisherianas, modelo lineal, histogramas). No contiene correspondencias múltiples. La utilización de todos los programas está debidamente explicada. La traduccicín es correcta. Algunos términos informáticos franceses son presentados en su versión inglesa (software por logiciel, etc.). Esta versión castellana incluye también algunos párrafos complementarios que se añaden al original en francés. Actas de las I Jornadas de Estadística . ^ Ramón Ardamuy, coordinador) . Documentos didácticos 115 . Instituto de Ciencias de la Educación, Universidad de Salamanca . 1987 . por DANIEL PEIVA Universidad Politécnica de Madrid Estas jornadas incluyen siete de las nueve comunicaciones invitadas presentadas a las jornadas, que están encaminadas a discutir las aplicaciones de la Estadística a la^ Ciencias Experimentales. De las siete comunicaciones tres están dedicadas a las aplicaciones en Biología y Medicina, una al muestreo, otra a la simulación, otra a la necesidad de la Estadística en la investigacíón y, finalmente, la última trata un problema de la teoría de números y su inclusión en estas jornadas no parece estar suf^cientemente justíficada, especialmente C'RIT1C'A [^E LIHRC^S 201 cuando no se han incluido comunicaciones sohre las aplicaciones de la Estadística a la Física, la Química o la Ingeniería, o a las C`iencias Sociales (Economía, Sociología, Psicología, etc. ). Las tres comunicaciones de aplicaciones a la Biología y Medicina son debidas a E. Rubio ("Modelos Estadísticos en Medicina y E3iologia), S. Rios ("Panorámiea de Id tnvestigación Operativa en Medicina y Sanidad"^ y J. M. Bernardo ("Diagnóstico automática en Medicina"). Rubio describe modelos de crecimiento de poblaciones basados en la teoría de procesos estocásticos, especialmente procesos de rami^icación, procesos de nacimiento y muerte y proceso5 de renoti^ación. Rios expone diversas aplicaeiones de la programación matemática, 1a teoría de colas y la simulaeión a la Sanidad. Bernardo presenta el problema de decisión en Medicina cumo un problema de discriminación estadística y propone un enfoque ba^^esiano basado en aproximar la distribución a posteriori de cada enfermedad dada la e^ idencia observada por una distribución logística. El criterio de aproximación es la medida de discrepancia de Kullback-Leibler. F. Azorín (" Aspectos aJ perspectivas del muestreo") contiene una re^^isión de algunos prohlemas importantes en la elaboración de encuestas por muestreo. M. Martín C^íaz ("Simulación Estadística, Método de Monte Carlc^") re^^isa el método de montecarlo indicando su aplicación a un problema de epidemia de sarampión. Finalmente L. Parras ("Necesidad e importancia de la Estadística en la in^^estigac:ión empírica") comenta la metodología de construcción de modelos estadísticos ^^ la^ técnicas de diseño experimental. Este volumen puede ser especialmente útil para profesionales trahajando en el área de Biocsta^iística ^ par^i to^i+^^s los interesados en las aplicaciones de la Estadística.