UNIDAD 0: Introducción. 1. Introducción histórica de la Estadística “El pensamiento estadístico será un día tan necesario para el ciudadano eficiente como la capacidad de leer y escribir” H. G. Wells La Bioestadística es la aplicación de las técnicas estadísticas a la Biología, la Medicina y, en general a todas las ciencias relacionadas con los seres vivos. La estadística actual es el resultado de la unión de dos disciplinas que evolucionan independientemente hasta confluir en el siglo XIX: la primera es el cálculo de probabilidades, que nace en el siglo XVII como teoría matemática de los juegos de azar; la segunda es la «Estadística» (o ciencia del Estado, del latín Status) que estudia la descripción de datos, y tiene unas raíces más antiguas. La integración de ambas líneas de pensamiento da lugar a una ciencia que estudia cómo obtener conclusiones de la investigación empírica mediante el uso de modelos matemáticos. La estadística actúa como disciplina puente entre los modelos matemáticos y los fenómenos reales […] La Estadística proporciona una metodología para evaluar y juzgar estas discrepancias entre la realidad y la teoría. Extraído de Estadística Modelos y métodos Daniel Peña El término estadística se asocia al término del latín statisticum que significa Estado y de su derivado italiano statista hombre de estado, y parte de su origen es ése, pero fue Gottfried Achenwall (1749) quien primero denominaba con la palabra alemana, Statistik, el análisis de datos del Estado, y no fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el inglés John Sinclair. Aunque el término es relativamente reciente, los comienzos de los procedimientos estadísticos son mucho más antiguos. En el antiguo Egipto los faraones lograron recopilar, hacia el año 3050 antes de Cristo, datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el antiguo Israel, la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general Apuntes Bioestadística Antonia R. Gil Armas del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). Pero fueron los romanos quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. En un segundo período, la estadística, sin abandonar su tarea recopilatoria, empieza su avance tanto el terreno de la aplicación del método científico a la recogida de datos, como también en el campo del análisis e interpretación de los mismos. En Inglaterra, durante el siglo XVII, se inicia y desarrolla lo que vino en llamarse Aritmética Política. Así, en 1662 el londinense John Graunt 1620-1674), publicó su libro Natural and Political Observations made upon the Bills of Mortality. En esta obra se lleva a cabo el primer intento de interpretar fenómenos biológicos y sociales de la población a partir de datos numéricos. En su libro, Graunt pone de manifiesto las cifras brutas de nacimientos y defunciones en Londres durante el período comprendido entre 1604 y 1661, así como la influencia ejercida en dichos fenómenos por causas naturales y sociales. Hoy en día el uso de la estadística se ha extendido más allá de sus orígenes como un servicio al Estado, y las personas y organizaciones la usan para entender datos y tomar decisiones en prácticamente todos los campos sociales y científicos. 2. Conceptos básicos La estadística hoy en día es considerada como una rama de las Matemáticas que se encarga de la recopilación e interpretación de datos obtenidos mediante un estudio. La estadística, tal y como hemos visto en la introducción, permite tomar decisiones en el ámbito gubernamental, pero también en el mundo económico, científico y hasta personal. Definición: Se denomina estadística al conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales, en nuestro caso las ciencias naturales. Apuntes Bioestadística Antonia R. Gil Armas La estadística se divide en dos ramas: la estadística descriptiva y la inferencia estadística. La estadística descriptiva se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos. Esencialmente consiste en resumir éstos mediante unos parámetros (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadística Descriptiva es el método de obtener de un conjunto de datos conclusiones sobre sí mismos y no sobrepasan el conocimiento proporcionado por éstos. Estadística Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, población, partiendo de lo específico, muestra. La estadística inferencial es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico procedimiento del manejo de datos de la muestra. Los métodos estadísticosmatemáticos surgieron desde la teoría de la probabilidad. Antes de continuar es conveniente que conozcamos algunos términos básicos usados en estadística. Definición: Al conjunto de elementos, objetivo de la investigación se le denomina población. Individuo o Unidad estadística: Cada uno de los elementos de la población. Definición: Se denomina muestra a un subconjunto de la población. La estadística inferencial, es el proceso por el cual se deducen (infieren) propiedades o características de una población a partir de una muestra, extraída de la población mediante métodos de extracción de muestras. Estas técnicas se utilizan cuando el estudio de la población completa puede ser de elevado coste o incluso imposible. Desde el punto de vista de las técnicas desarrolladas por la estadística inferencial, la muestra debe ser lo más representativa posible. Definición: La observación de un individuo se traduce en la descripción de alguna cualidad o propiedad inherente al mismo. A esta cualidad o propiedad se le denomina característica o variable. Una característica puede adoptar diferentes modalidades. Modalidad: Diferentes posibilidades o variantes de una característica o variable. Apuntes Bioestadística Antonia R. Gil Armas Ejemplo. Población: alumnos de un centro Características: sexo, edad, curso, número de hermanos, deporte que practican, notas Modalidades: • Sexo: hombre, mujer. • Edad: 1, 2, 3… • Curso: primero, segundo, tercero, cuarto… • Número de hermanos: 0,1,2,3... • Deporte que practica: natación, baloncesto, fútbol, gimnasia… • Notas: insuficiente, suficiente , … o bien 1, 2, 3… 3. Variables estadísticas Definición: La variable estadística es el conjunto de valores, numéricos o no, observados sobre un conjunto de individuos, a partir de una determinada característica. Las variables pueden ser de dos tipos: 3.1. Tipos de variables Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: son aquellas que toman valores que se pueden contar y sólo toman valores aislados (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). Apuntes Bioestadística Antonia R. Gil Armas Continuas: son aquellos valores que se pueden medir y pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h, etc. 3.2. Escalas de medición Cuando las variables son cuantitativas, sus diferentes modalidades son cantidades numéricas, como acabamos de ver. Pero también es posible asignar cantidades numéricas a las diferentes modalidades que presenta un carácter cualitativo, es decir, codificar numéricamente las diferentes modalidades de un atributo. Ejemplo. 1) Sexo: Hombre=0, Mujer=1 2) Gafas: No gafas=0, Sí gafas=1 3) Nivel de estudios: 1= Analfabeto 2= Sin estudios, pero sabe leer y escribir 4= Fue a la escuela pero no completó la Educación básica 5= Educación básica 6= Educación media 7= Educación superior Así, una variable estadística presentará una serie de valores numéricos, cuyo significado dependerá de la escala que se haya empleado. Para las variables cualitativas podemos distinguir dos tipos de escala: Escala nominal: Dadas dos modalidades, sólo podemos comprobar si son iguales o distintas. Ejemplo. 1) Sexo: Hombre=0, Mujer=1 2) Gafas: No gafas=0, Si gafas= 1 Escala ordinal: Además de poder comprobar que dos modalidades dadas son iguales o distintas también podremos establecer una relación de orden: Ejemplo. 3) Nivel de estudios: 1= Analfabeto 2= Sin estudios, pero sabe leer y escribir 4= Fue a la escuela pero no completó la Educación básica 5= Educación básica 6= Educación media 7= Educación superior Apuntes Bioestadística Antonia R. Gil Armas