Instituto Tecnológico de Celaya Departamento de Ingeniería química Introducción al análisis estadístico E stadística Es la ciencia que estudia las diversas formas de recopilar y organizar una serie de datos, así como los diferentes métodos de analizarlos e interpretarlos para su mejor comprensión. De esta definición obtenemos que las operaciones básicas de la estadística son cuatro: recopilar, organizar, analizar e interpretar datos. Antecedentes históricos La palabra statistik proviene de la palabra italiana statisca (que significa estadística). Fue utilizada por primera vez por Gottfried Achenwall (1719-1772), un profesor de Marlborough y de Gottingen, y el Dr. E. A. W. Zimmerman introdujo el término en Inglaterra. Sin embargo mucho antes del siglo XVIII, la gente utilizaba y registraba datos. El viejo testamento contiene informes sobre levantamiento de censos. Los gobiernos de los antiguos Babilonia, Egipto y Roma reunieron registros detallados sobre población y recursos. En la Edad Media, los gobernantes empezaron a registrar la propiedad de la tierra. Debido al temor de Enrique VII a la peste, Inglaterra empezó a registrar sus muertos en 1532 y comenzaron a publicar semanalmente las estadísticas de mortalidad y nacimiento clasificados según el sexo, en la misma época la ley francesa requirió al clero que registrara bautismos, defunciones y matrimonios. El capitán John Graunt utilizó las publicaciones inglesas para predecir sucesos futuros. Campos de aplicación de la estadística En el comercio, para investigar el mercado, índices de precios, potencialidad del producto, etc. En la producción, para mejorar el producto, control de calidad, etc. En los censos, para determinar los índices de natalidad, mortalidad, crecimiento, etc. En la educación, para determinar índice de aprobados, bajas, etc. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química En la administración pública, para conocer y resolver problemas de un pueblo o nación, como: desempleo, producción agrícola, comunicaciones, producción industrial. En contabilidad: Por ejemplo una empresa de contabilidad desea determinar si la cantidad que aparece en las cuentas por cobrar, en el balance de un cliente, representa fielmente la cantidad real de ese rubro. En el caso normal, la cantidad de cuentas individuales por cobrar es tan grande que sería demasiado lento y costoso revisar y validar cada cuenta. En casos como éste, regularmente se acostumbra que el personal del auditor seleccione un subconjunto de las cuentas, llamado muestra. Después de revisar la exactitud de las cuentas muestreadas, los auditores llegan a una conclusión acerca de si la cantidad que aparece en cuentas por cobrar, en los estados financieros de su cliente, es aceptable. En investigación. El Dr. Myron Harris y Jane Norman han descubierto que la escuela recibe la mayor ponderación en la mente de los jóvenes. Estos investigadores entrevistaron a más de 160 000 adolescentes y publicaron los resultados en The private life of American Teenager (Rawson, Wade). La siguiente es una lista de algunos de sus hallazgos: Más de 8 de cada 10 estudiantes cuya madre trabaja se sientes contentos y orgullosos de ella. El 80% de las jóvenes desean estudiar una carrera. El 90% de los adolescentes creen en el matrimonio. El 74% declara estar dispuesto a vivir maritalmente con alguien antes de contraer matrimonio. 7 de cada 10 estudiantes de secundaria han fumado mariguana. El 60% estudia sólo para aprobar, no para aprender. EL 55% admite haber copiado en exámenes. El 84% expresa que por lo general comenta con uno o con ambos de sus padres su manera de pensar acerca de algún tema. El 60% teme el fallecimiento de sus padres (aún más que su propia defunción). El 75% cree justificado el divorcio si los padres disputan con frecuencia, si interviene la violencia física o si existe infidelidad. O peraciones básicas de la estadística Recopilación La recopilación puede obtenerse por diferentes métodos: si se requiere de una estadística sociológica la recopilación de datos se puede realizar mediante encuestas, censos,... si es estadística psicológica mediante entrevistas, vaciado de test,... o en forma general mediante una anotación secuencial de los datos que se deseen analizar y que pueden ser de tipo médico, estudiantil, productivo, económico, deportivo, astronómico o de cualquier índole. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química Los datos pueden ser de dos tipos: Datos cualitativos o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Datos cuantitativos: tienen valor numérico (edad, precio de un producto, ingresos anuales) y se pueden clasificar en discretos y continuos: Discretos: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3.45). Estos datos se pueden contar. Continuos: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc. Estos datos se pueden medir. Una colección de datos se conoce como conjunto de datos. La información obtenida, antes de ser organizada y analizada, se conoce como datos sin procesar. Son sin procesar puesto que aún no han sido tratados mediante ningún método estadístico. La cantidad de datos más grande y los detalles más minuciosos pueden no contener la información más útil. Una parte importante de la planeación de sistemas de información administrativa, consiste en resumir y presentar los datos de modo que se pueda obtener la información crítica de manera rápida y sencilla. Organización Los datos obtenidos por la recopilación se encuentran entremezclados, unidos tan solo por la secuencia en que fueron obtenidos o anotados, analizarlos en esta secuencia puede resultar una labor ingente o repetitiva, es por ello que el segundo paso de la estadística es la organización de los datos, a fin de simplificar el análisis y omitir las operaciones repetitivas. Existen muchas formas de organizar la información. Podemos sólo recolectarla y mantenerla en orden; o si las observaciones están hechas con números, entonces podemos hacer una lista de los puntos del dato mayor al menor. Para que los datos sean útiles, se debe tener mucho cuidado y asegurarse que los que sean utilizados estén basados en suposiciones e interpretaciones correctas. Análisis El análisis de los datos nos muestra las semejanzas y las diferencias existentes entre los datos obtenidos, así como las variaciones que se tienen entre sí o con respecto a un dato fijo, que bien puede ser el dato central o un dato ideal al que debieran tender los datos analizarlos. El análisis de los datos puede ser exhaustivo o representativo. Será exhaustivo si se analizan todos y cada uno de los datos obtenidos y será representativo si solamente se analiza un grupo o selección de los datos obtenidos; a la totalidad de datos se Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química le denomina población, en tanto que a un subconjunto de la población se le denomina muestra. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo. Cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. Población. La población es el conjunto completo de individuos u objetos de interés, ésta debe definirse cuidadosamente y se considera definida por completo sólo cuando se específica una lista de sus miembros para que no quede duda de si un dato pertenece o no a la población. El conjunto de “todos los estudiantes que han asistido a una universidad ” es un ejemplo de población bien definida. Generalmente se entiende por población un conjunto de personas. Sin embargo, en estadística una población puede ser también un conjunto de animales u objetos. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Parámetrro . : Característica numérica de una población Muestra. Se compone de una parte de los individuos, objetos, medidas u observaciones seleccionados de la población. Una muestra representativa contiene las características relevantes de la población en las mismas proporciones en que están incluidas en la población. Estadística; Característica numérica de una muestra Dentro de las diferentes muestras o selecciones que pudieran obtenerse de una población, en estadística tiene especial importancia la denominada muestra aleatoria, cuyo primer significado es el de un grupo donde cada uno de los elementos bien pudo ser otro cualquiera. Profundizando en esto: no se trata de una selección de los elementos mejores o peores, ni de los mayores o menores de la población, ni de los de un mismo color o de una misma característica determinada; tampoco será un grupo con uno o dos elementos de cada uno de los tamaños, calidades o características variantes en la población. La muestra aleatoria es un grupo representativo de la población, es una selección que se ha obtenido sin deliberación alguna, donde el elemento que se seleccionó bien pudo ser el dato que se encontraba a un lado o en otro extremo u otro elemento cualquiera; sólo así se puede obtener una muestra realmente representativa sin tener la necesidad de analizar la población. Si en la muestra aleatoria aparecen más elementos de una característica determinada es porque en la población hay más datos con esa característica. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química Ejemplo Si de una población de canicas obtenemos una muestra de 10 o 20 canicas y todas ellas resultan amarillas, podemos concluir que la totalidad o la mayoría de la población es de color amarillo: sin embargo esta conclusión no será válida si deliberadamente se han elegido sólo canicas amarillas. Estadística descriptiva: Clasificación de la estadística . Resume mediante el empleo de medidas sumatorias, la información amorfa y desordenada de datos y para ello se tiene que determinar la ausencia o presencia de la característica o características en estudio o en su caso, medir su magnitud en todos los elementos que componenen el conjunto. stadística inferencial: E Tiene por objeto describir las características de un conjunto, pero sín que se registren los datos correspondientes a todos sus elementos sino sólo una parte de los componentes y con esta información poder inferir sobre la población. La estadística inferencial implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez. Ejemplo Supóngase que un profesor calcula la calificación promedio de un grupo de historia, como la estadística describe el desempeño de un grupo pero no hace ninguna generalización acerca de los diferentes grupos, podemos decir que el profesor está utilizando estadística descriptiva. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química Ejemplo Supóngase ahora que el profesor de historia decide utilizar el promedio de calificación obtenido por uno de sus grupos, para estimar la calificación promedio de los diez grupos del mismo curso de historia. El proceso de estimación de tal promedio sería un problema concerniente a la estadística inferencial. Obviamente cualquier conclusión a la que llegue el profesor sobre las diez unidades del curso estará basada en una generalización que va más allá de los datos del grupo original de historia y ésta puede no ser completamente válida, de modo que el profesor debe establecer qué posibilidad hay de que sea cierta. Interpretación La cuarta operación básica de la estadística es la interpretación, ésta incluye el fin para el cual se ha realizado todo el proceso estadístico y puede significar desde una simple información hasta una transformación total en la forma de actuar. En escolaridad, dicha información puede informarnos sobre el avance o retroceso de un grupo, en medicina puede orientar sobre consecuencias fisiológicas posteriores, en sociología puede marcar los pasos de un gobierno, en una fábrica quizá signifique un cambio de proceso y en general, la interpretación del proceso estadístico es una información del presente para la obtención de un futuro mejor. Autor: Rosalba Patiño Herrera Agosto del 2002