Introducción al análisis estadístico

Anuncio
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Introducción al análisis
estadístico
E
stadística
Es la ciencia que estudia las diversas formas de recopilar y organizar una serie de datos,
así como los diferentes métodos de analizarlos e interpretarlos para su mejor comprensión.
De esta definición obtenemos que las operaciones básicas de la estadística son cuatro:
recopilar, organizar, analizar e interpretar datos.
Antecedentes históricos
La palabra statistik proviene de la palabra italiana statisca (que significa estadística). Fue
utilizada por primera vez por Gottfried Achenwall (1719-1772), un profesor de
Marlborough y de Gottingen, y el Dr. E. A. W. Zimmerman introdujo el término en
Inglaterra. Sin embargo mucho antes del siglo XVIII, la gente utilizaba y registraba datos.
El viejo testamento contiene informes sobre levantamiento de censos. Los gobiernos de los
antiguos Babilonia, Egipto y Roma reunieron registros detallados sobre población y
recursos. En la Edad Media, los gobernantes empezaron a registrar la propiedad de la
tierra. Debido al temor de Enrique VII a la peste, Inglaterra empezó a registrar sus
muertos en 1532 y comenzaron a publicar semanalmente las estadísticas de mortalidad y
nacimiento clasificados según el sexo, en la misma época la ley francesa requirió al clero
que registrara bautismos, defunciones y matrimonios. El capitán John Graunt utilizó las
publicaciones inglesas para predecir sucesos futuros.
Campos de aplicación de la estadística
En el comercio, para investigar el mercado, índices de precios, potencialidad del
producto, etc.
En la producción, para mejorar el producto, control de calidad, etc.
En los censos, para determinar los índices de natalidad, mortalidad, crecimiento, etc.
En la educación, para determinar índice de aprobados, bajas, etc.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
En la administración pública, para conocer y resolver problemas de un pueblo o
nación, como: desempleo, producción agrícola, comunicaciones,
producción
industrial.
En contabilidad: Por ejemplo una empresa de contabilidad desea determinar si la
cantidad que aparece en las cuentas por cobrar, en el balance de un cliente, representa
fielmente la cantidad real de ese rubro. En el caso normal, la cantidad de cuentas
individuales por cobrar es tan grande que sería demasiado lento y costoso revisar y
validar cada cuenta. En casos como éste, regularmente se acostumbra que el personal
del auditor seleccione un subconjunto de las cuentas, llamado muestra. Después de
revisar la exactitud de las cuentas muestreadas, los auditores llegan a una conclusión
acerca de si la cantidad que aparece en cuentas por cobrar, en los estados financieros
de su cliente, es aceptable.
En investigación. El Dr. Myron Harris y Jane Norman han descubierto que la escuela
recibe la mayor ponderación en la mente de los jóvenes. Estos investigadores
entrevistaron a más de 160 000 adolescentes y publicaron los resultados en The private
life of American Teenager (Rawson, Wade). La siguiente es una lista de algunos de sus
hallazgos:
Más de 8 de cada 10 estudiantes cuya madre trabaja se sientes contentos y
orgullosos de ella.
El 80% de las jóvenes desean estudiar una carrera.
El 90% de los adolescentes creen en el matrimonio.
El 74% declara estar dispuesto a vivir maritalmente con alguien antes de contraer
matrimonio.
7 de cada 10 estudiantes de secundaria han fumado mariguana.
El 60% estudia sólo para aprobar, no para aprender. EL 55% admite haber
copiado en exámenes.
El 84% expresa que por lo general comenta con uno o con ambos de sus padres su
manera de pensar acerca de algún tema.
El 60% teme el fallecimiento de sus padres (aún más que su propia defunción).
El 75% cree justificado el divorcio si los padres disputan con frecuencia, si
interviene la violencia física o si existe infidelidad.
O
peraciones básicas de la estadística
Recopilación
La recopilación puede obtenerse por diferentes métodos: si se requiere de una
estadística sociológica la recopilación de datos se puede realizar mediante encuestas,
censos,... si es estadística psicológica mediante entrevistas, vaciado de test,... o en forma
general mediante una anotación secuencial de los datos que se deseen analizar y que
pueden ser de tipo médico, estudiantil, productivo, económico, deportivo, astronómico o de
cualquier índole.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Los datos pueden ser de dos tipos:
Datos cualitativos o atributos: no se pueden medir numéricamente (por ejemplo:
nacionalidad, color de la piel, sexo).
Datos cuantitativos: tienen valor numérico (edad, precio de un producto, ingresos
anuales) y se pueden clasificar en discretos y continuos:
Discretos: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá
ser 3.45). Estos datos se pueden contar.
Continuos: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.
Estos datos se pueden medir.
Una colección de datos se conoce como conjunto de datos. La información obtenida,
antes de ser organizada y analizada, se conoce como datos sin procesar. Son sin
procesar puesto que aún no han sido tratados mediante ningún método estadístico. La
cantidad de datos más grande y los detalles más minuciosos pueden no contener la
información más útil. Una parte importante de la planeación de sistemas de información
administrativa, consiste en resumir y presentar los datos de modo que se pueda obtener la
información crítica de manera rápida y sencilla.
Organización
Los datos obtenidos por la recopilación se encuentran entremezclados, unidos tan
solo por la secuencia en que fueron obtenidos o anotados, analizarlos en esta secuencia
puede resultar una labor ingente o repetitiva, es por ello que el segundo paso de la
estadística es la organización de los datos, a fin de simplificar el análisis y omitir las
operaciones repetitivas.
Existen muchas formas de organizar la información. Podemos sólo recolectarla y
mantenerla en orden; o si las observaciones están hechas con números, entonces podemos
hacer una lista de los puntos del dato mayor al menor. Para que los datos sean útiles, se
debe tener mucho cuidado y asegurarse que los que sean utilizados estén basados en
suposiciones e interpretaciones correctas.
Análisis
El análisis de los datos nos muestra las semejanzas y las diferencias existentes entre
los datos obtenidos, así como las variaciones que se tienen entre sí o con respecto a un
dato fijo, que bien puede ser el dato central o un dato ideal al que debieran tender los
datos analizarlos. El análisis de los datos puede ser exhaustivo o representativo. Será
exhaustivo si se analizan todos y cada uno de los datos obtenidos y será representativo si
solamente se analiza un grupo o selección de los datos obtenidos; a la totalidad de datos se
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
le denomina población, en tanto que a un subconjunto de la población se le denomina
muestra.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
Individuo. Cualquier elemento que porte información sobre el fenómeno que se estudia.
Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si
estudiamos el precio de la vivienda, cada vivienda es un individuo.
Población. La población es el conjunto completo de individuos u objetos de interés, ésta
debe definirse cuidadosamente y se considera definida por completo sólo cuando se
específica una lista de sus miembros para que no quede duda de si un dato pertenece o no
a la población. El conjunto de “todos los estudiantes que han asistido a una universidad ”
es un ejemplo de población bien definida. Generalmente se entiende por población un
conjunto de personas. Sin embargo, en estadística una población puede ser también un
conjunto de animales u objetos. Por ejemplo, si estudiamos el precio de la vivienda en
una ciudad, la población será el total de las viviendas de dicha ciudad.
Parámetrro
. :
Característica numérica de una población
Muestra. Se compone de una parte de los individuos, objetos, medidas u observaciones
seleccionados de la población. Una muestra representativa contiene las características
relevantes de la población en las mismas proporciones en que están incluidas en la
población.
Estadística;
Característica numérica de una muestra
Dentro de las diferentes muestras o selecciones que pudieran obtenerse de una población,
en estadística tiene especial importancia la denominada muestra aleatoria, cuyo
primer significado es el de un grupo donde cada uno de los elementos bien pudo ser otro
cualquiera. Profundizando en esto: no se trata de una selección de los elementos mejores o
peores, ni de los mayores o menores de la población, ni de los de un mismo color o de una
misma característica determinada; tampoco será un grupo con uno o dos elementos de
cada uno de los tamaños, calidades o características variantes en la población. La muestra
aleatoria es un grupo representativo de la población, es una selección que se ha obtenido
sin deliberación alguna, donde el elemento que se seleccionó bien pudo ser el dato que se
encontraba a un lado o en otro extremo u otro elemento cualquiera; sólo así se puede
obtener una muestra realmente representativa sin tener la necesidad de analizar la
población. Si en la muestra aleatoria aparecen más elementos de una característica
determinada es porque en la población hay más datos con esa característica.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Ejemplo
Si de una población de canicas obtenemos una muestra de 10 o 20
canicas y todas ellas resultan amarillas, podemos concluir que la
totalidad o la mayoría de la población es de color amarillo: sin
embargo esta conclusión no será válida si deliberadamente se han
elegido sólo canicas amarillas.
Estadística descriptiva:
Clasificación de
la estadística
.
Resume mediante el empleo de medidas
sumatorias, la información
amorfa y desordenada de datos y para ello se tiene que determinar la ausencia
o presencia de la característica o características en estudio o en su caso, medir
su magnitud en todos los elementos que componenen el conjunto.
stadística inferencial:
E
Tiene por objeto describir las características de un conjunto, pero sín que se
registren los datos correspondientes a todos sus elementos sino
sólo una parte de los componentes y con esta información poder inferir sobre
la población.
La estadística inferencial implica generalizaciones y afirmaciones con
respecto a la probabilidad de su validez.
Ejemplo
Supóngase que un profesor calcula la calificación promedio de un
grupo de historia, como la estadística describe el desempeño de un
grupo pero no hace ninguna generalización acerca de los
diferentes grupos, podemos decir que el profesor está utilizando
estadística descriptiva.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Instituto Tecnológico de Celaya
Departamento de Ingeniería química
Ejemplo
Supóngase ahora que el profesor de historia decide utilizar el
promedio de calificación obtenido por uno de sus grupos, para
estimar la calificación promedio de los diez grupos del mismo
curso de historia. El proceso de estimación de tal promedio sería
un problema concerniente a la estadística inferencial. Obviamente
cualquier conclusión a la que llegue el profesor sobre las diez
unidades del curso estará basada en una generalización que va
más allá de los datos del grupo original de historia y ésta puede no
ser completamente válida, de modo que el profesor debe establecer
qué posibilidad hay de que sea cierta.
Interpretación
La cuarta operación básica de la estadística es la interpretación, ésta incluye el fin para
el cual se ha realizado todo el proceso estadístico y puede significar desde una simple
información hasta una transformación total en la forma de actuar. En escolaridad, dicha
información puede informarnos sobre el avance o retroceso de un grupo, en medicina
puede orientar sobre consecuencias fisiológicas posteriores, en sociología puede marcar
los pasos de un gobierno, en una fábrica quizá signifique un cambio de proceso y en
general, la interpretación del proceso estadístico es una información del presente para la
obtención de un futuro mejor.
Autor: Rosalba Patiño Herrera
Agosto del 2002
Descargar