1 UNIDAD I. ESTADÍSTICA DESCRIPTIVA OBJETIVOS o Interpretar las definiciones básicas de los elementos de la estadística descriptiva. o Construir la tabla de distribución de frecuencias. o Realizar los gráficos de la tabla de frecuencias e interpretarlos. o Interpretar las medidas de tendencia central. o Interpretar las medidas de dispersión. TEMA 1. INTRODUCCIÓN A LA ESTADISTICA DESCRIPTIVA 1. ASPECTOS GENERALES La estadística es una asignatura instrumental, está relacionada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. La estadística como ciencia tiene los siguientes elementos: DATOS DE ENTRADA MÉTODOS Y TÉCNICAS DE PROCEDIMIENTOS RESULTADOS O SALIDA DE INFORMACIÓN PASOS PARA LA TOMA DE DECISIONES Los datos llegan a ser la materia prima (o antecedente) y los resultados o salida de información producto terminado, listo para realizar la toma de decisiones, partiendo de la producción (o pronóstico). 1.1. INTRODUCCIÓN. Está ciencia esta relacionada con la recopilación, presentación, análisis y uso de datos para resolver problemas, cualquier persona tanto en su carrera como en la vida cotidiana recibe información a través de periódicos, radios, la televisión y de otros medios. Frecuentemente es necesario obtener conclusiones de la información obtenida en los datos, debido a que los Ingenieros obtienen y analizan datos de manera rutinaria, el conocimiento de la estadística tiene gran importancia en este campo. De modo concreto, el conocimiento de la estadística y la probabilidad puede constituirse en una herramienta poderosa para ayudar a los Ingenieros a diseñar nuevos productos y sistemas, a perfeccionar los existentes y a diseñar, desarrollar y mejorar procesos de producción, de redes, sistemas de información, etc. 2 1.2. DEFINICION. La estadística es una ciencia que proporciona un conjunto de métodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los "datos" con respecto a una característica materia de estudio o investigación. La estadística en general se considera que puede llegar a producir normas que rigen dichos fenómenos. Podemos decir en ese sentido como ser: Obtener, Agrupar, Ordenar y Clasificar los datos y la información. 2. CLASIFICACIÓN DE LA ESTADÍSTICA 2.1. ESTADISTICA DESCRIPTIVA Es el Conjunto de métodos que se ocupa de la recolección, clasificación, tabulaciones y representaciones gráficas de los datos estadísticos que se derivan de la medición de las características del objeto de estudio. Un estudio estadístico se considera "descriptivo" cuando sólo se analiza y describe los datos. 2.2. ESTADISTICA INFERENCIAL También se llama Inductiva, es el conjunto de métodos o técnicas que posibilitan la generalización o toma de las decisiones en base a una información parcial obtenida mediante técnicas descriptivas. 3. POBLACIÓN Y MUESTRA Las estadísticas de por sí no tienen sentido si no se consideran o se relacionan dentro del contexto con que se trabajan. Por lo tanto, es necesario entender los conceptos de población y de muestra para lograr comprender mejor su significado en la investigación educativa o social que se lleva a cabo. 3 3.1. POBLACIÓN Es el conjunto total de individuos, objetos o medidas que poseen algunas características comunes observables en un lugar y en un momento determinado. Cuando se vaya a llevar a cabo alguna investigación debe de tenerse en cuenta algunas características esenciales al seleccionarse la población bajo estudio. Entre éstas tenemos: Homogeneidad que todos los miembros de la población tengan las mismas características según las variables que se vayan a considerar en el estudio o investigación. Tiempo se refiere al período de tiempo donde se ubicaría la población de interés. Determinar si el estudio es del momento presente o si se va a estudiar a una población de cinco años atrás o si se van a entrevistar personas de diferentes generaciones. Espacio se refiere al lugar donde se ubica la población de interés. Un estudio no puede ser muy abarcador y por falta de tiempo y recursos hay que limitarlo a un área o comunidad en específico. Cantidad se refiere al tamaño de la población. El tamaño de la población es sumamente importante porque ello determina o afecta al tamaño de la muestra que se vaya a seleccionar, además que la falta de recursos y tiempo también nos limita la extensión de la población que se vaya a investigar. 3.2. MUESTRA La muestra es un subconjunto fielmente representativo de la población. Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione dependerá de la calidad y cuán representativo se quiera sea el estudio de la población. Aleatoria cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser incluido. Estratificada cuando se subdivide en estratos o subgrupos según las variables o características que se pretenden investigar. Cada estrato debe corresponder proporcionalmente a la población. Sistemática cuando se establece un patrón o criterio al seleccionar la muestra. Ejemplo: se entrevistará una familia por cada diez que se detecten. 3.3. MUESTREO Es indispensable para el investigador ya que es imposible entrevistar a todos los miembros de una población debido a problemas de tiempo, recursos y esfuerzo. Al seleccionar una muestra lo que se hace es estudiar una parte o un subconjunto de la población, pero que la misma sea lo suficientemente representativa de ésta para que luego pueda generalizarse con seguridad de ellas a la población. 4 El tamaño de la muestra depende de la precisión con que el investigador desea llevar a cabo su estudio, pero por regla general se debe usar una muestra tan grande como sea posible de acuerdo a los recursos que haya disponibles. Entre más grande la muestra mayor posibilidad de ser más representativa de la población. En la investigación experimental, por su naturaleza y por la necesidad de tener control sobre las variables, se recomienda muestras pequeñas que suelen ser de por lo menos 30 sujetos. En la investigación descriptiva se emplean muestras grandes y algunas veces se recomienda seleccionar de un 10 a un 20 por ciento de la población accesible. 4. TECNICAS DE RECOLECCIÓN DE DATOS Los investigadores utilizan una variedad de métodos a fin de recopilar los datos sobre una situación existente, como entrevistas, cuestionarios, inspección de registros (revisión en el sitio) y observación. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigación completa. Para llevar a cabo un trabajo de investigación el investigador cuenta con gran variedad de métodos para diseñar un plan de recolección de datos. Tales métodos varían de acuerdo con cuatro dimensiones importantes: estructura, confiabilidad, injerencia del investigador y objetividad. La presencia de estas dimensiones se reduce al mínimo en los estudios cualitativos, mientras que adquieren suma importancia en los trabajos cuantitativos, no obstante el investigador a menudo tiene la posibilidad de adaptar la estrategia a sus necesidades. Cuando la investigación está altamente estructurada, a menudo se utilizan instrumentos o herramientas para la recolección formal de datos. Las tres principales técnicas de recolección de datos son: o Entrevistas o Encuesta o Observación 4.1. ENTREVISTA. La entrevista, desde un punto de vista general, es una forma específica de interacción social. El investigador se sitúa frente al investigado y le formula preguntas, a partir de cuyas respuestas habrán de surgir los datos de interés. Se establece así un diálogo, pero un diálogo peculiar, asimétrico, donde una de las partes busca recoger informaciones y la otra se nos presenta como fuente de estas informaciones. 5 Una entrevista es un dialogo en el que la persona (entrevistador), generalmente un periodista hace una serie de preguntas a otra persona (entrevistado), con el fin de conocer mejor sus ideas, sus sentimientos su forma de actuar. El entrevistado, deberá ser siempre una persona que interese a la comunidad. El entrevistado es la persona que tiene alguna idea o alguna experiencia importante que transmitir. El entrevistador, es el que dirige la entrevista debe dominar el dialogo, presenta al entrevistado y el tema principal, hace preguntas adecuadas y cierra la entrevista. La entrevista es también información y reportaje, las entrevistas pueden ser reales o imaginarias. Las reales presentan a una o más personas reales que responden a una serie de preguntas formuladas por un entrevistador. Las partes de una entrevista, una presentación suele ser breve, pero no suficientemente informativa. En ella no se habla del entrevistado, sino del tema principal de la entrevista. Se podrá observar y concluir que es una tarea imposible y muy costosa preguntar a cada persona, familia o empresa cuántas computadoras tiene. Es por eso que resulta conveniente escoger una pequeña parte de está población (una muestra) y hacerle la pregunta. 4.2. ENCUESTA. Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra representativa de la población o instituciones, con el fin de conocer estados de opinión o hechos específicos. Su objetivo es obtener información estadística indefinida, mientras que los censos y registros vitales de población son de mayor alcance y extensión. Actualmente, existen sistemas de gestión de encuestas en Internet, que están acercando su utilización a investigadores que hasta el momento no tenían acceso a los medios necesarios para ejecutarlas. Las encuestas son cuestionarios que se realizan con el objeto de recabar información de algún tipo. Existen en diferentes formatos y básicamente están formadas por los siguientes tipos de preguntas: o Cerradas de selección única o Cerradas de selección múltiple o Abiertas A continuación, mostraremos un cuestionario típico: 6 ENCUESTA MODELO Características y conexiones del equipo de computación. 1. ¿Tienes una computadora? Si [ ] 2. ¿Hace cuánto tiempo que la compró? 3. ¿Cuál de estos procesadores está usando? No [ ] __________________ Dual Core DDR2 [ ] Core Do duo DDR2 [ ] 4. 5. Core Qualk DDR2 [ ] Core i3 DDR3 [ ] Core i5 DDR3 [ ] Core i7 DDR3 [ ] Core i9 DDR3 [ ] Marque los accesorios que tiene su equipo: DVD [ ] Mouse [ ] Tarjeta de Red [ ] Antena Internet [ ] Fax Modem [ ] Impresora [ ] Cámara [ ] ¿Tienes conexión a Internet? Si [ ] No [ ] 4.3. OBSERVACIÓN Es una técnica útil para el investigador, consiste en observar a las personas cuando efectúan su trabajo, la cual puede reducirse a una percepción de los hechos, situaciones o cosas; no todos los datos se refieren a las mismas variables o indicadores, y es precio estar alerta para diferenciar adecuadamente frente a todo este conjunto posible de informaciones. En la investigación, la observación tiene amplia aceptación científica. Los sociólogos, sicólogos e Ingenieros utilizan extensamente ésta técnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organización. 7 5. VARIABLES Las variables en la investigación, representan un concepto de vital importancia dentro de un proyecto. Las variables, son los conceptos que forman enunciados de un tipo particular denominado hipótesis. 5.1. TIPOS DE VARIABLES Los tipos de variables son tres: o Variable independiente (causa) o Variable dependiente (efecto) o Variable intermitente (intermedia) Variable independiente, es lo que se va a evaluar para influir ya que es la causa del fenómeno estudiado, variable que el investigador manipula experimentalmente, incide o afecta a otras variables; no depende de algo para estar allí. Variable dependiente, experimenta los cambios sufridos como consecuencia de la manipulación de la variable independiente por parte del experimentador, ya que es el efecto del fenómeno estudiado, va a depender de algo que la hace variar y son las que se miden. Variable interviniente, son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes. 5.2. CLASIFICACIÓN DE LAS VARIABLES Las variables se clasifican en dos: o Variable cualitativa o Atributos (nominales y ordinales) o Variable cuantitativa (continuas o discretas) Variables cualitativas proporcionan etiquetas o nombres, observaciones, se dividen en: o Variables nominales: La variable cuenta con una serie de datos sin orden inherente o secuencia. Ejemplo: Área de una Empresa: Administrativa, Contable, Producción, Ventas, etc. o Variables ordinales: La variable cuenta con una serie de datos ordenados. Ejemplo: Tamaño de una persona: Pequeño, Mediano y Grande. Variables cuantitativas representa una cantidad o un número se pueden dividir en: o Variable discreta: El conjunto de todos los valores enteros que se pueden contar. Ejemplo: Cantidad de estudiantes de un curso, contar variables (1, 2, 3 ...). o Variables continuas: El conjunto de todos los valores reales que se pueden medir, se dan en intervalos o razón, también se llaman variables de escala. Ejemplo: Medir la estatura de cada estudiante de un curso. 8 TEMA 2. ORGANIZACIÓN Y ANALISIS DE LOS DATOS 1. ANÁLISIS ESTADÍSTICO Las etapas del análisis estadístico son: 1.1. Obtención de los Datos La obtención de los datos, permite tener los datos disponibles para poder utilizarlos. Los datos están inicialmente no agrupados (datos no agrupados o desordenados). 1.2. Ordenación de los datos y colocar en tablas Los datos obtenidos se los debe ordenar, luego de acuerdo con sus características agruparlos ya sea por repetición o por intervalos (datos agrupados). 1.3. Resumen de la información a través de las medidas (Descriptiva) Una vez agrupados, se lo debe resumir utilizando medidas estadísticas. 1.4. Analizar los datos provenientes de una muestra para sacar conclusiones sobre la población de la que proviene la muestra (Inferencial). Cuando se obtiene resultados de las medidas estadísticas se lo debe analizar e interpretar. 2. DISTRIBUCIÓN DE FRECUENCIAS Es la simplificación del conjunto de datos no agrupados obtenidos, resultando bastante útil resumir la información en un cuadro o tabla, para su posterior interpretación y análisis. Este cuadro recibe el nombre de “cuadro de distribución de frecuencias” La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia. 2.1. TIPOS DE FRECUENCIAS 9 La Distribución de frecuencia puede ser: o Agrupada por Repetición o Agrupada por Intervalo de Clase 2.2. DISTRIBUCION DE FRECUENCIA AGRUPADA POR REPETICIÓN Se utiliza cuando los datos son repetitivos además de enteros. Se debe colocar cada dato y frecuencia con que se repiten. Los pasos a seguir son: 1. Ordenar los datos en forma ascendente. 2. En la primera columna enumerar los datos (1, 2, 3, …) 3. En la segunda seleccionar de uno en uno cada variable ó dato diferente. 4. En la tercera colocar la frecuencia absoluta simple (f i) con que se repiten. 5. Las restantes columnas Fi(≤) (frecuencia absoluta acumulada) se acumulan los valores de fi y las F’i(≥) se retiran los valores de fi a partir del total. 6. Las frecuencia relativa simple (hi) es igual a: hi = fi / N. Las restantes idem al paso (5). Los resultados se los puede expresar en decimales, fracción o porcentaje. 7. Las frecuencia circular simple (ci) es igual a: ci = fi / N · 360. Las restantes idem al paso (5). El cuadro estructurado de distribución de frecuencias es el siguiente: FRECUENCIA RELATIVA (%) hi Hi(≤) H’i(≥) .h1 h1 1 FRECUENCIA CIRCULAR ci Ci(≤) C’i(≥) c1 c1 1 N-f1 .h2 h1 + h2 1-h1 c2 c1 + c2 1-c1 ... ... hm-1 h1+h2+..+hm-1 ... cm-1 c1+c2+..+cm-1 ... N=∑fi N-(f1+f2+.. hm 1=∑hi 1-(h1+h2+... cm 1=∑ci 1-(c1+c2+... FRECUENCIA ABSOLUTA Nº X 1 X1 fi .f1 Fi(≤) .f1 F’i(≥) N 2 X2 .f2 f1+f2 … ... ... fm m Xm Siendo Xi los distintos valores Xi que puede tomar la variable. Siendo fi el número de veces que se repite cada valor. Siendo f el porcentaje que la repetición de cada valor supone sobre el total Doc. MSc. Ing. Ramiro Burgoa