2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 TEMA 1: INICIACIÓN A LA ESTADÍSTICA. TABLAS Y GRÁFICOS. 1. INTRODUCCIÓN La Estadística actual es el resultado de la unión de dos disciplinas que evolucionan de manera independiente hasta confluir en el siglo XIX: el Cálculo de Probabilidades (que nace en el siglo XVII como teoría matemática de los juegos de azar) y la Estadística (ciencia del Estado) que estudia la recogida de datos y que es de raíces bastante más antiguas. Esto hace que una de las acepciones más acertadas de la Estadística sea la que la define como el conjunto de datos de observación relativos a un grupo de individuos o unidades. La Estadística actúa como disciplina puente entre los modelos matemáticos y los fenómenos reales. 2. ESTADÍSTICA DESCRIPTIVA. La Estadística Descriptiva o Deductiva trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones. Se construyen tablas y se representan gráficos que permiten simplificar la complejidad de los datos que intervienen en la distribución. Asimismo, se calculan parámetros estadísticos que caracterizan la distribución. No se hace uso del cálculo de probabilidades y únicamente se limita a realizar deducciones directamente a partir de los datos y parámetros obtenidos. A) ELEMENTOS. Denominamos población al conjunto formado por todos los elementos cuyo estudio nos interesa. Cada elemento de la población se denomina individuo. Muestra es un subconjunto limitado extraído de la población, con objeto de reducir el número de experiencias, (útiles por razones económicas, rapidez en la obtención de datos, etc.). Las características observadas en una población se clasifican en: Cualitativas: Aquellas que no se pueden cuantificar (color de pelo, gusto musical, …) Cuantitativas: Aquellas que si se pueden cuantificar (estatura, número de hijos,..) Estas a su vez se dividen en dos: -Discretas: Las que toman un conjunto finito o infinito numerables de valores. Nº de hijos, vehículos,...) -Continuas: Pueden tomar cualquier valor de un conjunto infinito no numerable de valores, es decir, pueden tomar cualquier valor dentro de un determinado intervalo (altura, tiempo de reacción, … Una vez obtenida la información referente a la variable de estudio, ésta se organiza y resume en las llamadas distribuciones de frecuencias (que nos proporciona el número de individuos para cada uno de los valores de la variable). 1 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 B) MEDIDAS. Uno de los objetivos de la estadística descriptiva es la de resumir toda la información recogida en unos pocos valores numéricos, para poder sacar conclusiones de esa información. Dentro del conjunto de valores numéricos que resumen toda la información los hay de distinto tipo y que aportan distintas características: Medidas de centralización (media, moda, mediana, cuartiles,...) Medidas de dispersión (Varianza, Desviación, típica, Rango,...) Medidas de forma o asimetría (Coef. de variación de Pearson, de Fisher,...) Relación entre variables (coeficiente de correlación lineal, recta de regresión,...) C) GRÁFICOS Dentro de las técnicas que permiten resumir la información de una variable estadística, lo gráficos ocupan un papel fundamental, debido a su facilidad de comprensión incluso entre aquellas personas que no poseen conocimientos de estadística. Los diagramas de barras, pictogramas, diagramas de sectores, histogramas, polígonos de frecuencias, entre otros, ofrecen una información visual muy clara. 3. MÉTODO ESTADÍSTICO La investigación científica es un proceso de aprendizaje dirigido. El objeto de los métodos estadísticos es hacer que ese proceso sea lo más eficiente posible. El método estadístico es el procedimiento mediante el cual se sistematiza y organiza el proceso de aprendizaje iterativo deductivo-inductivo. Las etapas básicas de aplicación de los métodos estadísticos son: 1. 2. 3. 4. 5. Planteamiento del problema. Diseño del experimento Obtención de los datos. Depuración de los datos. Estimación de parámetros. Los modelos estadísticos dependen de ciertas constantes desconocidas llamadas parámetros estadísticos. Utilizando la información de la muestra podemos estimar el valor o valores de ciertos parámetros, así como el posible error de estimación. 6. Simplificación del modelo estadístico: Se determina si son necesarios todos los parámetros definidos previamente. 7. Crítica del modelo. Se comprueba si la información que nos suministra el modelo estadístico y la información empírica es compatible y se puede aceptar el modelo como correcto 2 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 4. ENCUESTAS Y SONDEOS. Cuando una investigación se realiza a toda la población decimos que estamos realizando un censo, pero si recogemos datos de información relativos sólo a una muestra diremos que estamos realizando una encuesta o sondeo. La realización de una encuesta consta de varias etapas desde que se concibe hasta que se culmina. Estas etapas, según William Cochran, son las siguientes: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Indicar los objetivos de la encuesta. Definición de la población sobre la que se va a efectuar la encuesta. Determinación de las preguntas a efectuar. Expresión del grado de precisión que se desea. Métodos de medición. Elección de unidades de muestreo. Estratificación de la población. Puede ser uniforme, proporcional u óptima. Selección de la muestra. Encuesta piloto. Organización del trabajo de campo. Tabulación y análisis de datos. Tabulación y análisis de datos. Información para futuras encuestas. 5. REPRESENTACIÓN DE DATOS Tablas estadísticas Una vez que se ha extraído una muestra de la población, el siguiente paso es organizar los datos con el objetivo de poder analizarlos con comodidad. Cuando se trabaja con datos correspondientes a dos características suelen disponerse en forma de doble entrada, mientras que para tres o más características suele utilizarse una disposición lineal de los mismos. Al observar los datos numéricos de una encuesta, es muy probable que varios de estos datos se repitan. Esto nos conduce al concepto de frecuencia absoluta. DEF: Llamaremos frecuencia absoluta asociada al valor xi al número de veces que se repite dicho valor. Se representará por ni Obviamente se verificará: ni N (Siendo N el tamaño de la muestra.) Pero este valor no es suficiente para hacernos una idea de la representatividad de un cierto valor de la variable. Por tanto, se define: 3 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 DEF: Llamaremos frecuencia relativa asociada al valor xi al cociente entre la frecuencia absoluta asociada a xi y el nº total de datos, que denotaremos por N. n Se representará por fi = i . Obviamente fi =1. N Datos xi Frecuencias Absolutas ni x1 x2 : : xn Frecuencias Relativas f i n1 n2 : : nn Frecuencias Abs.acum. Ni Frecuencias Relat.acum. Fi F1 N1 N2 : : Nn f1 f2 : : fn F2 : : Fn EJEMPLO: Un estudio hecho en un conjunto de 25 personas con objeto de determinar su grupo sanguíneo ha conducido a los resultados que aparecen en la siguiente tabla: DATOS Fr.Abs. ni A 11 B 7 O 6 AB 1 Fr.Rel. Fr.Abs.acum.. Fr.Rel.acum. Ni fi Fi 11/25 11 11/25 7/25 18 18/25 6/25 24 24/25 1/25 25 1 Porcentaje 44% 28% 24% 4% EJEMPLO: La siguiente tabla muestra los datos obtenidos al preguntar a 62 personas el tiempo que dedicaron a ver la televisión durante el fin de semana. Tiempo (horas) 0,0´5 Fr.Abs. Fr.Rel. Fr.Abs.acum.. Fr.Abs.acum.. Porcentaje 10 10/62 10 10/62 16% 0´5,1´5 1´5,2´5 2´5, 4 10 10/62 20 20/62 16% 18 18/62 38 38/62 29% 12 12/62 50 50/62 19% 4,8 12 12/62 62 1 19% 4 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 Gráficas estadísticas: Aunque una tabla estadística encierra toda la información disponible sobre el carácter en estudio, es necesario traducirla a un gráfico para realizar una síntesis visual. Según la naturaleza del carácter estudiado, se utilizan distintos tipos de presentaciones; no obstante existen algunas líneas generales que debe verificar una representación gráfica. Las gráficas deben expresarse por sí mismas. Los títulos deben dar información sobre los sujetos de estudio y la materia objeto de la experimentación, cuantas observaciones se han efectuado,... Se deben indicar las unidades de escala de los ejes. Deberán dar una visión general del conjunto de datos. No deben abarcar mucha información en un solo gráfico. o Gráficas para variables cualitativas . La representación gráfica de este tipo de datos está basada en la proporcionalidad de las áreas de frecuencias absolutas o relativas. Diagrama de sectores. Se utilizan para comparar las distintas modalidades de un carácter. Para construirlos, simplemente se traza un círculo y se asigna a cada modalidad un sector circular cuyo ángulo es proporcional a su frecuencia relativa. EJEMPLO: Motivos para no donar sangre entre personas mayores de 18 años. - Temor a las agujas Peso < 50 kg. Padecer alguna enfermedad Falta de tiempo 50% 180º 10% 36º 20% 72º 20% 72º M o tiv o s p a r a n o d o n a r s a n g r e 20% 1 2 50% 3 4 20% 10% 5 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 Diagrama de barras. Consiste en construir tantos rectángulos (barras) como modalidades presente la característica cualitativa en estudio, todos ellos con base de igual amplitud. La altura se toma igual a la frecuencia absoluta o relativa, consiguiendo así que sus áreas sean proporcionales a las frecuencias que se quieren presentar. EJEMPLO: Para el mismo ejemplo anterior sería: M o tiv o s p a r a n o d o n a r s a n g r e 60 50 Porcentajes 40 30 20 10 0 1 2 3 4 M o tiv o s - Pictogramas: Tienen como objetivo ofrecer una descripción, lo más explícita posible de la distribución de los datos. Para construirlos se dibujan figuras que aluden a la distribución que se está estudiando y cuyos tamaños son proporcionales a sus frecuencias. o Gráficas para variables cuantitativas discretas - Diagrama de puntos: Se marcan tantos puntos sobre la recta encima de cada valor xi como diga su frecuencia absoluta. Ejemplo: 10,20,20,30,40,40,40,50,60,60,60,70,70,80 ________________________________________ 10 20 30 40 50 60 70 80 6 2º CC.EE. ESTADÍSTICA EMPRESARIAL. TEMA 1 - Diagrama de frecuencias acumuladas : Se corresponde con la representación gráfica de una función constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada hasta el menor de los valores de la variable que constituyen el tramo en el que es constante. Ejemplo: Tras encuestar a 25 familias sobre el nº de hijos que tienen, se obtuvo: xi 0 1 2 3 4 ni 0,2 0,24 0,32 0,16 0,08 o Gráficas para variables cuantitativas continuas. - Histogramas: Se colocan en el eje X los intervalos en que la variable toma sus valores, y sobre cada intervalo se construyen rectángulos que tienen por base la amplitud del intervalo y como altura la frecuencia absoluta de cada intervalo. - Polígono de frecuencias: Una vez construido el histograma, se puede obtener el polígono de frecuencias calculando el punto medio de los segmentos superiores de cada rectángulo y midiéndolos mediante segmentos. 7