Estadística Descriptiva Distribución de Frecuencias, Histogramas y Gráficos Al analizar una característica medida por una variable cualquiera, resultado de un determinado proceso (económico, financiero, sociológico, médico, de producción, de ventas, etc.), los datos obtenidos siempre están dispersos y nunca tiene un valor constante, por lo tanto se presenta el problema de detectar el patrón de la variabilidad de los datos, este problema se lo puede afrontar con herramientas estadísticas básicas, como las Distribuciones de Frecuencias, los histogramas y técnicas sencillas del análisis exploratorio de datos. La dispersión de los datos siempre sigue un patrón determinado, en primera instancia los datos no revelan nada por si solos, si embargo si se realizan divisiones en clases o celdas ordenadamente, se puede mejorar la visualización de los mismos, es decir, podemos visualizar la forma en como están distribuidos, a esta forma de distribución de la variabilidad de los datos se la conoce como Distribución de Frecuencias. La forma general de una distribución se la puede ver normalmente cuando tenemos muchos valores (algunos autores sugieren mas de 80), y se prepara una tabla de frecuencias con diez o veinte clases (algunos autores consideran un mínimo de 8 y máximo de 20 clases), pero la distribución de los datos se clarifica cuando representamos un histograma de frecuencias. Un histograma de frecuencias no es más que la representación gráfica en la que se observa con facilidad tres propiedades fundamentales de las distribuciones: 1. Forma 2. Tendencia Central o Acumulación 3. Dispersión o Variabilidad Con esto se consigue una idea bastante clara del proceso (datos), que no se la puede obtener del simple examen de los datos tabulados. Existen muchos métodos para construir histogramas, enunciaremos un método muy práctico que nos permita construirlo con facilidad: 1. El número de datos debe ser grande para agruparlos en clases, identificar el mínimo y el máximo. 2. El número de clases se lo obtiene tomando la raíz cuadrada del tamaño de la muestra, si no es entero se toma el entero inmediatamente superior. 3. Las clases deben tener amplitud (tamaño del intervalo) uniforme. 4. Se construye el primer intervalo comenzando con el límite inferior del mismo, solo un poco menor del valor mínimo. 5. Se construye el último intervalo comenzando con el límite superior del mismo, solo un poco mayor del valor máximo. 6. Para realizar el histograma se marcan los valores de las clases en el eje x (abscisas), sobre cada clase se levanta un rectángulo cuya altura representa el número de observaciones de la variable en cada clase. Objetivo de las Distribuciones de Frecuencia El objetivo principal de las distribuciones de frecuencia puede ser uno de los siguientes: Mejorar la visibilidad de la distribución de la variable e identificar su forma. Analizar, controlar y mostrar las capacidades de los procesos de los que provienen sus datos, tanto cualitativa como cuantitativamente. Ayudar a determinar medidas características de una distribución. Demostrar a que tipo de Distribución Matemática se puede acoplar estadísticamente la distribución empírica. Análisis de las distribuciones de frecuencias Las distribuciones de frecuencias ayudan a la interpretación de la forma de una distribución, no obstante se debe analizar los siguientes puntos: Si la posición del promedio de los datos es adecuada. La dispersión de los datos con respecto al promedio. Relaciones entre medidas de dispersión y de tendencia central. Valores atípicos. Valores máximos y mínimos razonables de acuerdo al proceso. Simetría de la distribución. Algunos conceptos adicionales que se presentan en un tabla de distribución de frecuencias se citan a continuación. Sea X una variable con valores x1, x2, …,xN, se define: Frecuencia Absoluta (ni): Se denomina frecuencia absoluta del valor xi de la variable X, el número de veces que se repite ese valor. Frecuencia Relativa (fi): Se denomina frecuencia relativa del valor xi de la variable X, al cociente entre el número de veces que aparece el valor xi y el número total de valores de la variable, es decir fi = ni/N. Frecuencia Absoluta Acumulada (Ni): Se denomina frecuencia absoluta del valor xi a la suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a xi. N i n j con j 1,...,i. j Frecuencia Relativa Acumulada (Fi): Se denomina frecuencia relativa acumulada al valor resultante de la división entre la frecuencia absoluta acumulada por el número total de valores de la variable, Fi = Ni/N. Marca de clase (Xi): Es el punto medio del intervalo de clase Xi = ( Ll-1 - Ll )/2 Tabla de frecuencias. Ii Xi ni fi [Lo,L1] x1 n1 f1=n1/N N1=n1 F1=N1/N [L1,L2] X2 n2 f2=n2/N N2=n1+ n2 F2=N2/N [L2,L3] X3 n3 f3=n3/N N3=n1+ n2+ n3 F3=N3/N . . . . . . . . . . . . . . . . . . [Lk-1,Lk] Xk nk fk=nk/N k ni N i 1 k f i 1 i Ni Nk=n1+…+ nk=N Fi Fk=Nk/N=1 1 Distribución de Frecuencias, Histogramas y Gráficos en Excel Excel permite varias alternativas para construir una tabla de frecuencias a partir de datos dispersos, utilizando funciones, herramientas de análisis y tablas dinámicas. Función FRECUENCIA La función FRECUENCIA(datos; grupos) de Excel solicita dos argumentos: datos.- Es una matriz de un conjunto de valores o una referencia a un conjunto de valores x1, x2, …,xn cuyas frecuencias se desea calcular. Si este argumento contiene valores, la función devuelve una matriz de ceros. grupos.- Es una matriz de intervalos o una referencia a intervalos de los cuales desea agrupar los valores. Si este argumento no contiene valores, la función devuelve el número de elementos contenido en datos Observaciones: La función frecuencia se debe introducir como una fórmula matricial, es decir marcando las celdas adyacentes de respuesta. El la matriz resultante tiene una fila mas que el argumento grupos, ya que la función agrupa todos los valores superiores al mayor intervalo. Esta función pasa por alto las celdas en blanco y texto. Al ser una fórmula matricial, es necesario para obtener la respuesta pulsar las teclas CONTROL + MAYÚSCULAS + ENTER, caso contrario solo calculará el valor para el primer intervalo. Ejemplo: Para el pago de comisiones a los oficiales de inversión existen rangos de acuerdo al plazo de las mismas, los rangos de plazos son de 0 a 30 días, de 31 a 60, de 61 a 90, de 91 a 180, de 181 a 365 y mas de 365 días, calcular la distribución de las captaciones para el pago de comisiones. El acceso a la función pude darse como en el ejemplo, insertando directamente la función, pero también se puede realizar la misma operación utilizando Insertar, Función, Estadísticas, Frecuencia como se describe. Herramientas de Análisis Excel proporciona un conjunto de herramientas par análisis de datos denominado “herramientas para análisis” que se utiliza para el desarrollo de análisis estadísticos. Para utilizar la lista de herramientas de análisis estadístico avanzado disponibles, se selecciona la opción Análisis de Datos en el menú Herramientas. Si esta opción no está activada en dicho menú, se debe instalarlo siguiendo lso siguientes pasos: 1. Dentro del menú de Herramientas, escoger Complementos. 2. Dar un clic en la casilla de herramientas para Análisis, al aceptar se instalan las mencionadas herramientas, en algunos casos es necesario utilizar el CD del programa. En la figura anterior se observa la opción Histograma, esta herramienta calcula las frecuencias individuales y acumuladas de los datos, genera tablas de frecuencia y grafica histogramas. Ejemplo 2. Con los datos del ejemplo 1 realizar el histograma para plazos de mensuales. En el cuadro de las opciones de salida debe ingresarse: Rango de Entrada: Los datos que se desea analizar. Rango de clases (opcional): Los rangos de celdas que definan los extremos de los intervalos de clase, estos valores deben estar en orden ascendente. Todos los valores inferiores al primer valor pertenecerán al primer intervalo de clase y los valores superiores al último valor formarán el último intervalo. Si se omite el rango de clase Excel creará un conjunto de clases distribuidas igualmente entre los valores mínimo y máximo de los datos. Si se activa Rótulos, se interpretará que la primera fila y la primera columna de entrada contiene Rótulos. Las opciones de salida nos indican: o Rango de Salida: Se debe especificar la celda superior izquierda de la tabla de resultados. o En una nueva hoja: Inserta una nueva hoja en el libro actual de trabajo, comenzando por la celda A1 de la nueva hoja. o En un libro nuevo: Crea un libro nuevo con los resultados. Pareto (Histograma ordenado): Presenta el gráfico en orden de frecuencia descendente. Porcentaje Acumulado: Genera en una columna en la tabla de resultados con porcentajes acumulados e incluye una línea de porcentaje acumulado en el gráfico del histograma. Crear Gráfico: Genera el gráfico del histograma. A continuación la tabla de resultados y el gráfico. Tablas Dinámicas. Una tabla dinámica o informe de tabla dinámica en una tabla interactiva que se pude utilizar para presentar distribuciones de frecuencias que resume rápidamente grandes volúmenes de información. Esta información puede graficarse, generándose los gráficos dinámicos que se pueden asociar con los histogramas de frecuencias. Para generar una tabla dinámica, ingrese en el menú Datos y utilice el asistente para tablas y gráficos dinámicos. El paso 1 le permite seleccionar el origen de los datos para generar el informe y si desea una tabla o un gráfico dinámico. El paso 2 debe indicar el rango ene el que están situados los datos. En el paso 3 nos indica donde queremos que se situe el informe o el gráfico dinámico. Al hacer clic en finalizar pasa a diseñar el informe, en el cual se debe arrastrar los campos cuyos valores van a situarse en las filas de la tabla, adicionalmente se arrastran los campos cuyos valores van a situarse en las columnas y arrastrar los campos a ser calculados, en nuestro caso nos interesa la opción Cuenta, existen adicionalmente varias alternativas para la generación y cálculos de los campos que no son objeto de este tema, peor se los rescatará a medida que sean necesarios. Ejemplo.- Se desea analizar las ventas de las agencias de la ciudad de Guayaquil utilizando tablas dinámicas para visualizar la distribución de los montos vendidos. Esta es la distribución de frecuencias a través de una tabla dinámica, para construir el histograma lo podemos realizar usando el informe para gráficos dinámicos. Seleccionamos una celda fuera de la tabla dinámica y haciendo clic en Asistente para gráficos y escogemos el gráfico de barras. Coloque campos de página aquí Histograma Contar de MONTO 6 Coloque campos de serie aquí Total 0 1000 1625 1800 3000 MONTO Gráficos de barras, columnas, líneas, sectores y áreas. La forma más simple para generar gráficos en Excel es mediante el Asistente para gráficos, para acceder a Él podemos directamente dar clic en el icono o seleccionar en la opción gráfico del menú Insertar. El paso 1 de 4 del asistente solicita escoger el tipo de gráfico y a su vez el subtipo de gráfico para cada tipo seleccionado. El botón cancelar abandona la operación y regresa a la hoja de cálculo, el botón siguiente avanza al siguiente paso del asistente y el botón finalizar termina el Asistente. En la solapa Tipos personalizados de la pantalla del asistente paso 1 de 4, se puede personalizar el gráfico, pudiendo elegir una gran variedad de gráficos similares a los estándar pero con características propias del usuario. Si presionamos el botón Siguiente, se obtiene la pantalla del asistente Paso 2 de 4, que presenta la solapa Rango de Datos, donde consta el rango de tatos seleccionado para hacer el gráfico y la opción Series que permite elegir tomar las series del gráfico en filas o columnas. Al seleccionar la solapa Serie podemos elegir para representar el campo Nombre el que indica la referencia de las celdas que contiene el rótulo de la serie, en el campo Valores indica la referencia de las celdas que contienen los datos de la serie y en el campo Rótulos del eje de categorías de (X), se puede especificar el rango de las celdas que no sea el mismo de la sección anterior, para utilizarlo como rótulo de categorías. Al hacer clic en el botón siguiente obtenemos el Paso 3 de 4 del asistente, que presenta varias solapas para manipular diferentes tipos de gráficos, las solapas que por defecto se presentan son Título, que permite introducir el Título del gráfico, Títulos para los ejes de categorías en X, Y, Z, según lo amerite. La Solapa Eje permite situar las opciones para mostrar en los ejes principales del gráfico. La solapa Líneas de división que permite situar diferentes líneas de división en el gráfico. La solapa Leyenda que permite situar la leyenda en sectores adecuados del gráfico. La solapa Rótulos que permite agregar o quitar los rótulos de datos en el gráfico y la solapa Tabla de Datos que permite agregar las series de datos bajo el gráfico o mostrar claves de leyenda y color de las series. Luego de haber definido todas las opciones anteriores presionamos el botón siguiente para obtener en el asistente el Paso 4 de 4 que nos permite escoger donde vamos a Colocar el gráfico, con las opciones En una hoja nueva, con su respectivo nombre o situar el gráfico como objeto en cualquier hoja del libro de trabajo. Diagramas de Barras y Columnas Columna o Barra Agrupada: Compara valores entre categorías. Columna o Barra Apilada: Compara, entre categorías el aporte de cada valor al total Columna o Barra 100% Apilada: Compara entre categorías el porcentaje que aporta cada valora al total. Las demás variantes son simplemente la visualización en tres dimensiones de las anteriores. Diagrama de líneas y de dispersión Línea: Se utiliza para representar tendencias a lo largo del tiempo o entre categorías. Línea Apilada: Se utiliza para representar la tendencia del aporte de cada valor a lo largo del tiempo o entre categorías. Línea 100% Apilada: Se utiliza para representar la tendencia del aporte porcentual de cada valor o a lo largo del tiempo o entre categorías. Las demás variantes permiten colocar marcadores en cada valor y una última con efecto en tres dimensiones. Dispersión: Se utiliza para comparar pares de valores de datos. Las variantes adicionales permiten colocar marcadores de datos y realizar la representación de las líneas que conectan los datos con su respectivo suavizamiento. Gráficos de Sectores y Áreas. Circular: Presenta el aporte de cada valor al total. Las demás variantes permiten visualizar el gráfico con efecto tridimensional y con una representación combinada ya sea con un sub gráfico circular o de barras. Área: Se utiliza para representar las tendencias a lo largo del tiempo o entre categorías. Área Apilada: Se utiliza para representar la tendencia del aporte de cada valor a lo largo del tiempo o entre categorías. Área 100% Apilada: Se utiliza para representar la tendencia del aporte porcentual de cada valor a lo largo del tiempo o entre categorías. Las demás variantes permiten visualizar el gráfico con efecto en tres dimensiones. Medidas de Concentración Dispersión y Forma con Funciones de Excel. Con el conocimiento básico de las distribuciones de frecuencia se puede resumir dichas distribuciones mediante las medidas de posición (centralización), si descuidar el error que podemos cometer en este resumen a través de las medidas de dispersión y analizaremos su forma con la ayuda de las medidas de forma. Estas medidas sintetizan las distribuciones de frecuencia, en lugar de manejar todos lo datos de las características o variables, podemos resumir dichos datos mediante algunos valores numéricos, sin embargo es necesario calcular la representatividad de dichos valores, para lo cual se debe cuantificar la distancia de los valores de la distribución respecto a dicha medida mediante las medidas de dispersión o variabilidad y conocer algo más sobre la distribución con las medidas de forma que se indican a continuación, con su correspondiente concepto y función. (Hoja de Excel) Medidas de Concentración Dispersión y Forma con Funciones con Herramientas de Análisis. Se puede utilizar las herramientas de Análisis Estadístico avanzado para calcular las medidas de concentración, dispersión y forma, seleccionando en el menú Herramientas, la opción Análisis de Datos y escogiendo la opción Estadística Descriptiva en el cuadro de Funciones para análisis. Al hacer clic en aceptar se obtiene la Pantalla de Estadística Descriptiva cuyos campos tienen las siguientes funcionalidades. Rango de entrada: Se introduce el rango de datos par ale análisis, debe contener dos o más rangos adyacentes organizados en filas o columnas. Agrupado por: Permite realizar el análisis por filas o columnas, de acuerdo a la organización de los datos. Rótulos en la Primera Fila: Permite del rango seleccionado tomar la primera fila o columna como rótulo de datos al estar activado. Rango de salida: Permite seleccionar la primera celda izquierda de la tabla de resultados, esta herramienta genera dos columnas de información por cada conjunto de datos, en la primera columna los rótulos de estadística y en la segunda los valores calculados de las estadísticas. En una hoja nueva: Crea una hoja nueva y pega los resultados comenzando en la columna A1, permite escribir adicionalmente el nombre de la hoja de cálculo a crearse. En un libro nuevo: Crea un libro nuevo y pega los resultados en una hoja del libro creado. Resumen de Estadísticas: Crea un campo en la tabla de resultados para cada variable estadística, media, error típico, mediana, moda, desviación estándar, varianza, curtosis, coeficiente de asimetría, rango, mínimo, máximo, suma cuenta, mayor número, menor número y nivel de confianza. Nivel de confianza para la media: Si se desea incluir una fila que corresponda al nivel de confianza de la media en la tabla de resultados, por defecto se encuentra en el 95%, es decir calculará el nivel de confianza par ala media con un nivel de importancia del 5%. K-ésimo mayor: Si se desea incluir una fila con el k-ésimo valor mayor del rango de datos. K-ésimo menor: Si se desea incluir una fila con el k-ésimo valor menor del rango de datos.
Puede agregar este documento a su colección de estudio (s)
Iniciar sesión Disponible sólo para usuarios autorizadosPuede agregar este documento a su lista guardada
Iniciar sesión Disponible sólo para usuarios autorizados(Para quejas, use otra forma )