UNIVERSIDAD NACIONAL TORIBIO RODRÍGUEZ DE MENDOZA DE AMAZONAS CURSO: ESTADÍSTICA DOCENTE: CICLO: VII TEMA: . INTEGRANTES: ÍNDICE 2 I. INTRODUCCIÓN.................................................................................................... 3 II. PLANTEAMIENTO DEL PROBLEMA ................................................................. 5 III. HIPÓTESIS ........................................................................................................... 6 IV. OBJETIVOS .......................................................................................................... 6 V. BASE TEÓRICA...................................................................................................... 7 VI. DESARROLLO ................................................................................................... 21 VII. CONCLUSIONES............................................................................................... 38 VIII. BIBLIOGRAFÍA ............................................................................................. 39 3 I. INTRODUCCIÓN El hombre siempre ha querido saberlo todo, aunque ay cosas de las cuales no se tiene información exacta y por ello que se creó la estadista, se define a la estadística como un conjunto de técnicas para describir grupos de datos y para tomar decisiones en ausencia de una información completa, aunque no generan datos exactos, pues están asociados a grado de incertidumbre o error. La estadística trata de lograr una aproximación de la realidad. La estadística como ciencia pues tiene diferentes ámbitos de aplicación y puede presentarse en diferentes niveles de dificultad matemática. Pues de acuerdo, con diferentes libros de textos se han descrito diferentes estadísticas como son la empresarial, educativa, médica, psicológica, ingeniería, etc. Dentro de sus ámbitos de aplicaciones tenemos a la ingeniería, pues esta ayuda a implementar los procesos probabilísticos y estadísticos de análisis e interpretación de datos o características de un conjunto de elementos al entorno industrial, mediante esta ciencia se toma decisiones con respecto a los datos que se analiza y las probabilidades (Ruiz, 2004). El resumen y la descripción de datos utilizando gráficos, tablas y el análisis de ciertos cálculos es una de las ramas de la estadística, conocida como estadística descriptiva. Antes de empezar con la construcción de una tabla estadista se debe de tener muchos aspectos anteriormente. Pues otra definición de la estadista seria, es la ciencia que estudia datos recopilados mediante técnicas de investigación, se analiza y se interpreta datos para obtener soluciones. Durante la recopilación de datos de debe de elegir una población de estudios de esta se derivará la muestra de estudio y de esta la unidad de análisis. Al tener una muestra de estudio es decir se tendrán datos dispersos de estos se ordenarán en un cuadro estadístico teniendo en cuenta su rango y amplitud. Luego de tener datos agrupados se procederá a obtener los parámetros cada parámetro debe de tener su correspondiente estadígrafo. En este informe académico seguiremos los pasos antes explicado a grandes rasgos, y elaborar un cuadro estadístico además los conceptos o definiciones exactas se explican en el capítulo de bases teóricas. 4 II. PLANTEAMIENTO DEL PROBLEMA Las clases virtuales han sido una revolución en la vida de todos los estudiantes, la UNTRM comprometida con un desarrollo prospero para sus estudiantes, va a repartir un chip con internet para lo cual realiza una encuesta para tener el dato exacto de personas que no cuentan con internet en casa. Se encuesto a todos estudiantes de diferentes escuelas profesionales, donde se les pregunto si contaban con un plan de internet en su hogar, La encuesta arrojo la cantidad de personas que no contaban con plan a internet y los datos son los siguientes. ¿Cuál será la cantidad exacta de chips que tendrá que comprar la Universidad Nacional Toribio Rodríguez de Mendosa? III. HIPÓTESIS De los estudiantes de la Universidad Nacional Toribio Rodríguez de Mendoza de Amazonas de todas las carreras profesionales, el 20% no cuentan con un plan de internet en su hogar. IV. OBJETIVOS OBJETIVO PRINCIPAL Mediante un estudio estadístico determinar la cantidad de chips comprados por la UNTRM. OBJETIVOS ESPECIFICOS Aplicar la metodología para organizar un cuadro de distribución e interpretar los datos observados. • Realizar Gráficos Estadísticos de acuerdo a la variable. • Determinar las medidas de posición y dispersión 5 V. BASE TEÓRICA Estadística: Es la ciencia que se encarga de la recolección, ordenamiento, representación, análisis e interpretación de datos generados en una investigación sobre hechos, individuos o grupos de los mismos, para deducir de ello conclusiones precisas o estimaciones futuras. Población Es el colectivo que abarca a todos los elementos cuya característica o características queremos estudiar; dicho de otra manera, es el conjunto entero al que se desea describir o del que se necesita establecer conclusiones Por su tamaño, las poblaciones pueden ser finitas o infinitas. Muestra Es un conjunto de elementos seleccionados de una población de acuerdo a un plan de acción previamente establecido (muestreo), para obtener conclusiones que pueden ser extensivas hacia toda la población. Censo Es el estudio de todos y cada uno de los elementos de una población. Esta condición hace que este tipo de estudios no sean muy frecuentes, por cuanto la recolección de toda esa información, sobre todo cuando el tamaño de la población es muy grande o sus elementos se encuentran muy dispersos, sea muy costosa. Muestreo Es la técnica que nos permite seleccionar muestras adecuadas de una población de estudio. El muestreo debe conducir a la obtención de una muestra representativa de la población de donde proviene, esta condición establece que cada elemento de la población tiene la 6 misma probabilidad de ser incluida en la muestra. El estudio de selección de muestras, en sí constituye todo un estudio pormenorizado, que no atañe al estudio en este texto. Parámetro Es cualquier medida descriptiva o representativa de una población Estadístico Constituyen cualquiera de las medidas descriptivas de una muestra. División de la Estadística Básicamente la estadística se divide en dos grandes ramas: estadística descriptiva o matemática y estadística inferencial, estas dos divisiones se articulan adecuadamente mediante las probabilidades. Estadística Descriptiva Es la parte de la estadística que permite analizar todo un conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para ese conjunto. Para realizar este análisis se procede a la recolección y representación de la información obtenida. Estadística Inferencial En esta rama de la estadística, lo que se pretende es obtener conclusiones generales de una determinada población, mediante el estudio de una muestra representativa sacada de ella, dicho de otra manera, lo que se trata es que, con el valor de los estadísticos obtenidos, podamos establecer los valores de los parámetros. Entonces podemos concluir que la estadística inferencial analiza o investiga a una población, valiéndose de los datos y resultados que se obtienen de una muestra. Variables de Datos La información que se obtiene de un estudio estadístico, proviene de variables, las mismas que están determinadas con el interés que se tenga sobre los elementos de Observación. 7 Tipo de Variable Variable Cualitativa. Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: Variable Cualitativa Nominal. Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. 8 Variable Cualitativa Ordinal o Variable Cuasi Cuantitativa. Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo: • La nota en un examen: suspenso, aprobado, notable, sobresaliente. • Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ... • Medallas de una prueba deportiva: oro, plata, bronce. Variable Cuantitativa. Una variable cuantitativa es la que se expresa mediante un número, por tanto, se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: Variable Discreta. Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable Continúa. Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos:1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres. Tabla de Frecuencias 9 Es el conjunto de datos organizados en categorías o clases; es decir, en grupos de valores que describen una característica de los datos y muestran el número de observaciones del conjunto de datos que pertenecen a cada una de las categorías. La tabla de frecuencias ayuda a agrupar datos de cualquier tipo de variable. Con tabulación de datos nos referimos a la construcción de una tabla en la que aparecen bien organizados los valores de las variables que se están estudiando, junto con otros datos denominados frecuencias. Clasificación de das Tablas de Frecuencias La forma más común de clasificar las tablas de frecuencias es en función del tipo de variable, cuyos datos se requiere resumir en la tabla. La clasificación es la siguiente: 10 • Tabla de frecuencias para datos de una variable cualitativa • Tabla de frecuencias para datos de una variable cuantitativa discreta • Tabla de frecuencias para datos de una variable cuantitativa continua • Tabla de frecuencias para datos de dos variables cualitativas o tabulación cruzada Estructura y Elementos de una Tabla de Frecuencias Toda tabla de frecuencias que resume datos de una variable (cualitativa o cuantitativa) debe tener número, título y cuerpo. Así, los elementos de una tabla de frecuencias son los siguientes: • Número de tabla • Título • Cuerpo − Categorías o clases − Marcas de clase (valor numérico de la categoría. Si la categoría es un intervalo de valores, la marca de clase es el punto medio del intervalo) − Frecuencias • Pie − Fuente La estructura de una tabla de frecuencias se muestra a continuación: 11 Figura 1. Estructura y elementos de una Tabla de Frecuencias. Donde: • fi = frecuencia absoluta simple de la categoría i. Es obtenida por conteo de los datos y representa el número de datos que pertenecen a la categoría i. • hi = fi / n = frecuencia relativa simple de la categoría i. Se interpreta como la proporción de datos que pertenecen a la categoría i. 12 • hi% = hi x 100 = frecuencia porcentual simple de la categoría i. Se interpreta como el porcentaje de datos que pertenecen a la categoría i. • Fi = frecuencia absoluta acumulada de la categoría i. Obtenida por acumulación de las frecuencias fi. Se interpreta como el número de datos acumulados hasta la categoría i. • Hi = frecuencia relativa acumulada. Obtenida por acumulación de las frecuencias hi. También se obtiene como Hi = Fi / n. Se interpreta como la proporción de datos acumulados hasta la categoría i. • Hi % = Hi x 100 = frecuencia porcentual acumulada. Se interpreta como el porcentaje de datos acumulados hasta la categoría i. Gráficos Estadísticos Según la norma técnica del INEI, en estadística denominamos “gráficos” a aquellas imágenes que, combinando sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de referencia (coordenadas), permiten presentar información cuantitativa. Los gráficos estadísticos presentan los datos en forma de dibujo, de tal modo que se puedan percibir fácilmente los hechos esenciales y compararlos con otros. La utilidad de los gráficos se da en dos sentidos: pueden servir no solo como sustituto de las tablas, sino también constituyen por sí mismos una poderosa herramienta para el análisis de los datos; y, por otro lado, en ocasiones son el medio más efectivo para describir, resumir y analizar la información. Clasificación de los Gráficos Estadísticos. La forma más común de clasificar los gráficos estadísticos es en función del tipo de variable que se intenta representar en el gráfico. Veamos la siguiente clasificación: • Gráficos para una variable cualitativa − Gráfico de barras − Gráfico de sectores circulares − Pictograma • Gráficos para una variable cuantitativa discreta: 11 − Gráfico de bastones • Gráficos para una variable cuantitativa continua: − Histograma − Polígono de frecuencias 12 − Ojiva • Gráficos para dos variables cualitativas: − Gráfico de barras agrupadas − Gráfico de barras apiladas Estructura y Elementos de un Gráfico Estadístico. Todo gráfico estadístico debe tener un código o número, título y cuerpo. Así, los elementos de un gráfico estadístico son los siguientes: • Código o número de gráfico • Título • Cuerpo − Figura − Escala o eje de valores − Leyenda − Eje de conceptos • Pie − Nota − Llamada − Fuente 13 Figura 2. Estructura y elementos de un gráfico estadístico 14 Procesamiento de Datos de una Variable Cuantitativa Continua y Discreta de Recorrido Largo Tabla de Frecuencias Para tabular los datos de una variable continua, se construyen intervalos de clase que agrupan los datos. Se determina el número de intervalos apropiado para los datos y se asigna una frecuencia absoluta o relativa (simple o acumulada) por cada intervalo de clase. El procedimiento para la construcción de la tabla de frecuencia es el siguiente: 1. Calcular el rango (R) de los datos: R = xmáx − xmin 2. Calcular el número de intervalos (K) utilizando la regla de Sturges. K = 1 + 3.3x log n El número de intervalos K debe ser redondeado al entero más cercano. Si el decimal es igual o mayor que 5, se redondea al siguiente entero; de lo contrario, permanece igual. 3. Calcular la amplitud o ancho (A) del intervalo: A= R K El redondeo de A es especial, para esta operación se tiene las siguientes consideraciones: 15 Figura 3. Consideraciones para el redondeo de A. 4. Formar los K intervalos semiabiertos por derecha. En este caso los intervalos son los siguientes: 16 Figura 4. K intervalos 5. Calcular las marcas de clase o puntos medio de los intervalos. La marca de clase o punto medio de un intervalo se calcula con x = i Li +Ls , donde: 2 Li = Límite inferior del intervalo Ls = Límite superior del intervalo 6. Realizar el conteo de los datos para obtener la tabla de distribución de frecuencias que se muestra a continuación: Figura 5. Tabla para datos cuantitativos con intervalos. Medidas de Posición Las medidas de posición, reflejan la tendencia central y la localización de los datos. 17 Mediana La mediana o valor mediano de una serie de valores observados es el número Me que separa a la serie de datos ordenados de forma creciente o decreciente en dos partes de igual número de datos. Calculo de la Mediana. Mediana de Datos no Tabulados 18 1. Se ordenan los datos en forma creciente. 2. Luego, se ubica el valor central Me. Si n es impar, la mediana es el dato ordenado del centro. Pero si n es par, la mediana es la semisuma de los valores ordenados centrales. Mediana de Datos Tabulados Donde: • Li es el límite inferior del intervalo de la mediana. • n es el número de datos observados. • Fi-1 es la frecuencia acumulada absoluta del intervalo inmediatamente anterior al intervalo de la mediana. • fi es la frecuencia absoluta del intervalo de la mediana. • A es la amplitud del intervalo de la mediana. Moda La moda de una serie de datos es el valor Mo, que se define como el dato que más veces se repite. Moda de Datos tabulados por Intervalos. Para calcular la moda de n datos tabulados por intervalos, primero se determina el intervalo que contiene la moda, esto es, el intervalo que tiene la mayor frecuencia (intervalo modal). Donde: 19 • Li es el límite inferior del intervalo modal. • d1 = fi – fi-1 • d2 = fi – fi+1 • A es la amplitud del intervalo moda Media Aritmética Media Aritmética de Datos no Tabulados. La media de n valores x1, x2, …, xn, de la variable cuantitativa X, observados en una muestra es el número: 20 Media Aritmética de Datos Tabulados. De Variable Discreta De Datos Tabulados por Intervalos. Si n valores de alguna variable X están tabulados en una distribución de frecuencias de k intervalos, donde: • m1, m2, …, mk, son las marcas de clase • f1, f2, …, fk, son las frecuencias absolutas respectivas Cuantiles Son medidas estadísticas de posición que dividen al conjunto de datos ordenados en varias partes iguales (en intervalos), que comprenden el mismo número de datos. Entre los cuantiles conocidos se encuentran: • La mediana, que divide al conjunto de datos ordenados en 2 partes iguales. • Los cuartiles, que dividen al conjunto de datos ordenados en 4 partes iguales. • Los quintiles, que dividen al conjunto de datos ordenados en 5 partes iguales. • Los deciles, que dividen al conjunto de datos ordenados en 10 partes iguales. • Los percentiles, que dividen al conjunto de datos ordenados en 100 partes iguales. 21 Medidas estadísticas de Dispersión o Variabilidad Las medidas estadísticas de variabilidad o dispersión nos indican si los valores de una variable están próximos entre sí o dispersos. Tienen por objeto alcanzar un valor que mide el grado de variabilidad o dispersión de todas las mediciones. Clasificación de las Medidas de Dispersión o Variabilidad Medidas Absolutas de Variabilidad. Son valores expresados en las mismas unidades de la variable en estudio y, por tanto, no permiten comparaciones o análisis respecto de la mayor o menor dispersión de series expresadas en diferentes unidades. 22 Las principales medidas absolutas son estas: − Rango o amplitud total − Varianza − Desviación estándar Medidas Relativas de Variabilidad. Son medidas adimensionales y no expresadas en ninguna unidad específica, que obvian el inconveniente señalado para las medidas absolutas. Con estas medidas es posible la comparación de la variabilidad entre dos o más series de datos. La principal medida es el coeficiente de variación. Rango o amplitud total (R). Se obtiene como la diferencia entre el valor máximo y el valor mínimo del conjunto de observaciones. Se calcula con esta fórmula: Varianza (S2). La varianza es el promedio de los cuadrados de las desviaciones de los datos respecto a su media. Cálculo de la varianza con datos no agrupados Si tenemos los datos observados de la variable X para una muestra de tamaño n, representados por x1, x2, …, xn, entonces la varianza de la muestra se calcula con la fórmula siguiente: Cálculo de la varianza con datos agrupados Si tenemos los datos observados de una muestra de tamaño n, resumidos en una tabla de frecuencias, entonces la varianza de la muestra se calcula con esta fórmula: 23 Donde xi = valor de la marca de clase i fi = frecuencia absoluta simple de la marca de clase i 24 Desviación estándar (S). El problema de la varianza es que no tiene interpretación práctica por sus unidades cuadráticas. Si queremos que la medida de dispersión sea de la misma dimensión que las observaciones, bastará tomar su raíz cuadrada. Por ello, se define la desviación estándar como la raíz cuadrada positiva de la varianza: Coeficiente de variación (CV). Es la medida relativa de variabilidad que se define como la relación entre la desviación estándar y la media aritmética. Dicho concepto se utiliza para calcular el nivel de desviación de una serie de datos respecto del valor promedio o media aritmética y está dado por la fórmula: El coeficiente de variación se expresa en porcentaje y se utiliza para lo siguiente: • Medir el grado de variabilidad de un conjunto de datos. • Comparar el grado de variabilidad entre dos o más distribuciones, aun cuando las unidades de medida de las variables están expresadas en diferentes unidades o escalas de medición. Interpretación del coeficiente de variación Una escala de interpretación del coeficiente de variación en fenómenos no controlados como los naturales, sociales, deportivos, culturales, entre otros, es la siguiente: 25 Figura 6. Interpretación del Coeficiente de Variación. 26 Medidas Estadísticas de Asimetría Son medidas que permiten establecer el grado de asimetría de un conjunto de observaciones o de una distribución de frecuencias de una variable cuantitativa. Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media; por tanto, hay el mismo número de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetría positiva (o a la derecha) si la “cola” a la derecha de la media es más larga; es decir, si hay valores más separados de la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) si la “cola” a la izquierda de la media es más larga; es decir, si hay valores más separados de la media a la izquierda. Figura 7. Tipos de Distribuciones de Frecuencias. Coeficiente de asimetría de Fisher (AF). Para datos no agrupados, el coeficiente de asimetría de Fisher se calcula con la siguiente fórmula: Donde: 27 xi = valor de la variable X 28 Para datos agrupados, el coeficiente de asimetría de Fisher se calcula con la fórmula: Donde: xi = valor de la marca de clase i fi = frecuencia absoluta simple de la marca de clase i Interpretación del Coeficiente de Asimetría Figura 8. Interpretación del Coeficiente de Asimetría. 29 VI. DESARROLLO 1.2.GRÁFICOS 1.3.INTERPRETACIONES VII. CONCLUSIONES VIII. BIBLIOGRAFÍA Cordova, M. (2003). Estadística descriptiva e inferencial (Quinta edición). MOSHERA S.R.L. Dicovskiy, L. M. (2016). Estadística Básica para ingenieros. Universidad Nacional de Ingeniería. Godínez, M. L. (2008). La inserción de las mujeres en las carreras de ingeniería y tecnología Perfiles Educativos. Redalyc, 30 (121), 63-96. http://www.redalyc.org/articulo.oa?id=13212030004 Lombardi, M. R. (2017). Women engineers in construction: The feminization possible and gender discrimination. Scielo, (263), 122-145. http://dx.doi.org/10.1590/198053143619 Mendenhall, W., Beaver, R., Beaver, B. (2010). Introducción a la probabilidad y estadística (Décima tercera edición). CENGAGE Learning. Muñoz, D. (2004). Manual de Estadística. Universidad Pablo Olavide. Ramos, R. J., Del Águila, V., Bazalar B. A. (2020). Estadística básica para los negocios. Rendón, M., Villasís, M., Miranda, M. (2016). Estadística descriptiva. Alergia México, 63 (4), 397-407. http://www.redalyc.org/articulo.oa?id=486755026009 30 Salazar, P. C., Del Castillo, G. S. (2018). Fundamentos básicos de estadística. Sardina, M. L. (2017). Mujer e ingeniería. influencia del género en la elección de carrera. Universidad de Cantabria. Villanueva, A. (2012). El progreso de la Estadística y su utilidad en la evaluación del desarrollo Papeles de Población. Redalyc, 18 (73), 1-31. http://www.redalyc.org/articulo.oa?id=11224638010 31