Subido por German Silvino Alvarez Gomez

Estadística básica I

Anuncio
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
ESTADÍSTICA BÁSICA I
AUTORES:
Ing. Rómulo Eduardo Mena Campaña, MBA.
Ing. Tania Eslavenska Escobar Erazo, MSc.
Ing. Edwin Ramiro Haro Haro, MBA.
Dra. Mayra Alexandra Córdova Alarcón, Mgst.
Ing. Víctor Marcelo Merino Castillo, Mgst.
Página 1
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Rómulo Eduardo Mena Campaña
Tania Eslavenska Escobar Erazo
Edwin Ramiro Haro Haro
Mayra Alexandra Córdova Alarcón
Víctor Marcelo Merino Castillo
ESTADÍSTICA BÁSICA I
ISBN-978-9942-21-953-4
Página 2
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
CONTENIDO
1
CAPÍTULO I: LA ESTADÍSTICA Y LA DESCRIPCIÓN DE
DATOS................................................................................ 10
OBJETIVOS ...........................................................................10
1.1 CONCEPTOS BÁSICOS. ...................................................10
1.1.1
ESTADISTICA ..................................................................... 10
1.1.2.
IMPORTANCIA Y ÁMBITO ...................................................... 11
1.1.3.
DATOS ESTADÍSTICOS ........................................................ 12
1.1.4
MÉTODOS ESTADÍSTICOS .................................................... 15
Recolección (medición) ______________________________ 15
Recuento (cómputo) ________________________________ 16
Presentación ______________________________________ 16
Síntesis __________________________________________ 16
Análisis. _________________________________________ 17
1.2. POBLACIÓN Y MUESTRA ................................................17
1.2.1.
POBLACIÓN ........................................................................ 17
1.2.2.
MUESTRA ........................................................................... 18
1.3. CLASIFICACIÓN ESTADÍSTICA.......................................19
1.3.1.
ESTADÍSTICA DESCRIPTIVA ................................................. 19
1.3.2.
ESTADÍSTICA INFERENCIAL.................................................. 19
1.4 LA INVESTIGACIÓN ESTADÍSTICA .................................19
1.4.1
PLANEAMIENTO................................................................... 20
El objeto de la investigación __________________________ 20
La finalidad. ______________________________________ 20
Página 3
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
La fuente de información. ____________________________ 21
Los procedimientos de investigación. ___________________ 22
Sistemas de investigación ___________________________ 22
El material estadístico ______________________________ 24
El costo y su financiación. ___________________________ 25
1.4.2
RECOLECCIÓN .................................................................... 25
1.4.3
CRÍTICA Y CODIFICACIÓN .................................................... 25
1.4.4
TABULACIÓN Y PROCESAMIENTO .......................................... 26
1.4.5
ANÁLISIS E INTERPRETACIÓN .............................................. 27
1.4.6
PUBLICACIÓN ..................................................................... 27
1.5 TABLAS ESTADÍSTICAS ..................................................28
1.5.1
PARTES DE UNA TABLA ........................................................ 29
Numeración de las tablas ____________________________ 29
Títulos de tablas ___________________________________ 30
Cuerpo de una tabla: _______________________________ 30
Notas de la tabla. __________________________________ 30
Tablas de otras fuentes. _____________________________ 31
1.5.2
TIPOS DE TABLAS ............................................................... 31
Tablas de una entrada. ______________________________ 31
Tablas de dos entradas. _____________________________ 32
Tablas complejas: __________________________________ 32
1.6 GRÁFICOS ESTADÍSTICOS .............................................34
1.6.1
GRÁFICAS LINEALES............................................................ 35
1.6.2
GRÁFICOS DE SUPERFICIE ................................................... 36
1.6.3
OTROS ............................................................................... 37
Página 4
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Gráficos XY (de dispersión): __________________________ 37
Gráficos de área ___________________________________ 38
1.7 DISTRIBUCIONES UNIDIMENSIONALES DE FRECUENCIAS
39
1.7.1
DISTRIBUCIONES DE FRECUENCIAS PARA DATOS
CUANTITATIVOS ....................................................................................... 40
Pasos para elaborar una distribución de frecuencias _______ 41
1.8 DIAGRAMAS DE FRECUENCIAS.......................................49
1.8.1
DATOS CORRESPONDIENTES A UN CARÁCTER CUALITATIVO .... 49
Diagrama de barras. ________________________________ 50
Gráficas en forma de pastel. _________________________ 50
1.8.2
DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO
DISCRETO
51
Diagrama de barras ________________________________ 51
Diagrama en forma de pastel _________________________ 52
1.8.3
DATOS CORRESPONDIENTES A UN CARÁCTER CUANTITATIVO
CONTINUO
53
Histograma _______________________________________ 54
Polígono _________________________________________ 55
Ojiva ____________________________________________ 55
2
CAPÍTULO II: ANÁLISIS ESTADÍSTICO SIMPLE ....... 57
OBJETIVOS ...........................................................................57
2.1 INTRODUCCIÓN .............................................................57
2.2 TIPOS DE ESTADÍGRAFOS ..............................................57
Página 5
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
2.3 ESTADÍGRAFOS DE TENDENCIA CENTRAL ......................58
2.3.1
MEDIA ARITMÉTICA ............................................................. 59
Media aritmética con datos no agrupados _______________ 59
Media aritmética con datos agrupados __________________ 63
2.3.2
MEDIA PONDERADA ............................................................. 67
2.3.3
LA MEDIANA ....................................................................... 68
Mediana de datos no agrupados _______________________ 68
Mediana de datos agrupados _________________________ 71
2.3.4
MODA ................................................................................ 75
Moda de datos no agrupados _________________________ 75
Moda de datos agrupados ___________________________ 77
2.3.5
MEDIA GEOMÉTRICA ........................................................... 79
2.3.6
MEDIA ARMÓNICA ............................................................... 83
2.4 FORMA DE LA DISTRIBUCIÓN ........................................85
2.4.1
RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA ........ 85
2.5 CUARTILES, DECILES Y PERCENTILES ............................90
2.5.1
Medidas de posición relativa ................................................. 91
Los Cuartiles ______________________________________ 91
Los Deciles _______________________________________ 91
Los Percentiles ____________________________________ 91
2.6 ESTADÍGRAFOS DE DISPERCIÓN ...................................99
2.6.1
DISPERCIÓN ABSOLUTA ....................................................... 99
Rango ___________________________________________ 99
Desviación media _________________________________ 101
Varianza ________________________________________ 104
Página 6
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Desviación estándar _______________________________ 108
2.6.2
DISPERCIÓN RELATIVA ...................................................... 110
Coeficiente de variabilidad __________________________ 110
2.7 MEDIDAS DE ASIMETRÍA .............................................113
2.8 MEDIDAS DE APUNTAMIENTO O CURTOSIS .................116
3
CAPÍTULO III: NÚMEROS ÍNDICES ........................ 120
OBJETIVOS .........................................................................120
3.1 INTRODUCCIÓN ...........................................................120
3.2 CARACTERÍSTICAS ......................................................120
3.3 CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES................120
3.3.1
NÚMEROS ÍNDICES DE PRECIOS ......................................... 120
3.3.2
NÚMEROS ÍNDICES DE CANTIDAD ...................................... 121
3.3.3
NÚMEROS ÍNDICES DE VALOR ............................................ 121
3.4 NÚMEROS ÍNDICES SIMPLES .......................................121
3.5 NÚMEROS ÍNDICES NO PONDERADOS ........................122
3.5.1
PROMEDIO SIMPLE DE LOS ÍNDICES DE PRECIOS ................. 122
3.5.2
ÍNDICE AGREGADO SIMPLE ................................................ 124
3.6 NÚMEROS ÍNDICES PONDERADOS ..............................124
3.6.1
ÍNDICE DE LAYSPEYRES ..................................................... 125
3.6.2
ÍNDICE DE PAASCHE ......................................................... 126
3.6.3
ÍNDICE DE FISHER ............................................................ 127
3.7 ÍNDICES DE VALOR ......................................................127
Página 7
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4
CAPÍTULO IV: REGRESIÓN. CORRELACIÓN Y SERIES
DE TIEMPO ....................................................................... 129
OBJETIVOS .........................................................................129
4.1 ANÁLISIS DE CORRELACIÓN ........................................129
4.1.1
VARIABLE DEPENDIENTE: .................................................. 129
4.1.2
VARIABLE INDEPENDIENTE: ............................................... 129
4.1.3
COEFICIENTE DE CORRELACIÓN ......................................... 129
4.1.4
CÁLCULO DE COEFICIENTE DE DETERMINACIÓN ................... 133
4.2 ANÁLISIS DE REGRESIÓN ............................................134
4.2.1
PRINCIPIO DE LOS MÍNIMOS CUADRADOS ........................... 134
4.2.2
TRAZO DE LA LÍNEA DE REGRESIÓN .................................... 137
4.2.3
EL ERROR ESTÁNDAR DE LA ESTIMACIÓN ............................ 138
4.3 FUNDAMENTOS PARA EL ANÁLISIS DE UNA SERIE DE
TIEMPO ...................................................................................139
4.4 COMPONENTES DE UNA SERIE DE TIEMPOS.................139
4.4.1
TENDENCIA SECULAR ........................................................ 139
4.4.2
VARIACIÓN CÍCLICA .......................................................... 141
4.4.3
VARIACIÓN ESTACIONAL ................................................... 142
4.4.4
VARIACIÓN IRREGULAR ..................................................... 143
4.5 MEDICIÓN DE TENDENCIAS .........................................143
4.5.1
TENDENCIA LINEAL ........................................................... 143
Método de libre ajuste _____________________________ 143
Método de mínimos cuadrados _______________________ 145
Página 8
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4.5.2
MÉTODO DEL PROMEDIO MÓVIL ......................................... 147
4.5.3
MÉTODO DEL PROMEDIO MÓVIL PONDERADO ...................... 151
Página 9
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
1
CAPÍTULO
I: LA ESTADÍSTICA Y LA
DESCRIPCIÓN DE DATOS
OBJETIVOS
1. Saber qué significa estadística.
2. Exponer el ámbito de aplicación y la importancia de la
estadística.
3. Diferenciar entre una variable cualitativa y una variable
cuantitativa.
4. Distinguir entre una variable discreta y una variable continua.
5. Diferenciar entre niveles de medición nominal, ordinal, por
intervalo y de razón.
6. Explicar qué es estadística descriptiva y estadística inferencial.
7. Realizar pequeñas investigaciones estadísticas, aplicando las
etapas del proceso de investigación.
8. Aplicar la metodología en la elaboración de tablas de distribución
de frecuencias.
9. Seleccionar y elaborar figuras que visualicen la información de
las tablas.
10. Analizar y obtener conclusiones sobre la información
contenida en las tablas y gráficas.
1.1 CONCEPTOS BÁSICOS.
1.1.1
ESTADISTICA
En esta unidad revisaremos algunos conceptos útiles los cuales
le servirá al estudiante formarse una idea de los términos más
usados en el estudio de la estadística.
Una definición clara y sencilla señala que, la estadística es la
ciencia que recoge, organiza, presenta, analiza e interpreta datos
con el fin de propiciar una toma de decisiones más eficaz (Lind,
Marchal, & Wathen, 2012).
Ciro Martínez, al presentar el significado de la palabra estadística
señala que, es un sistema o método usado para la recolección,
organización, análisis y descripción numérica de la información.
Página 10
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
También se puede decir que la estadística estudia el
comportamiento de hechos o fenómenos de grupo (Martínez,
2012).
Otra definición muy sucinta indica que, la estadística es el arte y
la ciencia de recolectar, analizar, presentar e interpretar datos
(Anderson, Sweeney, & Williams, 2008).
El término estadística proviene del latín statisticum collegium
(“consejo de Estado”) y de su derivado italiano statista (“hombre
de Estado o político”). En 1749, el alemán Gottfried Achenwall
comenzó a utilizar la palabra alemana statistik para designar el
análisis de datos estatales. Por lo tanto, los orígenes de la
estadística están relacionados con el gobierno y sus cuerpos
administrativos (Definición.de, 2015).
Por lo anterior, teniendo en cuenta las bondades que aportó la
estadística a la gestión de los estados; las empresas y personas, la
han aprovechado y en la actualidad no existe campo de estudio en
la que la estadística se encuentre ausente.
1.1.2.
IMPORTANCIA Y ÁMBITO
En nuestra vida cuotidiana, cuando revisamos periódicos,
revistas, internet, al mirar los noticieros en televisión, nos
encontramos
con
tablas,
gráficos,
medidas,
análisis
e
interpretaciones que nos dan cuenta de lo que pasa en nuestro
contexto y en distintos lugares del planeta. Podemos enterarnos,
que está ocurriendo en el campeonato nacional de futbol, qué
equipos ocupan las primeras posiciones en la tabla, cuáles ocupan
las últimas posiciones; en el ámbito artístico, cuáles son las
preferencias musicales de los jóvenes de 10 a 15 años, o de 16 a
25 años, por supuesto, se encontrarán diferencias; en el ámbito
profesional, cuáles son las tendencias de estudios universitarios
más demandadas, cuáles son las profesiones más rentables; en los
dispositivos tecnológicos, cuáles son las necesidades actuales de
equipos, las preferencias de un grupos de jóvenes, las necesidades
de los universitarios, de las amas de casa, de los hombres y
mujeres de negocios, etc.
Pero no solo podemos encontrar necesidades de personas
naturales; las personas jurídicas, esto es negocios y empresas,
pequeñas y grandes, también necesitan información para enrumbar
su actividad a aquello que les permita producir más, cubrir mayores
Página 11
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
mercados, incrementar su patrimonio, incrementar su utilidad,
cómo se encuentra evolucionando la demanda el mercado de los
bienes que producen, cuál es la evolución de los precios, cuál es la
participación de la empresa o producto en el mercado, si existen
posibilidades de expansión, si las ventas en cantidad y en dólares
se encuentran en franco ascenso o descenso, si existirá la
posibilidad de aplicar estrategias que mejoren las ventas, la
apertura para nuevos mercados, para nuevos productos, etc.
Pero la estadística no solo es útil para el desempeño de la vida
cuotidiana y de los negocios; sino que ésta va más allá de ellos, las
diferentes ciencias se han desarrollado mediante la utilización de la
estadística como: las médicas, que nos da cuenta de la evolución
de las enfermedades, la eficacia de los medicamentos y
tratamientos,
el porcentaje de éxito en determinado tipo de
cirugía, la frecuencia de las enfermedades, sus índices de
mortalidad, etc.;
las ciencias sociales la cual involucra a los
ámbitos: educativo, que nos permite conocer los índices de estudio
escolarizado, alfabetismo, analfabetismo; la psicología, que
contribuye al conocimiento del comportamiento de los individuos y
sus aptitudes, la sociología en la evolución y desarrollo de las
culturas y sociedades, la economía contribuye con estudios tanto
microeconómicos como macroeconómicos; y más ámbitos tales
como demografía, administración pública, historia, geografía,
antropología, etc.
Como se habrá dado cuenta, el ámbito de aplicación de la
estadística es extenso, por su muy diverso uso y su necesaria
actualización. La toma de decisiones acertadas son realizadas con
información, su validez y confiabilidad se sujetan a los instrumentos
y técnicas estadísticas utilizadas en la investigación de interés.
1.1.3.
DATOS ESTADÍSTICOS
Los datos son hechos, informaciones y cifras que se recogen,
analizan y resumen para su presentación e interpretación. A todos
los datos reunidos para un determinado estudio se les llama
conjunto de datos para el estudio (Anderson, Sweeney, & Williams,
2008).Como por ejemplo si considera:
Variable
Edad (en años)
Número de hijos
Conjunto de datos
{1, 2, 3, ⋯ }
{0, 1, 2, ⋯ }
Página 12
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Estatura (en centímetros)
Estado civil
Grupo sanguíneo
{150, 162,173, ⋯ }
{𝑠𝑜𝑙𝑡𝑒𝑟𝑜, 𝑐𝑎𝑠𝑎𝑑𝑜, 𝑑𝑖𝑣𝑜𝑟𝑐𝑖𝑎𝑑𝑜, ⋯ }
{𝐴, 𝐵, 𝐴𝐵, 𝑂}
VARIABLE. Una variable es una característica de los elementos
que es de interés (Anderson, Sweeney, & Williams, 2008). Las
cifras o información que conforma un conjunto de datos, son
obtenidas cuando se averigua una variable, a los elementos o
individuos sujetos en un estudio de investigación.
Como se observa en los ejemplos de: edad, número de hijos,
estatura, estado civil, grupo sanguíneo; se tienen variables de dos
clases de datos, los cuantitativos y cualitativos.
1. Datos cuantitativos. Son expresados numéricamente y nos
dan una idea de cantidad, dimensión, duración, distancia, etc.
2.
Datos cualitativos. Son conocidos también como datos de
atributo, agrupan a una población o muestra en características
semejantes, pero no tienen medidas numéricas; se encuentran
comprendidas por etiquetas o nombres que identifican el atributo
de cada elemento, Como en el caso de la variable estado civil, el
dato de respuesta podría ser: soltero, casado, viudo, divorciado,
etc.
De acuerdo a la naturaleza de los datos se debe escoger el
método apropiado para resumir la información, determinar las
medidas adecuadas y realizar sus correspondientes análisis. Para
ello es necesario clasificar a las variables en dos tipos.
1. Variables cuantitativas. Se encuentran en este grupo aquellas
que pueden medirse, cuantificarse, permiten una descripción o
representación numérica. Estas variables atendiendo a los
valores que pueden tomar se clasifican en variables discretas y
continuas.
a. Variable discreta. Se refiere a aquella que sólo puede tomar
valores enteros, esto es: 1, 2, 3, etc., tal es el caso del
número de hijos por familia, número de televisores en un
hogar, etc.
b. Variable continua. Toma todos los valores posibles en un
intervalo, es decir, se admiten valores fraccionarios, como el
número de años de una persona: 20 años, tres meses, cinco
Página 13
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
días, valor pagado por impuesto a la renta de un profesional o
empresa, etc.
2. Variables cualitativas. Estas variables agrupan cualidades o
atributos, en la que los casos de estudio pueden formarse dos
grupos como: hombre – mujer, estudiante – no estudiante, con
empleo – sin empleo, etc. Pero también estas variables pueden
conformar más de dos grupos como; al estudiar el grupo
sanguíneo de los individuos se tendrá: A, B, AB y O (cuatro
grupos); el estado civil de las personas se tendrá soltero (a),
casado (a), divorciado (a), viudo (a) y unión de hecho, etc.
Según sea de un tipo u otro, la variable podrá medirse de
distinta manera, esto es, tendrán distintas escalas o niveles de
medición.
En las variables cualitativas los datos son de nivel nominal y
ordinal.
a. Datos de nivel nominal. Los datos de los elementos sujetos de
análisis se encuentran representados por nombres, admiten una
clasificación, sin que ello signifique un orden lógico. Como
ejemplos serían: Países que integran el pacto andino, género de
los estudiantes de
un curso de estadística, marca de
automóviles, etc.
b. Datos de nivel ordinal. Los datos de los elementos sujetos de
análisis se disponen de acuerdo a un orden que se encuentra
especificado, razón por lo que los datos se pueden clasificar y
ordenar. Como ejemplo, las calificaciones cualitativas asignadas
por el profesor de estadísticas a los trabajos presentados por los
estudiantes serían: excelente, muy bueno, bueno, regular y
malo. Tabla de posiciones de los equipos que intervienen en el
campeonato ecuatoriano de futbol de la serie A, se tendría
primero, segundo, tercero, … ,etc.
En las variables cuantitativas los datos son de nivel de intervalo
y de razón.
a. Datos de nivel de intervalo. Identifica la posición ordinal de cada
elemento sujeto de análisis y las diferencias entre intervalos es
la misma. Ejemplos de datos de intervalo son la temperatura
ambiental observada en la escala de grados centígrados, las
tallas de las diferentes prendas de vestir, etc.
Página 14
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
b. Datos de nivel de proporción: Identifica la posición ordinal de
cada elemento sujeto de análisis, las distancias de cada intervalo
es la misma, se basa en un sistema numérico en la que el cero
es significativo y las operaciones de multiplicación y división
tienen un resultado racional. Ejemplos de esto se tiene a: las
ventas en dólares de un establecimiento comercial, en donde el
cero representa que en ese día no ha existido ventas, costos,
rentabilidad, participación en el mercado, etc.
1.1.4
MÉTODOS ESTADÍSTICOS
El método estadístico según se le atribuye a Jesús Reynaga,
profesor de Salud Pública de la Facultad de Medicina, UNAM,
consiste en una serie de procedimientos para el manejo de los
datos cualitativos y cuantitativos de la investigación.
Las características que adoptan los procedimientos propios del
método estadístico dependen del diseño de investigación
seleccionado para la comprobación de la consecuencia verificable en
cuestión.
El método estadístico tiene las siguientes etapas:





Recolección (medición)
Recuento (cómputo)
Presentación
Descripción
Análisis
Tales etapas siempre se encuentran en el orden descrito y cada
una de ellas consiste de manera resumida en lo siguiente:
Recolección (medición)
En esta etapa se recoge la información cualitativa y cuantitativa
señalada en el diseño de la investigación.
La recolección o medición puede realizarse de diferentes
maneras: a veces ocurre por simple observación y en otras
ocasiones requiere de complejos procedimientos de medición
La calidad técnica de esta etapa es fundamental ya que de ella
depende que se disponga de datos exactos y confiables en los
cuales se fundamenten las conclusiones de toda la investigación.
Página 15
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
En ocasiones, la recolección de la información debe ocurrir en
grupos tan grandes de individuos que se hace imposible tratar de
abarcar a todos ellos; entonces es cuando se pone en práctica
procedimientos de muestreo.
Tales procedimientos de muestreo están subordinados a la
consecuencia verificable que se desea comprobar y al diseño de
investigación seleccionado.
Recuento (cómputo)
En ésta etapa del método estadístico, la información recogida es
sometida a revisión clasificación y cómputo numérico.
A veces el recuento puede realizarse de manera muy simple, por
ejemplo con rayas o palillos; sin embargo, puede requerirse el
empleo de computadoras y programas especiales para el manejo
de base de datos.
En términos generales puede decirse que el recuento consiste en
la cuantificación de la frecuencia con que aparecen las diferentes
características medidas de los elementos en estudio; por ejemplo,
el número de personas de sexo femenino y el de personas de sexo
masculino; o, el número de niños con peso menor de 3 kilos y el
número de niños con peso igual o mayor a dicha cifra.
Presentación
En esta etapa del método estadístico, se elaboran las tablas y
figuras, las cuales permiten una inspección precisa y rápida de los
datos. La elaboración de tablas tiene por propósito acomodar los
datos de manera que se pueda efectuar una revisión numérica
precisa de los mismos. La elaboración de figuras tiene por propósito
facilitar la inspección visual rápida de la información.
Síntesis
En esta etapa la información, es resumida en forma de medidas
que permiten expresar de manera sintética las principales
propiedades numéricas de grandes series o agrupamiento de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los
interlocutores evocar de una misma esencia de los datos; por
ejemplo, cuando alguien informa que el promedio de un grupo de
alumnos es de 9.6 puntos en una escala que va del 0 al 10, la
Página 16
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
imagen que se transmite es de un grupo con buen aprovechamiento
escolar.
Entre las principales medidas para sintetizar los datos
cuantitativos se encuentra la moda y la amplitud, la mediana y los
percentiles y el promedio y la desviación estándar.
Análisis.
En esta etapa mediante fórmulas estadísticas apropiadas y el
uso de tablas específicamente diseñadas, se efectúa la comparación
de las medidas de resumen previamente calculada. El análisis
estadístico de los datos consiste en la comparación.
Existen procedimientos bien establecidos para la comparación de
las medidas de resumen que se hayan calculado en la etapa de
descripción. Tales procedimientos, conocidos como pruebas de
análisis estadísticos cuentan con sus fórmulas y procedimientos
propios.
Cada prueba de análisis estadístico debe utilizarse siempre en
función del tipo de diseño de investigación que se haya
seleccionado para la comprobación de cada consecuencia verificable
o deducible, a partir de la hipótesis general de la investigación.
Por lo anterior, puede considerarse a la estadística como una
disciplina que posee su propio método. Tal disciplina emplea
conocimientos de otras ciencias como la lógica y la matemática; y
por eso, se dice que la estadística es una forma razonable de
emplear el sentido común y la parte aritmética la complementa con
el manejo de datos de la investigación (Reynaga, 2015).
1.2. POBLACIÓN Y MUESTRA
1.2.1.
POBLACIÓN
Es un conjunto de medidas o recuento de todos los elementos
que presentan una característica común (Martínez, 2012).
Un estudio poblacional equivale a una investigación total,
ejemplo de ello, en el Ecuador se realizó en noviembre del 2010 el
Censo de Población y Vivienda, el cual consistió en un recuento de
la población y las viviendas para generar información estadística
Página 17
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
confiable, veraz y oportuna acerca de la magnitud, estructura,
crecimiento, distribución de la población y de sus características
económicas, sociales y demográficas, que sirva de base para la
elaboración de planes generales de desarrollo y la formulación de
programas y proyectos a cargo de organismos de los sectores
público y privado (Instituto Nacional de Estadísticas y Censos,
2015).
1.2.2.
MUESTRA
Es un conjunto de medidas o recuento de una parte de
elementos que pertenecen a la población de interés.
Para que una muestra sea representativa de una población, los
elementos deben ser seleccionados aleatoriamente, esto es, los
elementos que se encuentran en la población, todos tienen la
misma oportunidad de ser elegidos en la muestra.
Un estudio muestral se justifica cuando el estudio poblacional se
ve imposibilitado porque:






Las poblaciones son muy grandes o infinitas.
El tiempo requerido es demasiado grande.
Los costos son elevados que imposibilita la ejecución de la
investigación.
Existe limitación en la disponibilidad del recurso humano.
Debido a la naturaleza destructiva de los elementos sujetos a
estudio.
La homogeneidad de la característica.
Parámetro. Es una característica medida de una población
completa, por ejemplo: la proporción de alumnos de más de 21
años que ingresan a la universidad. En estadística se asignan
símbolos del alfabeto griego para designar un parámetro
(Slideshare, 2015).
Estimador. Es la medida de una característica relativa a la
muestra, al valor promedio de los datos y la imagen de éstos; la
mayoría de los estadísticos muestrales se encuentran por medio de
fórmulas y suelen asignárseles símbolos del alfabeto latino
(Slideshare, 2015).
Página 18
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
1.3. CLASIFICACIÓN ESTADÍSTICA
1.3.1.
ESTADÍSTICA DESCRIPTIVA
Es el conjunto de técnicas que se encargan de organizar,
resumir, presentar y describir los datos de manera informativa. Los
medios útiles para la presentación y descripción de datos son: las
tablas de frecuencia, los gráficos, el cálculo de medidas de
tendencia central, de posición, de variabilidad, etc.
1.3.2.
ESTADÍSTICA INFERENCIAL
Es el conjunto de técnicas que se encargan de estimar los
parámetros poblacionales a partir de una muestra. La exactitud de
la estimación depende de las técnicas estadísticas usadas y del
cuidado con que se tomó la muestra. La diferencia entre el
estadístico de la muestra y el parámetro de la población se
denomina error muestral.
1.4 LA INVESTIGACIÓN ESTADÍSTICA
En nuestra vida cuotidiana o laboral nos encontramos en la
necesidad de contar con información estadística para una adecuada
toma de decisiones. En una variedad de ocasiones podremos
encontrar la información requerida y elaborada usualmente por
instituciones estatales (información secundaria) que para el caso
ecuatoriano lo realiza el Banco Central del Ecuador, Instituto
Ecuatoriano de Estadísticas y Censos, Registro Civil, Identificación y
Cedulación, los diversos Ministerios que elaboran estadísticas en su
ámbito de acción (educación, salud, vivienda, trabajo, etc.); así
también, se puede obtener información de entidades privadas como
periódicos, revistas y páginas web especializadas (economía,
finanzas, educación, industrial, empresarial, emprendimientos,
etc.).
En otras ocasiones, habrá la necesidad de realizar una
investigación con el objeto de obtener la información necesaria para
el conocimiento y toma de decisiones adecuadas al interés
personal, laboral o empresarial. A la hora de realizar una
investigación, el método estadístico es la herramienta adecuada
para la recolección de la información mediante registros, que se
ordenan, clasifican, cuantifican y se muestran mediante tablas y
Página 19
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
gráficos, de forma clara, resumida y fácil de interpretar grandes
cantidades de información (Martínez, 2012).
Otras necesidades de información, son aquellas que se obtienen
en orden cronológico, tales como las temperaturas registradas en
las diferentes ciudades del Ecuador a una hora determinada de
cada día, número de accidentes de tránsito por provincia y periodo
mensual, precio promedio mensual de la canasta básica para el
consumidor, exportaciones e importaciones en periodos mensuales
del Ecuador, ventas diarias registradas en determinado negocio o
empresa, inventarios o utilidades al finalizar el año, etc.
Ciro Martínez, señala que el proceso de investigación estadística
consta de seis fases.
1.4.1
PLANEAMIENTO
Un plan de investigación debe contemplar lo siguiente:
El objeto de la investigación
Es el hecho o fenómeno que se va a observar o registrar
numéricamente. Ejemplo. Una investigación sobre los salarios. El
objeto de la investigación responde a la pregunta ¿qué se va a
investigar?
La finalidad.
Al analizar que se va a investigar se propone definir el objeto de
investigación, determinar la naturaleza cuantitativa y cualitativa,
determinar la posibilidad de su investigación y limitar el objeto
investigable, con los que se responde el por qué:



Definir el objeto de la investigación. Es la fijación precisa del
concepto de o que se aspira indagar. Decir con claridad y
exactitud lo que la estadística va a recoger. La unidad o
elemento de investigación debe ser: clara, adecuada,
mensurable y comparable.
Determinar su naturaleza cuantitativa o cualitativa del objeto de
la investigación. Esto es, establecer si la variable investigada es
de naturaleza numérica (cuantitativa) o de atributo (cualitativa).
Determinar la posibilidad de investigación. Es necesario
examinar si el objeto de la investigación pueden ser conocidas
Página 20
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.

con precisión, si se exteriorizan, si pueden contarse si admiten
su existencia y su intensidad.
Limitar el objeto investigable. Por imposibilidad o por ser
innecesaria la observación completa, la estadística reduce sus
trabajos a un doble aspecto. El primero limitando el objeto de la
investigación y segundo limitando el campo de la investigación.
La limitación de la investigación puede darse de manera
coordinada en función del tiempo, espacio, número, etc.
La fuente de información.
A continuación es necesario identificar en dónde se obtener
información de la investigación y si aquellas fuentes son de
naturaleza directa o indirecta.
Las investigaciones directas se recogen los datos de un
acontecimiento de cualquier índole, cuando acudimos a él, lo
observamos y anotamos su presencia o su ausencia y su intensidad
mediante números. Por tanto se llamará fuente de información
estadística directa allí donde el hecho sujeto de la investigación se
produce, como por ejemplo, la familia, la empresa, la fábrica, los
costos, los precios, etc.
Las investigaciones indirectas son cuando se recurren a un
hecho distinto del que se está interesado, para después deducir de
éste el valor del que en definitiva se desea conocer. Son
inducciones lógicas, cálculos aproximados, estimaciones que
constantemente se realizan en los negocios. Ejemplos de estos
pueden ser: la estimación de la cosecha en base a la siembra de un
producto agrícola, el cálculo poblacional en una fecha intermedia se
determina en base a dos censos, las necesidades de llantas se
calculan en base a la cantidad de autos en circulación en un estado
o región, etc. Las fuentes de información indirectas son aquellas
donde el hecho investigado se manifiesta indirectamente o donde
se refleja.
También pueden clasificarse a las fuentes de información como
primaria, cuando se obtiene directamente de la investigación,
realizada usualmente a través de una encuesta, y secundaria,
cuando se trata de información complementaria, publicada por la
misma institución o cualquier otra.
Página 21
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Los procedimientos de investigación.
Señala las normas que determinan el cómo debe realizarse la
investigación; estas se resumen en los siguientes puntos.



Claridad y publicidad. Toda investigación debe ser clara y
conocida por observadores y observados. La claridad debe estar
presente en todo el proceso de investigación.
Sencillez. Debe estar presente en: los formularios, las
instrucciones, en el proyecto, en la finalidad, en las tablas, en los
gráficos, en los comentarios y análisis, operaciones de cálculo,
etc.
Utilidad. Toda estadística que se inicie debe tener alguna
aplicación práctica de interés.
Las investigaciones pueden ser:




Ocasional. Si se da la recolección de datos en circunstancias
extraordinarias, cuando eventualmente se presenta un
problema, o se agita su solución. Por ejemplo cuando se realiza
una investigación del costo de vida o de salarios cuando se
plantea una huelga.
Periódica. Aquellas investigaciones que se repiten de tiempo en
tiempo, en lapsos regulares. Ejemplos de ello se tiene los censos
en periodos decenales, las estadísticas de las industrias con
periodicidad anual, los boletines de comercio exterior en forma
mensual, etc.
Continua. Son estadísticas que se produce sin interrupción,
ejemplos de ellas se tiene a las demográficas como: la natalidad,
la mortalidad, los matrimonios, tráfico por carreteras, etc.
Registro permanente. Aquellas que se registra a medida que
el hecho tiene lugar. Por ejemplo los accidentes de tránsito,
suicidios, etc.
Sistemas de investigación
Se distinguen varios procedimientos de investigación, entre ellos
se tiene:

Las recopilaciones automáticas de datos por declaración
espontánea del sujeto de la investigación, como inscripciones
obligatorias en los casos de natalidad, matrimonios, mortalidad,
migración, comercio exterior, edificaciones, recaudación de
impuestos, etc.
Página 22
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.




Las recopilaciones intencionales de datos, obtenidas mediante
empleo de un agente que ex profeso vaya a la fuente de
información para registrar los datos, como en los casos de los
censos de población y vivienda, encuestas de hogares sobre
ingresos y gastos, sobre las condiciones de una determinada
industria, etc.
Investigaciones completas, son aquellas que recogen todos los
datos, indagan todo el campo de observación, como todos los
balances de la banca, la producción de sal, la de cemento, de
transporte aéreo, que tiene lugar en una región o estado.
Investigaciones incompletas, son las que sólo atienden a una
parte de las unidades estadísticas, bien por no ser posible
recoger la totalidad de los datos, por no ser necesario para el fin
que se persigue. Si la estadística incompleta no es
representativa del conjunto, no es típica para generalizar los
resultados parciales al conjunto de los casos. En caso contrario,
cuando el círculo estudiado numéricamente puede sustituir al
total, la estadística incompleta es de extraordinaria utilidad.
Las recopilaciones voluntarias de datos, frecuentemente se
llevan a cabo por las instituciones privadas y se refieren
comúnmente a las monografías y encuestas científicas. La radio,
prensa y las revistas suelen invitar a sus lectores a opinar sobre
algunos problemas candentes o a declarar un dato de su vida o
negocio particular.
Pues bien, de estos sistemas, el proyecto, para el caso
particular, tendrá que decir cuál interesa más y cuál debe
emplearse.
Sobre la recolección de información, puede ser por correo,
entrega personal del cuestionario y la entrevista; otros sistemas de
menor importancia corresponden a: internet, teléfono y panel.
Todos estos presentan ventajas y desventajas, por ejemplo la
entrevista resulta más ventajosa por que proporciona un mayor
número de cuestionarios recolectados, mayor número de
respuestas, permite aclarar el objetivo de la investigación y las
dudas del informante; entre sus desventajas se tiene mayor costo,
más tiempo de recolección, alto número de encuestadores, etc.
Página 23
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
El material estadístico
Está constituido por los útiles, documentos o instrumentos
necesarios para llevar adelante la investigación. El material puede
dividirse en impreso e instrumental.
Material impreso. Se refiere a los formularios o cuestionarios,
boletines, hojas de inscripción, registros, circulares, pliegos de
instrucciones, etc.
Las normas de diseño y redacción de un formulario que se
someterá a discusión, pruebas y aprobación, son las siguientes.





Debe ser sucinto, limitado a las preguntas esenciales, las
necesarias para los fines de la investigación y que efectivamente
pueda obtenerse de la fuente informativa.
Debe prescindirse de toda pregunta indiscreta que levante
suspicacias y temores, o que moleste al investigado.
Debe ser claro, fácilmente comprensible, no ofrecer dudas en la
forma de contestar cada pregunta, que admita una sola
interpretación.
Debe evitarse los juicios personales del investigador y del
investigado, como cuando se deje a criterio del calificador juzgar
la importancia o la bondad de un hecho (grande, mediano o
pequeño); (bueno, regular, malo).
También debe tenerse en cuenta, la clase de papel, su tamaño,
la distribución de las partes del cuestionario, su impresión,
colores, el tiempo de llenado, etc.
Equipos. La recolección de datos y la elaboración posterior
requieren de varios instrumentos, aparatos, máquinas y útiles, que
quien proyecta debe tener en cuenta, en su número y clase. Existen
investigaciones que requieren de instrumentos especiales, sin los
que no se podrían recoger datos. En una investigación de
antropometría, requiere de escalas cromáticas de la piel, del pelo,
de los ojos, cinta métrica, balanza, etc. Si se trata de llevar
estadísticas de una empresa sobre los horarios de entrada y salida
del personal que labora o el de un aparcadero de autos, será
necesario contar con un reloj marcador. En un almacén, la
estadística de ventas e ingresos se lleva en una caja registradora.
Página 24
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
El costo y su financiación.
La estimación previa de gastos y su financiamiento, constituye el
último punto del proyecto de investigación estadística. Estos gastos
pueden ser atribuidos a estudios preliminares, asesorías, trabajos
geográficos, formulación del plan, plan de propaganda, impresión
del formulario, selección y adiestramiento del personal,
contratación de servicios auxiliares, materiales y equipos, trabajo
de campo, sistematización de la información y publicación.
Todo proyecto de esta clase debe ser discutido y aprobado por
un grupo de técnicos en estadística y por peritos en la materia que
va a investigarse.
La consecución del financiamiento no debe dejarse para más
tarde de la etapa de preparación, su previsión debe abarcar la
cantidad de dinero necesario hasta el final de la investigación.
Aprobado el plan con las modificaciones del grupo de técnicos y
peritos, se continúa con la ejecución del mismo.
1.4.2
RECOLECCIÓN
Preparado el proyecto de investigación es posible comenzar con
la recolección de la información. La etapa de recolección comprende
aspectos tales como:




Distribución del material o instrumento de recolección.
La recolección propiamente dicha.
Control del número de formularios recolectados
Control sobre la calidad de la información recolectada.
1.4.3
CRÍTICA Y CODIFICACIÓN
Es un conjunto de operaciones de revisión y corrección de la
información recolectada, que nos permita agruparla y procesarla,
de tal manera que se facilite la elaboración de tablas, gráficos y
análisis, necesarios en su publicación.
El objeto de la crítica, es clasificar el material primario que
precede de la misma investigación, en tres grupos: material bueno,
material incorrecto pero corregible y material incorregible o
desechable.
Página 25
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
La necesidad de procesar la información recogida en los
cuestionarios, ha obligado a traducir las respuestas en códigos. Por
ejemplo, el código para la pregunta estado civil, podría establecerse
de la siguiente manera.
Tabla 1.
CÓDIGO DE ESTADO CIVIL DE LOS CIUDADANOS
ESTADO
CIVIL
Soltero
Casado
Divorciado
CÓDIGO
1
2
3
ESTADO
CIVIL
Viudo
Separado
Otro
CÓDIGO
4
5
6
Cuando el número de respuestas sobrepasa de 9, es preciso
utilizar cifras de dos dígitos, tal como:
Tabla 2.
CÓDIGO DE PROFESIONES DE LOS CIUDADANOS
1.4.4
PROFESIONES
CÓDIGO
Abogado/a
Actor /Actriz
Agente de viaje
Arquitecto/ a
Astrónomo/a
⋮
Veterinario/a
01
02
03
04
05
35
TABULACIÓN Y PROCESAMIENTO
Puede ser manual, mecánica o computarizada y su elección
dependerá:



De la cantidad de formularios que se van a utilizar.
Del número de preguntas que tenga el formulario.
Del tiempo y los recursos, ya sean financieros o de equipo
disponible.
Cuando la tabulación se acuerda desde el principio como parte
integrante de la planeación general de la investigación, es de
suponer que todo el proceso será totalmente satisfactorio, sin
embargo, es necesario que sea revisado a fin de detectar
inconsistencias que se presenten en el presente proceso o en
Página 26
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
procesos anteriores. Una vez elaboradas las correcciones, se
procede a elaborar las tablas, gráficos, análisis, conclusiones y
recomendaciones, de ser el caso.
1.4.5
ANÁLISIS E INTERPRETACIÓN
El análisis de los datos tiene que ver con la formulación del
objetivo de la investigación y de las hipótesis establecidas; sin
embargo, este proceso de análisis tendrá menos dificultad, si el
investigador tiene pleno conocimiento de los problemas que son
inherentes al planteamiento de la investigación.
En este proceso, se debe considerar la elaboración de
distribuciones o tablas de frecuencia obtenidas a través de una
sistematización de la información para poder ser presentada en
forma de tablas y gráficos. Con los resultados anteriores se procede
a realizar un resumen y aplicar las diferentes medidas, a las que se
ha denominado estadígrafos cuando son aplicados a las
características de las unidades de la muestra o como parámetros
aplicados a las características de la población, entre los que se
tendrá en cuenta las medidas de dispersión, promedios, porcentajes
y proporciones.
Con las cifras resultantes, se pueden hacer comparaciones con
otros estudios o estudios anteriores, para llegar a mejores
conclusiones.
1.4.6
PUBLICACIÓN
La publicación propone llegar a las personas interesadas, el
resultado total del estudio, teniendo en cuenta todos los aspectos
considerados en el proceso, de tal forma que los datos sean
comprensibles, con la correspondiente validez que merezcan las
conclusiones.
En términos generales se puede decir que un informe deberá
contener:




Planteamiento del problema.
Objetivo de la información.
Hipótesis que se quiere probar.
Breve exposición de la metodología utilizada, diseño y tamaño
de la muestra. Proceso de selección de las unidades de
información y recolección.
Página 27
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.




Se podrá incluir en el informe, copia del formulario utilizado en
la recolección de la información, aún relacionando y justificando,
en forma sucinta, las preguntas que se consideran más
importantes dentro de la investigación.
Descripción de resultados en forma de tablas y gráficos,
acompañados del análisis y comparaciones obtenidas a través de
los datos.
Conclusiones y recomendaciones. Estas últimas cuando así lo
exija la investigación.
En algunos casos, el informe tiene una parte final, denominada
apéndice, en donde se incluyen tablas más generales, que
permiten aclarar o comprobar rápidamente cualquier información
más
detallada.
también
puede
incluir
información
complementaria al informe.
1.5 TABLAS ESTADÍSTICAS
Al realizar una investigación estadística, lo más probable es que
se cuente con una gran cantidad de datos correspondientes a una
variable de interés, por lo que será necesario tabularlos; es decir,
hay que confeccionar con ellos una tabla en la que aparezcan
ordenadamente. Esto es los valores de la variable de interés o
estudio y el número de elementos o individuos de cada valor; es
decir, su frecuencia.
En la sección 1.1.3 se realizó la distinción entre variables
cualitativas y cuantitativas. Recordando, la variable cualitativa o
atributo, es de naturaleza no numérica, la cual puede clasificarse en
distintas categorías, no hay un orden particular en estas categorías.
Ejemplos de datos cualitativos incluyen la afiliación política a los
distintos partidos existentes en el Ecuador como: Partido Renovador
Institucional Acción Nacional, Partido Avanza, Partido Movimiento
Popular Democrático, Partido Sociedad Patriótica, Partido Socialista,
Partido Social Cristiano, etc., el método de pago al comprar en
Supermercados La Favorita (SUPERMAXI): efectivo, cargo a tarjeta
de débito, crédito, etc. Por otra parte, las variables cuantitativas
son de índole numérica. Ejemplos de datos cuantitativos
relacionados con estudiantes universitarios incluyen: el precio de
los libros de texto, edad y horas que pasan estudiando a la semana,
etc.
Página 28
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
1.5.1
PARTES DE UNA TABLA
Según el documento Introducción al estilo APA, 6ta. Ed.,
preparado por el Lic. Manuel De La Vega Miranda, de la Universidad
Nacional abierta y a Distancia, enuncia a continuación los
elementos e instrucciones que se debe tener en cuenta para la
elaboración de tablas estadísticas (De La Vega, 2012).
Las normas APA, generalmente las tablas, exhiben valores
numéricos exactos y los datos están dispuestos de forma
organizada en líneas y columnas, facilitando su comparación.
Las tablas son eficientes para presentar una gran cantidad de
datos en un pequeño espacio. Si la tabla es corta (dos o menos
columnas y/o filas) se debe presentar textualmente la información.
De manera general la estructura de una tabla está conformada
por las partes señaladas en la figura 1.
Las tablas para su adecuada construcción debe observase los
siguientes puntos.
Numeración de las tablas
Las tablas deben ser enumeradas con números arábigos
secuencialmente dentro del texto y en su totalidad). Ej.: Tabla 1,
Tabla 2, Tabla 3, etc. No utilice subíndices (3, 3a y 3b). Si la tabla
está dentro de un apéndice, use letras mayúsculas y números
(Tabla B2)
Figura 1. Identificación de las partes que conforma una tabla estadística
Página 29
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Títulos de tablas
El título de la tabla debe ser breve, claro y explicativo. Debe ser
puesto arriba de la tabla, en el margen superior izquierdo, debajo
de la palabra Tabla (con la inicial en mayúscula) y acompañado del
número con que la designa. Si es necesario puede explicarse las
abreviaturas dentro del mismo título [i.e., falsa alarma (FA)]
Relación entre tablas y texto. Las tablas complementan, no duplican
el texto. Se escribe en el texto los elementos destacados de la
tabla. Al citar tablas en el cuerpo del texto, se escribe el número
específico de la tabla. (ej.: como se muestra en la Tabla 1, Tabla 2,
Tabla3, etc. (la palabra Tabla inicia con mayúscula). No se escribe,
“la tabla que se muestra arriba o abajo”, tampoco, “la tabla de la
página43”.
Relación entre tablas. Evite combinar tablas que repitan datos. Para
facilitar comparaciones, se debe ser consistente en la presentación
de todas las tablas. Se debe usar la misma terminología para todos
los casos.
Encabezado. Establece la lógica para la organización de los datos.
Identifica las columnas de datos debajo de ellos. Debe ser corto, no
más ancho que la columna que abarca.
Cuerpo de una tabla:
a. Valores enteros y/o decimales.
b. Celdillas vacías.
 Deje en blanco si no hay datos.
 Inserte una raya (guion) si no se obtuvieron o no se
informaron los datos.
c. Concisión.
 No incluya columnas de datos que puedan calcularse con
facilidad a partir de otras.
Notas de la tabla.
Las tablas presentan tres tipos de notas: generales, específicas y de
probabilidad.
Las notas son útiles para eliminar la repetición en el cuerpo de
una tabla. Se ubican en el margen izquierdo (sin sangría) debajo de
la tabla (entre la tabla y la nota se insertan dos espacios). Y deben
ser ordenadas en esta secuencia: nota general, nota específica y
Página 30
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
nota de probabilidad, y cada tipo de nota debe ir en una línea
nueva.
Nota general. Explica u ofrece informaciones relacionadas a la
tabla como un todo, explica las abreviaturas, símbolos y afines
Nota específica. Se refieres a una columna, fila o ítem especifico.
Debe ser indicada por letra minúscula sobrescrita (a, b, c).
Nota de probabilidad. Indica los resultados de pruebas
significativos y se indican con asterisco sobrescrito (*). *p < .05,
**p < .01.
Tablas de otras fuentes.
Debe obtener la autorización de la fuente que posee la propiedad
literaria (derecho de autor), para reproducir o adaptar una parte o
toda una tabla de otro autor.
Las tablas reproducidas de otra fuente, deben presentar debajo
de la tabla, la referencia del autor original, aunque se trate de una
adaptación.
1.5.2
TIPOS DE TABLAS
Tablas de una entrada.
Se denominan de una entrada o de entrada simple, cuando
representan una sola variable o característica de la realidad. En la
columna matriz van las clases en que se presenta las variaciones de
la característica en estudio.
Tabla 3.
ESTUDIANTES DE LA MODALIDAD A DISTANCIA DE LA FACULTAD DE
CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD DEL PERIODO ABR –
SEP DEL 2015.
EDAD (AÑOS
CUMPLIDOS)
18 – 27
28 – 37
38 – 47
48 – 57
MAS DE 57
TOTAL
NÚMERO
1,146
573
291
113
52
2,175
Página 31
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tablas de dos entradas.
Son tablas en las que se presentan dos variables de la realidad,
las clases de una de ellas van en la columna matriz (vertical) y las
clases de la segunda en el encabezado (horizontal).
Tabla 4.
ESTUDIANTES DE LA MODALIDAD A DISTANCIA DE LA FACULTAD DE
CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD Y GÉNERO, DEL
PERIODO ABR – SEP DEL 2015.
EDAD (AÑOS
CUMPLIDOS)
18 – 27
28 – 37
38 – 47
48 – 57
MÁS DE 57
TOTAL
NÚMERO DE
ESTUDIANTES
Masculino
Femenino
478
668
243
330
158
133
67
46
32
20
TOTAL
1146
573
291
113
52
2,175
Tablas complejas:
Son tablas que presentan en forma simultánea tres o más
variables o características de la realidad en estudio, una va en la
columna matriz y las otras en el encabezado. El uso de estas tablas
debe ser restringido, porque puede ser complicada su interpretación
si representan muchas variables.
Tabla 5.
ESTUDIANTES DE LA MODALIDAD A DISTANCIA DE LA FACULTAD DE
CIENCIAS ADMINISTRATIVAS DE LA UCE, SEGÚN EDAD, TIPO DE COLEGIO Y
GÉNERO, DEL PERIODO ABR – SEP DEL 2015.
BACHILLERATO EN COLEGIO
EDAD (AÑOS
CUMPLIDOS)
Fiscal
Fisco misional
Particular
TOTAL
Masculino
Femenino
Masculino
Femenino
Masculino
Femenino
18 – 27
28 – 37
38 – 47
48 – 57
MÁS DE 57
259
163
87
29
15
297
154
66
23
12
82
57
22
14
9
112
55
22
7
3
137
23
49
24
8
259
121
45
16
5
1,146
573
291
113
52
TOTAL
553
552
184
199
241
446
2,175
Página 32
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 1
En el feriado del 10 de agosto del 2015, se preguntó a un total
de 1,000 residentes de la sierra ecuatoriana, ¿qué playa para
vacacionar preferían? Los resultados fueron que a 200 les gustaba
más alguna de las playas de le provincia de Esmeraldas; a 300,
alguna de las playas de la provincia de Manabí; a 400, alguna de
las playas de la provincia de del Guayas y a 100, alguna de las
playas de la provincia de El Oro. Elabore una tabla con los puntos
sugeridos.
Solución
Tabla 6
PREFERENCIA DE LOS CIUDADANOS DE LA SIERRA ECUATORIANA, SOBRE
LAS PLAYAS POR PROVINCIA EN LAS QUE LES GUSTA VACACIONAR, EN AGOSTO
DEL 2015.
PROVINCIA
Playas de Esmeraldas
Playas de Manabí
Playas de Guayas
Playas de El Oro
TOTAL
NÚMERO
200
300
400
100
1,000
Ejemplo de aplicación 2
Se preguntó a 500 viajeros (as) de negocios frecuentes que
llegaron a la ciudad Quito, ¿qué hotel era de su preferencia?, los
resultados fueron los siguientes: Casa Gangotena, 25; Swissotel,
100; Hilton Colón, 80; Best Western Premier, 120; Casa San
Marcos Hotel, 45; el resto prefería JW Marriott Hotel. El 30% son
mujeres.
a. Elabore una tabla de frecuencias la distribución por hotel y
género.
b. Elabore una tabla de frecuencias la distribución por hotel,
género y región de origen (Porcentaje aproximado: costa
45%, sierra 35% y oriente 20%; aproxime al entero más
cercano).
Solución
a) La tabla estará dispuesta por la primera columna con los
nombres de los hoteles que frecuentan los viajeros de negocios a
Página 33
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
la ciudad de Quito; las siguientes dos columnas identificarán el
género de los viajeros; y una última columna por el total.
Tabla 7.
PREFERENCIA DE HOTELES DE VIAJEROS (AS) DE NEGOCIOS QUE LLEGAN A
QUITO, SEGÚN GENERO, EN AGOSTO DEL 2015.
GÉNERO
Femenino Masculino
Casa Gangotena
9
21
Swissotel
30
70
Hilton Colón
24
56
Best Western Premier
36
84
Casa San Marcos Hotel
12
28
JW Marriott Hotel
39
91
TOTAL
150
350
HOTEL
TOTAL
30
100
80
120
40
130
500
b) La tabla estará dispuesta al igual que la tabla 7, y además se
adicionará columnas que identifiquen las regiones del Ecuador
continental.
Tabla 8
PREFERENCIA DE HOTELES DE VIAJEROS (AS) DE NEGOCIOS QUE LLEGAN A
QUITO, SEGÚN GENERO Y REGIÓN DE PROCEDENCIA, EN AGOSTO DEL 2015.
GÉNERO
Femenino
Masculino
Costa Sierra Oriente Costa Sierra Oriente
Casa Gangotena
4
3
2
10
7
4
Swissotel
14
11
5
31
25
14
Hilton Colón
11
8
5
25
20
11
Best Western Premier
16
13
7
38
29
17
Casa San Marcos Hotel
5
4
3
13
10
5
JW Marriott Hotel
18
14
7
41
32
18
TOTAL
68
53
29
158
123
69
HOTEL
TOTAL
30
100
80
120
40
130
500
1.6 GRÁFICOS ESTADÍSTICOS
En las investigaciones estadísticas, comúnmente se tendrá una
gran cantidad de datos numéricos, con los que se tendrá elaboradas
tablas que resumen la información recolectada. A más de esto, es
Página 34
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
necesario contar con gráficas estadística, las cuales permiten tener
información clara y rápida de lo obtenido en el estudio.
Existen varias gráficas para describir un conjunto de datos;
dependiendo de lo que se requiera representar, cada una de ellas
es adecuada para un estudio determinado, ya que no siempre se
puede utilizar la misma para todos los casos.
1.6.1
GRÁFICAS LINEALES
Se compone de una serie de datos representados por puntos,
unidos por segmentos lineales. Mediante esta gráfica se puede
comprobar rápidamente el cambio de tendencia de los datos.
Los diagramas o gráficas lineales son de aplicación en las
denominadas series de tiempo o series cronológicas, donde una de
las variables, por defecto, corresponde al tiempo (𝑋) (años, meses,
días, etc.) y la segunda es la variable investigada (Y) (Martínez,
2012).
Un ejemplo de gráficas lineales podría obtenerse con los datos
de la empresa ABC, en la que se señala los ingresos y costos
anuales, que se muestran a continuación
Tabla 9.
INGRESOS Y COSTOS DE LA EMPRESA ABC EN LOS AÑOS 2004 A 2010.
AÑOS
2004
2005
2006
2007
2008
2009
2010
INGRESOS
EN MILES
260
380
300
620
470
720
870
3,620
COSTOS EN
MILES
110
200
150
420
360
510
620
2,370
Si solo se quiere observar la evolución de los ingresos de la
empresa ABC, en una gráfica lineal, se presentaría de la siguiente
manera.
Página 35
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
1000
E
N
800
M
$
I
L
E
S
600
400
200
0
2004 2005 2006 2007 2008 2009
AÑOS
Figura 2. Evolución de los ingresos de la empresa ABC en los años 2004 a 2010
Si se representa, tanto los ingresos como los costos, en una
gráfica lineal, estos se representan en la misma forma que la
gráfica anterior; además que se observarán las diferencias para
cada uno de los años; el espacio entre las líneas de costos e
ingresos, representa la utilidad bruta anual. Observe las diferencias
que existen para los años 2008 y 2010, es claro que en el 2010, la
utilidad es mayor.
E
N
M
I
L
E
S
$
1000
900
800
700
600
500
400
300
200
100
0
INGRESOS
EN MILES
COSTOS
EN MILES
UTIL
IDAD
2004 2005 2006 2007 2008 2009 2010
AÑOS
Figura 3. Evolución de los ingresos y costos de la empresa ABC de los años
2004 a 2010.
1.6.2
GRÁFICOS DE SUPERFICIE
Este tipo de gráficos puede comparar varias series de datos,
como novedad respecto al resto de gráficos. En este caso se
emplean distintos colores para diferenciar cada valor que
Página 36
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
corresponde a una unidad mayor. Si los datos están muy dispersos
el gráfico será muy difícil de interpretar (Recursos para trabajos
administrativos, 2013).
Tabla 10.
INVENTARIO DE ARTÍCULOS PARA LA VENTA DE ALMACENES 1, 2 Y 3.
ALMACÉN 1 ALMACÉN 2 ALMACÉN 3
Tijeras
4
6
8
Bolígrafos
2
4
6
Carpetas
1.4
3
6
Lapiceros
4
6
8
Figura 4. Inventario de artículos para la venta de almacenes 1, 2 y 3.
1.6.3
OTROS
Gráficos XY (de dispersión):
Presentan la peculiaridad de que los dos ejes muestran valores
(no hay un eje de categorías). Se emplean para reflejar la relación
entre dos variables. Ejemplo: relación entre la Renta y la Inversión,
las dos variables están correlacionadas, a mayor renta mayor
inversión (Recursos para trabajos administrativos, 2013).
Página 37
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tabla 11.
RELACIÓN ENTRE LA RENTA Y LA INVERSIÓN EN MILES DE DÓLARES.
Renta en miles $ Inversión en miles $
1
1.5
2
2.1
3
3.2
I
N
V
E
R
S
I
Ó
N
E
N
3,5
3
M
I
L
E
S
$
2,5
2
1,5
1
0,5
0
0
1
2
3
4
RENTA EN MILES $
Figura 5. Relación entre la renta y la inversión en miles de dólares.
Gráficos de área
Son como los gráficos de líneas, pero con colores debajo de las líneas
para ayudar a su identificación, ya que apilar las series contribuye a
verlas más claramente (Recursos para trabajos administrativos,
2013).
Tabla 12.
VENTAS ANUALES POR TIPO DE ORDENADORES.
AÑOS
2008
2009
2010
2011
2012
SOBREMESA PORTÁTILES
32
12
32
12
28
12
12
21
15
28
Página 38
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
50
40
30
PORTÁTILES
20
SOBREMESA
10
0
2008
2009
2010
2011
2012
Figura 6. Ventas anuales por tipo de ordenadores de los años 2008 a 2012.
1.7 DISTRIBUCIONES
UNIDIMENSIONALES
DE
FRECUENCIAS
La tabla formada por las distintas modalidades (valores o
intervalos) del carácter X y por las frecuencias absolutas, absolutas
acumuladas, relativas o relativas acumuladas, recibe el nombre de
distribución de frecuencias: absolutas, absolutas acumuladas,
relativas y relativas acumuladas, respectivamente (García & Japón ,
2015).
Por lo anterior, se tiene cuatro distribuciones de frecuencias,
obteniéndose a partir de una cualquiera de ellas, las tres restantes,
supuesto que se conoce la frecuencia total. Las cuatro
distribuciones de frecuencias se expresan en tablas como las que se
presentan a continuación.
a. Carácter cualitativo.
𝑴𝒊
𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝟏
𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝟐
⋮
𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝐢
⋮
𝐂𝐮𝐚𝐥𝐢𝐝𝐚𝐝𝐤
𝒇𝒊
𝑓1
𝑓2
⋮
𝑓𝑖
⋮
𝑓𝑘
𝑭𝒊
𝐹1
𝐹2
⋮
𝐹𝑖
⋮
𝐹𝑘 = 𝑛
n
𝒉𝒊
ℎ1
ℎ2
⋮
ℎ𝑖
⋮
ℎ𝑘
𝑯𝒊
𝐻1
𝐻2
⋮
𝐻𝑖
⋮
𝐻𝑘 = 1
1
Página 39
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
b. Carácter cuantitativo sin agrupar
𝑿𝒊
𝒙𝟏
𝒙𝟐
⋮
𝒙𝒊
⋮
𝒙𝒌
𝒇𝒊
𝑓1
𝑓2
⋮
𝑓𝑖
⋮
𝑓𝑘
𝑭𝒊
𝐹1
𝐹2
⋮
𝐹𝑖
⋮
𝐹𝑘 = 𝑛
𝒉𝒊
ℎ1
ℎ2
⋮
ℎ𝑖
⋮
ℎ𝑘
n
𝑯𝒊
𝐻1
𝐻2
⋮
𝐻𝑖
⋮
𝐻𝑘 = 1
1
c. Carácter cuantitativo agrupado en intervalos
𝑰𝒊
𝑰𝟏
𝑰𝟐
⋮
𝑰𝒊
⋮
𝑰𝒌
𝒇𝒊
𝑓1
𝑓2
⋮
𝑓𝑖
⋮
𝑓𝑘
𝑭𝒊
𝐹1
𝐹2
⋮
𝐹𝑖
⋮
𝐹𝑘 = 𝑛
n
𝒉𝒊
ℎ1
ℎ2
⋮
ℎ𝑖
⋮
ℎ𝑘
𝑯𝒊
𝐻1
𝐻2
⋮
𝐻𝑖
⋮
𝐻𝑘 = 1
1
Para la preparación de una tabla de distribución de frecuencias
de carácter cuantitativo agrupado en intervalos, tenga en cuenta lo
siguiente.
1.7.1
DISTRIBUCIONES
DE
FRECUENCIAS
PARA
DATOS CUANTITATIVOS
Las variables cuantitativas tales como número de hermanos,
número de goles marcados por un equipo de fútbol, valor de ventas
diarias, producción de un bien en la semana, pago de sueldos
mensuales, número de turistas anuales que han ingresado al
Ecuador durante una década, etc. son idóneas para realizar
distribuciones de frecuencias de datos cuantitativos.
Distribución de frecuencias. Agrupación de datos en clases
mutuamente excluyentes, que muestra el número de observaciones
que hay en cada clase.
Página 40
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Pasos para elaborar una distribución de
frecuencias
Los pasos para elaborar una distribución de frecuencias son:
1.
2.
3.
4.
5.
Determinar el número de clases que se desea tener.
Determinar la amplitud o intervalo de clase.
Determinar los límites de cada una de las clases.
Distribuir los datos originales en las distintas clases o tabular.
Contar el número de elementos en cada clase que corresponde al
valor de la frecuencia.
Paso 1. Determinar el número de clases
Es usar suficientes grupos o clases, que indiquen la forma de la
distribución, por lo que se recomienda un número de clase no
menor a 5 ni mayor a 15. El objetivo es usar un número suficiente
de clases que indiquen la forma de la distribución.
Para determinar el número de clases se utiliza la regla “2 k n”,
la misma que sugiere utilizar como número de clases el menor
número (k) tal que 2 k(en palabras 2 elevado a la potencia k) sea
mayor que el número de observaciones (n).
Donde:
𝑛 = 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
𝑘 = 𝑒𝑠 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑒𝑛𝑡𝑒𝑟𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜 𝑜, 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟.
Por ejemplo, si se realizaron 30 llamadas telefónicas para la
venta de computadores y se desea saber cuántas clases se debe
utilizar;
𝑛 = 30
2 = 𝑛ú𝑚𝑒𝑟𝑜 𝑏𝑎𝑠𝑒
𝑘 = 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠.
Utilizando la regla tenemos:
2𝑘 𝑛
25  30
Página 41
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
32  30
Al ser 32 mayor que 30, la regla para calcular el número de
clases, se recomienda que sean 5 clases en la tabla de frecuencias.
Paso 2. Determinar la amplitud o intervalo de clase.
Para determinar la amplitud se resta del límite superior, el
inferior de un conjunto de datos y se divide para el número de
clases.
Al conocer el ancho del intervalo o intervalo de clase a utilizar,
se puede aplicar la siguiente fórmula para encontrar el número de
clases a utilizarse; en caso de que se manejen datos agrupados.
𝑖≥
𝐻−𝐿
𝐾
Donde:
𝑖 = 𝑒𝑠 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝐻 = 𝑒𝑠 𝑒𝑙 𝑚𝑎𝑦𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
𝐿 = 𝑒𝑠 𝑒𝑙 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
𝑘 = 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
El primer procedimiento a estudiar para organizar y resumir un
conjunto de datos es realizar una tabla de frecuencias.
TABLA DE FRECUENCIAS O FRECUENCIA ABSOLUTA (𝑓𝑖 ).
Se agrupa datos cualitativos y cuantitativos en clases
mutuamente excluyentes que muestra el número de observaciones
en cada clase. Por ejemplo, en la venta de vehículos marca Toyota
se identifica cinco modelos SUV'S, la identificación por modelo es
una variable cualitativa. Suponga que Toyota Ecuador desea
resumir las ventas del año pasado por modelo de vehículo. El
resumen en una tabla de frecuencia se presentaría de la siguiente
manera.
Página 42
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tabla 13.
Tabla de frecuencias absolutas de vehículos Toyota, modelos Suv's vendidos
en el ecuador en el año 2014.
Modelos SUV'S (𝑿𝒊 ) Número de vehículos. (𝒇𝒊 )
4RUNNER
300
FJ CRUISER
200
FORTUNER
400
LAND CRUISER
200
RAV4
500
FRECUENCIA ABSOLUTA ACUMULADA (𝐹𝑖 ).
Esta frecuencia tiene sentido calcularla para variables
cuantitativas o cualitativas ordenables, en los demás casos no tiene
mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta
acumulada es el número de veces que ha aparecido en la muestra o
población un valor menor o igual que el de la variable.
El cálculo de la frecuencia absoluta acumulada está dado por la
fórmula
𝐹𝑖 = 𝐹𝑖−1 + 𝑓𝑖
La frecuencia absoluta acumulada de las operaciones de
microcréditos de la Cooperativa de Ahorro y Crédito La Dura, se
presenta en la tabla 14.
Tabla 14.
Tabla de frecuencias absolutas acumuladas de operaciones de microcrédito de
la C.A.C. La Dura, correspondiente al año 2014.
(𝑴𝒊 )
Microcrédito minorista
Microcrédito de acumulación
simple
Microcrédito de acumulación
ampliada
TOTAL
300
200
Frecuencia
absoluta
acumulada
(𝑭𝒊 )
300
500
400
900
(𝒇𝒊 )
900
Página 43
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
FRECUENCIAS RELATIVAS DE CLASE (ℎ𝑖 ).
Es la fracción del número total de observaciones en cada clase;
esto es, la frecuencia relativa capta la relación entre la totalidad de
elementos de una clase y el número total de observaciones. En el
ejemplo de la venta de vehículos Toyota, busca conocer el
porcentaje de vehículos modelos SUV'S vendidos en el Ecuador en
el año 2014.
La fórmula de cálculo para las frecuencias relativas de clase está
dada por
ℎ𝑖 =
ℎ𝑖 =
𝑓𝑖
𝑁
, o
𝑓𝑖
𝑛
Donde
𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Tabla 15.
Tabla de frecuencias absolutas y relativas de vehículos Toyota, modelos Suv's
vendidos en el ecuador en el año 2014.
𝑿𝒊
𝒇𝒊
4RUNNER
FJ CRUISER
FORTUNER
LAND CRUISER
RAV4
300
200
400
200
500
𝑵 = 𝟏, 𝟔𝟎𝟎
TOTAL
Frecuencia
relativa (𝒉𝒊 ).
300⁄1,600
200⁄1,600
400⁄1,600
200⁄1,600
500⁄1,600
𝟏, 𝟔𝟎𝟎⁄𝟏, 𝟔𝟎𝟎
Frecuencia
relativa (𝒉𝒊 ).
0.19
0.12
0.25
0.13
0.31
1.0000
Frecuencia relativa acumulada (𝐻𝑖 ).
Es el cociente entre la frecuencia acumulada de una clase
determinada y el número total de datos.
La fórmula de cálculo de las frecuencias relativas acumuladas se
obtiene al calcular
Página 44
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐻𝑖 =
𝐻𝑖 =
𝐹𝑖
𝑁
𝐹𝑖
, o
𝑛
Tabla 16.
Tabla de frecuencias absolutas, absolutas acumuladas, relativas y relativas
acumulada de vehículos Toyota, modelos Suv's vendidos en el Ecuador en el año
2014.
𝑿𝒊
𝒇𝒊
(𝑭𝒊 )
4RUNNER
FJ CRUISER
FORTUNER
LAND
CRUISER
RAV4
TOTAL
300
200
400
300
500
900
0.188
0.125
0.250
Frecuencia
relativa
acumulada(𝑯𝒊 )
0.19
0.31
0.56
200
1,100
0.125
0.69
500
1,600
1,600
0.313
1.0000
1.00
(𝒉𝒊 ).
Ejemplo de aplicación 3
Se ha investigado el número de hijos correspondientes a 25
familias, los resultados se muestran a continuación.
1
4
2
1
2
4
0
2
1
2
3
0
2
1
3
3
4
5
0
1
2
2
1
3
3
a. Elabore una tabla de frecuencias absolutas.
b. Otra con frecuencias absolutas, absolutas acumuladas, relativas
y relativas acumuladas.
Solución
a. Se elabora una tabla resumen, la cual contendrá en el presente
caso, en la primera columna, la variable cuantitativa (número de
hijos por familia) y para la segunda columna, el conteo
correspondiente de acuerdo al número de hijos obtenido en los
datos.
Página 45
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tabla 17.
Conteo de número de hijos por familia
NÚMERO DE HIJOS
0
1
2
3
4
5
TOTAL
CONTEO
III
IIIII I
IIIII II
IIIII
III
I
25
Una vez elaborado el conteo se procede a llenar la nueva tabla
con números arábigos.
Tabla 18.
Distribución de frecuencias absolutas del número de hijos por familia.
NÚMERO DE
HIJOS 𝑿𝒊
0
1
2
3
4
5
TOTAL
FRECUENCIA
𝒇𝒊
3
6
7
5
3
1
25
b. La tabla anterior contiene la frecuencia absoluta, por lo que le
llamaríamos distribución de frecuencias absolutas. A partir de
esta tabla se puede construir las demás frecuencias (absolutas
acumuladas, relativas y relativas acumuladas).
Tabla 19.
Distribuciones de frecuencias (absoluta, absoluta acumulada, relativa, relativa
acumulada) del número de hijos por familia.
𝑿𝒊
0
1
2
3
4
5
TOTAL
𝒇𝒊
3
6
7
5
3
1
25
𝑭𝒊
3
9
16
21
24
25
𝒉𝒊
0.12
0.24
0.28
0.20
0.12
0.04
1
𝑯𝒊
0.12
0.36
0.64
0.84
0.96
1.00
Página 46
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 4
Se ha investigado la estatura de 50 estudiantes de estadística,
los resultados que se muestran han sido previamente ordenados en
forma ascendente.
151
158
166
173
178
151
158
168
174
180
152
158
170
174
182
152
159
170
175
183
153
161
170
176
184
154
161
170
177
184
154
163
170
177
184
154
164
171
177
185
155
164
171
177
185
156
164
172
178
185
a. Elabore una tabla de frecuencias absolutas.
b. Otra con frecuencias absolutas, absolutas acumuladas, relativas
y relativas acumuladas.
Solución
a. Tenga en cuenta los pasos señalados en la preparación de una
tabla de distribución de frecuencias de carácter cuantitativo
agrupado en intervalos.
PASO 1. Determinar el número de clases que se desea tener.
2𝑘 𝑛
Donde 𝑛 = 50,
Entonces 2𝑘 > 50
Por tanto
26 > 50
64 > 50
Si 𝑘 = 6, entonces se tendrá seis intervalos de clase.
PASO 2. Determinar la amplitud o intervalo de clase.
𝑖≥
𝐻−𝐿
𝐾
Donde:
𝑖 =?
Página 47
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐻 = 186
𝐿 = 151
𝑘=6
𝑖≥
186 − 151
= 5.83 ≅ 6
6
186 − 151 = 35
6 × 6 = 36 ∗
* El rango del problema es 35, sin embargo, se dispone de 36,
lo que da lugar para mover en una unidad en uno de los extremos,
sea este, superior o inferior.
PASO 3. Determinar los límites de cada una de las clases.
′
𝑋𝑖−1
− 𝑋𝑖′
150 – 156
156 – 162
162 – 168
168 – 174
174 – 180
180 – 186
PASO 4. Distribuir los datos originales en las distintas clases o
tabular.
′
𝑋𝑖−1
− 𝑋𝑖′
150 – 156
156 – 162
162 – 168
168 – 174
174 – 180
180 – 186
TOTAL
𝑓𝑖
IIIII IIIII
IIIII I
IIIII I
IIIII IIIII I
IIIII IIII
IIIII III
50
PASO 5. Contar el número de elementos en cada clase que
corresponde al valor de la frecuencia.
Página 48
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tabla 20.
Frecuencias absolutas de alturas de estudiantes de estadística del periodo
2015 – 2015.
𝑿′𝒊−𝟏 − 𝑿′𝒊
150 – 156
156 – 162
162 – 168
168 – 174
174 – 180
180 – 186
TOTAL
𝒇𝒊
10
6
6
11
9
8
50
b. La tabla anterior contiene la frecuencia absoluta, por lo que le
llamaríamos Distribución de frecuencias absolutas. A partir de
esta tabla se puede construir las demás frecuencias (absolutas
acumuladas, relativas y relativas acumuladas).
Tabla 21.
Frecuencias: absolutas, relativas, absolutas acumuladas y relativas
acumuladas de alturas de estudiantes de estadística del periodo 2015 – 2015.
𝑿′𝒊−𝟏 − 𝑿′𝒊
150 – 156
156 – 162
162 – 168
168 – 174
174 – 180
180 – 186
𝒇𝒊
10
6
6
11
9
8
50
𝑭𝒊
10
16
22
33
42
50
𝒉𝒊
0.20
0.12
0.12
0.22
0.18
0.16
1.00
𝑯𝒊
0.20
0.32
0.44
0.66
0.84
1.00
1.8 DIAGRAMAS DE FRECUENCIAS
1.8.1
DATOS CORRESPONDIENTES A UN CARÁCTER
CUALITATIVO
Comúnmente las gráficas de datos cualitativos son en forma de
barras y de pastel. Sin embargo en situaciones especiales pueden
ser útiles para datos cuantitativos.
Página 49
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Diagrama de barras.
Se representa en el primer cuadrante de un sistema coordenado
rectangular, aquí las clases se representan en el eje horizontal y la
frecuencia de clase en el eje vertical. Las frecuencias de clase son
proporcionales a las alturas de las barras. El eje horizontal muestra
la variable de interés y el eje vertical la cantidad, número o fracción
de cada uno de los posibles resultados. Una característica distintiva
de la gráfica de barras es que existe una distancia o espacio entre
las barras.
500
Número de vehículos
500
400
300
400
300
200
200
200
100
0
Modelos SUV'S
Figura 7. Gráfica de barras de vehículos Toyota, modelos Suv's
ecuador en el año 2014.
vendidos en el
Gráficas en forma de pastel.
Es una gráfica que muestra la parte o porcentaje que representa
cada clase del total de números de frecuencia. Para elaborar una
gráfica de pastel consiste en registrar los porcentajes 0, 10, 20, … ,
100 uniformemente alrededor de la circunferencia (véase la figura
8). Para indicar la parte de 19% destinada a 4RUNNER, trace una
línea del centro del círculo al 0, y otra línea del centro del círculo al
19%. Tome el punto cero del círculo y constitúyalo como punto de
partida, girando en sentido a las manecillas del reloj, señale los
valores constantes en las frecuencias relativas acumuladas, en su
orden; ello le permitirá distribuir los porcentajes correspondientes
de cada una de las características de la variable.
Página 50
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4RUNNER
19%
4RUNNER
RAV4
31%
FJ CRUISER
FJ
CRUISER
12%
FORTUNER
LAND CRUISER
RAV4
LAND
CRUISER
13%
FORTUNER
25%
Figura 8. Gráfica de pastel de vehículos Toyota, modelos Suv's vendidos en
el ecuador en el año 2014.
1.8.2
DATOS CORRESPONDIENTES A UN CARÁCTER
CUANTITATIVO DISCRETO
Diagrama de barras
En el ejemplo del número de hijos por familia, la variable
número de hijos, es cuantitativa discreta, por tanto, recordando la
distribución de frecuencias absolutas del número de hijos por
familia de la tabla 15, se tiene
NÚMERO DE
HIJOS 𝑿𝒊
0
1
2
3
4
5
TOTAL
El diagrama
continuación.
de
barras
FRECUENCIA
𝒇𝒊
3
6
7
5
3
1
25
correspondiente,
se
representa
a
Página 51
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
F
R
E
C
U
E
N
C
I
A
8
7
6
5
4
3
2
1
0
7
6
5
3
3
1
0
1
2
3
4
5
NÚMERO DE HIJOS
Figura 9. Diagrama de barras del número de hijos por familia
Diagrama en forma de pastel
Recordando la distribución de frecuencias absolutas y relativas
del número de hijos por familia de la tabla 16, se tiene
𝒇𝒊
3
6
7
5
3
1
25
𝑿𝒊
0
1
2
3
4
5
TOTAL
𝒉𝒊
0.12
0.24
0.28
0.20
0.12
0.04
1
El diagrama en forma de pastel correspondiente a la frecuencia
absoluta 𝑓𝑖 , se representa a continuación.
3
1
3
6
5
0
1
2
3
4
5
7
Figura 10. Frecuencias absolutas del número de hijos por familia.
Página 52
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
El diagrama en forma de pastel correspondiente a la frecuencia
relativa ℎ𝑖 , se representa a continuación.
0,12
0,04 0,12
0,24
0,20
0
1
2
3
4
5
0,28
Figura 11. Frecuencias relativas del número de hijos por familia.
1.8.3
DATOS CORRESPONDIENTES A UN CARÁCTER
CUANTITATIVO CONTINUO
Son de común aplicación en datos agrupados cuantitativo
continuo. El histograma, el polígono y la ojiva, son gráficas
usualmente usadas para datos cuantitativos continuos, en los que,
como se observará a continuación, se representa las frecuencias:
absolutas, absolutas acumuladas, relativas y relativas acumuladas.
Para la representación gráfica, tenga en cuenta la Tabla 18, que
se observa a continuación.
𝑿′𝒊−𝟏 − 𝑿′𝒊
𝒇𝒊
𝑭𝒊
𝒉𝒊
𝑯𝒊
150 – 156
10
10
0.20
0.20
156 – 162
6
16
0.12
0.32
162 – 168
6
22
0.12
0.44
168 – 174
11
33
0.22
0.66
174 – 180
9
42
0.18
0.84
180 – 186
8
50
0.16
1.00
50
1.00
Página 53
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Histograma
Se representa en el primer cuadrante de un sistema coordenado
rectangular, aquí las clases se representan en el eje horizontal y la
frecuencia de clase en el eje vertical. Las frecuencias de clase son
proporcionales a las alturas de las barras. El eje horizontal muestra
la variable de interés y el eje vertical la cantidad, número o fracción
de cada uno de los posibles resultados. Una característica distintiva
de la gráfica de barras es que no existe una distancia o espacio
entre las barras.
El histograma es útil para representar las frecuencias absolutas y
relativas de una variable continua.
12
F
R
E
C
U
E
N
C
I
A
A
B
S
O
L
U
T
A
10
11
10
8
9
6
6
8
6
4
2
0
150 – 156 156 – 162 162 – 168 168 – 174 174 – 180 180 – 186
ESTATURAS
Figura 12. Histograma de frecuencias absolutas de las alturas de 50
estudiantes de estadística, del periodo 2015 – 2015.
0,25
F
R
E
C
U
E
N
C
I
A
R
E
L
A
T
I
V
A
0,2
0,22
0,2
0,15
0,18
0,12
0,12
156 – 162
162 – 168
0,16
0,1
0,05
0
150 – 156
168 – 174
174 – 180
180 – 186
ESTATURAS
Figura 13. Histograma de frecuencias relativas de las alturas de 50
estudiantes de estadística, del periodo 2015 – 2015.
Página 54
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Polígono
Se representa en el primer cuadrante de un sistema coordenado
rectangular, aquí las clases se representan en el eje horizontal y la
frecuencia de clase en el eje vertical. Las frecuencias se
representan por las alturas correspondientes en los extremos
superiores de cada intervalo. Una característica distintiva del
polígono es que las alturas correspondientes a los extremos
superiores se unen mediante segmentos.
El Polígono es útil para representar las frecuencias absolutas y
relativas de una variable continua.
12
F
R
E
C
U
E
N
C
I
A
A
B
S
O
L
U
T
A
10
11
10
8
9
6
4
6
6
156 – 162
162 – 168
8
2
0
150 – 156
168 – 174
174 – 180
180 – 186
ALTURAS
Figura 14. Polígono de frecuencias absolutas de las alturas de 50 estudiantes
de estadística, del periodo 2015 – 2015.
0,25
F
R
E
C
U
E
N
C
I
A
R
E
L
A
T
I
V
A
0,2
0,15
0,22
0,2
0,1
0,18
0,12
0,12
156 – 162
162 – 168
0,16
0,05
0
150 – 156
168 – 174
174 – 180
180 – 186
ALTURAS
Figura 15. Polígono de frecuencias relativas de las alturas de 50 estudiantes de
estadística, del periodo 2015 – 2015.
Ojiva
Se representa en el primer cuadrante de un sistema coordenado
rectangular, aquí las clases se representan en el eje horizontal y la
Página 55
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
frecuencia de clase en el eje vertical. Las frecuencias acumuladas
se representan por las alturas correspondientes en los extremos
superiores de cada intervalo, dando una altura cero al extremo
inferior del primer intervalo y siendo constante a partir del extremo
superior del último. El eje horizontal muestra la variable de interés
y el eje vertical la cantidad, número o fracción de cada uno de los
posibles resultados. Una característica distintiva de la ojiva es que
las alturas correspondientes a los extremos superiores se unen
mediante segmentos.
La ojiva es útil para representar las frecuencias absolutas
acumuladas y relativas acumuladas de una variable continua.
F
R
E
C
U
E
N
C
I
A
A
B
S
O
L
U
T
A
S
A
C
U
M
U
L
A
D
A
S
60
50
30
20
0
50
180 –
186
186 –
192
33
40
10
50
42
10
16
22
0
144 –
150
150 –
156
156 –
162
162 –
168
168 –
174
174 –
180
ALTURAS
Figura 16. Ojiva de frecuencias absolutas acumuladas de las alturas de 50
estudiantes de estadística, del periodo 2015 – 2015.
1,2
F
R
E
C
U
E
N
C
I
A
R
E
L
A
T
I
V
A
A
C
U
M
U
L
A
D
A
1
180 –
186
186 –
192
0,66
0,6
0,4
0
1
0,84
0,8
0,2
1
0,2
0,32
0,44
0
144 –
150
150 –
156
156 –
162
162 –
168
168 –
174
174 –
180
ALTURAS
Figura 17. Ojiva de frecuencias relativas acumuladas de las alturas de 50
estudiantes de estadística, del periodo 2015 – 2015.
Página 56
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
2
CAPÍTULO
II:
ANÁLISIS
ESTADÍSTICO
SIMPLE
OBJETIVOS
1. Calcular la media aritmética, la media ponderada, la mediana,
la moda y la media geométrica.
2. Conocer las características, uso, ventajas de las Medidas de
Tendencia Central.
3. Identificar la ubicación de las Medidas de Tendencia Central.
4. Calcular la amplitud de variación, desviación media, la
varianza y la desviación estándar de datos originales.
5. Calcular la amplitud de variación, desviación media, la
varianza y la desviación estándar de datos agrupados.
6. Conocer las ventajas y desventajas de las Medidas de
Dispersión.
7. Calcular y analizar los cuartiles, deciles y centiles, la amplitud
cuartílica e intecuartílica.
8. Elaborar el diagrama de caja.
9. Calcular y analizar el coeficiente de variación y asimetría.
2.1 INTRODUCCIÓN
En el capítulo anterior se presentó algunas definiciones útiles
para el estudio de la estadística, la recolección de la información, su
forma de resumir, tanto en tablas como en gráficos para variables
cualitativas y cuantitativas. En el presente capítulo se considera
medidas resúmenes, tales como; las medidas de centralización, de
posición, de dispersión, de asimetría y apuntamiento.
Resumir un conjunto de datos es pasar de una visión detallada a
una generalización simple e informativa tratando de preservar las
características esenciales. ¿Por qué resumir? Para simplificar la
comprensión y la comunicación de los datos.
2.2 TIPOS DE ESTADÍGRAFOS
Después de haber ordenado y descrito un conjunto de datos,
aún el análisis resulta un tanto incompleto; es necesario entonces
resumir la información y facilitar así su análisis e interpretación
utilizando ciertos indicadores. A estos indicadores se les denomina
Página 57
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
también estadígrafos o medidas de resumen, permiten hallar un
valor numérico, el mismo que representa a toda la población o
muestra en el estudio; estas son:
1. Medidas de tendencia central
a. Media aritmética
b. Media ponderada
c. Mediana
d. Moda
e. Media geométrica
f. Media armónica
2. Medidas de tendencia no central
a. Deciles
b. Cuartiles
c. Percentiles
3. Medidas de dispersión
a. Rango
b. Desviación media
c. Desviación estándar
d. Varianza
e. Coeficiente de variación
4. Medidas de asimetría, y
5. Medidas de apuntamiento o curtosis.
2.3 ESTADÍGRAFOS DE TENDENCIA CENTRAL
Al recolectar y organizar los datos, el objetivo es encontrar un
punto central en función de sus frecuencias. En estadística las
medidas de tendencia central, varían de acuerdo con lo que se
desea o que se requiera encontrar del conjunto de datos
recolectados.
Estas medidas serán estudiadas en dos formas:
1.
Datos no agrupados, y
2.
Datos agrupados en una tabla de frecuencias.
Las fórmulas difieren para calcular en vista de que depende si
Página 58
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
son datos de población o datos de muestras, pero el procedimiento
es el mismo.
Una medida de tendencia central es un valor único que resume
un conjunto de datos, señalando el centro de los valores.
2.3.1
MEDIA ARITMÉTICA
Es la medida de tendencia central que más se utiliza en
Estadística, se calcula sumando todos los valores de las
observaciones y se divide para el total de las mismas.
Características
1. Es una medida totalmente numérica o sea sólo puede calcularse
en datos de características cuantitativas.
2. En su cálculo se toman en cuenta todos los valores de la
variable.
3. Es lógica desde el punto de vista algebraico.
4. La media aritmética es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que
tengan clases abiertas.
6. La media aritmética es única, o sea, un conjunto de datos
numéricos tiene una y solo una media aritmética.
7. Esta medida es
poblaciones.
muy útil para analizar y comparar dos o más
Media aritmética con datos no agrupados
La media aritmética poblacional y muestral de datos no
agrupados, es la suma de todos los valores de la población o
muestra, dividido para el número total de los datos.
Fórmula poblacional
La fórmula está dada por:
μ=
∑ 𝑥𝑖
N
donde:
Página 59
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
μ
Es la representación de la media de la población, con
letra griega “mu” minúscula.
N
Indica el número total de elementos de la población.
𝑥𝑖
Es cualquier valor en particular.

La letra griega “sigma” mayúscula, es para sumar los
datos.
∑ 𝑥𝑖
Indica que es la sumatoria total de los valores de 𝑥.
La característica que mide a la población, está representada
por el parámetro. Es una característica de una población.
Ejemplo de aplicación 1
Las edades de un equipo titular de básquet de la liga ecuatoriana
es: 22, 28, 19, 25 y 26. Calcular la media de edad de los
jugadores.
Solución
El equipo titular de básquet contiene cinco jugadores, en
consecuencia, se trata de la población o equipo titular.
𝑁 = 5, equipo titular
∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 22 + 28 + 19 + 25 + 26 = 120
μ=
∑ 𝑥𝑖 120
=
= 24 𝑎ñ𝑜𝑠
N
5
μ=
∑ 𝑥𝑖 120
=
N
5
μ = 24 𝑎ñ𝑜𝑠
Interpretación del resultado
El equipo titular de básquet está conformado con una media de
edad de 24 años.
Página 60
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 2
El bufete de abogados Emily’s Asociados tiene 10 socios, el día
de hoy estos socios atendieron el siguiente número de clientes.
Bufete de
Abogados
Socio 1
Socio 2
Socio 3
Socio 4
Socio 5
Socio 6
Socio 7
Socio 8
Socio 9
Socio 10
No. de clientes
𝒙𝒊
5
10
8
6
7
6
12
11
10
5
a. ¿Esta información es una muestra o una población?
b. ¿Cuál es el número medio de clientes atendidos por los 10
socios del bufete?
Solución
Es
socios
media
dividir
una población, puesto que se toma en cuenta a todos los
del bufete de abogados Emily’s Asociados y para sacar la
aritmética poblacional, se debe sumar todos los valores y
para el número total de los socios atendidos.
𝑁 = 10
∑ 𝑥𝑖 = 80
μ=
∑ 𝑥𝑖
80
=
N
10
μ=8
Interpretación del resultado
El valor medio de clientes atendidos por socio es 8.
Página 61
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Fórmula muestral
La fórmula está dada por:
𝑋̅ =
∑ 𝑥𝑖
𝑛
donde
𝑋̅ Media aritmética de la muestra
𝑛 Número de elementos de la muestra
∑ 𝑥𝑖
Indica que es la sumatoria total de los valores de 𝑥.
Ejemplo de aplicación 3
Un equipo de básquet de la liga ecuatoriana está conformado
por 12 jugadores, de los cuales se toma una muestra aleatoria de 5
de ellos, con el propósito de calcular la estatura promedio. Si sus
estaturas en centímetros son: 190, 208, 196, 205 y 206. ¿Cuál es
la media en centímetros?
Solución
El equipo completo de básquet contiene 12 jugadores, si se
considera a cinco de ellos, tomados de manera aleatoria, entonces
se tiene una muestra, ya que se ha considerado una parte del total.
𝑛 = 5, muestra aleatoria
∑ 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 190 + 208 + 196 + 205 + 206 = 1,005
𝑋̅ =
∑ 𝑥𝑖 1,005
=
n
5
𝑋̅ = 201 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠
Interpretación del resultado
La estatura promedio de la muestra de los jugadores de básquet
es de 201 centímetros.
Página 62
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Media aritmética con datos agrupados
En datos agrupados se pueden presentar dos grupos de tablas
de frecuencia.
Cuando una serie simple se le agrupa con frecuencias para
obtener la media aritmética, se multiplica la variable 𝑥𝑖 por la
frecuencia respectiva fi , se obtiene la suma de todos estos
productos y luego a este valor se lo divide para el número de
elementos 𝑛 (Suárez, 2015). La fórmula de cálculo está dada por:
Fórmula poblacional
𝜇=
𝑓1 𝑥1 + 𝑓2 𝑥2 + ⋯ + 𝑓𝑛 𝑥𝑛 ∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
=
∑𝑓
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛
𝑁
Donde ∑ 𝑓 = 𝑁 que es el número total de elementos de una
población.
Ejemplo de aplicación 4
En una fiesta infantil se encuentran 20 niños (as) de edades de
4 a 10 años, las edades en años están distribuidas de acuerdo a la
información siguiente.
𝒙𝒊
en años
4
5
6
7
8
9
10
Total
𝒇𝒊
frecuencia
3
2
3
1
6
1
4
20
Se requiere calcular la media aritmética.
Solución
Como
𝜇=
∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
∑𝑓
𝑁
Página 63
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Entonces, de acuerdo a la información prevista en la tabla del
problema, se tiene
𝜇=
(3)(4) + (2)(5) + (3)(6) + (1)(7) + (6)(8) + (1)(9) + (4)(10) 144
=
3+2+3+1+6+1+4
20
𝜇 = 7.2 𝑎ñ𝑜𝑠
Interpretación del resultado
El promedio de edad de los 20 niños y niñas que se encuentran
en la fiesta infantil es de 7.2 años.
Cuando una serie se la agrupa en intervalos para obtener la
media aritmética, se multiplica la marca de clase de intervalo 𝑥𝑖 por
la frecuencia respectiva 𝑓𝑖 , se obtiene la suma de todos estos
productos y luego a este valor se lo divide para el número de
elementos (Suárez, 2015). La fórmula de cálculo está dada por:
𝜇=
𝑓1 𝑥1 + 𝑓2 𝑥2 + ⋯ + 𝑓𝑛 𝑥𝑛 ∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
=
∑𝑓
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛
𝑁
Donde 𝑥𝑖 es la marca de clase de los intervalos.
La fórmula para el cálculo de la marca de clase es:
′
𝑥𝑖−1
+ 𝑥𝑖′
𝑥𝑖 =
2
Donde
′
𝑥𝑖−1
= 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑥𝑖′ = 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
Ejemplo de aplicación 5
La edad de los estudiantes de la modalidad a distancia de la
Facultad de Ciencias Administrativas de la UCE, matriculados en el
periodo abr – sep del 2015, arrojaron los resultados siguientes.
Página 64
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
EDAD (AÑOS
CUMPLIDOS) 𝒙′𝒊−𝟏 +
𝒙′𝒊
[𝟏𝟖 – 𝟐𝟖) ᴬ
[𝟐𝟖 – 𝟑𝟖)
[𝟑𝟖 – 𝟒𝟖)
[𝟒𝟖 – 𝟓𝟖)
MÁS DE 57
TOTAL
MARCA DE CLASE
𝒙𝒊
NÚMERO
18 + 28
= 23
2
28 + 38
= 33
2
38 + 48
= 43
2
48 + 58
= 53
2
1,146
573
291
113
52
2,175
ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa
que el 28 no está incluido, pero si incluye los valores cercanos al 28
por la izquierda.
Se requiere calcular la media de edad en años.
Solución
Se ha considerado a todos los estudiantes de la modalidad a
distancia de la Facultad de Ciencias Administrativas de la UCE, se
trata de toda la población.
En consecuencia
𝜇=
∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
∑𝑓
𝑁
Entonces, de acuerdo a la información prevista en la tabla del
problema y a la característica cinco de la media aritmética, no es
posible el cálculo de 𝑓𝑖 𝑥𝑖 , en razón que el quinto intervalo es
abierto.
Fórmula muestral
𝑋̅ =
∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
∑𝑓
𝑛
Ejemplo de aplicación 6
Si de los estudiantes de la modalidad a distancia de la Facultad
de Ciencias Administrativas de la UCE, se toma como muestra a 50
Página 65
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
matriculados de manera aleatoria en el periodo abr – sep del 2015,
para determinar la media de estatura en centímetros. Entonces, de
acuerdo a las mediciones correspondientes se tiene.
𝑿′𝒊−𝟏 − 𝑿′𝒊
𝒙𝒊
𝒇𝒊
[150 – 156)
[156 – 162)
[162 – 168)
[168 – 174)
[174 – 180)
[180 – 186)
153
159
165
171
177
183
10
6
6
11
9
8
50
∑=
Solución
Como
𝑋̅ =
∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
∑𝑓
𝑛
Entonces, adecuando la tabla de información del problema y
obteniendo la marca de clase 𝒙𝒊 , se tendría:
𝑿′𝒊−𝟏 − 𝑿′𝒊
𝒙𝒊
𝒇𝒊
[150 – 156)
[156 – 162)
[162 – 168)
[168 – 174)
[174 – 180)
[180 – 186)
153
159
165
171
177
183
10
6
6
11
9
8
50
∑=
𝒙𝒊 𝒇 𝒊
1,530
954
990
1,881
1,593
1,464
8,412
Reemplazando en la fórmula, queda:
𝑋̅ =
8,412
= 168.24 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠
50
Página 66
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
2.3.2
MEDIA PONDERADA
En ocasiones es necesaria la obtención de una media aritmética
de variables cuyos valores observados tienen distinta importancia y
por tanto se deben ponderar de distinta manera para obtener la
media.
En el caso que la ponderación sea distinta, se habla de una
media ponderada y los valores por los cuales se ponderan los
distintos valores se llaman pesos o ponderaciones (𝑤𝑖).
La fórmula está dada por:
𝑋̅𝑤 =
𝑤1 𝑥1 + 𝑤2 𝑥2 + 𝑤3 𝑥3 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
A la fórmula se le resume de la siguiente forma:
𝑋̅𝑤 =
∑𝑛𝑖=1 𝑤𝑖 𝑥𝑖
∑𝑛𝑖=1 𝑤𝑖
Siendo:
𝑋̅𝑤 = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎
Que se lee: “X barra subíndice W”
Ejemplo de aplicación 7
A continuación se muestran las ponderaciones de las
evaluaciones en los cursos de estadística y las calificaciones de un
estudiante durante el semestre.
Evaluación
Parcial 1
Parcial 2
Examen final
Tema especial
Otras evaluaciones
Nota 𝒙𝒊
9
7
8
9
8.4
Porcentaje
𝒘𝒊
30
30
20
10
10
Determine la calificación promedio del estudiante.
Página 67
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Solución
Como
𝑋̅𝑤 =
𝑤1 𝑥1 + 𝑤2 𝑥2 + 𝑤3 𝑥3 + ⋯ + 𝑤𝑛 𝑥𝑛
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
Entonces
𝑋̅𝑤 =
(30)(9) + (30)(7) + (20)(8) + (10)(9) + (10)(8.4)
30 + 30 + 20 + 10 + 10
𝑋̅𝑤 =
814
100
𝑋̅𝑤 = 8.14 𝑝𝑢𝑛𝑡𝑜𝑠
La calificación promedio del estudiante de los cinco ítems
evaluados es de 8.14 puntos.
2.3.3
LA MEDIANA
La mediana de un conjunto finito de valores, es aquel valor que
divide al conjunto en dos partes iguales, de forma que el número de
valores mayor o igual a la mediana es igual al número de valores
menores o igual a estos. Su aplicación se ve limitada ya que solo
considera el orden jerárquico de los datos y no alguna propiedad
propia de los datos, como en el caso de la media.
Mediana de datos no agrupados
Los criterios necesarios para calcular
siguientes:
la mediana, son los
a. Se requiere es ordenar los datos en forma ascendente o
descendente, cualquiera de las ordenaciones conducen al mismo
resultado. Esto es: 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 .
b. Si N es Impar, hay un término central, el término 𝑋𝑁+1 , que será el valor
2
de la mediana.
c. Si N es Par, hay dos términos centrales, 𝑋𝑁 y 𝑋𝑁+1 , la mediana será la
2
2
media de esos dos valores
Página 68
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Características:

Para el cálculo de la mediana interesa que los valores estén
ordenados de menor a mayor o viceversa.

La mediana no es afectada por valores extremos.

Puede ser calculada en distribuciones de frecuencia con clases
abiertas.
La notación más usual que se utiliza para representar a la
mediana son 𝑀𝑒, 𝑀𝑑, 𝑥̃
Fórmula para población y muestra impar
𝑀𝑒 = 𝑋𝑁+1
2
𝑀𝑒 = 𝑋𝑛+1
2
Donde 𝑋𝑁+1 y 𝑋𝑛+1 , es la posición que ocupa el valor de la
mediana.
2
2
Ejemplo de aplicación 8
El contenido de cinco botellas de gaseosas denominadas
personal son seleccionadas de forma aleatoria de un lote de
producción en ml, al medir sus contenidos se tiene: 235.4, 236.3,
234.9, 236.4, y 236.0. ¿Cuál es la mediana de las observaciones
muestreadas?
Solución
Primero se ordena de mayor a menor, entonces:
234.9, 235.4, 236.0, 236.3, 236.4
Aplicando la regla para el cálculo de la mediana de datos no
agrupados de un conjunto de elementos impar, se tiene:
𝑀𝑒 = 𝑋𝑛+1
2
𝑛+1 5+1
=
=3
2
2
Página 69
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
El tres es la posición de la serie de elementos ordenados y
contados de izquierda a derecha, por lo que se tendría que:
𝑀𝑒 = 236.0
234.9, 235.4, 236.0, 236.3, 236.4
Fórmula para población y muestra par
𝑀𝑒 =
𝑀𝑒 =
Donde
mediana.
𝑋𝑁 +𝑋𝑁
2
2
2
+1
y
𝑋𝑛 +𝑋𝑛
2
2
+1
2
𝑋𝑁 + 𝑋𝑁+1
2
2
2
𝑋𝑛 + 𝑋𝑛+1
2
2
2
, es la posición que ocupa el valor de la
Ejemplo de aplicación 9
El contenido de seis botellas de gaseosas denominadas personal
son seleccionadas de forma aleatoria de un lote de producción en
ml, al medir sus contenidos se tiene: 235.4, 236.3, 234.9, 236.4,
237.2 y 236.0. ¿Cuál es la mediana de las observaciones
muestreadas?
Solución
Primero se ordena de mayor a menor, entonces:
234.9, 235.4, 236.0, 236.3, 236.4, 237.2
Aplicando la regla para el cálculo de la mediana de datos no
agrupados de un conjunto de elementos impar, se tiene:
𝑛
2
+
𝑛
2
2
+ 1
6
=
6
+2+1
2
2
=
7
= 3.5
2
El tres punto cinco, es la posición de la serie de elementos
ordenados y contados de izquierda a derecha, por lo que cuando la
serie contiene un número de elementos par, se contará con dos
elementos medios y se tendrá:
234.9, 235.4, 236.0, 236.3, 236.4, 237.2
Página 70
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑀𝑒 =
236.0 + 236.3
= 236.15
2
𝑀𝑒 == 169.64 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠
Mediana de datos agrupados
Cuando los datos se encuentran agrupados en una distribución
de frecuencia, no conocemos los datos originales, por lo tanto es
necesario estimar la mediana mediante los siguientes pasos:
1. Calcular el valor 𝑛/2 o 𝑁⁄2, según se trate.
2. Localizar el intervalo de clase donde se encuentra la mediana
(intervalo mediano). Esto se hace encontrando el primer
intervalo de clase donde la frecuencia acumulada es igual o
mayor que 𝑛/2.
3. Aplicar la siguiente fórmula de la mediana para datos
agrupados con respecto al intervalo mediano.
Fórmula de la mediana para una población.
𝑁
𝑀𝑒 = 𝐿𝑖−1 + (𝑐) 2
− 𝐹𝑖−1
𝑓𝑖
Fórmula de la mediana para una muestra.
𝑛
𝑀𝑒 = 𝐿𝑖−1 + (𝑐) 2
− 𝐹𝑖−1
𝑓𝑖
Donde:
𝑀𝑒 = 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑐
= 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐹𝑖−1 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
Características:

Existe una mediana para un conjunto de datos.
Página 71
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.

Para el cálculo de la mediana interesa que los valores estén
ordenados de menor a mayor o viceversa.

Al existir valores extremadamente grandes o muy pequeños la
mediana no se ve afectada.

Se calculará la mediana para una distribución de frecuencias
con una clase de extremo abierto. Cuando la mediana no se
encuentra en esa clase.
Ejemplo de aplicación 10
La edad de los estudiantes de la modalidad a distancia de la
Facultad de Ciencias Administrativas de la UCE, matriculados en el
periodo abr – sep del 2015, arrojaron los resultados siguientes.
EDAD (AÑOS
CUMPLIDOS) 𝒙′𝒊−𝟏 +
𝒙′𝒊
[𝟏𝟖 – 𝟐𝟖) ᴬ
[𝟐𝟖 – 𝟑𝟖)
[𝟑𝟖 – 𝟒𝟖)
[𝟒𝟖 – 𝟓𝟖)
MÁS DE 57
TOTAL
MARCA DE CLASE
𝒙𝒊
18 + 28
= 23
2
28 + 38
= 33
2
38 + 48
= 43
2
48 + 58
= 53
2
NÚMERO
1,146
573
291
113
52
2,175
ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa
que el 28 no está incluido, pero si incluye los valores cercanos al 28
por la izquierda.
Se requiere calcular la mediana de edad en años de los
estudiantes de la modalidad a distancia.
Solución
Se ha considerado a todos los estudiantes de la modalidad a
distancia de la Facultad de Ciencias Administrativas de la UCE, se
trata de toda la población.
En consecuencia
Página 72
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑁
𝑀𝑒 = 𝐿𝑖−1 + (𝑐) 2
− 𝐹𝑖−1
𝑓𝑖
Donde
𝑁 2,175
=
= 1,087.5
2
2
Completando la tabla para la aplicación de la fórmula, se tiene:
EDAD (AÑOS
CUMPLIDOS) 𝒙′𝒊−𝟏 +
𝒙′𝒊
[18 – 28)
[28 – 38)
[38 – 48)
[48 – 58)
MÁS DE 57
MARCA DE CLASE
𝒙𝒊
FRECUENCIA
𝒇𝒊
1,146
18 + 28
= 23
2
28 + 38
= 33
2
38 + 48
= 43
2
48 + 58
= 53
2
TOTAL
FRECUENCIA
ACUMULADA
𝑭𝒊
1,146
573
1,719
291
2,010
113
2,123
52
2,175
2,175
𝐿𝑖−1 =18
𝑐 = 10
𝐹𝑖−1 = 0
𝑓𝑖 = 1,146
Reemplazando
2,175
𝑀𝑒 = 18 + (10)
2
−0
1,146
= 18 + 9.49
𝑀𝑒 = 27.49 𝑎ñ𝑜𝑠
Ejemplo de aplicación 11
Si de los estudiantes de la modalidad a distancia de la Facultad
de Ciencias Administrativas de la UCE, se toma como muestra a 50
matriculados de manera aleatoria en el periodo abr – sep. del 2015,
para determinar la mediana de estatura en centímetros. Entonces,
de acuerdo a las mediciones correspondientes se tiene.
Página 73
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑿′𝒊−𝟏 − 𝑿′𝒊
𝒙𝒊
𝒇𝒊
[150 – 156)
153
10
[156 – 162)
159
6
[162 – 168)
165
6
[168 – 174)
171
11
[174 – 180)
177
9
[180 – 186)
183
8
Σ
50
Solución
Se ha considerado a una parte de los estudiantes de la
modalidad a distancia de la Facultad de Ciencias Administrativas de
la UCE, se trata de una muestra.
En consecuencia
𝑛
𝑀𝑒 = 𝐿𝑖−1 + (𝑐) 2
− 𝐹𝑖−1
𝑓𝑖
Donde
𝑛 50
=
= 25
2
2
𝐿𝑖−1 =168
𝑐=6
𝐹𝑖−1 = 22
𝑓𝑖 = 11
Completando la tabla para la aplicación de la fórmula, se tiene:
𝑿′𝒊−𝟏 − 𝑿′𝒊
𝒙𝒊
𝒇𝒊
𝑭𝒊
[150 – 156)
153
10
10
[156 – 162)
159
6
16
[162 – 168)
165
6
22
[168 – 174)
171
11
33
[174 – 180)
177
9
42
[180 – 186)
183
8
50
∑=
50
Página 74
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Reemplazando
50
𝑀𝑒 = 168 + (6)
2
− 22
11
= 168 + 1.64
𝑀𝑒 = 169.64
2.3.4 MODA
La moda es el valor de la variable que tiene mayor frecuencia
absoluta o la que más se repite.
Características
1. Es la única medida de centralización que tiene sentido estudiar
en una variable cualitativa, pues no precisa la realización de
ningún cálculo.
2. En su determinación no se incluyen todos los valores de la
variable.
3. El valor de la moda puede ser afectado grandemente por el
método de designación de los intervalos de clases.
4. Puede ser calculada en distribuciones de frecuencia que tengan
clases abiertas.
5. No es afectada por valores extremos.
6. Por su propia definición, la moda no es única, pues puede haber
dos o más valores de la variable que tengan la misma
frecuencia, siendo esta máxima; en cuyo caso se tendrá una
distribución bimodal o polimodal, según el caso.
Moda de datos no agrupados
La moda es una medida que se relaciona con la frecuencia con
que se presenta el dato o los datos con mayor incidencia; por lo
que se considera la posibilidad de que exista más de una moda para
un conjunto de datos.
La notación más frecuente es la siguiente: 𝑀𝑜 y 𝑥̂. Esta medida
es aplicable tanto para datos cualitativos como cuantitativos.
Página 75
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Forma de cálculo
𝑀𝑜 = 𝑓𝑖 𝑚á𝑥𝑖𝑚𝑎
𝑓𝑖 máxima, quiere decir que es la de mayor frecuencia absoluta
Tipos de moda
1. Unimodal. La moda es única.
2. Polimodal. Por su propia definición, la moda puede no ser
única, pues puede haber dos o más valores de la variable que
tengan la misma frecuencia, siendo esta máxima; en cuyo caso se
tendrá una distribución bimodal o polimodal según el caso
(Universidad Michoacana de San Nicolás de Hidalgo, 2015).
Ejemplo de aplicación 12
Determinar la moda del siguiente conjunto de datos:
1, 2, 3, 3, 4, 5, 6, 7, 7, 3, 1, 9, 3.
Solución
Para mayor facilidad, si se ordena de manera ascendente se
tiene:
1, 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 7, 9.
Se identifica el elemento que más se repite, por lo cual
𝑀𝑜 = 3
Por tanto, la moda del conjunto de datos es igual a 3 y si
considera unimodal.
Ejemplo de aplicación 13
Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4,
4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 3, 4.
Solución
Para mayor facilidad, si se ordena de manera ascendente se
tiene: 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 6,
Se identifica los elementos que más se repite, por lo cual
Página 76
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑀𝑜 = 3, y
𝑀𝑜 = 4
Las modas de este conjunto de datos son 3 y 4, ya que ambas
tienen la más alta frecuencia y se determina que es bimodal.
Ejemplo de aplicación 14
Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4,
5, 6, 7, 8, 9
Solución
La muestra no contiene dato o datos repetidos, por lo que se
considera que la muestra es amodal.
Moda de datos agrupados
Para determinar la moda de datos agrupados se debe utilizar
intervalos con igual amplitud.
Fórmula
La fórmula de cálculo para la moda de datos agrupados está
dada por:
𝑀𝑜 = 𝐿𝑖−1 + (𝑐)
∆𝑓𝑖
∆𝑓𝑖 + ∆𝑓𝑠
Nomenclatura
𝑀𝑜 = 𝑀𝑜𝑑𝑎
𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑐 = 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
∆𝑓𝑖 = 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑜𝑑𝑎𝑙 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
∆𝑓𝑠 = 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑜𝑑𝑎𝑙 𝑠𝑜𝑏𝑟𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1
∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1
Página 77
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 15
La edad de los estudiantes de la modalidad a distancia de la
Facultad de Ciencias Administrativas de la UCE, matriculados en el
periodo abr – sep del 2015, arrojaron los resultados siguientes.
EDAD (AÑOS
CUMPLIDOS)
𝒙′𝒊−𝟏 + 𝒙′𝒊
[𝟏𝟖 – 𝟐𝟖) ᴬ
[𝟐𝟖 – 𝟑𝟖)
[𝟑𝟖 – 𝟒𝟖)
[𝟒𝟖 – 𝟓𝟖)
MÁS DE 57
TOTAL
FRECUENCIA
𝒇𝒊
1,146
573
291
113
52
2,175
ᴬ El símbolo “[18”, significa que incluye el 18; y “28)”, significa que el 28 no
está incluido, pero si incluye los valores cercanos al 28 por la izquierda.
Se requiere calcular la moda de edad en años de los estudiantes
de la modalidad a distancia.
Solución
Se ha considerado a todos los estudiantes de la modalidad a
distancia de la Facultad de Ciencias Administrativas de la UCE, se
trata de toda la población.
En consecuencia
𝑀𝑜 = 𝐿𝑖−1 + (𝑐)
∆𝑓𝑖
∆𝑓𝑖 + ∆𝑓𝑠
Donde
∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1
𝑓𝑖−1 = 0
𝑓𝑖 = 1,146
∆𝑓𝑖 = 1,146 − 0 = 1,146
∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1
Página 78
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑓𝑖+1 = 573
𝑓𝑖 = 1,146
∆𝑓𝑠 = 1,146 − 573 = 573
𝐿𝑖−1 =18
𝑐 = 10
Reemplazando
𝑀𝑜 = 18 + (10)
573
= 18 + 10
1,146 − 573
𝑀𝑜 = 28 𝑎ñ𝑜𝑠
2.3.5
MEDIA GEOMÉTRICA
La media geométrica nos permite encontrar el promedio de
porcentajes, razones, índices o tasas de crecimiento, es utilizada
ampliamente en los negocios y la economía, ya que frecuentemente
permite determinar el cambio porcentual en ventas, sueldos, o
cifras económicas, como el Producto Interno Bruto.
La media geométrica al ser un conjunto de n números positivos
se realiza como la raíz n-enésima del producto de n valores.
Características
1. Se toman en cuenta todos los valores de la variable
2. Se utiliza cuando se quiere dar importancia a valores pequeños
de la variable
3. Su valor no es muy influenciable por datos extremos grandes.
4. No puede ser calculada en distribuciones con clase abiertas.
5. Es usada para promediar razones, tasas de cabio, interés
compuesto y números índices. Es recomendada para datos de
progresión geométrica
Fórmula de la media geométrica de datos no agrupados.
Está dada por:
Página 79
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑛
𝑛
𝑀𝑜 = 𝐺 = 𝑀𝑔 = √∏ 𝑥𝑖 = 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 ∗ ⋯ ∗ 𝑥𝑛
𝑖=1
Nomenclatura
𝑀𝑜 = 𝐺 = 𝑀𝑔 = 𝑚𝑒𝑑𝑖𝑎 𝑔𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎
𝑥𝑖 = 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑜 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑠𝑢𝑗𝑒𝑡𝑜𝑠 𝑎 𝑙𝑎 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝐺.
𝑖 = 1, 2, 3, ⋯ , 𝑛
Usando logaritmos la fórmula queda como:
log 𝑀𝑔 =
∑ 𝑙𝑜𝑔 𝑥𝑖
𝑛
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
∑ 𝑙𝑜𝑔𝑥𝑖
𝑛
Ejemplo de aplicación 16
Si los precios por acción de uno de los supermercados de la
cuidad en los últimos cuatro meses fueron; 4.75, 5.23, 4.78 y 6.32
dólares por unidad. Calcular el factor de crecimiento promedio y el
crecimiento porcentual promedio.
Solución
Se considera el factor de crecimiento mes a mes, esto es
por lo que el primer factor se tendría
𝑥𝑖+1
5.23
4.78
4.75
5.23
, el segundo sería
𝑥𝑖
,
, y así
sucesivamente. Para el cálculo de la media geométrica se tienen
dos formas de solución, de acuerdo a las fórmulas dadas.
Primer método.
Aplicando la fórmula radical, se tiene:
3
𝑀𝑔 = √
5.23 4.78 6.32
3
×
×
= √1.33053 = 1.0999
4.75 5.23 4.78
El 1.0999 es factor de crecimiento promedio y para obtener el
crecimiento se aplica la siguiente formula:
Página 80
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = (𝑀𝑔 − 1) × 100 = (1.0999 − 1) × 100
𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 9.99%
Segundo método.
Aplicando la fórmula logarítmica se tiene:
𝒙𝒊
5.23
= 1.101053
4.75
4.78
= 0.913958
5.23
6.32
= 1.322176
4.78
𝒍𝒐𝒈𝒙𝒊
0.041808
-0.039074
0.121289
0.124023
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
∑ 𝑙𝑜𝑔𝑥𝑖
𝑛
0.124023
3
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔0.041341
𝑀𝑔 = 1.0999
El 1.0999 es factor de crecimiento promedio y el crecimiento
porcentual promedio es:
𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = (𝑀𝑔 − 1) × 100 = (1.0999 − 1) × 100
𝐶𝑟𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = 9.99%
Fórmula de la media geométrica de datos agrupados.
Está dada por:
log 𝑀𝑔 =
∑ 𝑓𝑖 𝑙𝑜𝑔 𝑥𝑖
𝑛
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
∑ 𝑓𝑖 𝑙𝑜𝑔𝑥𝑖
𝑛
Página 81
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 17
Si de los estudiantes de la modalidad a distancia de la Facultad
de Ciencias Administrativas de la UCE, se toma como muestra a 10
matriculados de manera aleatoria en el periodo abr – sep del 2015,
para determinar la media geométrica de estatura en centímetros.
Entonces, de acuerdo a las mediciones correspondientes se tiene.
ESTATURA (EN
CENTÍMETROS)
𝒙′𝒊−𝟏 + 𝒙′𝒊
[𝟏𝟓𝟎 – 𝟏𝟔𝟎)
[𝟏𝟔𝟎 – 𝟏𝟕𝟎)
[𝟏𝟕𝟎 – 𝟏𝟖𝟎)
TOTAL
MARCA DE
CLASE 𝒙𝒊
FRECUENCIA
𝒇𝒊
155
165
175
5
3
2
10
Solución
Se ha considerado a una parte de los estudiantes de la
modalidad a distancia de la Facultad de Ciencias Administrativas de
la UCE, se trata de una muestra.
En consecuencia
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
∑ 𝑓𝑖 𝑙𝑜𝑔𝑥𝑖
𝑛
Adecuando la tabla de datos a para la aplicación de la fórmula de
𝑀𝑜 , se tiene:
ESTATURA (EN
CENTÍMETROS)
𝒙′𝒊−𝟏 + 𝒙′𝒊
[𝟏𝟓𝟎 – 𝟏𝟔𝟎)
[𝟏𝟔𝟎 – 𝟏𝟕𝟎)
[𝟏𝟕𝟎 – 𝟏𝟖𝟎)
TOTAL
MARCA DE
CLASE 𝒙𝒊
FRECUENCIA
𝒇𝒊
155
165
175
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
5
3
2
10
𝒍𝒐𝒈 𝒙𝒊
𝒇𝒊 𝒍𝒐𝒈𝒙𝒊
2.19033
2.21748
2.24303
10.95165
6.65244
4.48606
22.09015
22.09015
10
Página 82
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑀𝑔 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔 2.209015
𝑀𝑔 = 161.81 𝑐𝑒𝑛𝑡í𝑚𝑒𝑡𝑟𝑜𝑠
2.3.6
MEDIA ARMÓNICA
La Media Armónica, se representa como 𝑀𝐻 y 𝑀−1 .
Dada una serie de datos 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 , el inverso de la media
armónica de la variable 𝑥 es igual a la media aritmética del inverso
de los valores de la variable (Martínez, 2012).
Características




Es de gran utilidad cuando la variable está dada en forma de
tasa.
La media armónica se basa en todas las observaciones por lo
que está afectada por todos los valores de la variable.
Un valor de la variable de cero, invalida su cálculo.
La media armónica está rígidamente definida y su resultado no
puede ser usado en cálculos posteriores.
Fórmula de datos no agrupados
1
1
= 𝑀( )
𝑀−1
𝑥𝑖
𝑠𝑖𝑒𝑛𝑑𝑜 →
𝑀−1 =
𝑛
∑
1
𝑥𝑖
Fórmula de datos agrupados
𝑀𝐻 = 𝑀−1 =
𝑛
∑
𝑓𝑖
𝑥𝑖
Se adapta para tasas medias de velocidad, tiempo, rendimiento,
precio, etc.
Nomenclatura
𝑀𝐻 = 𝑀−1 = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑚ó𝑛𝑖𝑐𝑎
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒
Ejemplo de aplicación 18
Suponga que se tiene seis observaciones con los siguientes valores:
2, 8, 6, 3, 5, 4 y se quiere calcular la media armónica.
Página 83
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Solución
Al aplicar la fórmula de datos no agrupados, se tiene
𝑛
𝑀𝐻 = 𝑀−1 =
𝑀𝐻 = 𝑀−1 = 1
2
∑
1
𝑥𝑖
6
1
1
1
1
1=
+8+6+3+5+4
𝑀𝐻 = 𝑀−1 =
6
63
40
240
63
𝑀𝐻 = 𝑀−1 = 3.81 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠
Ejemplo de aplicación 19
Con los datos de la siguiente tabla de frecuencias, de una
distribución continua, calcular la media armónica.
𝒇𝒊
𝒙𝒊
𝒙′𝒊−𝟏 + 𝒙′𝒊
𝒙𝒊
𝒇𝒊
2.1 – 6
4
1
0.25
6.1 - 10
8
3
0.38
10.1 - 14
12
4
0.33
14.1 - 18
16
2
0.13
Σ
10
1.08
Solución
Al aplicar la fórmula de datos no agrupados, se tiene
𝑀𝐻 = 𝑀−1 =
𝑀𝐻 = 𝑀−1 =
𝑛
∑
𝑓𝑖
𝑥𝑖
10
1.08
𝑀𝐻 = 𝑀−1 = 9.26 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠
Página 84
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
2.4 FORMA DE LA DISTRIBUCIÓN
2.4.1
RELACIÓN ENTRE MEDIA ARITMÉTICA,
MEDIANA Y MODA
En distribuciones totalmente simétricas, la media, la mediana y
la moda coinciden, localizándose en un mismo valor. En cambio, en
distribuciones moderadamente asimétricas, la siguiente relación se
mantiene aproximadamente:
Posiciones relativas de la media, la mediana y la moda para
curvas de frecuencias asimétricas a derecha e izquierda
respectivamente, para curvas simétricas los tres valores coinciden
(Cabrera, 2015)
Ejemplo de aplicación 20
Una granja ganadera registro durante febrero el nacimiento de
29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente:
22
40
43
31
40
43
33
40
44
34
41
45
35
41
46
36
42
46
37
42
46
38
42
46
38
42
50
39
42
Los datos anteriores al ser dispuestos en una tabla de
distribución de frecuencias se obtuvo la siguiente tabla resultante.
Página 85
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Clases
𝒙′𝒊−𝟏 + 𝒙′𝒊
21.5 – 26.5
26.5 – 31.5
31.5 – 36.5
36.5 – 41.5
41.5 – 46.5
46.5 – 51.5
Total
Frecuencia
𝒇𝒊
1
1
4
9
13
1
29
Calcule en las dos variantes (datos no agrupados y datos
agrupados) la media aritmética, la mediana y la moda.
Solución
Datos no agrupados:
Los nacimientos registrados en el mes de febrero es de 29
terneros, razón por la que se trata de un valor poblacional
22
40
43
31
40
43
33
40
44
34
41
45
35
41
46
36
42
46
37
42
46
38
42
46
38
42
50
39
42
Media aritmética.
La fórmula de cálculo es
μ=
∑ 𝑥𝑖
N
Reemplazando los datos, se tiene
μ=
22 + 31 + 33 + ⋯ + 46 + 50
29
μ=
1,164
= 40.14 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
29
Mediana
La fórmula de cálculo es
𝑀𝑒 = 𝑋𝑁+1
2
Página 86
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑋𝑁+1 = 𝑋29+1 = 𝑋30 = 𝑋15
2
2
2
Sustituyendo 𝑋15 , se tiene
𝑀𝑒 = 𝑋15 = 41 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Moda
La fórmula de cálculo es
𝑀𝑜 = 𝑓𝑖 𝑚á𝑥𝑖𝑚𝑎
La frecuencia mayor se encuentra en el número 42, donde
𝑓𝑖 = 5.
Por tanto, se tiene que
𝑀𝑜 = 42 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Al comparar 𝜇, 𝑀𝑒 𝑦 𝑀𝑜, se tiene:
μ = 40.14 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
𝑀𝑒 = 41 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
𝑀𝑜 = 42 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Como
𝝁 < 𝑴𝒆 < 𝑴𝒐
Entonces, la distribución es asimétrica hacia la izquierda.
Página 87
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Datos agrupados:
Para el cálculo de la media, mediana y moda, es necesario
adecuar la tabla proporcionada, por la siguiente.
Clases
𝐱 ′𝐢−𝟏 + 𝐱 ′𝐢
21.5
26.5
31.5
36.5
41.5
46.5
–
–
–
–
–
–
26.5
31.5
36.5
41.5
46.5
51.5
Marca
clase 𝒙𝒊
de
Frecuencia
𝒇𝒊
24
29
34
39
44
49
Σ
𝒙𝒊 𝒇 𝒊
1
1
4
9
13
1
29
24
29
136
351
572
49
1,161
Frecuencia
acumulada
𝑭𝒊
1
2
6
15
28
29
Media aritmética.
La fórmula de cálculo es
𝜇=
∑ 𝑓𝑖 𝑥𝑖 ∑ 𝑓𝑥
=
∑𝑓
𝑁
Reemplazando los datos, se tiene
𝜇=
1,161
29
𝜇 = 40.03 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Mediana
La fórmula de cálculo es
𝑁
𝑀𝑒 = 𝐿𝑖−1 + (𝑐) 2
− 𝐹𝑖−1
𝑓𝑖
Para la aplicación de la fórmula, es necesario identificar el
renglón de la clase mediana, para lo cual el número de elementos
se divide para dos.
𝑁 29
=
= 14.5
2
2
Página 88
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Como 14.5 es la mitad del total, buscamos en la columna de 𝐹𝑖
el valor más cercano mayor a 14.5, obteniéndose el renglón
36.5 – 41.5
39
9
351
15
En base a este renglón y sus relacionados en la tabla, se
procede a su reemplazo.
29
𝑀𝑒 = 36.5 + (5)
2
−6
9
𝑀𝑒 = 36.5 + (5)(0.94444) = 36.5 + 4.7222
𝑀𝑒 = 41.22 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Moda
La fórmula de cálculo es
𝑀𝑜 = 𝐿𝑖−1 + (𝑐)
∆𝑓𝑖
∆𝑓𝑖 + ∆𝑓𝑠
Para la aplicación de la fórmula, es necesario identificar el
renglón de la clase modal, la cual está dada por el intervalo de
clase con mayor frecuencia, esto es
41.5 – 46.5
44
13
572
28
En base a este renglón y sus relacionados en la tabla, se
procede a su reemplazo.
Entonces
∆𝑓𝑖 = 𝑓𝑖 − 𝑓𝑖−1 = 13 − 9 = 4
∆𝑓𝑠 = 𝑓𝑖 − 𝑓𝑖+1 = 13 − 1 = 12
Reemplazando en la fórmula, se tiene
𝑀𝑜 = 41.5 + (5)
4
4 + 12
𝑀𝑜 = 41.5 + (5)(0.25) = 41.5 + 1.25
Página 89
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑀𝑜 = 42.75 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Al comparar 𝜇, 𝑀𝑒 𝑦 𝑀𝑜, se tiene:
μ = 40.03 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
𝑀𝑒 = 41.22 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
𝑀𝑜 = 42.75 𝑘𝑖𝑙𝑜𝑔𝑟𝑎𝑚𝑜𝑠
Como
𝝁 < 𝑴𝒆 < 𝑴𝒐
La gráfica de la distribución, sería aproximadamente así.
2.5 CUARTILES, DECILES Y PERCENTILES
Está claro que para localizar cuál es el valor que se encuentra al
centro de un grupo de datos utilizamos la mediana y que ésta es el
valor que divide al grupo de datos en mitades. Pues bien, para
ciertos fines puede ser de mucha utilidad saber qué valor se
encuentra al primer cuarto del grupo de datos, o al tercer cuarto
del grupo de datos.
De esta forma:



Los cuartiles dividen a la distribución en cuartos
Los deciles en décimos, y
Los percentiles en 100 partes
Los cuales se obtienen con fórmulas que modifican la de la
mediana como en los siguientes ejemplos:
Página 90
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
2.5.1
Medidas de posición relativa
Estas medidas son también llamadas cuantilas, cuantiles o
fractiles y cuyo objetivo es describir el comportamiento de una
variable dividiendo la serie de valores en diferente número de
partes porcentualmente iguales, las más usadas son: los cuartiles
(cuartas partes), los deciles (decimas partes) y los centiles o
percentiles (centésimas partes).
Los Cuartiles
Son aquellos números que dividen a éstas en cuatro partes
porcentualmente iguales. Hay tres cuartiles 𝑄1 , 𝑄2 𝑦 𝑄3 . El primer
cuartil 𝑄1 , es el valor en el cual o por debajo del cual queda
aproximadamente un cuarto (25%) de todos los valores de la
sucesión (ordenada); El segundo cuartil 𝑄2 es el valor por debajo
del cual queda el 50% de los datos (Mediana), el tercer cuartil 𝑄3
es el valor por debajo del cual quedan las tres cuartas partes (75%)
de los datos.
Los Deciles
Son ciertos números que dividen el conjunto de observaciones
(ordenadas) en diez parte porcentualmente iguales. Los deciles se
denotan por 𝐷1 , 𝐷2 , ⋯ , 𝑄9 . El decil 5 corresponde al cuartil 2
(mediana).
Los Percentiles
Son ciertos números que dividen el conjunto de datos ordenados
en cien partes porcentualmente iguales. El percentil 50 equivale a
la mediana.
Considerando la definición de la mediana, esta será el segundo
cuartil, el quinto decil o el 50avo percentil o centil. En cualquiera de
estas medidas el valor matemático que se obtenga será
representativo del número de datos o menos que corresponde al
valor relativo planteado. (Ejemplo: el primer cuartil es un valor
representativo del 25% o menos de los valores de una distribución,
es decir, los valores inferiores de la distribución).
Cuantiles para datos no agrupados
Para ubicar los cuartiles, deciles y percentiles, se aplica la
siguiente fórmula, siendo este valor la posición donde se ubican.
Página 91
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ubicación de un centil:
𝐿𝑐 = (𝑛 + 1)
𝑃
100
donde:
𝐿𝑐, 𝑒𝑠 𝑙𝑎 𝑟𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙, 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑐𝑒𝑛𝑡𝑖𝑙.
𝑛, 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
𝑃, 𝑒𝑠 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙, 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑐𝑒𝑛𝑡𝑖𝑙.
Para calcular los cuartiles, deciles y centiles
ordenar los datos.
primero se debe
Ejemplo de aplicación 21
Con la información que siguiente:
18
58
23
58
38
59
41
60
43
62
45
63
50
63
51
66
52
71
53
77
54
83
54
84
58
95
Se pide:
a. Calcular el primer y tercer cuartil.
b. Calcular el sexto decil.
c. Calcular el ochenta percentil.
Solución
a. Calcular el primer y tercer cuartil.
Primer cuartil. Donde 𝑄1 = 𝑃25
𝐿𝑐 = (𝑛 + 1)
𝑃
100
Reemplazando los datos del problema en la fórmula general, se
tiene
𝐿𝑐 = (26 + 1)
25
100
Página 92
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐿𝑐 = 6.75 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
El valor observado indica la posición del primer cuartil.
En el conjunto de datos la posición del primer cuartil, ocupa la
posición 6 y 7, siendo 45 y 50 y se calcula de la siguiente manera:
6
45
7
50
Restamos el valor mayor del menor, es decir,
50 − 45 = 5
Se resta la posición del primer cuartil y el inmediato anterior
entero.
6.75 − 6 = 0.75
Se procede a multiplicar
5 ∗ 0.75 = 3.75
El resultado obtenido de la multiplicación más el valor menor, es
el primer cuartil; es decir,
45 + 3.75 = 48.75
A los cuartiles se les abrevia con la letra 𝑄, entonces el 𝑄1, es:
𝑄1 = 48.75
Tercer cuartil. Donde 𝑄3 = 𝑃75
𝐿𝑐 = (𝑛 + 1)
𝑃
100
Reemplazando los datos del problema en la fórmula general, se
tiene
𝐿𝑐 = (26 + 1)
75
100
𝐿𝑐 = 20.25 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
El valor observado indica la posición del tercer cuartil.
Página 93
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
En el conjunto de datos la posición del tercer cuartil, ocupa la
posición 20 y 21 siendo 63 y 66 y se calcula de la siguiente
manera:
20
63
21
66
Restamos el valor mayor del menor, es decir,
66 − 63 = 3
Se resta la posición del tercer cuartil y el inmediato anterior
entero.
20,25 – 20 = 0,25
Se procede a multiplicar
3 ∗ 0.25 = 0,75
El resultado obtenido de la multiplicación más el valor menor es
el tercer cuartil, es decir,
63 + 0.75 = 63.75
Por tanto,
𝑄3 = 63.75
b. Calcular el sexto decil.
𝐿𝑐 = (𝑛 + 1)
𝑃
100
El sexto decil es igual a 60 percentil, por tanto:
𝐿𝑐 = (26 + 1)
60
100
𝐿𝑐 = 16.2 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
Realizando la interpolación correspondiente, se tiene:
16
59
17
60
Página 94
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Restamos el valor mayor del menor, es decir:
60 − 59 = 1
Se resta la posición del sexto decil y el inmediato anterior
entero.
16.2 – 16 = 0.2
Se procede a multiplicar
1 ∗ 0.2 = 0.2
El resultado obtenido de la multiplicación más el valor menor, es
el sexto decil, es decir:
59 + 0.2 = 59.20
Por tanto
𝐷6 = 59.20
c. Calcular el ochenta percentil.
𝐿𝑐 = (𝑛 + 1)
𝑃
100
Reemplazando percentil 80, en P, entonces:
𝐿𝑐 = (26 + 1)
80
100
𝐿𝑐 = 21.16 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
Realizando la interpolación correspondiente, se tiene:
21
66
22
71
Restamos el valor mayor del menor, es decir:
71 − 66 = 5
Se resta la posición del percentil 80 y el inmediato anterior
entero.
Página 95
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
21.16 – 21 = 0.16
Se procede a multiplicar los resultados obtenidos
5 ∗ 0.16 = 0.8
El resultado obtenido de la multiplicación más el valor menor, es
el percentil 80, es decir:
66 + 0.8 = 66.80
Por tanto
𝑃80 = 59.20
Cuantiles para datos agrupados
Para calcular los cuartiles 𝑄𝑘 ,
aplica las fórmulas que siguen.
deciles 𝐷𝑘 y
𝑘𝑛
𝑄𝑘 = 𝐿𝑖−1 +
4
− 𝐹𝑖−1
𝑓𝑖
percentiles 𝑃𝑘 ,
se
∗ 𝑐𝑖
donde 𝑘 = 1,2,3
𝑘𝑛
𝐷𝑘 = 𝐿𝑖−1 + 10
− 𝐹𝑖−1
𝑓𝑖
∗ 𝑐𝑖
donde 𝑘 = 1,2,3, … , 9
𝑘𝑛
𝑃𝑘 = 𝐿𝑖−1 +
100
− 𝐹𝑖−1
𝑓𝑖
∗ 𝑐𝑖
donde 𝑘 = 1,2,3, … , 99
Nomenclatura
𝐿𝑖−1 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝑐 = 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝐹𝑖−1 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑜 𝑑𝑒𝑐𝑖𝑙 𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
Página 96
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 22
Para la tabla de salarios de la compañía P&R, encontrar:
a. Los cuartiles 𝑄1 , 𝑄2 𝑦 𝑄3 .
b. Decil 𝐷6 .
c. Percentil 𝑃80 .
Salarios
Frecuencia
𝒇𝒊
250.00 - 259.99
8
Frecuencia
acumulada
𝑭𝒊
8
260.00 - 269.99
10
18
270.00 - 279.99
16
34
280.00 - 289.99
14
48
290.00 - 299.99
10
58
300.00 - 309.99
5
63
310.00 - 319.99
2
65
Σ
65
Solución
a. Los cuartiles 𝑄1 , 𝑄2 𝑦 𝑄3 .
𝑘𝑛
𝑄𝑘 = 𝐿𝑖 +
4
− 𝐹𝑖−1
𝑓𝑖
∗ 𝑐𝑖
Para la aplicación de 𝑄1, tenga en cuenta que 𝑘 = 1, por
consiguiente
1∗65
𝑄1 = 260 +
𝑄1 = 260 +
4
−8
10
(10)
16.25 − 8
(10)
10
𝑄1 = 268.25
Para la aplicación de 𝑄2 , tenga en cuenta que 𝑘 = 2, por
Página 97
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
consiguiente
2∗65
4
𝑄2 = 270 +
𝑄2 = 270 +
− 18
16
(10)
32.5 − 18
(10)
16
𝑄2 = 279.06
Para la aplicación de 𝑄3 , tenga en cuenta que 𝑘 = 3, por
consiguiente
3∗65
𝑄3 = 290 +
𝑄3 = 289.995 +
4
− 48
10
(10)
48.75 − 48
(10)
10
𝑄3 = 290.75
b. Decil 𝐷6 .
𝑘𝑛
𝐷𝑘 = 𝐿𝑖−1 + 10
− 𝐹𝑖−1
𝑓𝑖
∗ 𝑐𝑖
Para la aplicación de 𝐷6 , tenga en cuenta que 𝑘 = 6, por
consiguiente
6∗65
𝐷6 = 280 +
10
− 34
14
∗ 10
𝐷6 = 280 + 3.57
𝐷6 = 283.57
c. Percentil 𝑃80 .
𝑘𝑛
𝑃𝑘 = 𝐿𝑖−1 +
100
− 𝐹𝑖−1
𝑓𝑖
∗ 𝑐𝑖
Para la aplicación de 𝑃80 , tenga en cuenta que 𝑘 = 80, por
consiguiente
Página 98
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑃80 = 290 +
52 − 48
∗ 10
10
𝑃80 = 290 + 4
𝑃80 = 294
2.6 ESTADÍGRAFOS DE DISPERCIÓN
Los métodos numéricos que describen a los conjuntos de
observaciones tienen como objetivo dar una imagen mental de la
distribución de frecuencias. Una vez localizado el centro de la
distribución de un conjunto de datos, lo que procede es buscar una
medida de dispersión de los datos (García Pérez, 2015).
La dispersión o variación es una característica importante de un
conjunto de datos porque intenta dar una idea de cuán esparcidos
se encuentran éstos. Se puede diferenciar dos tipos de dispersión,
las absolutas y relativas.
2.6.1
DISPERCIÓN ABSOLUTA
Se toma como punto central de referencia la media aritmética,
aunque puede considerarse además a la mediana. Entre las
medidas de dispersión absoluta se tiene al rango, desviación media,
varianza y desviación estándar.
Rango
Se obtiene sacando la diferencia entre el valor mayor y el valor
meno de un conjunto de datos.
Características




El rango es la medida de dispersión más sencilla de calcular e
interpretar.
Se basa en los valores extremos por lo que puede ser errática
El recorrido solo se encuentra influenciado por los valores
extremos y no considera el resto de valores de la variable.
Existe el peligro que el recorrido ofrezca una descripción
distorsionada de la dispersión cuando existe valores muy
pequeños o muy grandes.
Página 99
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Fórmula
𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 – 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜.
𝑅 = 𝑥𝑛 − 𝑥1
Nomenclatura
𝑅 = 𝑟𝑎𝑛𝑔𝑜
𝑥1 = 𝑝𝑟𝑖𝑚𝑒𝑟 𝑡é𝑟𝑚𝑖𝑛𝑜
𝑥𝑛 = ú𝑙𝑡𝑖𝑚𝑜 𝑡é𝑟𝑚𝑖𝑛𝑜
Ejemplo de aplicación 23
El número de pacientes atendidos en emergencias en una clínica
privada de la ciudad, en un periodo de 8 días del mes pasado fue:
3
1
5
8
2
4
8
3
5
8
8
Calcule e interprete el rango.
Solución:
La fórmula del rango es:
𝑅 = 𝑥𝑛 − 𝑥1
Ordenando la serie,
1
2
3
3
4
El número de elementos está dado por
𝑛=8
Por tanto
𝑅 = 𝑥8 − 𝑥1
Reemplazando valores en la fórmula, se tiene
𝑅 = 8−1=7
Página 100
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Desviación media
La desviación media es el promedio de los valores absolutos de
las desviaciones en relación de la media aritmética.
Características





Con datos no agrupados, guarda el mismo número de
dimensiones y observaciones.
La suma de valores absolutos es relativamente sencilla de
calcular.
Es engorroso trabajar con ella cuando se trata de poblaciones o
muestras grandes en datos no agrupados.
Cuanto mayor sea el valor de la desviación media, mayor es la
dispersión de los datos.
La desviación media al tomar los valores absolutos mide una
observación sin mostrar si la misma está por encima o por
debajo de la media aritmética.
Fórmula para datos no agrupados
𝐷𝑀 =
|𝑥𝑖 − 𝑋̅|
𝑛
Nomenclatura
𝑥𝑖 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛
𝑋̅ = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎.
𝑛 = 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
̅ | = 𝐸𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 −
|𝒙𝒊 − 𝑿
𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑐𝑜𝑛 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎
Ejemplo de aplicación 24
El número de pacientes atendidos en emergencias en una clínica
privada de la ciudad, en un periodo de 8 días del mes pasado fue:
3
1
5
8
2
4
8
3
Calcule e interprete la Desviación Media.
Página 101
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Solución.
Para la aplicación de la fórmula de 𝐷𝑀, primero se debe calcular
la media aritmética. Por tanto
̅
X=
̅
X=
∑ 𝑥𝑖
n
3 + 1 + 5 + 8 + 2 + 4 + 8 + 3 34
=
8
8
𝑋̅ = 4.25
Para una mejor comprensión se ha preparado una tabla en la
que se notará las operaciones necesarias y el valor absoluto
correspondiente.
̅|
|𝒙𝒊 − 𝑿
𝒙𝒊
3
1
5
8
2
4
8
3
34
|3
|1
|5
|8
|2
|4
|8
|3
−
−
−
−
−
−
−
−
4,25|
4,25|
4,25|
4,25|
4,25|
4,25|
4,25|
4,25|
=
=
=
=
=
=
=
=
|− 1.25|
|− 3.25|
|0.75|
|3.75|
|− 2.25|
|− 0.25|
| 3.75|
|−1.25|
Desviación
Absoluta
1.25
3.25
0.75
3.75
2.25
0.25
3.75
1.25
16.5
Con estos datos se calcula la desviación media en base a la
siguiente fórmula:
𝐷𝑀 =
|𝑥𝑖 − 𝑋̅|
𝑛
Reemplazando valores, se tiene:
𝐷𝑀 =
16.50
8
𝐷𝑀 = 2.06
Se observa que la desviación media es de 2.06 pacientes por
día, es decir que el número varía, en promedio, en
2.06
pacientes por día respecto de la media de 4.25 enfermos diarios.
Página 102
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Fórmula para datos agrupados.
Se emplea la ecuación:
𝐷𝑀 =
𝛴𝑓𝑖 |𝑥𝑚 − 𝑋̅|
𝑛
Nomenclatura
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑥𝑚 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑋̅ = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎.
𝑛 = 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠
Ejemplo de aplicación 25
Calcular la desviación media de las calificaciones finales en la
asignatura de matemáticas, de un curso de 40 estudiantes, según
datos de la tabla que sigue.
Calificación
(0 − 2]
(2 − 4]
(4 − 6]
(6 − 8]
(8 − 10]
Total
Cantidad de
estudiantes
2
4
8
16
10
40
Solución:
Para calcular la media aritmética se llena la siguiente tabla:
Calificación
(0 − 2]
(2 − 4]
(4 − 6]
(6 − 8]
(8 − 10]
Σ
Cantidad de
estudiantes
𝒇𝒊
2
4
8
16
10
40
Marca de
clase 𝒙𝒎
𝒇 𝒊 𝒙𝒎
1
3
5
7
9
Σ
2
12
40
112
90
256
Página 103
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Calculando la media aritmética se obtiene:
𝑋̅ =
∑ 𝑓𝑖 𝑥𝑖
𝑛
𝑋̅ =
256
40
𝑋̅ = 6.4
Para calcular la desviación media es necesario adecuar la tabla
de la siguiente forma:
Calificación
Cantidad de
estudiantes
𝒇𝒊
(0 − 2]
(2 − 4]
2
4
(4 − 6]
(6 − 8]
(8 − 10]
8
16
10
40
Σ
Marca de
clase 𝒙𝒎
1
3
5
7
9
̅|
|𝒙𝒎 − 𝑿
5.4
3.4
1.4
0.6
2.6
Σ
𝐷𝑀 =
̅|
𝒇𝒊 |𝒙𝒎 − 𝑿
10.8
13.6
11.2
9.6
26.0
71.2
𝛴𝑓𝑖 |𝑥𝑚 − 𝑋̅|
𝑛
𝐷𝑀 =
71.2
40
𝐷𝑀 = 1.78
Varianza
La varianza de un conjunto de datos se define como el cuadrado
de la desviación típica y viene dada en consecuencia por 𝜎 2 .
Cuando sea necesario distinguir la desviación típica de una
población
y
de
una
muestra,
se
usará 𝜎 2 o 𝑠 2 ,
correspondientemente.
La varianza no puede ser negativa.
Características


Para su cálculo se utilizan todos los valores.
No se ve influenciada por valores extremos.
Página 104
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.




La varianza indica el grado en que están dispersos los datos en
una distribución. A mayor medida, mayor dispersión.
La varianza es un número muy grande con respecto a las
observaciones, por lo que con frecuencia se vuelve difícil para
trabajar.
Debido a que la varianza siempre se expresa en términos de los
datos originales elevados al cuadrado, el resultado tiene
unidades de medida al cuadrado, lo cual no permite una
apreciación lógica.
Para solucionar las complicaciones que se tiene con la varianza,
se halla la raíz cuadrada de la misma, es decir, se calcula la
desviación estándar.
Fórmulas
Para el cálculo de la varianza poblacional y muestral se debe
tener en cuenta si se trata de datos agrupados o no agrupados.
Datos no agrupados
𝜎2 =
∑(𝑥𝑖 − 𝜇)2
𝑁
𝑠2 =
∑(𝑥𝑖 − 𝑋̅)2
𝑛−1
Datos agrupados
𝜎2 =
∑ 𝑓𝑖 (𝑥𝑖 − 𝜇)2
𝑁
𝑠2 =
∑ 𝑓𝑖 (𝑥𝑖 − 𝑋̅)2
𝑛−1
Nomenclatura
𝜎 2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑥𝑖 = 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
Página 105
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑡𝑖𝑚é𝑡𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑁 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑠 2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑋̅ = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑡𝑖𝑚é𝑡𝑖𝑐𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Ejemplo de aplicación 26
El número de pacientes atendidos en emergencias en una clínica
privada de la ciudad, en un periodo de 8 días del mes pasado fue:
3
1
5
8
2
4
8
3
Calcule e interprete la varianza.
Solución.
Para la aplicación de la fórmula de 𝑠 2 , primero se debe calcular
la media aritmética. Por tanto
̅
X=
̅
X=
∑ 𝑥𝑖
n
3 + 1 + 5 + 8 + 2 + 4 + 8 + 3 34
=
8
8
𝑋̅ = 4.25
La fórmula de la varianza muestral
𝑠2 =
∑(𝑥𝑖 − 𝑋̅)2
𝑛−1
Reemplazando los datos en la fórmula, se tiene.
(3 − 4.25)2 + (1 − 4.25)2 + (5 − 4.25)2 + (8 − 4.25)2
+(2 − 4.25)2 + (4 − 4.25)2 + (8 − 4.25)2 + (3 − 4.25)2
𝑠2 =
8−1
𝑠2 =
1.5625 + 10.5625 + 0.5625 + 14.0625 + 5.0625 + 0.0615 + 14.0625 + 1.5625
8−1
Página 106
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
47.50
8−1
𝑠2 =
𝑠 2 = 6.79 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 2
Ejemplo de aplicación 27
Calcular la varianza de las calificaciones finales en la asignatura
de matemáticas, de un curso de 40 estudiantes, según datos de la
tabla que sigue.
Calificación
Cantidad de
estudiantes
2
4
8
16
10
40
(0 − 2]
(2 − 4]
(4 − 6]
(6 − 8]
(8 − 10]
Total
Solución:
Para calcular la varianza es necesario primero calcular la media
aritmética, la siguiente tabla permite su cálculo.
Calificación
(0 − 2]
(2 − 4]
(4 − 6]
(6 − 8]
(8 − 10]
Σ
Cantidad de
estudiantes
𝒇𝒊
2
4
8
16
10
40
Marca de
clase 𝒙𝒊
𝒇 𝒊 𝒙𝒊
1
3
5
7
9
Σ
2
12
40
112
90
256
La media aritmética es:
𝑋̅ =
∑ 𝑓𝑖 𝑥𝑖
𝑛
𝑋̅ =
256
40
𝑋̅ = 6.4
Página 107
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Para calcular la varianza es necesario adecuar la tabla de la
siguiente forma:
Calificación
Cantidad de
estudiantes
𝒇𝒊
(0 − 2]
(2 − 4]
2
4
(4 − 6]
(6 − 8]
(8 − 10]
8
16
10
40
Σ
Marca de
clase 𝒙𝒊
̅ )𝟐
(𝒙𝒊 − 𝑿
̅ )𝟐
𝒇𝒊 (𝒙𝒊 − 𝑿
1
3
5
7
9
29.16
11.56
1.96
0.36
6.76
58.32
46.24
15.68
5.76
67.6
Σ
193.6
La fórmula para el cálculo de la varianza del problema, es
∑ 𝑓𝑖 (𝑥𝑖 − 𝑋̅)2
𝑠 =
𝑛−1
2
𝑠2 =
193.6
40 − 1
𝑠 2 = 4.96 𝑝𝑢𝑛𝑡𝑜𝑠 2
Desviación estándar
Es la medida más frecuentemente usada de variabilidad y se calcula
como la raíz cuadrada de la varianza.
Características



Expresa la cantidad de variabilidad promedio en una distribución.
Permite determinar cómo se distribuyen los valores en relación
con la media
Su fórmula es indistinta para distribuciones de datos originales o
agrupados.

Para solucionar las complicaciones que se tiene con la varianza,
se halla la raíz cuadrada de la misma, es decir, se calcula

la desviación estándar es un número pequeño expresado en
unidades de los datos originales y que tiene un significado
lógico.

A pesar de lo anterior, es difícil describir exactamente qué es lo
que mide la desviación estándar. Sin embargo, el teorema de
Página 108
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Chebyshev establece que para todo conjunto de datos en una
distribución, se cumple lo siguiente.
𝜇 ± 𝜎 ≅ 𝑎𝑙 68% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
𝜇 ± 2𝜎 ≅ 𝑎𝑙 95% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
𝜇 ± 3𝜎 ≅ 𝑎𝑙 99.74% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
Fórmula poblacional
𝜎 = √𝜎 2
Fórmula muestral
𝑠 = √𝑠 2
Nomenclatura
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Ejemplo de aplicación 28
Calcule las desviaciones estándar de los ejemplos de aplicación
26 y 27.
Ejemplos aplicación 26
Página 109
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Se tiene que
𝑠 2 = 6.79 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 2
Aplicando la fórmula de la desviación estándar
𝑠 = √6.79
𝑠 = 2.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠
Ejemplos de aplicación 27
Se tiene que
𝑠 2 = 4.96 𝑝𝑢𝑛𝑡𝑜𝑠 2
Aplicando la fórmula de la desviación estándar
𝑠 = √4.96
𝑠 = 2.23 𝑝𝑢𝑛𝑡𝑜𝑠
2.6.2
DISPERCIÓN RELATIVA
Cuando el objetivo es realizar comparaciones, no resulta
adecuado comparar magnitudes absolutas, ya que las unidades no
son siempre comparables.
Cuando se pretende comparar la dispersión de variables
medidas en distintas unidades o variables con distinto orden de
magnitud, es necesario relativizar.
Coeficiente de variabilidad
Una forma de relativizar es considerar la dispersión en relación
al valor absoluto de la media, consiguiendo así el coeficiente de
variación, que suele ser interpretado en términos de proporción o
porcentaje:
El coeficiente de variación es la razón (cociente) de la desviación
estándar y la media aritmética expresada con un porcentaje.
Características
Se utiliza cuando no es posible una comparación directa de dos
o más medidas de dispersión y muy útil cuando:
Página 110
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.


Los datos están en unidades diferentes (como dólares y días de
inasistencia)
Los datos están en las mismas unidades, pero los valores
medios están muy distantes (como sucede con los ingresos de
ejecutivos superiores, y el ingreso de empleados no calificados)
Fórmula
Se calcula con la siguiente fórmula:
𝐶𝑉 =
𝑠
|𝑋̅|
Nomenclatura
𝐶𝑉 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
|𝑋̅| = 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎
Ejemplo de aplicación 29
El número de pacientes atendidos en emergencias en una clínica
privada de la ciudad, en un periodo de 8 días del mes pasado fue:
3
1
5
8
2
4
8
3
Calcule e l coeficiente de variación.
Solución.
La media aritmética es
𝑋̅ = 4.25
La varianza es
𝑠 2 = 6.79 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 2
La desviación estándar es
𝑠 = 2.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠
La fórmula para el cálculo del coeficiente de variación es
Página 111
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐶𝑉 =
Reemplazando valores, se tiene
𝐶𝑉 =
𝑠
|𝑋̅|
2.61
|4.25|
𝐶𝑉 = 0.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠
Ejemplo de aplicación 30
Calcular el coeficiente de variación de las calificaciones finales en
la asignatura de matemáticas, de un curso de 40 estudiantes,
según datos de la tabla que sigue.
Calificación Cantidad
de
estudiantes
(0 − 2]
2
(2 − 4]
4
(4 − 6]
8
(6 − 8]
16
(8 − 10]
10
Total
40
Solución:
La media aritmética es
𝑋̅ = 6.4
La varianza es
𝑠 2 = 4.96 𝑝𝑢𝑛𝑡𝑜𝑠 2
La desviación estándar es
𝑠 = 2.23 𝑝𝑢𝑛𝑡𝑜𝑠
La fórmula para el cálculo del coeficiente de variación es
𝐶𝑉 =
Reemplazando valores, se tiene
𝑠
|𝑋̅|
Página 112
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐶𝑉 =
2.23
|6.4|
𝐶𝑉 = 0.35
2.7 MEDIDAS DE ASIMETRÍA
Mide la desviación de la simetría, expresada la diferencia entre
la media y la mediana con respecto a la desviación estándar del
conjunto de mediciones de la población o muestra.
En un conjunto de datos
con asimetría positiva, la parte
alargada de la gráfica está a la derecha y cuando un conjunto de
datos con asimetría negativa, la parte alargada de la gráfica está a
la izquierda.
Características
Definiremos asimetría positiva, cuando 𝑀𝑑 ≤ 𝑀𝑒 ≤ 𝑋̅ . Esto
queda reflejado en el diagrama de barras o en un histograma
presentando la distribución de los datos una cola a la derecha.
Definiremos asimetría negativa, cuando 𝑋̅ ≤ 𝑀𝑒 ≤ 𝑀𝑑 . Esto
queda reflejado en el diagrama de barras o en un histograma
presentando la distribución de los datos una cola a la izquierda.
Fórmula
𝐶𝐴 =
3(𝑋̅ − 𝑀𝑒)
𝑠
Página 113
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tomando en cuenta esta relación, el coeficiente de asimetría
puede variar desde −3 hasta +3. Un valor cercano a −3, como por
ejemplo −2.57 indica una considerable asimetría negativa; un valor
como +1.63 indica una asimetría positiva moderada. El valor de 0
que se presenta cuando la media y la mediana son iguales, señala
que la distribución es simétrica.
Nomenclatura
𝐶𝐴 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎
𝑋̅ = 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎
𝑀𝑒 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Ejemplo de aplicación 31
El número de pacientes atendidos en emergencias en una clínica
privada de la ciudad, en un periodo de 8 días del mes pasado fue:
3
1
5
8
2
4
8
3
Calcule el coeficiente de asimetría.
Solución.
El ejemplo tiene una media aritmética de
𝑋̅ = 4.25
Una mediana de
𝑀𝑒 = 3.5
Una desviación estándar de
𝑠 = 2.61 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠
La fórmula de coeficiente de variación es
𝐶𝐴 =
3(𝑋̅ − 𝑀𝑒)
𝑠
Reemplazando valores, se tiene
Página 114
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐶𝐴 =
3(4.25 − 3.5)
2.61
𝐶𝐴 =
2.25
2.61
𝐶𝐴 = 0.86
Definiremos asimetría positiva, cuando 𝑀𝑒 ≤ 𝑋̅ . Presenta la
distribución de los datos una cola a la derecha.
Ejemplo de aplicación 32
Calcular el coeficiente de asimetría de las calificaciones finales en la
asignatura de matemáticas, de un curso de 40 estudiantes, según
datos de la tabla que sigue.
Calificación Cantidad
de
estudiantes
(0 − 2]
2
(2 − 4]
4
(4 − 6]
8
(6 − 8]
16
(8 − 10]
10
Total
40
Solución:
La media aritmética es
𝑋̅ = 6.4 𝑝𝑢𝑛𝑡𝑜𝑠
La mediana es
𝑀𝑒 = 6.75 𝑝𝑢𝑛𝑡𝑜𝑠
La desviación estándar es
𝑠 = 2.23 𝑝𝑢𝑛𝑡𝑜𝑠
La fórmula para el cálculo del coeficiente de asimetría es
𝐶𝐴 =
3(𝑋̅ − 𝑀𝑒)
𝑠
Página 115
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝐶𝐴 =
3(6.4 − 6.75)
2.23
𝐶𝐴 = −0.47
Definiremos asimetría negativa, cuando 𝑋̅ ≤ 𝑀𝑒 . Presenta la
distribución de los datos una cola a la izquierda.
2.8 MEDIDAS DE APUNTAMIENTO O CURTOSIS
La curtosis mide el grado de agudeza o achatamiento de una
distribución con relación a la distribución normal, es decir, mide
cuán puntiaguda es una distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
1. Distribución mesocúrtica: presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribución normal).
2. Distribución leptocúrtica: presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
3. Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable
(Aula Fácil, 2015).
Características
𝑔2 = 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑚𝑒𝑠𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎
Página 116
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑔2 > 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑙𝑒𝑝𝑡𝑜𝑐ú𝑟𝑡𝑖𝑐𝑎
𝑔2 < 0 ; 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑝𝑙𝑎𝑡𝑖𝑐ú𝑟𝑡𝑖𝑐𝑎
Fórmula
El coeficiente de curtosis viene definido por la siguiente fórmula:
1 𝑚
∑ (𝑥𝑖 − 𝑋̅)4
𝑚4
𝑛 1
𝑔2 = 4 − 3 =
−3
𝑠
𝑠4
1
𝑔2 =
𝑛
̅ 4
∑𝑚
1 𝑓𝑖 (𝑥𝑖 − 𝑋 )
𝑠4
−3
Página 117
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 32
Calcular el coeficiente de apuntamiento o curtosis de las
calificaciones finales en la asignatura de matemáticas, de un curso
de 40 estudiantes, según datos de la tabla que sigue.
Calificación Cantidad
de
estudiantes
(0 − 2]
2
(2 − 4]
4
(4 − 6]
8
(6 − 8]
16
(8 − 10]
10
Total
40
Solución:
La media aritmética es
𝑋̅ = 6.4 𝑝𝑢𝑛𝑡𝑜𝑠
La desviación estándar es
𝑠 = 2.23 𝑝𝑢𝑛𝑡𝑜𝑠
La fórmula para el cálculo del coeficiente de apuntamiento es
1 𝑚
∑ 𝑓 (𝑥 − 𝑋̅)4
𝑚4
𝑛 1 𝑖 𝑖
𝑔2 = 4 − 3 =
−3
𝑠
𝑠4
𝑔2 =
1
[2(1 −
40
6.4)4 + 4(3 − 6.4)4 + 8(5 − 6.4)4 + 16(7 − 6.4)4 + 10(9 − 6.4)4 ]
(2.23)4
𝑔2 =
1
[2(−5.4)4
40
+ 4(−3.4)4 + 8(−1.4)4 + 16(−0.6)4 + 10(−2.6)4 ]
(2.23)4
𝑔2 =
1
[1,700.61 +
40
534.53 + 30.73 + 2.07 + 456.98]
24.73
𝑔2 =
−3
−3
−3
2,724.93
−3
989.2
𝑔2 = 2.7547 − 3
𝑔2 = −0.2453
Página 118
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Como
𝑔2 < 0
Entonces la distribución es platicúrtica.
Página 119
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
3 CAPÍTULO III: NÚMEROS ÍNDICES
OBJETIVOS
El estudiante podrá:
1. Expresar las características y definir un número índice.
2. Calcular e interpretar los números índices de precios, cantidad y
valor.
3. Calcular e interpretar los números índices simples, ponderados y
no ponderados.
3.1 INTRODUCCIÓN
Número índice es una medida estadística diseñada para poner
de relieve cambios en una variable o en un grupo de variables
relacionadas con respecto al tiempo, situación geográfica, ingresos,
o cualquier otra característica. (Spiegel, 1997)
Número índice es un número que expresa el cambio relativo en
precio, cantidad o valor comparado con un periodo base. (Lind,
Marchal, & Wathen, 2006).
3.2 CARACTERÍSTICAS

Es un porcentaje,
porcentual.
pero
generalmente
se
omite
el
signo

Tiene un período base.

La mayor parte de los índices se aproximan al décimo más
próximo de un porcentaje .

La base de la mayor parte de los índices es 100.
3.3 CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES
3.3.1
NÚMEROS ÍNDICES DE PRECIOS
Es un número que expresa el cambio relativo de precio
comparando con un periodo base. El índice de este tipo más
conocido es Índice de precios al consumidor (IPC), el cual mide el
costo de vida en los países.
Página 120
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
3.3.2
NÚMEROS ÍNDICES DE CANTIDAD
Es un número que expresa el cambio relativo de cantidad de una
variable comparando con un periodo base.
3.3.3
NÚMEROS ÍNDICES DE VALOR
Es un número que expresa el cambio relativo de valor
comparando con un periodo base. Es decir mide los cambios en el
valor monetario total. (Levin & Rubin, 2004)
3.4 NÚMEROS ÍNDICES SIMPLES
Son los que se refieren a una sola magnitud, y por lo tanto nos
proporcionan la variación que ha sufrido esa magnitud en dos
periodos distintos.
Se calcula hallando el cociente del valor del año determinado
entre el valor del año base por 100, así:
𝑃=
𝑝𝑡
∗ 100
𝑝𝑜
Donde:
𝑃 = í𝑛𝑑𝑖𝑐𝑒 𝑠𝑖𝑚𝑝𝑙𝑒
𝑝𝑡 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑎ñ𝑜 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑜
𝑝𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑎ñ𝑜 𝑏𝑎𝑠𝑒
Ejemplo de aplicación 1
El salario básico unificado en enero del 2012 fue de $292, el
salario básico unificado en enero del 2015 fue de $354. Cuál es el
índice correspondiente para los trabajadores en enero del 2015, con
base en los datos de enero del 2012?
𝑃=
𝑝𝑡
354
∗ 100 =
100 = 121.23
𝑝𝑜
292
Durante este periodo aumento en 121.23 − 100 = 21.23 el salario
básico unificado.
Página 121
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 2
En el 2013 la población de hombres en Ecuador fue de
7,868,368 y el de mujeres fue de 7,869,510 ¿Cuál fue la proporción
de la población de hombres comparada con la de mujeres?
𝑃=
𝑝𝑡
7,868,368
∗ 100 =
100 = 99.98
𝑝𝑜
7,869,510
El índice de hombres es de 99.98 de la población de mujeres o la
población de hombres es 100 − 99.98 = 0.02 menor que la de
mujeres
Ejemplo de aplicación 3
Los siguientes datos, se tomaron de los informes anuales de la
empresa Johnson & Johnson, de la misma que sus acciones
comunes se enlistan en la Bolsa de Valores con el símbolo de JNJ.
Tomando como base el año 1991, calcular el Índice Simple.
Regla de tres :
Años
1991
1992
1993
1994
1995
1996
5.43
----
6.25
----
Ventas
Nacionales
(miles de
dólares)
5.43
6.25
6.9
7.2
7.81
9.19
100 %
x
=
Cálculo del Índice
5.43
6.25
6.90
7.20
7.81
9.19
/5.43
/5.43
/5.43
/5.43
/5.43
/5.43
=1
=1.15101289
=1.2071823
=1.32596685
=1.43830571
=1.69244936
115,10
Índice
Simple %
100
115.1
127.07
132.6
143.83
169.24
3.5 NÚMEROS ÍNDICES NO PONDERADOS
3.5.1
PROMEDIO SIMPLE DE LOS ÍNDICES DE
PRECIOS
Este índice se obtiene sumando los índices simples de cada
producto y dividiendo para el número de productos.
Página 122
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Así:
𝑃 =
∑ 𝑃𝑖
𝑛
𝑃𝑖 = Í𝑛𝑑𝑖𝑐𝑒𝑠 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠
Ejemplo de aplicación 4
Tomando como base los siguientes datos se calcula el promedio
simple de los índices de precios relativos.
𝑃=
100 + 115.1 + 127.07 + 132.60 + 143.83 + 169.24
6
𝑃=
787.85
6
𝑃 = 131.31
Ejemplo de aplicación 5
Un administrador estudia la evolución de los precios de un
artículo que produce su empresa en los 5 últimos años, los valores
se registran en la siguiente tabla. Calcule el promedio simple de los
índices de precios, tomando como periodo de referencia el año 1.
Años
Precio del producto
1
4
2
5.5
3
6
4
5
5
8
Primero calculo los índices simples
Años
1
2
3
4
5
𝑃 =
Precio del
producto
4
5.5
6
5
8
Índice
Simple
100
137.5
150
125
200
∑ 𝑃𝑖
100 + 137.5 + 150 + 125 + 200
=
= 142.5
𝑛
5
Página 123
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Esto indica que el precio del producto a incrementado en 42.5%
3.5.2
ÍNDICE AGREGADO SIMPLE
Un índice agregado simple se calcula sumando todos los
elementos de un periodo dado y luego dividiendo este resultado
entre la suma de los mismos elementos durante el periodo base.
Así:
𝑃 =
∑ 𝑃𝑖
∗ 100
∑ 𝑃0
𝑃𝑖 ∶ Cantidad de elementos del periodo que se desea el índice
𝑃0 : Cantidad de elementos en el año base
Ejemplo de aplicación 6
Determine el índice agregado simple de precios para el año 2015
y 2012 de tres productos considerados, usando como año base
2012.
Tabla 3:
PRODUCTOS DE PRIMERA NECESIDAD
Producto
Leche $/lt
Pan $/und
Huevos$/doc
2012
∑ = 2.42
𝑃 =
2015
0.84
0.14
1.44
0,86
0.16
1.50
∑ = 2.52
∑ 𝑃𝑖
2.52
∗ 100 =
∗ 100
∑ 𝑃0
2.42
𝑃 = 104.13
3.6 NÚMEROS ÍNDICES PONDERADOS
Dos métodos para calcular el índice de precios compuestos o
ponderado son el método de Laspeyres y el de Paasche. Difieren
sólo en el periodo para la ponderación. En el método de Laspeyres
se utilizan ponderaciones en el periodo base; es decir, los precios y
las cantidades originales de los artículos comprados se utilizan para
Página 124
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
encontrar el cambio porcentual durante un periodo, ya sea en el
precio o en la cantidad consumida, según el problema. En el
método de Paasche se utilizan ponderaciones en el año en curso.
(Lind, Marchal, & Wathen, 2006)
3.6.1
ÍNDICE DE LAYSPEYRES
𝑃 =
Dónde:
∑ 𝑝𝑡 𝑞0
𝑥 100
∑ 𝑝0 𝑞0
𝑃 𝑒𝑠 𝑒𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠.
𝑝𝑡 es el precio actual
𝑝0 es el precio del periodo base
𝑞0 es la cantidad en el periodo base
(Lind, Marchal, & Wathen, 2006)
Ejemplo de aplicación 7
Determinar un índice de precios ponderado con el método de
Laysperes, con los precios dados en la siguiente tabla tomando
como referencia Quito.
Producto
Arveja tierna
Banano
Limón
Piña
Cantidad
(Libras)
0,55
0,65
0,80
0,05
𝑃 =
Quito
Guayaquil
12,50
7,00
15,00
1,50
20,00
5,00
15,18
1,31
∑ 𝑝𝑡 𝑞0
𝑥 100
∑ 𝑝0 𝑞0
Calculemos el índice simple de cada producto tomando como
referencia Quito, a continuación presentamos los precios de
diferentes productos en Quito y Guayaquil
Página 125
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Quito
Producto
𝒒𝟎 (𝒍𝒃)
Arveja tierna
Banano
Limón
Guayaquil
𝒑𝟎
110
Piña
𝒒𝒕 (𝒍𝒃)
𝒑𝒕 𝒒𝒕
𝒑𝒐 𝒒𝒕
55
65
7
65
5
325
455
325
455
80
15
95
18
1,440
1,200
1,710
1,425
5
1.5
65
17
𝑃 =
20
𝒑𝟎 𝒒𝟎
25
𝑃 =
3.6.2
𝒑𝒕 𝒒𝟎
𝒑𝒕
2,200
2,750
1,100
1,375
85
7.5
1105
97.5
4,050
4,412.5
4,240
3,352.5
∑ 𝑝𝑡 𝑞0
𝑥 100
∑ 𝑝0 𝑞0
4,050
𝑥 100 = 91.78
4,412.5
ÍNDICE DE PAASCHE
El cálculo es similar que el índice de Laspeyres, pero en lugar de
emplear cantidades en el periodo base como ponderaciones, se
utilizan cantidades en el período actual.
𝑃 =
∑ 𝑝𝑡 𝑞𝑡
𝑥 100
∑ 𝑝0 𝑞𝑡
Ejemplo de aplicación 8
En el ejercicio de aplicación 7, calculemos el índice de Paasche
𝑃 =
4,240
𝑥 100 = 126.47
3,352.5
Ejemplo de aplicación 9
Los precios, de cuatro artículos que se indican a continuación,
en los años 2001 y 2003, permitiran calcular el índice de
Paasche.
Artículo
Pan
Huevos
Leche
Manzana
∑
po
2001
0.05
0.06
0.35
0.15
0.61
Qo
2001
20
30
10
15
75
Pt
2003
0.08
0.09
0.48
0.25
0.90
qt
2003
24
36
15
20
95
pt*qt
po*qt
1.92
3.24
7.20
5.00
17.36
1.20
2.16
5.25
3.00
11.61
Página 126
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑃 =
∑ 𝑝𝑡 𝑞𝑡
𝑥 100
∑ 𝑝0 𝑞𝑡
𝑃 =
17.36
𝑥 100
11.61
𝑃 = 149.52
Este resultado. indica que el precio de este grupo de alimentos.
aumentó en el 49.52 %. en el período de dos años.
3.6.3
ÍNDICE DE FISHER
Es la media geométrica de los índices de Laspeyres y Paasche.
Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √(Í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝐿𝑎𝑠𝑝𝑒𝑦𝑟𝑒𝑠)(Í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑃𝑎𝑎𝑠𝑐ℎ𝑒)
Parece ser el ideal porque combina las mejores características
del de Laspeyres y del de Paasche.
Ejemplo de aplicación 10
Al tener ya determinado el índice de Laspeyres y el índice de
Paasche, en el ejemplo de aplicación 9 procedemos a calcular el
índice ideal de Fisher.
Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √(150.29)(149.52)
Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = √22471.3608
Í𝑛𝑑𝑖𝑐𝑒 𝑖𝑑𝑒𝑎𝑙 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 = 149.90
3.7 ÍNDICES DE VALOR
Mide cambios tanto en los precios como en las cantidades que
intervienenen. Se usa precios y cantidades del perìodo base y del
perìodo actual.
𝑉=
∑𝑝𝑡 ∗ 𝑞𝑡
∑𝑝𝑜 ∗ 𝑞𝑜
Página 127
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
donde:
𝑉 𝑒𝑠 𝑒𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟
𝑝𝑜 𝑒𝑠 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑏𝑎𝑠𝑒
𝑞𝑜 𝑒𝑠 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑐𝑜𝑛𝑠𝑢𝑚𝑖𝑑𝑎 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑏𝑎𝑠𝑒
𝑞𝑡 𝑒𝑠 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑐𝑜𝑛𝑠𝑢𝑚𝑖𝑑𝑎 𝑒𝑛 𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜 𝑎𝑐𝑡𝑢𝑎𝑙
𝑝𝑡 𝑒𝑠 𝑒𝑙 𝑝𝑟𝑒𝑐𝑖𝑜 𝑎𝑐𝑡𝑢𝑎𝑙
Ejemplo de aplicación 11
Los precios de cuatro artículos que se indican a continuación, en
los años 2001 y 2003, permitirán calcular el índice de Valor.
Artículo
qo
2001
20
30
10
15
Pt
2003
0.08
0.09
0.48
0.25
Qt
2003
24
36
15
20
ptqt
poqo
Pan
Huevos
Leche
Manzana
Po
2001
0.05
0.06
0.35
0.15
1.92
3.24
7.20
5.00
1.00
1.80
3.50
2.25
∑
0.61
75
0.90
95
17.36
8.55
𝑉=
𝑉=
∑𝑝𝑡 ∗ 𝑞𝑡
∑𝑝𝑜 ∗ 𝑞𝑜
17.36
∗ 100
8.55
𝑉 = 203.04
Con este resultado, miramos que el valor de este grupo de
alimentos, aumentó en el 103.04 %, en el período de dos años.
Página 128
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4 CAPÍTULO
IV:
REGRESIÓN.
CORRELACIÓN Y SERIES DE TIEMPO
OBJETIVOS
El estudiante podrá:
1. Diferenciar e interpretar los términos variable dependiente e
independiente.
2. Encontrar y analizar los coeficientes de correlación y
determinación y error estándar.
3. Encontrar la ecuación de la recta aplicando el método del libre
ajuste
4. Encontrar la ecuación de la recta aplicando el método de los
mínimos cuadrados.
5. Especificar los componentes de una serie de tiempo.
6. Encontrar un promedio móvil.
7. Calcular la ecuación para una tendencia lineal
4.1 ANÁLISIS DE CORRELACIÓN
Mide la intensidad de la asociación entre dos variables, cuyo
principal objetivo es determinar, qué tan intensa es la relación
entre esas dos variables.
4.1.1
VARIABLE DEPENDIENTE:
Es la variable que se predice o se calcula.
4.1.2
VARIABLE INDEPENDIENTE:
Es una variable que proporciona las bases para el cálculo. Es la
variable de predicción.
4.1.3
COEFICIENTE DE CORRELACIÓN
Mide la intensidad de la asociación entre dos variables.


Ambas variables deben ser al menos el nivel de intervalo de
medición.
El coeficiente de correlación puede variar desde
-1.00 hasta
1.00.
Página 129
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.




Si la correlación entre dos variables es 0, no hay asociación
entre ellas.
Un valor de 1.00 indica una correlación positiva perfecta, y una
de -1.00, una correlación negativa perfecta.
Un signo positivo significa que hay una relación directa entre las
variables, y un signo negativo, que hay una relación inversa.
Se identifica con la letra 𝑟.
La fórmula que permite calcular el coeficiente de correlación es
la siguiente:
𝑟=
𝑛(∑𝑋𝑌) − (∑𝑋)(∑𝑌)
√(𝑛(∑𝑋 2 ) − (∑𝑋)2 )(𝑛(∑𝑌 2 ) − (∑𝑌)2 )
donde:
𝑛
𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟𝑒𝑠 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
∑𝑋
𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋
∑𝑌
𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌
(∑𝑋 2 ) 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋
(∑𝑌 2 ) 𝑒𝑠 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌
(∑𝑋)2 𝑒𝑠 𝑒𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑋
(∑𝑌)2 𝑒𝑠 𝑒𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑌
∑𝑋𝑌
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠 𝑑𝑒 𝑋 𝑦 𝑌
En la Figura 1 y 2 se resume la intensidad y la dirección del
coeficiente de correlación.
Figura 1. Intensidad del coeficiente de correlación
Página 130
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Figura 2. Recta con correlación positiva y negativa
Ejemplo de aplicación 1
Las llamadas mensuales realizadas para la venta de productos
de limpieza y desinfección de la empresa Solquim S.A. de lo cual se
toma una muestra de 5 vendedores, se expresa en la siguiente
tabla.
Representantes de
ventas
Paquita Trujillo
Kléver Sosa
Ximena López
Andrea Flores
Marcelo Campaña
No. de
llamadas
20
40
20
30
10
No. de
productos
vendidos
40
60
40
60
20
Solución
El primer paso para mostrar la relación entre dos variables es
graficando los datos en un diagrama de dispersión.
En la Figura 3 podemos obsevar que existe relación entre el
número de llamadas y los productos vendidos, puesto que, a mayor
número de llamadas, se realizan mayores ventas de productos.
Para realizar el cálculo del coeficiente de correlación es
importante que identifiquemos las variable dependiente (No. de
productos vendidos) y la independiente (No. de llamadas).
Página 131
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Figura 3. Diagrama de dispersión.
A continuación añadimos tres columnas a la tabla para realizar
los cálculos requeridos por la fórmula de coeficiente de correlación.
𝑛(∑𝑋𝑌) − (∑𝑋)(∑𝑌)
𝑟=
√(𝑛(∑𝑋 2 ) − (∑𝑋)2 )(𝑛(∑𝑌 2 ) − (∑𝑌)2 )
Representantes de
ventas
Paquita Trujillo
Kléver Sosa
Ximena López
Andrea Flores
Marcelo Campaña
Total
20
40
No. de
productos
vendidos
(Y)
40
60
20
30
10
120
40
60
20
220
No. de
llamadas
(X)
X2
400
1,60
0
400
900
100
3,40
0
Y2
XY
1,600
3,600
800
2,400
1,600
3,600
400
10,800
800
1,800
200
6,000
Reemplazando los datos obtenidos en la fórmula, se tiene.
r
56000   120 220 
53400  120 510800   220 
2
2
Página 132
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
r
30000  26400
17000  14400 54000  48400 
r
3600
26005600
r
r
3600
14560000
3600
3815 .76
El coeficiente de correlación es:
𝑟 =
0.94
El coeficiente de correlación es positivo, lo cual nos permite ver
que existe una relación directa entre el número de llamadas y la
cantidad de productos vendidos.
El valor de 0.94, está bastante cercano a 1.00. Si observamos la
figura 1 podemos concluir que la relación es fuerte.
4.1.4
CÁLCULO
DE
COEFICIENTE
DE
DETERMINACIÓN
Es la porción de la variación total en la variable dependiente Y
que se explica por la variación en la variable independiente X.
Varía de 0 a 1.
Es el cuadrado del coeficiente de correlación.
Al elevar el coeficiente de correlación al cuadrado. obtendremos
el coeficiente de determinación.
𝑟 = 0.94
Entonces
𝑟 2 = 0.942
𝑟 2 = 0.89
Ver figura 3, obtenido a través de excel.
Página 133
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4.2 ANÁLISIS DE REGRESIÓN
La intensidad y dirección de la relación que existe entre dos
variables se determina en una ecuación que define la relación lineal
entre dos variables.
4.2.1
PRINCIPIO DE LOS MÍNIMOS CUADRADOS
Es la técnica empleada para obtener la ecuación de regresión,
minimizando la suma de los cuadrados de las distancias verticales
entre los valores verdaderos de 𝑌 y los valores pronosticados de 𝑌 ′ .
La forma general de la ecuación de regresión lineal es:
𝑌′ = 𝑎 + 𝑏𝑥
donde:
𝑌’ se lee “Y prima”, es el valor pronosticado de la variable 𝑌
para un valor seleccionado de 𝑋.
𝑎 es la ordenada de la intersecciòn con el eje 𝑌; es decir, el
valor estimado de 𝑌′ cuando 𝑥 = 0 . Dicho de otra forma,
corresponde al valor estimado de 𝑌′, donde la recta de regresiòn
cruza el eje 𝑌,
cuando 𝑥 = 0.
𝑏 es la pendiente de la recta, o el cambio promedio en Y’ por
unidad de cambio (incremento o decremento) en la variable
independiente 𝑥.
𝑥 es cualquier valor seleccionado de la variable independiente.
Para poder encontrar ( 𝒂 que es la ordenada) y ( 𝒃 que es la
pendiente) a las que se les denomina coeficientes de regresión
estimado, o simplemente coeficiente de regresión, para lo cual se
requiere de las siguientes fórmulas
Pendiente de la línea de regresión
𝑏=
𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑌
𝑛 ∗ ∑𝑋 2 − (∑𝑋)2
Punto donde se intercepta con el eje 𝑌
Página 134
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑎=
∑𝑌 ∗ ∑𝑋 2 − ∑𝑋 ∗ ∑(𝑋𝑌)
𝑛 ∗ ∑𝑋 2 − (∑𝑋)2
o’
𝑎=
∑𝑌
∑𝑋
−𝑏
𝑛
𝑛
donde:
𝑋 es un valor de la variable independiente
𝑌 es un valor de la variable dependiente
𝑛 es el número de elementos en la muestra
Ejemplo de aplicación 2
Para calcular la ecuación de la recta, utilizando el método de los
mínimos cuadrados, traemos el planteamiento del problema del
ejemplo 1.
Representantes de
ventas
Paquita Trujillo
Kléver Sosa
Ximena López
Andrea Flores
Marcelo Campaña
No. de
llamadas
20
40
20
30
10
No. de
productos
vendidos
40
60
40
60
20
Las fórmulas a utilizar son las siguientes:
Pendiente de la línea de regresión
𝑏=
𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑌
𝑛 ∗ ∑𝑋 2 − (∑𝑋)2
Punto donde se intercepta con el eje 𝑌
𝑎=
∑𝑌 ∗ ∑𝑋 2 − ∑𝑋 ∗ ∑(𝑋𝑌)
𝑛 ∗ ∑𝑋 2 − (∑𝑋)2
Página 135
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑎=
∑𝑌 ∗ ∑𝑋 2 − ∑𝑋 ∗ ∑(𝑋𝑌)
𝑛 ∗ ∑𝑋 2 − (∑𝑋)2
o’
𝑎=
∑𝑌
∑𝑋
−𝑏
𝑛
𝑛
A la tabla anterior añadimos tres columnas para realizar los
cálculos requeridos por las fórmulas de los mínimos cuadrados.
Identificando primero la variable dependiente (No. de productos
vendidos) Y y la independiente (No. de llamadas) X.
Representantes
de ventas
Paquita Trujillo
Kléver Sosa
Ximena López
Andrea Flores
Marcelo Campaña
Total
No. de
llamadas
(X)
20
40
20
30
10
120
No. de
productos
vendidos (Y)
40
60
40
60
20
220
X2
400
1,600
400
900
100
3,400
Y2
1,600
3,600
1,600
3,600
400
10,800
XY
800
2,400
800
1,800
200
6,000
Pendiente de la línea de regresión:
𝑏=
𝑛 ∗ ∑(𝑋𝑌) − ∑𝑋 ∗ ∑𝑦
𝑛 ∗ ∑𝑥 2 − (∑𝑥)2
𝑏=
5(6000) − (120)(220)
5(3400) − (120)2
𝑏=
30000 − 26400
17000 − 14400
𝑏=
3600
2600
𝑏 = 1.38
Punto donde se intercepta con el eje 𝑌:
∑𝑌
∑𝑋
𝑎 = 𝑛 −𝑏 𝑛
220
120
𝑎=
− (1.38)
5
5
𝑎 = 44 − 33.12
Página 136
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
𝑎 = 10.88
Remplazando en la ecuación 𝑌′ = 𝑎 + 𝑏𝑥, los valores obtenidos se
obtiene Y= 10.88+1.38X
El valor de 𝑏 = 1.38 significa que para cada llamada adicional
que realizan los representantes de ventas pueden esperar aumentar
en casi 1.4 el número de venta de productos de limpieza y
desinfección. El valor a de 10.88 es el punto donde la ecuaciòn
cruza el eje 𝑌, luego si no se hacen llamadas esto es 𝑋 = 0 se
venderán 10.88 productos.
4.2.2
TRAZO DE LA LÍNEA DE REGRESIÓN
Consideraciones Básicas
Para aplicar correctamente la regresión lineal deben satisfacerse
varias suposiciones:
 Para cada valor de la variable 𝑋, hay un cojunto de valores de
𝑌. Estos valores de 𝑌 siguen una distribución normal.
 Las medias de estas distribuciones normales se encuentran
sobre la línea de regresión.
 Las desviaciones estándar de todas estas distribuciones
normales, son iguales. La mejor estimación que se tiene de esta
desviación estándar es común, es el error
estándar de
estimación (𝑆𝑦, 𝑥).
 Los valores de 𝑌 son estadísticamente independientes. Lo que
significa que el tomar la muestra en determinado valor de X no
depende de ningún otro valor de X. Esto es importante cuando
se toman datos durante un período. En esos casos los errores
de un determinado período suelen estar correlacionados con lo
de otro período.
Ejemplo de aplicación 3
En el ejemplo 2 se obtuvo la gráfica 𝑌 = 10.88 + 1.38𝑋. El valor de
10.88 representa la intersección con el eje y, para encontrar otro
punto, arbitrariamente damos un punto cualquiera a la variable X,
podría ser el 20, remplazando en la ecuación 𝑌 = 10.88 + 1.38(20) se
obtiene Y = 38.48. Si tenemos dos puntos ya podemos encontrar el
gráfico de la ecuación al unir estos puntos. Tomando en cuenta que
se trata de la Ecuación de la recta, como se muestra a
continuación.
Página 137
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Figura 4 Gráfica de la ecuación de la recta.
4.2.3
EL ERROR ESTÁNDAR DE LA ESTIMACIÓN
Es la medida de la dispersión de los valores observados. con
respecto a la línea de regresión.
Está en las mismas unidades que la variable dependiente. Se
basa en las desviaciones al cuadrado respecto de la recta de
regresión
Valores pequeños indican que los puntos se agrupan cerca de la
recta de regresión
Para su cálculo se utiliza la siguiente fórmula:
S y. x
Y 2  aY   bXY 

n2
Ejemplo de aplicación 4
Al trabajar con los datos del ejercicio del ejemplo 3, tendremos
el siguiente error estándar de estimación.
Para su cálculo se utiliza la siguiente fórmula:
S y. x 
S y. x 
Y 2  aY   bXY 
n2
10,800  10.88220   1.386,000 
52
Página 138
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
S y. x 
10,800  2,393.6  8,280
3
S y. x 
126.4
3
S y. x  42.13
S y. x  6.49
El error estándar de estimación. mide la variación alrededor de
la línea de regresión.
4.3 FUNDAMENTOS PARA EL ANÁLISIS DE UNA
SERIE DE TIEMPO
Una serie de tiempo es una oportunidad, de poder mejorar las
decisiones que toma la gerencia ya que se puede realizar una
predicción a largo plazo. Ya que una serie de tiempo al registrar los
datos puede hacer uso de ellos para realizar proyecciones, ya que
los patrones del pasado pueden repetirse y ser de gran utilidad. En
una empresa si disponemos de la información en que los periodos
de ventas en que la demanda es alta pueden ayudar a predecir,
planificar y programar la producción en un período posterior,
incluso puede ayudar a tomar decisiones a largo plazo.
4.4 COMPONENTES DE UNA SERIE DE TIEMPOS




Tendencia Secular
Variación cíclica
Variación estacional
Variación irregular.
4.4.1
TENDENCIA SECULAR
La serie de tiempo con tendencia secular sigue una dirección
uniforme en el tiempo. A pesar de que pueda haber variaciones, es
importante notar a largo plazo la tendencia que sigue.
Página 139
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 5
En el siguiente ejemplo se muestra una empresa se sabe que en
función del tiempo, sus clientes han incrementado en cientos,
figuran en la tabla siguiente: se puede observar que el incremento
es proporcional en el tiempo y sigue una tendencia definida.
Figura 5. Ventas del 2009 al 2014
El micro mercado Cotocollao revisa el historial de sus ventas y
encuentra que las ventas se han incrementado con el tiempo, a
pesar de tener una acentuada disminución en las ventas en el año
2001 comparado con las ventas en el 2000, luego se observa una
recuperación en los años siguientes.
Figura 6. Venta del micro mercado Cotocollao
Página 140
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Si consideramos el número personas que salieron a España a
buscar trabajo de un determinado sector del país en el transcurso
del 2000 al 2010, encontramos que en el 2000 salieron 1,000
personas, mientras que en el 2002 fueron 1,300, luego
encontramos una clara disminución para el año 2010 ya tenemos
70 personas que abandonaron el país, la tendencia a largo plazo
está bastante clara.
Figura 7. Emigrantes a España (datos supustos)
4.4.2
VARIACIÓN CÍCLICA
Se da un aumento y una disminución en períodos mayores a un
año, manteniendo la tendencia en el trascurso del tiempo.
Ejemplo de aplicación 6
En la parte productiva es normal que existan variaciones en las
ventas o ingresos en el trascurso de períodos de tiempo, esto se
puede dar por reactivación de la economía por nuevos ingresos
petroleros o disminución de los mismos. Nuevas obras de inversión
en el país como es el caso de las hidroeléctricas, finalización de
estas obras, incluso cambios de gobierno, entre otros factores que
determina e influyen sobre la producción.
El ejemplo expuesto a continuación muestra la variación de los
ingreso de Sinec Constructores en miles de dólares entre 1998 y el
2015.
Página 141
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
800
600
400
200
0
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
Ingresos en miles de
dólares
Ingresos en miles de dolares
Año
Figura 8. Ingresos en miles de dólares Sinec Constructores
4.4.3
VARIACIÓN ESTACIONAL
Sigue patrones de cambio durante un año, y se repiten en los
años posteriores.
Ejemplo de aplicación 7
En la mayoría de negocios suele suceder que se repiten los patrones
de venta de un año a otro, pueden ser por situaciones como las de fin de
año en la que la mayoría realiza compras y regalos por motivos religiosos
o de comportamiento, que en nuestro país viene acompañado del sueldo
adicional que se recibe en diciembre, lo mismo sucede con el inicio de
clases y todos los requerimientos, que pueden ser lista de útiles, ropa de
uniformes, zapatos. Negocios que se ven estimulados en sus ingresos en
estas fechas. Este comportamiento suele repetirse cada año, para ello se
muestra un ejemplo de la ventas en miles de dólares.
Figura 9. Ventas en miles de dólares
Página 142
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
4.4.4
VARIACIÓN IRREGULAR
Es aquella cuya variación es difícil predecir y pueden se
variaciones episódicas y residuales.
Ejemplo de aplicación 8
Las variaciones episódicas pueden originarse por eventos como
una guerra, una huelga, un golpe de estado, una catástrofe natural
y la residual por los demás factores que originan la variación. Como
se indica son impredecibles.
4.5 MEDICIÓN DE TENDENCIAS
4.5.1
TENDENCIA LINEAL
Se da un aumento y una disminución de los ingresos, ventas,
gastos u otra variable, manteniendo la tendencia en el trascurso del
tiempo.
Del ejemplo 6 anterior la variación de los ingreso de Sinec
Constructores en miles de dólares entre 1998 y el 2015. Podemos
ver que la tendencia que sigue a pesa de la variación en el
transcurso del tiempo el lineal.
Método de libre ajuste
Es un método aproximado y rápido para obtener la ecuación de
la recta.
Ejemplo de aplicación 9
En la tabla 4, se muestra los ingreso en miles de dólares en
función del tiempo.
Solución
Graficamos como se muestra en la figura 10 los puntos de los
años y los ingresos, numerados el primero como el año uno (1998 =
Página 143
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
1), como se indica en la tabla 4 para los siguientes años tomando
la misma consideración.
Trace una recta entre los puntos, la recta indica la tendencia.
Tabla 4
CÁLCULO POR EL MÉTODO DEL LIBRE AJUSTE
Ingresos
Ingresos
en miles de Años (X) Años (X) en miles de
dólares (Y)
dólares (Y)
200
2007
10
450
Años (X)
Años (X)
1998
1
1999
2
300
2008
11
470
2000
3
350
2009
12
490
2001
4
250
2010
13
600
2002
5
270
2011
14
700
2003
6
290
2012
15
750
2004
7
400
2013
16
650
2005
8
500
2014
17
670
2006
9
550
2015
18
690
Extendemos la recta para obtener el punto donde interseca con
el eje ‘𝑦’.
Encontramos dos puntos de esta recta estimando los valores que
serán aproximados, el primero puede ser (0; 185) y el oro el final
(18; 735).
Encuentre el valor de la pendiente con los puntos anteriores
𝑏=
𝑦2 − 𝑦1 735 − 185
=
= 30.55
𝑥2 − 𝑥1
18 − 0
El valor de 𝑎 recuerde que es la intersección con el eje ‘𝑦’ el cual
es 𝑎 = 185
La ecuación de la recta es 𝑌 = 𝑎 + 𝑏𝑥
Remplazando los valores encontrados 𝑌 = 185 + 30.55𝑥
Al realizar una comparación de la ecuación de la recta
encontrada en Excel es bastante aproximada a la encontrada.
Página 144
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Figura 10. Ingreso en miles de dólares
Método de mínimos cuadrados
Para encontrar la tendencia aplicando el método de los mínimos
cuadrado realizamos las siguientes consideraciones.
Grafique los puntos de los años numerados el primero como el
año uno (1998 = 1) los siguiente tomando la misma consideración
como en el caso anterior o simplemente con los años reales y los
ingresos.
La ecuación de la recta es 𝑌 = 𝑎 + 𝑏𝑥
Donde
∑𝑦 ∗ ∑𝑥 2 − ∑𝑥 ∗ ∑(𝑥𝑦)
𝑎=
𝑛 ∗ ∑𝑥 2 − (∑𝑥)2
𝑏=
𝑛 ∗ ∑(𝑥𝑦) − ∑𝑥 ∗ ∑𝑦
𝑛 ∗ ∑𝑥 2 − (∑𝑥)2
Ejemplo de aplicación 10
Realice una tabla y encuentre los valores requeridos, al final
podemos ver los valores encontrados.
Página 145
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Tabla 5.
CÁLCULO DE LOS MÍNIMOS CUADRADOS
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
Ingresos en
miles de
dólares (Y)
200
300
350
250
270
290
400
500
550
450
470
490
600
700
750
650
670
690
3,992,004
3,996,001
4,000,000
4,004,001
4,008,004
4,012,009
4,016,016
4,020,025
4,024,036
4,028,049
4,032,064
4,036,081
4,040,100
4,044,121
4,048,144
4,052,169
4,056,196
4,060,225
36117
∑𝑥
8,580
∑𝑦
72,469,245
∑𝑥 2
Número de
años
Años (X)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
18
𝑛
X*Y
𝑿𝟐
399,600
599,700
700,000
500,250
540,540
580,870
801,600
1,002,500
1,103,300
903,150
943,760
984,410
1,206,000
1,407,700
1,509,000
1,308,450
1,349,380
1,390,350
17,230,560
∑𝑥𝑦
Remplace los valores encontrados en las fórmulas.
∑𝑦 ∗ ∑𝑥 2 − ∑𝑥 ∗ ∑(𝑥𝑦)
𝑎=
𝑛 ∗ ∑𝑥 2 − (∑𝑥)2
𝑎=
8580 ∗ 72469245 − 36117 ∗ 17230560
= −60,774
18 ∗ 72469245 − (36117)2
𝑏=
𝑏=
𝑛 ∗ ∑(𝑥𝑦) − ∑𝑥 ∗ ∑𝑦
𝑛 ∗ ∑𝑥 2 − (∑𝑥)2
18 ∗ 17230560 − 36117 ∗ 8580
18 ∗ 72469245 − (36117)2
𝑚 = 30.526
Página 146
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Remplazando los valores encontrados
𝑦 = 𝑎 + 𝑏𝑥
𝑦 = − 60,774 + 30.526𝑥
Ingreso en miles de
dólares
Al realizar una comparación de la ecuación de
encontrada en Excel es igual al calculado.
800
la recta
Ingresos en miles de
dolares (Y)
600
400
200
y = 30,526x + 186,67
R² = 0,8713
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Años
Figura 11. Ingreso en miles de dólares
4.5.2
MÉTODO DEL PROMEDIO MÓVIL
El
promedio móvil es óptimo para patrones de demanda
aleatoria o nivelada donde se pretende eliminar el impacto de los
elementos irregulares históricos mediante un enfoque en períodos
de demanda reciente.
El promedio móvil podemos observar la tendencia que indica la
proyección de la serie, la variación cíclica en este caso el ciclo se
repite cada 7 años
Finalmente se promedia la variación cíclica y la variación
irregular y como resultado obtenemos la tendencia, que esta
expresada por una recta que es una forma suavizada de
representar el promedio móvil, recta viene dada de la forma 𝑦 = 𝑎 +
𝑏𝑥 , donde 𝑏 es la pendiente de la recta y 𝑎 representa la
intersección con el eje 𝑦.
Página 147
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Ejemplo de aplicación 11
Tabla 6
CÁLCULO DEL PROMEDIO MOVIL PARA 7 AÑOS
Año
Ventas
Promedio móvil de 7
años
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
4
5
6
7
8
7
6
5
6
7
8
9
8
7
6
7
8
9
10
9
8
7
8
9
10
6.14
6.29
6.43
6.57
6.71
6.86
7.00
7.14
7.29
7.43
7.57
7.71
7.86
8.00
8.14
8.29
8.43
8.57
8.71
La primera columna indica el año, la segunda la ventas anuales
en miles de dólares y la tercera el promedio móvil el mismo que se
calcula sumando los primeros 7 años de ventas que es donde se
repite completamente el ciclo (color azul) y dividimos para en
número de años (4 + 5 + 6 + 7 + 8 + 7 + 6)/7 = 6.14 que viene a ser el
promedio móvil, el siguiente de color naranja (5 + 6 + 7 + 8 + 7 +
6)/7 = 6.29 y de esta manera continuamos con los siguientes
valores. Si graficamos los años con las ventas observamos
diferentes rectas cada una con una tendencia propia, en este caso
al graficar el tiempo con el promedio móvil, la gráfica se suaviza y
Página 148
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
se convierte en la tendencia de las ventas, si tomamos dos puntos
cualquiera de los años y el valor de promedio móvil (1993; 6.14) y
(2011; 8.71), calculamos la pendiente
8.71−6.14
𝑎 = 2011−1993 = 0.1429 ,
la proyección de la recta sobre el eje “y” es 5.57. De ésta manera
obtenemos la ecuación 𝑦 = 0.1429𝑥 + 5.57 que representa el
promedio móvil; excel es una gran herramienta que permite
encontrar la variación y la tendencia con la respectiva ecuación, la
gráfica muestra lo expuesto.
12
Ventas
10
y = 0,1429x + 5,5714
Ventas
8
6
Ventas
Promedio Movil
4
Lineal (Promedio
Movil)
2
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
0
Años
Figura 12. Ventas entre 1900 y 2014
En la mayoría de los casos es difícil obtener una tendencia lineal,
por lo general sea las ventas, los ingreso, la producción u otra
variable en función del tiempo presentan una variación irregular,
razón por la que la tendencia del promedio móvil no representa una
línea recta como se muestra en el ejemplo a continuación. Además
se debe considerar la naturaleza de los datos que pueden ser
mensuales en este caso el promedio móvil se sugiere que se lo
tome para los doce meses, o incluso la información la podemos
tener diaria, que la relacionaríamos con el número de días de la
semana. En la tabla expuesta a continuación los ingresos por
Página 149
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
ventas son anuales y está calculado el promedio móvil para tres y
cinco años. Para calcular el primer valor del promedio móvil para
tres años (azul), sume las tres primero datos y divida para tres (8 +
9 + 11)/3 = 9.33 y el promedio móvil para cinco años (amarillo) (8 +
9 + 11 + 15 + 6)/5 = 9.80. El promedio móvil para cuatro años se debe
encontrar un doble promedio (violeta) y colocar en la ubicación
mitad del número de años más uno. (4/2) + 1 = 3; encuentre el
promedio los cuatro primeros datos de los Ingresos por Ventas (8 +
9 + 11 + 15)/4 = 10.75 ; luego parta del segundo valor y calculo el
promedio de los siguientes cuatro datos (9 + 11 + 15 + 6)/4 = 10.25;
finalmente calcule el promedio de los dos promedios (10.75 +
10.25)/2 = 10.50. Continúe con el procedimiento como se indica en
la tabla.
Tabla 7
CÁLCULO DEL PROMEDIO MÓVIL DE 3, 5 Y 4 AÑOS
Luego de calcular los datos lo ideal es representarlos en una
gráfica. Al observar el promedio móvil de los ingresos agrupados en
tres años, cuatro y el de
cinco años, este último tiene una
tendencia más suave, por lo que se observa que mientras mayores
Página 150
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
sea la cantidad de datos que agrupemos para el promedio móvil la
tendencia está mejor representada.
Figura 13 Ingreso por ventas
4.5.3
MÉTODO DEL PROMEDIO MÓVIL PONDERADO
El pronóstico de promedio móvil es óptimo para patrones de demanda
aleatoria o nivelada donde se pretende eliminar el impacto de los
elementos irregulares históricos mediante un enfoque en períodos de
demanda reciente.
Ejemplo de aplicación 12
En el promedio móvil las ponderaciones son las mismas para
todos los datos si ponderamos para tres años sumamos los tres
valores y dividimos para tres cada valor tiene una ponderación de
1/3, mientras que en el promedio ponderado cada valor tiene una
ponderación según la necesidad, la consideración que podría
tomarse en cuenta es la necesidad de que al calcular el promedio
móvil éste se encuentra entre los valores tomados. Si bien la
tendencia se ha suavizado, existe la necesidad de que el promedio
se aproxime al valor del período final.
El promedio móvil obtenemos al sumar los clientes de los tres
primeros años y dividirlo para tres (4,511 + 4,898 + 5,533)/3 = 4,980.67
Las ponderaciones para este ejemplo son de 0.1; 0.2; 0.7, que
suma 1; para cada uno de los períodos la ponderación es diferente
tomando en cuenta que la ponderación del último año es mayor.
Página 151
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
El promedio móvil ponderado obtenemos al sumar los clientes de
los tres primero años multiplicados por la ponderación y dividirlo
para tres (4,511(0.1) + 4,898(0.20) + 5,533(0.7))/3 = 5,303.80.
En la tabla siguiente del ejemplo se observa en 1999 existieron
10,200 clientes y el promedio móvil fue de 8,776.33, mientras que
el promedio ponderado de 9,278 que se aproxima más a los
clientes en ese año. La grafica muestra como el promedio móvil
ponderado se aproxima más al número de clientes.
Figura 14. Promedio móvil ponderado para diferentes periodos.
Página 152
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
BIBLIOGRAFÍA
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para
administración y economía. Mexico D.F.: CENAGE Learning.
Aula Fácil. (28 de 12 de 2015). Curso de Estadística. Obtenido de
http://www.aulafacil.com/cursos/l11221/ciencia/estadisticas/estadi
sticas/coeficiente-de-curtosis
Cabrera, F. A. (24 de 12 de 2015). Medidas de tendencia central Estadística económica. Obtenido de
http://www.monografias.com/trabajos43/medidas-tendenciacentral/medidas-tendencia-central2.shtml
De La Vega, M. (mayo de 2012). TABLAS Y FIGURAS APA 6ta. Ed.
Obtenido de investigación.casagrande.edu.ec:
http://investigacion.casagrande.edu.ec/wpcontent/uploads/2013/10/3.-TABLAS-y-FIGURAS-APA-6ta.-ed..pdf
Definición.de. (12 de julio de 2015). Definición.de. Obtenido de
http://definicion.de/estadistica/
García Pérez, C. (26 de 12 de 2015). Medidas de dispersión . Obtenido de
http://fcps.uaq.mx/descargas/prope2014/estadistica/4/medidas_di
spersion.pdf
Página 153
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
García, J., & Japón , M. (10 de agosto de 2015). thales.cica.es. Obtenido
de http://thales.cica.es/rd/Recursos/rd99/ed99-0278-01/ed990278-01.html
Instituto Nacional de Estadísticas y Censos. (6 de julio de 2015). INEC.
Obtenido de ¿Qué es el censo de población y vivienda?:
http://www.ecuadorencifras.gob.ec/que-es-el-censo-de-poblaciony-vivienda-2/
Levin, R., & Rubin, D. (2004). Estadística para Administración y
Economía. Mexico: Pearson.
Lind, D. A., Marchal, W. G., & Wathen, S. A. (2006). Estadística aplicada a
los negocios y la economía. México: McGraw - Hill.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadística Aplicada a los
Negocios y la Economía. Mexico D.F.: Mc Grawhill.
Martínez, C. (2012). Estadística y muestreo. Bogotá: ECOE EDICIONES.
Recursos para trabajos administrativos. (18 de febrero de 2013).
www.funcionarioseficientes.com.
Reynaga, J. (6 de julio de 2015). Introducción al método estadístico.
Obtenido de
http://www.facmed.unam.mx/emc/computo/infomedic/presentac/
modulos/modulo3/estadistica/clase1/
Página 154
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Slideshare. (5 de julio de 2015). Probabilidad y estadística. Obtenido de
http://es.slideshare.net/RoberLaura/52812712probabilidadyestadisticamisaiasefarias-1
Spiegel, M. R. (1997). Estadística. Madrid: McGraw - Hill.
Suárez, M. O. (16 de 12 de 2015). Guía didáctica para el Interaprendizaje
de Medidas de Tendencia Central. Obtenido de
http://www.monografias.com/trabajos85/interaprendizajemedidas-tendencia-central/interaprendizaje-medidas-tendenciacentral.shtml#mediaarita
Universidad Michoacana de San Nicolás de Hidalgo. (26 de 12 de 2015).
Moda. Obtenido de
http://dieumsnh.qfb.umich.mx/estadistica/moda.htm#La%20moda
Página 155
ESTADÍSTICA BÁSICA I
Mena, R. Escobar, T. Haro, E. Córdova, M. Merino, V.
Página 156
Descargar