Subido por Adrid Cuadrado

ESTADISTICA

Anuncio
ESTADISTICA Y PROBABILIDAD
Texto universitario
ING. ROLANDO W. RIVERA OLIVERA
UNIVERSIDAD AUTONOMA SAN FRANCISCO
AREQUIPA PERU
i
ESTADÍSTICA Y PROBABILIDAD
ii
ESTADÍSTICA Y PROBABILIDAD
ING. ROLANDO WENCESLAO RIVERA OLIVERA
2017
UNIVERSIDAD AUTÓNOMA SAN FRANCISCO
iii
© ESTADÍSTICA BÁSICA
Autor – Editor: Ing., Rolando Wenceslao Rivera Olivera
Calle Piérola N°107, Mariano Melgar, Arequipa.
© Primera Edición – Febrero del 2017.
HECHO EL DEPÓSITO LEGAL EN LA BIBLIOTECA
NACIONAL DEL PERÚ ISBN N°
© Prohibida la reproducción total o parcial de esta obra sin previa
autorización escrita del editor.
© Impreso en Perú / Printed in Perú.
iv
RESUMEN
Este texto Universitario a guisa de ensayo primigenio, podrá ser empleado
básicamente
por
los
estudiantes
de
Educación
Superior,
por
que
implícitamente aborda los temas tan complicados de manera sencilla a fin de
satisfacer los diferentes ritmos de aprendizaje que cada persona tiene con el
mundo abstracto de la ciencia, el arte y la tecnología.
Los cálculos que en ella se incluyen son básicos para toda Carrera Profesional
y sobre todo cuando iniciemos una investigación de enfoque cuantitativo
necesitamos calcular o contar toda la información poseída y mucha veces
lograda con mucho esfuerzo, para poder inferir a través de ella, obtener
conclusiones y lo que es más delicado aún tomar decisiones.
Cada capítulo contiene un dossier de ejercicios de afianzamiento así como su
correspondiente autoevaluación, cuya diversidad son producto de la enseñanza
que se ejerce en la docencia Universitaria. Esta obra se ha clasificado en 6
capítulos que a nuestro entender constituye el tema de Estadística y
Probabilidades, en la primera parte se abarca los temas generales y una
introducción al estudio y tratamiento de datos, una segunda parte con la
organización y/o presentación de los datos para posteriormente cuantificarlos
con las medidas correspondientes es decir, de tendencia central y la
variabilidad, incluimos el tema de Números Índices a fin de que se tenga una
correlación de datos con su obtención y las diferentes interpretaciones que
podemos obtener con ellos, por ejemplo si son o no simétricos o el grado de
apuntalamiento que pudieran presentar en tal o cual situación terminando con
el estudio de las probabilidades, sus usos, enfoques y la trascendencia que
implica manejar la ocurrencia o no de un
siempre para la toma de decisiones.
v
determinando evento o suceso
PRESENTACIÓN:
Este trabajo tiene como objeto contribuir al enriquecimiento cognitivo del
estudiante, sirviendo como guía por esa ruta de aprender a aprender esta rama
tan importante de las matemáticas como es la estadística, la única asignatura
que nos enseña el arte de la toma de decisiones.
En la literatura es común encontrar numerosos textos de Estadística
llenos de vocabulario abstracto y un lenguaje técnico bastante sofisticado que
algunas veces se muestra árido para el estudiante, que en vez de acercarlo a
su dominio, suele muchas veces alejarlo, dado que adolecen de un sentido
práctico y funcional de la Estadística, es por eso que nos sentimos animados a
llevar adelante este proyecto de ofrecer este texto universitario como
herramienta complementaria hacia los logros de aprendizaje de esta signatura.
Anteriormente el término estadística solo era aplicado para asuntos de
gobierno, sin embargo hoy en día se hace extensivo su uso en todas las
disciplinas del conocimiento y cómo no en las facetas cotidianas de la vida
humana, porque nuestro actuar se basa en tomar decisiones permanentes. Así,
utilizamos estadística para la biología, los negocios, la medicina, sociología, la
enseñanza, pero fundamentalmente es una herramienta básica del proceso de
investigación a todo nivel. Como conocimiento prerrequisito señalamos la
aritmética y algunos conocimientos de álgebra.
Se incluye en éste texto seis capítulos y cada uno de ellos ilustrados con
ejemplos y al final se invita al estudiante a resolver los ejercicios de aplicación
para cada ítem, así como también en cada capítulo se encuentran las pruebas
de Autoevaluación que permitirá al estudiante comprobar el logro de su
aprendizaje.
Debemos dejar clara constancia que no somos autores de todo lo que se
encuentra en el presente texto, dado que los conocimientos, definiciones y
algunos ejemplos, se van recreando y contextualizando a las exigencias de uso
de los diferentes ritmos de aprendizaje de cada estudiante, cada autor va
imprimiendo en dicha recreación su sello personal y la dirección con que
induce al estudiante para el logro de los objetivos trazados, el nuestro es que el
joven se recree con los ejemplos que se consignan, buscando constituir una
herramienta fácil y sencilla para la toma de decisiones. Valoramos el aporte de
los diferentes autores de quienes se ha nutrido el presente texto, cuya
referencia indicamos oportunamente en la Bibliografía y que son muchos y si
existiera alguna omisión es totalmente involuntaria.
Finalmente, deseo agradecer a la Universidad Autónoma San Francisco
por impulsar y cooperar con el logro de este proyecto.
Ing. Rolando W. Rivera Olivera
vi
INDICE
ING. ROLANDO W. RIVERA OLIVERA ....................................................................................... i
UNIVERSIDAD AUTONOMA SAN FRANCISCO ......................................................................... i
PRESENTACIÓN: ..................................................................................................................... vi
CAPITULO I ................................................................................................................................. 1
1. CONCEPTOS GENERALES................................................................................................ 1
1.1. ESTADISTICA .................................................................................................................... 1
1.2. CLASES DE ESTADISTICA ............................................................................................ 1
1.2.1.
Descriptiva – subjetiva : ..................................................................................... 1
1.2.2.
Inferencial – objetiva: .......................................................................................... 2
1.3. TERMINOLOGÍA ESTADÍSTICA .................................................................................... 2
1.4. VARIABLES Y ATRIBUTOS ............................................................................................ 5
1.5. FORMAS DE OBSERVAR LA POBLACIÓN: ............................................................... 6
1.5.1.
ATENDIENDO A LA FUENTE.- se clasifican en directa o indirecta.............. 6
1.5.2. ATENDIENDO A LA PERIODICIDAD.- puede ser continua, periódica o
circunstancial. ..................................................................................................................... 7
1.6. CENSO: ............................................................................................................................... 8
1.7. Encuesta: ............................................................................................................................ 9
1.8. MODALIDADES DE RECOLECCIÓN DE DATOS: ..................................................... 9
1.8.1.
Fuentes de información: ..................................................................................... 9
1.8.2.
Sistemas de recolección: ............................................................................... 10
1.8.3.
Técnicas de recoleccion ................................................................................... 10
1.9. ESCALAS O NIVELES DE MEDICION ........................................................................ 11
1.9.1.
Medición................................................................................................................ 11
1.9.2.
Niveles o Escalas de mediciones................................................................... 11
1.10.
LAS VARIABLES Y SU MEDICIÓN: .................................................................... 14
1.11.
INTERVALO. ............................................................................................................. 16
1.12.
RAZÓN. ..................................................................................................................... 16
1.13.
FORMAS DE RECOLECTAR INFORMACIÓN .................................................. 17
1.14.
MUESTREO. ............................................................................................................. 17
1.14.1. Aleatorio Simple: ................................................................................................ 18
1.14.2. Sistemático: ......................................................................................................... 19
1.14.3. Estratificado: ....................................................................................................... 19
vii
1.14.4. Por conglomerados; En este caso la muestra nos presenta gran dificultad
para establecer sus diferencias, por lo que iniciamos seleccionando en forma
aleatoria una muestra de conglomerados, ya que, cada uno de ellos podría
representar una muestra, posteriormente se deberá elaborar un censo para poder
establecer las proporciones de las diferentes categorías que se encuentren
presentes en nuestra muestra. ....................................................................................... 19
CAPITULO II .............................................................................................................................. 27
2. PROCESO ESTADISTICO. ................................................................................................ 27
2.1.
ORGANIZACIÓN Y RESUMEN DE DATOS.- Cuando se tiene ya los datos
que han sido tomados, recolectados, se procede a prepararlos y ordenarlos con
un criterio sistemático, de forma que, puedan determinarse las características que
se pretendan analizar, del cual nos ocuparemos en esta parte, denominamos a
esta etapa como tabulación de resultados, es decir, representarlo mediante unas
tablas que describiremos más adelante. ...................................................................... 27
2.2.
DISTRIBUCIÓN DE FRECUENCIAS. .............................................................. 27
2.3.
CLASIFICACIÓN DE DISTRIBUCION DE RECUENCIAS:........................... 28
2.4.
Pasos para la elaboración de un tabla de distribución de frecuencias:
29
2.5.
OTRAS FORMAS DE ELABORAR LA TABLA DE DISTRIBUCION DE
FRECUENCIAS. ............................................................................................................... 33
2.6.
FUENTE DE DATOS. .......................................................................................... 40
2.7.
REPRESENTACION GRAFICA ........................................................................ 43
CAPITULO III ................................................................................................................................ 63
3 MEDIDAS DE CENTRALIZACIÓN ................................................................................... 63
3.1.
MEDIDAS DE TENDENCIA CENTRAL MÁS UTILIZADAS. ....................... 63
3.2.
MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES ..... 75
3.3.
MEDIDAS DE POSICIÓN ................................................................................... 86
CAPITULO IV ............................................................................................................................. 103
4. MEDIDAS DE DISPERSIÓN. ........................................................................................... 103
Introducción: .................................................................................................................... 103
4.1.
RANGO o alcance (o Intervalo: R ): ............................................................... 103
4.2.
RANGO INTER CUARTIL (RI): ....................................................................... 104
4.3.
RANGO SEMI-INTER CUARTIL (RSIQ): (o Desviación Cuartil) ............ 104
4.4.
DESVIACIÓN MEDIA ABSOLUTa (DM): (o Desviación Absoluta Promedio)
104
4.5.
VARIANZA: ......................................................................................................... 105
4.6.
DESVIACIÓN ESTÁNDAR: ............................................................................. 107
4.8.
MEDIDAS DE FORMA ...................................................................................... 109
viii
4.9
MEDIDAS DE CONCENTRACIÓN ................................................................. 113
CAPITULO V ............................................................................................................................... 127
5 NUMEROS INDICES. ........................................................................................................ 127
5.1
Concepto. ........................................................................................................... 127
5.2
Número índice simple de precio, cantidad y valor .................................. 127
5.3
Índices relativo de precios ............................................................................. 128
5.4
Índice de cantidad o volumen relativo ........................................................ 130
5.5
Índice de valor ................................................................................................... 130
5.6
Índices de Agregación Simple. ..................................................................... 132
5.7
Método de media de Relativos simples...................................................... 132
5.8
Método de cálculo de los índices por agregación ponderada. ............ 133
5.9
METODO DE MEDIA DE RELATIVOS PONDERADA ............................... 135
5.10
NÚMEROS INDICES DE CANTIDAD O VOLUMEN. .................................. 136
5.11
NUMEROS INDICES DE VALOR ................................................................... 136
CAPITULO VI .......................................................................................................................... 145
6. PROBABILIDAD. ............................................................................................................... 145
6.2.
SUCESO ELEMENTAL: hace referencia a cada una de las posibles
soluciones que se pueden presentar. ......................................................................... 147
6.3.
SUCESO COMPUESTO: .................................................................................. 147
6.4.
RELACIÓN ENTRE SUCESOS ....................................................................... 148
6.5.
CÁLCULO DE PROBABILIDADES ................................................................ 149
6.6.
PROBABILIDAD DE SUCESOS ..................................................................... 152
6.7.
ANALISIS COMBONATORIO Y PROBABILIDAD. ..................................... 155
6.8.
PROBABILIDAD CONDICIONADA ................................................................ 169
6.9.
PROBABILIDAD COMPUESTA ...................................................................... 171
6.10.
TEOREMA DE LA PROBABILIDAD TOTAL ................................................ 172
6.11.
TEOREMA DE BAYES ..................................................................................... 174
6.12.
SUCESOS INDEPENDIENTES ....................................................................... 176
6.13.
DISTRIBUCIONES DISCRETAS: BERNOUILLI .......................................... 178
6.14.
DISTRIBUCIONES DISCRETAS: BINOMIAL .............................................. 180
6.15.
DISTRIBUCIONES DISCRETAS: POISSON ................................................ 181
ix
CAPITULO I
1. CONCEPTOS GENERALES
1.1. ESTADISTICA
La estadística es una Técnica, arte, ciencia que forma parte de una comunicación gráfica. Es el
estudio de datos. “es la primera herramienta de la investigación que se ocupa de la recolección,
estudio, organización y análisis e interpretación de datos, tanto para la deducción de conclusiones
como para tomar decisiones razonables.”
1.2. CLASES DE ESTADISTICA
1.2.1. Descriptiva – subjetiva :
Tienen por objeto fundamental describir y analizar las características de un
conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a la
observación de todos los elementos de una población (observación exhaustiva)
sino también a la descripción de los elementos de una muestra (observación
parcial).
En relación a la estadística descriptiva, Ernesto Rivas González dice; “Para el
estudio de estas muestras, la estadística descriptiva nos provee de todos sus
medidas; medidas que cuando quieran ser aplicadas al universo total, no
tendrán la misma exactitud que tienen para la muestra, es decir al estimarse
para el universo vendrá dada con cierto margen de error; esto significa que el
valor de la medida calculada para la muestra, en el oscilará dentro de cierto
límite de confianza, que casi siempre es de un 95 a 99% de los casos.
1
Podemos decir también que es subjetivo depende de los sentimientos, estados
de ánimo.
1.2.2. Inferencial – objetiva:
Se basa en hechos reales tal y como son, además se apoyan en el cálculo
probabilístico
y
utiliza
pruebas
objetivas
para
obtener
inferencias
y
predicciones; utiliza estimaciones que más adelante tendrán validez general.
Está fundamentada en los resultados obtenidos del análisis de una
muestra de población, con el fin de inducir o inferir el comportamiento o
característica de la población, de donde procede, por lo que recibe
también el nombre de Inferencia estadística. Según Berenson y Levine;
Estadística Inferencial son procedimientos estadísticos que sirven para
deducir o inferir algo acerca de un conjunto de datos numéricos
(población), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica
en identificar clases numerosas de objetos, personas o eventos a partir de
otras relativamente pequeñas compuestas por los mismos elementos.
1.3. TERMINOLOGÍA ESTADÍSTICA
❖ Población.- conjunto de unidades de análisis que conforman un todo que
tienen propiedades comunes.
“Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones”.
Levin&Rubin (1996).
“Una población es un conjunto de elementos que presentan una
característica común”. Cadenas (1974).
Ejemplo:
Los miembros del Colegio de Ingenieros de la Región Arequipa.
El tamaño que tiene una población es un factor de suma importancia en el
proceso de investigación estadística, y este tamaño vienen dado por el
número de elementos que constituyen la población, según el número de
elementos la población puede ser finita o infinita. Cuando el número de
2
elementos que integra la población es muy grande, se puede considerar a
esta como una población infinita, por ejemplo; el conjunto de todos los
números positivos. Una población finita es aquella que está formada por
un limitado número de elementos, por ejemplo; el número de estudiante
del
ISEP “Honorio Delgado E.”, o los Estudiantes de la Universidad
UANCV.
Cuando la población es muy grande, es obvio que la observación de
todos los elementos se dificulte en cuanto al trabajo, tiempo y costos
necesario para hacerlo. Para solucionar este inconveniente se utiliza una
muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los
individuos, sobre todos si estos son muchos. En lugar de examinar al
grupo entero llamado población o universo, se examina una pequeña
parte del grupo llamada muestra.
❖ Muestra.- una parte del todo con propiedades diferentes.
“Se llama muestra a una parte de la población a estudiar que sirve para
representarla”. Murria R. Spiegel (1991).
“Una muestra es una colección de algunos elementos de la población,
pero no de todos”. Levin&Rubin (1996).
“Una muestra debe ser definida en base de la población determinada, y
las conclusiones que se obtengan de dicha muestra solo podrán referirse
a la población en referencia”, Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros de la
Región Arequipa.
El estudio de muestras es más sencillo que el estudio de la población
completa; cuesta menos y lleva menos tiempo. Por último se aprobado
que el examen de una población entera todavía permite la aceptación de
elementos defectuosos, por tanto, en algunos casos, el muestreo puede
elevar el nivel de calidad.
Una muestra representativa contiene las características relevantes de la
población en las mismas proporciones que están incluidas en tal
población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta
3
información para hacer referencias sobre la población que está
representada por la muestra. En consecuencia muestra y población son
conceptos relativos. Una población es un todo y una muestra es una
fracción o segmento de ese todo.
❖ Muestreo.-Esto no es más que el procedimiento empleado para obtener
una o más muestras de una población; el muestreo es una técnica que
sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral
representativo de la población, se procede a la selección de los elementos
de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que
calculamos para cada muestra no necesariamente serían iguales, y lo
más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de Contabilidad del
ISEP “Honorio Delgado E.” de la ciudad de Arequipa, determinando por lo
menos dos caracteres a ser estudiados en dicha población: Religión y
Expectativas profesionales; estas serán diferentes a los de los estudiantes
de Administración, lo que corrobora que hay variación de muestra a
muestra.
❖ Tipos de muestreo.-
Existen dos métodos para seleccionar muestras de poblaciones; el
muestreo no aleatorio o de juicio y el muestreo aleatorio o de
probabilidad. En este último todos los elementos de la población tienen
la oportunidad de ser escogidos en la muestra. Una muestra seleccionada
por muestreo de juicio se basa en la experiencia de alguien con la
población. Algunas veces una muestra de juicio se usa como guía o
muestra tentativa para decidir cómo tomar una muestra aleatoria más
adelante. Las muestras de juicio evitan el análisis estadístico necesario
para hacer muestras de probabilidad.
❖ Dato.- es un atributo, una cualidad, una habilidad, todo atributo, toda
variable, todo lo que existe en nuestro mundo real.
4
❖ Parámetro.- son las medidas de la población.
❖ Estadígrafo o estadístico.- son las medidas de las muestras en relación
al tamaño de la población pueden ser finitas e infinitas.
❖ Características, propiedades, rasgos, atributos de una unidad de análisis,
de carácter cualitativa y cuantitativa.
❖ Modalidades.- son los diferentes estados o situaciones de un carácter
estas
deben ser
a la vez muy exhaustivas y además mutuamente
excluyentes.
❖ Clases.- es el conjunto de una o más modalidades en el que se verifica
en que cada modalidad pertenece a uno solo y a una clase.
1.4. VARIABLES Y ATRIBUTOS
Es todo dato o característica de una unidad de análisis que puede tomar
cualquier valor cualitativo o cuantitativo.
Las variables, también suelen ser llamados caracteres cuantitativos, son
aquellos que pueden ser expresados mediante números. Son caracteres
susceptibles de medición. Como por ejemplo, la estatura, el peso, el
salario, la edad, etc.
Según, Murray R. Spiegel, (1992) “una variable es un símbolo, tal como
X, Y, 𝑓𝑋 , que puede tomar un valor cualquiera de un conjunto
determinado de ellos, llamado dominio de la variable. Si la variable puede
tomar solamente un valor, se llama constante.”
Todos los elementos de la población poseen los mismos tipos de
caracteres, pero como estos en general no suelen representarse con la
misma intensidad, es obvio que las variables toman distintos valores. Por
lo tanto estos distintos números o medidas que toman los caracteres son
los “valores de la variable”. Todos ellos juntos constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que
no son susceptibles de medición, es decir que no se pueden expresar
mediante un número.
Iutin (1997). “Reciben el nombre de variables cualitativas o atributos,
5
aquellas características que pueden presentarse en individuos que
constituyen un conjunto.
La forma de expresar los atributos es mediante palabras, por ejemplo;
profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los
atributos no se presentan en la misma forma en todos los elementos.
Estas distintas formas en que se presentan los atributos reciben el
nombre de “modalidades”.
Ejemplo;
El estado civil de cada uno de los estudiantes del curso de estadísticas I,
no se presenta en la misma modalidad en todos.
1.5. FORMAS DE OBSERVAR LA POBLACIÓN:
1.5.1. ATENDIENDO A LA FUENTE.- se clasifican en directa o
indirecta.
•
Observación directa: es aquella donde se tienen un contacto directo
con los elementos o caracteres en los cuales se presenta el
fenómeno que se pretende investigar, y los resultados obtenidos se
consideran datos estadísticos originales. Para Ernesto Rivas
González (1997) “Investigación directa, es aquella en que el
investigador observa directamente los casos o individuos en los
cuales se produce el fenómeno, entrando en contacto con ellos; sus
resultados se consideran datos estadísticos originales, por esto se
llama también a esta investigación primaria”.
Ejemplo: El seguimiento de la población agrícola por año, llevado en
una determinada granja.
•
Observación Indirecta: es aquella donde la persona que investiga
hace uso de datos estadísticos ya conocidos en una investigación
6
anterior, o de datos observados por un tercero (persona o entidad).
Con el fin de deducir otros hechos o fenómenos.
Ejemplo; si un investigador pretende estudiar la producción por años
de una granja avícola, en el Distrito de la Joya, en sus últimos cinco
años de producción, tendría que hacer un seguimiento, a tal fin
recurriría a las observaciones que posee la oficina administrativa de
la granja durante estos cinco años, o dirigirse a la oficina de
estadística, llevada en la Gerencia del Ministerio de la Producción y
Comercio de nuestra localidad donde está registrada dicha granja.
Es de notar que el investigador se vale de observaciones realizadas
por terceros.
1.5.2. ATENDIENDO A LA PERIODICIDAD.-
puede ser continua,
periódica o circunstancial.
Una observación continua; Como su nombre lo indica es aquella
que se lleva acabo de un modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras,
ventas y otras operaciones que se van registrando a medida que van
produciéndose.
•
Una observación periódica; es aquélla que se lleva a cabo a
través de períodos de tiempo constantes. Estos períodos de
tiempos pueden ser semanas, trimestres, semestres, años, etc.
Lo que debemos destacar es que los períodos de tiempo
tomados como unidad deben tomarse constantes en lo posible.
Ejemplo; el registro llevado por la Oficinas de Secretaría Académica
de la Universidad UANCV, en cuanto a la inscripción de los
estudiantes por semestre.
La observación circunstancial, es aquella que se efectúa en forma
7
ocasional o esporádica, esta observación hecha más por una
necesidad momentánea, que de carácter regular o permanente.
Ejemplo; la obtención de números de aulas utilizadas y no utilizadas
en el campus del ISEP “Honorio Delgado E.” en la ciudad de
Arequipa.
1.5.3. ATENDIENDO A LA COBERTURA. pueden ser exhaustivas,
parciales o mixtas
•
Observación Exhaustiva. Cuando la observación es efectuada
sobre la totalidad de los elementos de la población se habla de
una observación exhaustiva.
•
Observación Parcial. Dados que las poblaciones en general son
grandes, la observación de todos sus elementos se ve
imposibilitada. La solución para superar este inconveniente es
observar una parte de esta población.
•
Observación Mixta. En este tipo de observación se combinan
adecuadamente la observación exhaustiva con la observación
parcial. Por lo general, este tipo de observaciones se lleva a cabo
de tal manera que los caracteres que se consideran básicos se
observan exhaustivamente y los otros mediante una muestra; o
bien cuando la población es muy grande, parte de ella se observa
parcialmente.
1.6. CENSO:
Se entiende por censo aquella numeración que se efectúa a todos y
cada uno de los caracteres componentes de una población.
Para Levin&Rubin (1996) “Algunas veces es posible y práctico examinar
a cada persona o elemento de la población que deseamos describir. A
esto lo llamamos una numeración completa o censo. Utilizamos el
muestreo cuando no es posible contar o medir todos los elementos de la
población.
Si es posible listar (o enumerar) y observar cada elemento de la
población, los censos se utilizan rara vez porque a menudo su
8
compilación es bastante difícil, consume mucho tiempo por lo que
resulta demasiado costoso.
1.7.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es
decir son observaciones parciales.
El diseño de encuestas es exclusivo de las ciencias sociales y parte de la
premisa de que si queremos conocer algo sobre el comportamiento de las
personas, lo mejor, más directo y simple es preguntárselo directamente a
ellas. (Cadenas, 1974).
Según Antonio Napolitano “La encuesta, es un método mediante el cual se
quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos
que son aplicados a un gran número de personas”.
1.8. MODALIDADES DE RECOLECCIÓN DE DATOS:
1.8.1. Fuentes de información:
Es el lugar, la institución o persona donde están los datos que
se necesitan para cada una de las variables o aspectos de la
investigación. Las fuentes de información pueden ser:
a)
Fuentes primarias: Cuando los datos se obtienen
directamente de la misma persona o
entidad utilizando ciertas
técnicas.
Ejemplo:
Llevar a cabo una encuesta para conocer el grado de
satisfacción laboral en los trabajadores de una empresa “X”.
b)
Fuentes secundarias: Cuando los datos ya han sido
elaborados y procesados por otras personas o instituciones.
Ejemplo:
La
información
estadística
que
diferentes ministerios del Perú.
9
publica
el
INEI
de
los
1.8.2. Sistemas de recolección:
Son procedimientos que se utilizan para recoger información y
pueden ser:
a) Los registros: Son libros, padrones, etc. en donde se anotan en
forma regular permanente y obligatoria los hechos ocurridos.
Ejemplo
Registros Civiles, RENIEC, Registros Públicos, Registros Electrónicos,
etc.
b) Las encuestas: Son procedimientos de obtención de información
estructurada según criterios previos de sistematización que se efectúa con
un propósito específico en toda la población o en un sector de ella y pueden
ser:
b.1) Encuesta censal: Cuando abarca toda la población en
estudio.
Ejemplo:
Censos de población y vivienda de una localidad o país.
b.2) Encuesta muestral: Cuando abarca una parte de la
población en estudio.
Ejemplo
Llevar a cabo una Encuesta de preferencia electoral.
1.8.3. Técnicas de recoleccion
Son procedimientos que se utilizan para recolectar información
según la observación, naturaleza del trabajo de investigación.
Pueden ser: La observación, el cuestionario, la entrevista, test, etc.
a) La observación: Es la acción de mirar con rigor, en forma
sistemática y profunda, con el interés de descubrir la importancia de
aquello que se observa.
b) El cuestionario: Es un instrumento constituido por un conjunto de
preguntas
sistemáticamente
elaboradas,
que
se
formulan
al
encuestado o entrevistado, con el propósito de obtener datos de las
10
variables consideradas en estudio.
c) La entrevista: Es un diálogo entre personas, es una técnica donde
una persona llamada entrevistador, encuestador o empadronador
solicita al entrevistado, le proporcione algunos datos e información.
d) El test : Pruebas o exámenes con ayuda de un cuestionario o escala
que mide determinadas funciones, generalmente cognitivas.
1.9. ESCALAS O NIVELES DE MEDICION
1.9.1. Medición
Existen diversas definiciones del término “medición”, pero estas
dependen de los diferentes puntos de vista que se puedan tener
al abordar el problema de la cuantificación y el proceso mismo de
la construcción de una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a
elementos u objetos para representar o cuantificar una propiedad.
El problema básico está dado por la asignación de un numeral
que represente la magnitud de la característica que queremos
medir y que dicho números pueden analizarse por manipulaciones
de acuerdo a ciertas reglas. Por medio de la medición, los
atributos de nuestras percepciones se transforman en entidades
conocidas y manejables llamadas “números”. Es evidente que el
mundo resultaría caótico si no pudiéramos medir nada. En este
caso cabría preguntarse de que le serviría al físico saber que el
hierro tiene una alta temperatura de fusión.
1.9.2. Niveles o Escalas de mediciones
1.9.2.1. Escala Nominal:
La escala de medida nominal, puede considerarse la escala de
nivel más bajo, y consiste en la asignación, puramente arbitraria
de números o símbolos a cada una de las diferentes categorías
en las cuales podemos dividir el carácter que observamos, sin
que puedan establecerse relaciones entre dichas categorías, a no
11
ser el de que cada elemento pueda pertenecer a una y solo una
de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que
pertenezcan a la misma sean equivalentes respecto del atributo o
propiedad en estudio, después de lo cual se asignan nombres a
tales clases, y el hecho de que a veces, en lugar de
denominaciones, se le atribuyan números, puede ser una de las
razones por las cuales se le conoce como “medidas nominales”.
Ejemplo, podemos estar interesados en clasificar los estudiantes
de la UASF Distrito de Tiabaya de acuerdos a la carrera que
cursan.
Carrera
Número
asignada
a
la
categoría
Ing. Industrial
01
Ing. Comercial
02
Ing. Mecánica
03
Se ha de tener presente que los números asignados a cada
categoría sirven única y exclusivamente para identificar la
categoría y no poseen propiedades cuantitativas.
1.9.2.2. Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo
o propiedad de un objeto, la medida ordinal es la indicada, puesto
que entonces puede recurrirse a la propiedad de “orden” de los
números asignándolo a los objetos en estudio de modo que, si la
cifra asignada al objeto A es mayor que la de B, puede inferirse
que A posee un mayor grado de atributo que B.
12
La asignación de números a las distintas categorías no puede ser
completamente arbitraria, debe hacerse atendiendo al orden
existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten,
por el hecho mismo de poder ordenar todas sus categorías, el
cálculo de las medidas estadísticas de posición, como por
ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el
orden de llegada, estamos llevando una escala ordinal, es decir que al
primero en llegar ordinal, es decir que al primeo en llegar le asignamos
el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada
número representará una categoría en general, con un solo elemento y
se puede establecer relaciones entre ellas, ya que los números
asignados guardan la misma relación que el orden de llegada a la
consulta.
1.9.2.3. Escalas de intervalos iguales:
La escala de intervalos iguales, está caracterizada por una unidad de
medida común y constante que asigna un número igual al número de
unidades equivalentes a la de la magnitud que posea el elemento
observado. Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningún momento ausencia
de la magnitud que estamos midiendo. Esta escala, además de poseer
las características de la escala ordinal, encontramos que la asignación
de los números a los elemento es tan precisa que podemos determinar
la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es
la primera escala verdaderamente cuantitativa y a los caracteres que
posean esta escala de medida pueden calculársele todas las medidas
estadísticas a excepción del coeficiente de variación.
13
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre
2000-2001.
1.9.2.4. Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se
diferencia de las escalas de intervalos iguales únicamente por poseer un
punto cero propio como origen; es decir que el valor cero de esta escala
significa ausencia de la magnitud que estamos midiendo. Si se observa
una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los números asignados
corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un
valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó
que hay familias que no tienen hijos, otras tienen 6 hijos que es
exactamente el doble de hijos que aquellas que tienen 3 hijos
1.10. LAS VARIABLES Y SU MEDICIÓN:
Una variable es un símbolo, tal como X, Y, H, x ó b, que pueden tomar
un conjunto prefijado de valores, llamado dominio de esa variable. Para
Murray R. Spiegel (1991) “una variable que puede tomar cualquier valor
entre dos valores dados se dice que es una variable continua en caso
contrario diremos que la variable es discreta”.
Una Variable puede ser también clasificada de dos formas atendiendo
su naturaleza:
Cuantitativas y cualitativas, las primeras se pueden expresar por
cantidades y la segunda sólo resalta las cualidades o atributos
especiales y no se expresan con cantidades medibles sino en categorías
o atributos.
14
Las variables, también llamadas caracteres cuantitativos, son aquellas
cuyas variaciones son susceptibles de ser medidas cuantitativamente,
es decir, que pueden expresar numéricamente la magnitud de dichas
variaciones. Por intuición y por experiencia sabemos que pueden
distinguirse dos tipos de variables; las continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo
par de valores siempre se puede encontrar en valor intermedio, (el peso,
la estatura, el tiempo empleado para realizar un trabajo, temperatura,
etc.)
Una variable es continua, cuando puede tomar infinitos valores
intermedios dentro de dos valores consecutivos y expresarse con
fracciones o decimales.
Ejemplo:
En el preescolar Niña María, ubicado en la urbanización San Martin,
Mariano Melgar de esta ciudad se procedió a recoger las medidas de
talla y peso de los niños que a este asisten.
Niño
Peso
Talla
José
18,300
1,15
Julio
20,500
1,20
Pedro
19,000
1,10
Luis
18,750
1,18
Las variables discretas serán aquellas que pueden tomar solo un
número limitado de valores separados y no continuos; son aquellas que
solo toman un determinado números de valores, porque entre dos
valores consecutivos no pueden tomar ningún otro; por ejemplo el
número de estudiantes de una clase es una variable discreta ya que solo
tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como
1,5 estudiantes
Las escalas más frecuentes de medición son el nominal, ordinal del
intervalo y de razón; estas mediciones se deben expresar como un
número que informe lo más preciso posible sobre las características en
la unidad observada.
15
RESUMEN DE VARIABLES:
Cualitativas.- muestran atributos, cualidades, categorías, no cantidades.
Cuantitativas.- resulta de medir y pesar o contar y si se expresa en cantidades.
•
Contar: discretas (carro, personas, edad) son aquellas que se cuenta y no
éxpresan fracciones o decimales.
•
Medir, pesar: continuas.- (Talla, temperatura, presión, velocidad, etc.) Se pueden
expresar en fracciones y aceptan cantidades decimales.
Dependiente: Efecto (bajo rendimiento académico)
Independiente: Causa Principal (no tiene apoyo logístico)
Intervinientes: Cusas secundarias: (no estudia, no asiste, llega tarde, trabaja, etc.)
1.11. INTERVALO.
Además de las características anteriores se tiene que analizar la diferencia
entre los números asignados ya que representa propiamente, cantidades
de la característica medida y estas se expresan en rangos, parámetros,
que se pueden estimar dentro de un conjunto de datos, entonces podemos
indicar que una cierta cantidad está entre dos valores uno máximo y otro
mínimo al cual denominamos intervalo (k).
a≤k≤b
k
a
b
1.12. RAZÓN.
Aquí, los propios
números
asignados en la medida ya representan
cantidades de las características que se mide, estas escalas se
caracterizan no solo por tener una unidad de medida sino también por
poseer un cero absoluto u origen natural el cual significa ausencia de la
característica por tanto más prima las razones convencionales en su uso.
•
Cuestionarios
--------------------
•
Entrevista
--------------------- preguntas abiertas
•
Encuesta
•
Observador descriptivo ---------
preguntas abiertas
------------------- preguntas cerradas
16
objetivo
1.13. FORMAS DE RECOLECTAR INFORMACIÓN
1.13.1 Directa: Cuando vamos a recoger información en forma personal
con instrumentos
diseñados para las circunstancias
específicas.
1.13.2 Indirecta: Cuando los datos o información ya están registrados y
almacenados. Ej. Ios datos que se obtienen de las instituciones
como Municipalidades, Hospitales, Colegios, Comisarias, Centros
de salud, Bibliotecas, Internet, Reniec etc. etc.
1.14. MUESTREO.
Cuando ya se han identificado el problema que deseamos resolver, la
población, el tipo de datos y las variables con las que nos acercaremos a
la información entonces será necesario especificar si es necesario
trabajar solo con la población o con una muestra así como la forma en la
que obtendremos los datos.
Por lo anterior se describirán las diferentes formas de obtener una
muestra:
Dentro de la estadística se pueden obtener muestras que resultan
probabilísticas y las no probabilísticas, diferenciándose en el método de
su consecución, es decir, cuando utilizamos un método que nos
garantice que todos los elementos de una población tienen la misma
probabilidad de ser elegidos estamos trabajando con un muestreo
probabilístico
y cuando la obtención de una muestra resulte de
criterios, juicios, preferencias o cualquier elemento subjetivo (o en otras
palabras, que no podamos garantizar que contemos con elementos
equiprobables) entonces estaremos trabajando con un muestreo no
probabilístico.
De ahí que nos enfocáremos más a los primeros; subdividiéndolos en:
17
1.14.1.
Aleatorio Simple:
El muestreo aleatorio requiere del tamaño de la población “N”, el
tamaño de la muestra “n”, de una tabla de números aleatorios,
especificar si se realizará con reemplazo o sin él, así como, de una regla
de uso (no debe ser la misma en todos los casos)
y determinar el
número de dígitos que se utilizarán. Por ejemplo; si me intereso en
determinar el nivel socioeconómico de
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
1
0
5
3
5
0
9
6
8
3
4
5
6
3
2
5
8
0
3
9
5
5
9
3
9
4
2
3
4
3
9
5
5
0
6
0
9
0
5
2
7
4
5
9
4
9
2
3
2
2
1
9
9
7
5
2
5
8
5
5
3
3
9
2
4
8
8
0
5
4
5
6
6
3
6
2
5
3
1
4
5
9
8
9
1
9
1
7
4
7
9
7
5
1
9
1
8
1
4
9
3
0
3
0
8
4
4
9
6
2
3
9
0
6
5
9
9
0
0
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
0 9 4 5 6 4 9 4 9 0 5 7 7 6 9 4 4
6 8 2 3 4 9 9 3 7 7 6 8 4 9 3 8 3
5 5 9 0 8 5 6 7 1 6 0 2 7 7 7 8 4
3 3 1 6 4 4 1 9 6 8 9 6 8 4 4 0 3
4 1 4 3 2 7 2 0 3 9 4 9 9 0 1 1 6
2 0 9 7 0 1 0 8 1 6 0 7 9 4 0 7 3
8 0 5 1 8 5 6 1 5 9 1 8 2 3 9 4 4
8 3 5 9 9 3 7 6 3 7 3 5 1 8 6 4 3
2 6 8 0 8 2 4 1 2 1 7 2 2 2 8 3 8
7 6 0 4 7 8 5 6 1 4 8 5 6 9 7 7 5
1 0 7 5 6 4 2 0 5 7 0 2 5 7 1 9 7
2 0 2 7 8 8 9 7 1 6 8 0 4 4 7 3 7
7 6 0 6 9 9 7 2 0 8 9 1 9 8 8 4 2
1 3 7 3 0 0 4 8 7 7 9 0 7 4 3 6 1
las personas que se encuentran trabajando dentro de una empresa y
deseo que todos sus integrantes tengan la misma probabilidad de ser
elegidos entonces realizo lo siguiente: determino el número total de
empleados (N=200), el número de personas que integrarán la muestra
(n=10), selecciono una regla para utilizar mi tabla de números aleatorios
(lanzaré mi lápiz y donde caiga leeré de 3 en 3 dígitos sobre la misma
columna hacia abajo hasta terminarla y cuando esto suceda continuare
leyendo en la siguiente columna hasta terminar de obtener los diez datos).
Supongamos que la tabla es la siguiente y que al arrojar el lápiz cayó en
el renglón 5 columna 7, entonces,
las personas que debemos seleccionar serán:
097,766, 628,179, 047, 582, 478, 895, 664, 604, 772, 373, 685, 765, 553,
101, 780, 295, 191, 276, 321, 298, 797, 454, 544, 221, 458, 097,363, 158,
409, 517, 279, 458, 243, 755, 061, 212, 061, 641, 112, tomando en
cuenta que es un muestreo con reemplazo.
18
1.14.2.
Sistemático:
Este muestreo permite obtener los elementos de cada k - ésima unidad
de la población, y para ello se requiere conocer el tamaño de la
población (N), el de la muestra (n) y obtener el valor de k, de tal forma
que al tener estos datos escojamos al primer dato por medio del número
aleatorio simple y de ahí de k en k.
K
N
n
Por ejemplo; si tenemos la necesidad de extraer una muestra de 20
artículos de 1000 unidades producidas entonces deberemos dividir
1000/20 obteniendo 50 por lo que el primer número lo seleccionamos de
nuestra tabla de números aleatorios obteniendo el número 12, por lo
que, los siguientes números deberán ser 12+k, 12+2k, etc., es decir, 12,
62,112, 162, 212, 262, 312, 362, 412, 462, 512, etc.
1.14.3.
Estratificado:
Este tipo de muestreo requiere tener una población bien clasificada en
varios grupos llamados estratos, que a su interior se mantengan
bastante homogéneos, para construir la muestra normalmente se toma
una cantidad de elementos del mismo tamaño de cada uno de los
estratos, este debe ser mediante el muestreo aleatorio simple (m.a.s.);
aunque en algunos casos cuando las proporciones de los estratos son
distintas se toman en cuenta.
1.14.4.
Por conglomerados; En este caso la muestra nos presenta gran
dificultad para establecer sus diferencias, por lo que iniciamos
seleccionando en forma aleatoria una muestra de conglomerados, ya
que, cada uno de ellos podría representar una muestra, posteriormente
se deberá elaborar un censo para poder establecer las proporciones de
las diferentes categorías que se encuentren presentes en nuestra
muestra.
19
Ejercítate en: ¿Podrías escoger los números del juego “Tinka” mediante
un muestreo probabilístico?, ¿De poder cuál utilizarías?, ¿Qué números
seleccionarías?, ¿Te atreverías a pagar por esos números?
20
EJERCICIOS PROPUESTOS N° 1
1. Para cada caso señale qué tipo de variables son:
a. Puntaje en un a examen de un curso en la Carrera de Contabilidad.
b. Número de teléfono celular
c. El ranking de un examen.
d. Tiempo de reacción ante un estímulo visual.
e. Número de DNI.
f. Ingreso mensual familiar.
g. Pérdida de peso en Kilogramos de las personas subidas en peso.
h. Intensión de voto para las próximas elecciones.
i.
Dirección de una vivienda.
j.
Número de botes que da una pelota al ser lanzado de cierta altura.
2. Para cada uno de los siguientes casos:
a. Identificar: Población, muestra unidad de análisis, variable y tipo de
variable.
b. Clasificar los datos en una tabla de distribución de frecuencias, usar
criterio personal.
c. Interpretar el significado de:
𝑓2 , ℎ3 , 𝐹4; 𝐻3 ; 𝑝4 (𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑠𝑖𝑚𝑝𝑙𝑒); 𝑃2 (𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜).
2.1.
Una empresa que vende microcomputadoras ha llevado a cabo
un estudio para analizar el número de microcomputadoras que existe
en pequeñas empresas del distrito A. Para el efecto toma una
muestra aleatoria de 40 empresas, encontrando los siguientes
resultados:
5; 7; 9; 7; 8; 5; 4; 4; 3; 7
8; 4; 9; 6; 8; 7; 6; 9; 8; 4
6; 4: 7; 4; 3; 5; 8; 5; 9; 6
7; 9; 4; 7; 5; 8; 7; 9; 6; 8
2.2.
Un experto en computadoras, tratando de optimizar la operación
de un sistema, reunió datos sobre el tiempo, en microsegundos,
entre las solicitudes de servicio de un proceso especial.
21
2,81; 4, 20; 3, 85; 9,11; 2,08; 5, 91; 1, 62; 6, 72; 21, 66
3,07; 2,95; 8,77; 4,73; 9,21; 14,21; 1,58; 9,85; 78,81
2.3.
6,65; 1,80; 7,01; 1,89; 4,23; 6,58;
4,74; 8,53; 10,56
43,0; 16,72; 2,61; 26,46; 34,87; 4,19;
4,03; 2,78; 28,81
La confiabilidad de un sistema de cómputo se mide en términos
de vida de un componente de hardware específico (por ejemplo, la
unidad del disco). Se prueba un conjunto de componentes de
computadora hasta que fallen, y se registra su vida (en meses).
12 18; 5; 2; 8; 24; 17; 5; 9; 15
27; 35; 18; 14; 3; 9; 15; 20; 24; 27
30; 22; 21; 17: 20; 36; 28; 23; 12; 11
22; 32; 37; 40; 28; 36; 35; 39; 12; 19
28; 20; 15; 6;
2.4.
4; 12; 16
El tiempo de respuesta de una computadora se define como el
tiempo que un usuario debe esperar mientras la computadora accede
a información en el disco. Se observaron aleatoriamente un grupo
de 48 computadoras del Laboratorio de Contabilidad y se
obtuvo los siguientes resultados (en milisegundos):
59 92 54 48 73 60 73 75 74 84
33 61 71 38 47 53 63 48 41 68
60 44 39 34 75 86 72 50 47 52
65 68 70 47 40 36 70 38 40 52
60 50 90 84 72 88 49 40
2.5.
En las fechas recientes se recabaron datos correspondientes a la
velocidad MHz de 50 computadoras elegidas al azar en las oficinas
de la UASF.
33 25 20 33 25 16 16 16 16 20
12 20 33 33 20 33 20 12 25 20
33 25 16 25 33 25 20 20 20 20
12 25 16 16 20 16 25 20 25 16
22
AUTOEV ALUACIÓN I
NOMBRE…………………………………………………… CARRERA……..
1. Indica
qué
variables
son
Cualitativas(Cl)
y
cuáles
Cuantitativas (Ct)
a) Profesión que te gusta.
( )
b) Número de goles marcados por tu equipo favorito en la última
temporada
( )
c) Comida Favorita.
( )
d) Número de alumnos de tu Instituto.
( )
e) El color de los ojos de tus compañeros de c lase.
( )
f) f) Coeficiente intelectual de tus compañeros de clase.
( )
2. De las siguientes variables indica cuáles son discretas:
(D) y
cuales continuas:(C)
a. Número de acciones vendidas cada día en la Bolsa.
( )
b. Temperaturas registradas cada hora en un observatorio.
( )
c. Período de duración de un automóvil.
( )
d. El diámetro de las ruedas de varios coches.
( )
e. Número de hijos de 50 familias.
( )
f. Censo anual de los españoles.
( )
3.
Clasificar
las
siguientes
variables
en
cualitativas( C
)
y
cuantitativas discretas( CD) ó continuas ( CC).
a. La nacionalidad de una persona.
( )
b. Número de litros de agua contenidos en un depósito.
( )
c. Número de libros en un estante de librería.
( )
d. Suma de puntos tenidos en el lanzamiento de un par de dados .
( )
e. La profesión de una persona.
( )
f. El área de las distintas baldosas de un edificio.
( )
23
4. Responda con palabras concretas sobre los siguientes términos:
a. Probabilidad…………………………………………………………………………
…………………………………………………………………………………………
……
b. Estadístico………………………………………………………………………… …
…………………………………………………………………………………………
….
c. Atributo.………………………………………………………………………………
…………………………………………………………………………………………
….
d. Población………………………………………………………………………………
………………………………………………………………………………………….
e. Unidad de análisis
…………………………………………………………………………………………
……………………………………………….............................
f. Variable………………………………………………………………………………
…………………………………………………………………………………………
….
g. Gráfico estadístico……………………………………………………….
…………………………………………………………………………
h. Intervalo de confianza
.………..………………………………………………………………
…………………………………………………………………………
24
5. Explique:
a. La diferencia que existe entre
Estadística Descriptiva y
probabilística
b. La diferencia entre Variable Cuantitativa contínua y discreta.
c. La diferencia entre lo Objetivo y Subjetivo.
d. La diferencia entre Población y muestra.
6. Diga específicamente qué razones existen para efectuar un
muestreo?
7. Consigne en qué consisten, si fuera el caso y en qué casos se
aplican las:
a. Preguntas abiertas.
b. Preguntas cerradas.
c. Preguntas mixtas
d. Fichas de observación.
e. Fichas de entrevista.
f. Manuales.
25
26
CAPITULO II
2. PROCESO ESTADISTICO.
Una vez encontrados los datos de manera directa o indirecta el paso que sigue
consiste en investigar el comportamiento de un fenómeno aleatorio para lo cual se
utilizan técnicas propis de la estadística y tiene los siguientes pasos:
• Toma de datos
• Organización y resumen de datos
• Análisis e interpretación
2.1. ORGANIZACIÓN Y RESUMEN DE DATOS.- Cuando se tiene ya los
datos que han sido tomados, recolectados, se procede a prepararlos y
ordenarlos con un criterio sistemático, de forma que, puedan determinarse
las características que se pretendan analizar, del cual nos ocuparemos en
esta parte, denominamos a esta etapa como tabulación de resultados, es
decir, representarlo mediante unas tablas que describiremos más
adelante.
2.2. DISTRIBUCIÓN DE FRECUENCIAS.
Es una organización de datos, en la cual se distribuyen los resultados de
la recopilación de información en tablas o cuadros al que denominamos;
tabla de distribución de frecuencias o un agrupamiento de datos
estadísticos que están ordenados y agrupados en clases o categorías que
muestran la cantidad y los porcentajes de observaciones de cada una de
ellas.
27
Los datos agrupados posteriormente se pueden representar en tablas, en
cuadros y estos originan grafico de diferente tipo, las mismas que nos
permiten observar el comportamiento de este fenómeno aleatorio.
2.3. CLASIFICACIÓN DE DISTRIBUCION DE RECUENCIAS:
Las distribuciones de frecuencias se construyen de acuerdo a la
variable y su clasificación está dada por: distribuciones de frecuencias
en puntos aislados, distribuciones de frecuencias en intervalos de clase
y distribuciones de frecuencias por atributos o categorías, tal como se
muestra en el siguiente mapa conceptual.
28
Ing. Rolando W. Rivera Olivera
2.4. Pasos para la elaboración de un tabla de
distribución de
frecuencias:
Para elaborar una tabla de distribución de frecuencias seguiremos los
siguientes pasos:
a. Determinar el rango o amplitud de variación ( R ):
Es la diferencia entre el dato máximo y el dato mínimo.
𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙
R
Dato min.
Dato máx
b. Número de intervalos:
Para encontrar el número de intervalos peticionamos la
amplitud de variación o rango en grupos llamados intervalos
de clase.
5 ≤ K ≤ 20
Este número depende de la naturaleza de los datos y de los
objetivos del analista o investigador; no pueden ser pocos
porque
no
serían
significativos
para
obtener
buenas
conclusiones, ni tampoco muchos ya que proporcionarían
demasiados detalles y se perdería el propósito de la
investigación por lo tanto este número
de intervalos, de
acuerdo a ciertas reglas de convencionalismos deben ser
mayor o igual que 5 y menor o igual a 20.
Para el número adecuado
de
intervalos
se asumen
la
recomendación hecha por STURGES que recomienda que el
número de intervalos sea igual a:
29
Ing. Rolando W. Rivera Olivera
N° de intervalos →
𝐾 = 1 + 3.322 log 𝑛
n  número de
datos
c. Cálculo del Tamaño o Amplitud del intervalo C:
El tamaño del intervalo es el rango de cada intervalo y para el
grupo de datos resulta de dividir el Rango entre el número de
intervalos.
𝑐=
Amplitud →
𝑅
𝐾
d. Construir los intervalos de clase:
Empezamos con organizar la columna de intervalos con el
dato mínimo (𝐿𝑖 ) y luego sucesivamente vamos sumando en
cada intervalo al límite inferior y la amplitud ( C - 1 )
𝐿𝑠 = 𝐿𝑖 + (C - 1)
e. Computar la frecuencia de clases:
Es decir el número de datos en cada clase o intervalo a la que
comúnmente se denomina frecuencia absoluta: ( 𝑓𝑖 ) lo que
confirmaremos mejor con el siguiente ejemplo.
EJERCICIO No. 1:
1. Se tiene la estatura de 50 estudiantes de un salón en cm.
164
169
160
167
165
168
157
166
171
161
163
152
166
170
166
169
160
172
165
175
174
167
166
162
157
160
172
154
172
167
165
161
159
150
177
174
162
158
155
161
30
167
170
158
173
157
155
172
162
163
182
Ing. Rolando W. Rivera Olivera
Efectuar la tabla de distribución de frecuencias y efectuar un análisis
básico:
a.
𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙
Calculo de rango(𝑹 ):
𝑅 = 182 – 150
b.
entonces
R= 32
Cálculo de K intervalos:
𝐾 = 1 + 3.322 log (50) = 6,64 ( Este
7
x exceso
resultado aproximar a 2 números
6,64
enteros.)
6
X defecto
𝐾1 = 7 𝑦 𝐾 2 = 6
Entonces obtenemos dos valores de K :
c.
𝑅
𝑐=𝐾
Cálculo de C Amplitud :
C =
32
6
C = 5,83
C =
32
7
C = 4,57
5
6
5
4
Luego despejamos de la fórmula de c, los valores de K y de C, así:
𝐾 ∗
𝐶= 𝑅 =
7
*
32
5 = 35
De estos valores se descartan los resultados de R que no
7 *
4 =
incluyan
28
al valor de R o sea 32 y de los que quedan se
36
sea más próximo a éste, en este caso 35 entonces
selecciona al que
6 *
6 =
los valores son:
6 *
5 =
30
K =7;
C = 5;
31
R = 32
Ing. Rolando W. Rivera Olivera
Entonces nuestra Tabla de frecuencias tendrá 7 intervalos de tamaño 5
↔
𝐿𝑠 = 𝐿𝑖 + (𝐶 − 1)
Luego:
𝑳𝒔 = 150 + (5 − 1) = 154
y así
sucesivamente;
𝒀𝒊 : Marca de clase o promedio de cada intervalo: 𝑌𝑖 =
𝐿𝑖 +𝐿𝑠
2
𝒇𝒊 ∶ Frecuencia absoluta: Número de datos en cada intervalo
𝑭𝒊 ∶ Frecuencia Absoluta Acumulada, se inicia desde el primero y se va
acumulando hasta el final.
𝒉𝒊 ∶ Frecuencia Relativa
3
50
𝒉𝒊 =
𝑓𝑖
𝑛
en este caso para el 1er intervalo
𝒉𝒊 =
= 0,06
𝑯𝒊 : Frecuencia Relativa acumulada.
TABLA 1: Estatura de estudiantes de la Universidad.
Li - Ls
Li - Ls
150 - 154
155 - 159
160 - 164
165 - 169
170 - 174
175 - 179
180 - 184
CONTEO
FRECUENCIA FRECUENCIA
ABSOLUTA
RELATIVA
149,5 - 154,5
III
154,5 - 159,5
IIII III
159,5 - 164,5 IIII IIII II
164,5 - 169,5 IIII IIII IIII
169,9 - 174,5
IIII IIII
174,5 - 179,5
II
179,5 - 184,5
I
fi
hi
3
8
12
14
10
2
1
50
0,06
0,16
0,24
0,28
0,20
0,04
0,02
1,00
FRECUENCIA FRECUENCIA
PORCENTAJE PORCENTAJE
ABSOLUTA
RELATIVA
SIMPLE
ACUMULADO
ACUMULADA ACUMULADA
Fi
Hi
3
11
23
37
47
49
50
0,06
0,22
0,46
0,74
0,94
0,98
1,00
Fuente: propia
28%
24%
14
20%
12
16%
10
8
6%
6
4%
2%
4
2
149,50
154,50 1159,50
164,50
169,50
Histograma
32
174,50
179,50
184,50
%S
%A
6
16
24
28
20
4
2
100
6
22
46
74
94
98
100
Ing. Rolando W. Rivera Olivera
.
14
.
12
.
10
.
8
6
.
4
.
.
2
147
152
157
162
167
172
177
182
187
Polígono de Frecuencias
INTERPRETACION:
Las características más relevantes es que el mayor porcentaje de los chicos
es de 28% de los 50 estudiantes, tienen una estatura promedio de 1.67 cm
(14 personas) a la talla está Comprendida entre y podemos concluir también
que el 74% tiene una estatura comprendida entre 149.5 – 169 a 37 personas
que equivale al 74%.
2.5.
OTRAS FORMAS DE ELABORAR LA TABLA DE DISTRIBUCION DE
FRECUENCIAS.
Ahora bien, después de haber elaborado una tabla de distribución de
frecuencias nombraremos otros mecanismos de elaboración, las mismas
que se ciñen al buen juicio y pericia del investigador y entre ellos tenemos
los siguientes casos:
Una vez determinado qué tipo de variables utilizaremos, de que formas las
vamos a medir y si será necesario obtener una muestra nuestra siguiente
decisión a tomar dentro del método estadístico será el de especificar si
usaremos los datos en forma agrupada o no agrupada.
Para el caso de querer agrupar los datos, entonces deberemos crear una
tabla de distribución de frecuencias y para ello los pasos que debemos
seguir son los siguientes:
Se debe conocer el número total de datos (N).
33
Ing. Rolando W. Rivera Olivera
Se elaborará el Diagrama de Tallo y Hojas, buscando la cifra que haga más
evidente el cambio para formar el tallo y los demás valores formarán las
hojas.
Ejemplo:
Supongamos que tenemos los siguientes datos:
87
65
78
87
60
87
34
31
43 87
78
90
65
68
62
70
80
61
62 72
95
64
80
90
68
80
30
35
40 75
59
68
65
92
70
78
95
33
72 65
70
95
50
75
31
60
43
78
70 60
65
60
30
90
40
80
59
27
92 65
Un restaurante establece, sobre la base de sus registros, que el número de
comensales que hicieron uso de su servicio día con día, durante los últimos
dos meses a la hora de la comida, son los que se presentan a continuación:
Nos podemos percatar que en este caso las cifras significativas son las
que representan a las decenas por lo que el diagrama quedará compuesto
de la siguiente forma:
2
3
4
5
6
7
8
9
7
0
0
0
0
0
0
0
0
0
9
0
0
0
0
1
3
9
0
0
0
0
1 3 4 5
3
0
0
0
2
1
2
7
2
2
2
7
5
2
5
7
5
4 5 5 5 5 5 5 8 8 8
5 8 8 8
7 8
5
Nótese que este diagrama nos sirve para encontrar los valores mínimos
y máximos de forma más rápida, también nos permitió ordenar a los datos
en forma más sencilla y por último nos muestra al menos el comportamiento
de la forma en el conjunto de datos.
34
Ing. Rolando W. Rivera Olivera
El siguiente paso es obtener el Rango mediante la siguiente relación, en
la que nos debemos cuestionar su significado, ya que, no representa una
diferencia simplemente sino que, más bien es nuestra primer medida
estadística que representa la máxima dispersión que vamos a encontrar en
nuestro conjunto de datos, así tendremos:
𝑹 = 𝑿𝒎𝒊𝒏 − 𝑿𝒎á𝒙
R = 95 - 27 = 68
Posteriormente debemos determinar la cantidad de intervalos o clases
(K) deseamos utilizar para clasificar o agrupar nuestra información y para
ello contamos con Cuatro procedimientos al menos:
1) Obtenemos la raíz de N y el resultado redondeado siempre a valor
entero nos dará en número de renglones ( en nuestro ejemplo
tendremos K = 60  7.7459666  8 )
2) Seleccionar de una tabla, el número de renglones representados por K
y el número que más se aproxime al número de datos en la columna
denominada con la letra N por ejemplo en nuestro problema tenemos
60 datos, por lo que, la tabla nos sugiere utilizar 5 intervalos para
poderlos agrupar adecuadamente.
K
N
4
8
5
16
6
32
7
64
8
128
etc.
etc.
3) Número de Intervalos:No debe ser menor de 5 ni mayor de 20.
( 5  K  20 )
Se puede establecer:
-
al criterio óptimo del investigador
n redondeado al siguiente entero
utilizando la tabla
35
Ing. Rolando W. Rivera Olivera
-
mediante la expresión 2  n
k
4) Escoger el número de renglones o intervalos a juicio del investigador,
tomando en cuenta que si no se tiene experiencia en este tipo de
problemas el diagrama de tallo y hojas puede proporcionarnos una buena
cantidad de renglones para nuestro objetivo, en nuestro ejemplo el
diagrama sugiere 8 renglones.
C
Tamaño de
intervalo
rango  1
K
Número de renglones
El paso siguiente para elaborar la tabla de distribución de frecuencias es
calcular el tamaño de intervalo, en nuestro caso resultará de 9, por lo que
procederemos a calcular los límites de los intervalos, comenzando con los
límites inferiores sumándole al número más pequeño el tamaño del intervalo
“K” veces, en nuestro ejemplo tendríamos
𝑙𝑖
27
36
45
54
63
72
81
90
Nótese que al dato menor se le ha sumado el tamaño de intervalo que
es 9
resultándonos el siguiente y así sucesivamente hasta sumarle el
tamaño del intervalo 8 veces (que es el número de renglones que hemos
escogido). Posteriormente debemos calcular los límites superiores y para
ello debemos considerar que los intervalos que nos encontramos
construyendo son intervalos cerrados, es decir, intervalos que incluyen a
sus extremos, de esta manera observamos que los números que deben
36
Ing. Rolando W. Rivera Olivera
estar en el primer intervalo son 27, 28, 29, 30, 31, 32, 33, 34 y 35, o sea,
nuestro límite superior es 35 en lugar de 36 que es el resultado de sumar
27+9, por lo que debemos disminuir el resultado una unidad. (Por lo anterior
los límites superiores que nos quedan en nuestro ejemplo son tomados de
los inferiores pero con una unidad menos).
El siguiente paso será determinar la frecuencia ( f ) o número de datos
que caen dentro de los intervalos que hemos generado por lo que debemos
contestar a la pregunta de ¿cuántos datos se encuentran entre tal valor y tal
otro?, es decir, en nuestro ejemplo vemos que debemos preguntarnos
¿cuántos datos hay entre los valores de 27 y 35?, pudiendo observar en el
diagrama de tallo y hojas que contamos con 8 datos, y así sucesivamente
hasta terminar de preguntarnos los demás intervalos teniendo:
𝑓𝑖
8
4
1
9
14
11
5
8
De esta manera ahora ya contamos con una tabla de distribución de
frecuencias la cual nos permitiera crear nuevas columnas que nos facilitarán
la tarea de describir una realidad y con ello resolver un problema mediante
decisiones importantes.
Fi
8
12
13
22
36
47
52
60
37
Ing. Rolando W. Rivera Olivera
Una de las columnas que podemos generar puede ser la que representa
n
a la Frecuencia acumulada ( Fi   f i ), es decir, la que nos responderá a
i 1
la pregunta de ¿cuántos datos se fueron presentando desde el primer
intervalo hasta el último?, Dé esta forma tendremos:
Así, con esta columna podemos decir que 8 días tuvimos entre 25 y 37
comensales, 12 días entre 25 y 44, etc.
Después debemos encontrar un número que representa a todo el
intervalo, ya que, es más sencillo hablar de un solo dato a un intervalo.
Este número se llama marca de clase o punto medio el cual quedará
representado por una “ Yi ” y se calcula utilizando los límites o los límites
reales o verdaderos, mediante la siguiente relación:
Yi =
Li + Ls
2
=
L ri + L rs
2
En donde “ L i ” representa al límite inferior “ L s ” al límite superior y “ Lri ”,
“ L rs ” a los límites reales.
Nótese que la marca de clase puede obtenerse con los límites que
habíamos obtenido o con los límites reales, los cuales resultan de las
siguientes acciones.
Es importante lograr establecer un intervalo continuo para poder hacer
análisis estadístico de todo el conjunto de datos y que a la vez no nos limite
este mismo conjunto.
Para obtener un límite real debemos tomar los valores de los límites que
presentan un “hito” de información (como es el caso de 44 y 45 en nuestro
ejemplo) y encontrar un punto que represente ese intervalo con la fórmula
que hemos utilizado con las marcas de clase.
Ahora procederemos a calcular la frecuencia relativa ( h i ) la cual nos
representa la proporción que le corresponde a cada intervalo con respecto
al total de datos mediante la fórmula:
Al tener la frecuencia
hi =
fi
x 100
N
relativa entonces también nos
38
Ing. Rolando W. Rivera Olivera
n
podemos preguntar cuál es la proporción acumulada ( H i   hi ) por
i 1
renglón de la misma forma que lo hicimos para la frecuencia.
Hi
hi
(%)
(%)
13
13
7
20
2
22
15
37
23
60
18
78
8
87
13
100
Como estas columnas representan la proporción que le corresponde a
cada una de las frecuencias en cada renglón entonces también podríamos
crear una columna que representara los grados dentro de una
circunferencia con el objetivo de crear una gráfica de pastel o de pay
también llamada gráfica de sectores, esto en resumen sería como sigue:
TABLA No. 2
𝐿𝑖
𝐿𝑠
Yi
fi
hi
Fi
Hi
% Simp
27
35
31
8
0,13
8
0,13
13
13
36
44
40
4
0,07
12
0,20
7
20
45
53
49
1
0,02
13
0,22
2
22
54
62
58
9
0,15
22
0,37
15
37
63
71
67
14
0,23
36
0,60
23
60
72
80
76
11
0,18
47
0,78
18
78
81
89
85
5
0,08
52
0,87
8
87
90
98
94
8
0,13
60
1,00
13
100
60
1,00
TOTAL
100
Fuente: Elaboración propia
39
% Acum.
Ing. Rolando W. Rivera Olivera
2.6.
FUENTE DE DATOS.
Ahora nos interesa describir la forma en que la estadística se hace llegar
la información para poder trabajarla. En principio podemos decir que hay
dos tipos de estudios estadísticos; aquellos que involucran la toma de
decisiones respecto a una población y/o sus características, es decir, el
estudio enumerativo y el segundo llamado estudio analítico que
involucra realizar actividad sobre un proceso para mejorar el desempeño
en el futuro.
Después de haber decidido qué tipo de estudio se debe realizar
entonces podremos encontrar la información en tres tipos de fuentes:
1)
La bibliográfica
2)
La experimentación y
3)
La entrevista.
Dentro de la información bibliográfica podemos decir que está
representada por la información impresa y quedan incluidas las nuevas
fuentes tales como la información obtenida en Internet, discos
compactos, y cualquier otro medio digital que permita obtener
información almacenada. Las ventajas de este tipo de datos quedan
manifiestas por la velocidad de obtención de la información, ya que, tal
vez pueda estar clasificada y ordenada, además de evitarnos la pérdida
de tiempo para recopilar esta información. La desventaja es que muchas
veces la información no es actualizada o que la información no se
apegue exactamente a nuestro problema.
La experimentación en forma contraria a la bibliográfica tiene como
ventaja que la información obtenida es exactamente de nuestro
problema, pero esto implica que se requiera de un grupo de
investigadores, de presupuesto, así como de todos los insumos para su
funcionamiento.
En cuanto a la entrevista podemos decir que contamos al menos con
tres tipos diferentes:
40
Ing. Rolando W. Rivera Olivera
a) Por correo
b) Por teléfono
c) Directa.
Cada una de ellas tiene sus ventajas y sus desventajas pero también son
utilizadas en la actualidad, así como, una serie de versiones que mezclan
estos tres tipos, por ejemplo en los noticieros televisivos hacen una
pregunta y dan dos diferentes teléfonos o tres para recibir las respuestas.
EJERCICIO 2
Los datos siguientes corresponden a las notas obtenidas por los
estudiantes de la carrera de contabilidad del II Semestre, 32 estudiantes
cuyas notas fueron en la primera evaluación.
Efectuar un análisis estadístico simple
13
07
10
06
05
10
13
03
18
16
10
13
03
06
05
15
02
16
06
06
10
06
19
13
04
02
06
06
08
09
12
10
a. Calculo de rango ( R ) :
R= X máx. – X min
R= 19 – 02
R= 17
b. Cálculo de K intervalos:
K= 1 + 3.322 log 32
41
Ing. Rolando W. Rivera Olivera
K = 1 + 3.322 (1.50)
K = 5.98
K=6
7
x exceso
6
X defecto
6
Luego:
K₁ = 6
y K₂ = 7
c. Cálculo de C Amplitud
C =
C =
C =
R
K
C =
17
7
2,40
3
C =
17
6
2,80
2
2
3X 7
2X 7
3X 6
2X 6
=
=
=
=
3
Ls
Ls
Ls
21
14
18
12
= Li + (C - 1)
= 2+2
= 4
R = 17
C=3
K=6
TABLA 3: Frecuencias de Notas de Estadística
Li - Ls
2- 4
5- 7
8 - 10
11 - 13
14 - 16
17 - 19
Li - Ls
15 - 45
45 - 75
75 - 105
105 - 135
135 - 165
165 - 195
Yi
3
6
9
12
15
18
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
fi
hi
5
10
7
5
3
2
0,15625
0,3125
0,2188
0,1563
0,0938
0,0625
42
FRECUENCIA FRECUENCIA
PORCENTAJE PORCENTAJE
ABSOLUTA
RELATIVA
SIMPLE
ACUMULADO
ACUMULADA ACUMULADA
Fi
Hi
5
15
22
27
30
32
0,15625
0,46875
0,6875
0,84375
0,9375
1
%S
%A
15,625
3125
31,875
15,625
9375
625
15,625
46,875
68,75
84,737
9375
100
Ing. Rolando W. Rivera Olivera
2.7. REPRESENTACION GRAFICA
Una vez construida la tabla de distribución de frecuencia y que esta nos
permite visualizar el comportamiento de los datos posteriormente se
afectaran los gráficos correspondientes estas nos permite apreciar con
mayor facilidad estos comportamientos dentro de ellos tenemos los
siguientes:
2.7.1 HISTOGRAMA
Es un gráfico plano formado por rectángulos cuya área es proporcional a la
frecuencia (absoluta o relativa). Se siguen los siguientes pasos:
Paso 1.- se constituye el cuadrante superior derecho de un sistema de
coordenadas rectangulares. Paso 2.- la longitud de los semejantes tanto el
eje de las abscisas como las ordenadas es convencional por lo tanto es
criterio de cada persona asignar las medidas teniendo en cuenta lo
siguiente:
Paso 3.- elegimos los segmentos de las abscisas y ordenadas y
posteriormente en las divisiones de los ejes de menos a mayor y en las
abscisas van los intervalos de clase y en las ordenadas la frecuencias
absolutas relativas.
HISTOGRAMA
28%
14
13
24%
12
11
10
20%
9
16%
8
7
6
5
6%
4%
4
3
2%
2
1
149,50
154,50
159,50
164,50
169,50
43
174,50
179,50
184,50
Ing. Rolando W. Rivera Olivera
Paso 4.- Por ultimo sobre cada segmento de las abscisas se constituye un
rectángulo cuya altura será indicada por la frecuencia de clase absoluta o
relativa.
Ejemplo de aplicación No. 3
Hallar el análisis estadístico y construir el histograma para los siguientes
datos.
Las calificaciones de un test de inteligencia de 32 estudiantes han sido las
siguientes.
60
67
67
55
15
15
25
50
50
50
30
45
75
67
60
60
55
50
50
30
20
20
30
30
50
50
50
45
55
55
55
55
El test era de 100 puntos
1. Cálculo de rango (R):
R= X máx. – X min
R= 75 – 15
R= 60
2. Cálculo de K intervalos:
K= 1 + 3.322 log 32
K = 1 + 3.322 (1.50)
7
x exceso
6
X defecto
C =
60
6
10
6
K = 6,0001
K=6
3. Cálculo de C Amplitud
C =
C =
C =
R
K
60
7
8,57
9
C =
11
10
8
44
Ing. Rolando W. Rivera Olivera
4. selección de K y C
CxK
9X 7
8X 7
11 X 6
10 X 6
=
=
=
=
=
R = 60
63
56
66
60
Nota: recordemos que debemos desechar a los resultados que no
incluyan al Rango, en este caso 60 y de los que quedan es decir 63 y
66, se toma al más próximo al rango, en este caso 63, por tanto nos
quedamos con: 9 x 7 = 63; es decir:
K = 7 ; C = 9 y R = 60
TABLA 4
Li - Ls
15 - 23
24 - 32
33 - 41
42 - 50
50 - 59
60 - 68
69 - 77
Li - Ls
14,5 - 23,5
23,5 - 32,5
32,5 - 41,5
41,5 - 505
50,5 - 59,5
59,5 - 68,5
68,5 - 77,5
Yi
19
28
37
46
55
64
73
FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
fi
hi
04
05
00
10
06
06
01
32
0,125
0,15625
0
0,3125
0,1875
0,1875
0,03125
45
FRECUENCIA FRECUENCIA
PORCENTAJE PORCENTAJE
ABSOLUTA
RELATIVA
SIMPLE
ACUMULADO
ACUMULADA ACUMULADA
Fi
Hi
04
09
09
19
25
31
32
0,125
0,28125
0,28125
0,59375
0,7813
0,96875
1
%S
%A
12,5
15,625
0
31,25
18,75
18,75
3,215
12,5
28,125
28,125
59,375
78,125
96,875
100
Ing. Rolando W. Rivera Olivera
HISTOGRAMA
12
11
10
9
8
7
6
5
4
3
2
1
14,5
23,5
32,5
41,5
50,5
59,5
68,5
77,5
Poligono de Frecuencia
12
11
10
9
8
7
6
5
4
3
2
1
10
19
28
27
46
55
64
73
82
2.7.2 POLIGONO DE FRECUENCIAS
Para construir el polígono de frecuencias se empieza uniendo
mediante una línea poligonal, los puntos medios de los techos de los
rectángulos obteniendo en el histograma este polígono de frecuencias,
se acostumbra cerrar este polígono en el eje de la abscisa.
46
Ing. Rolando W. Rivera Olivera
Poligono de Frecuencia
14
13
12
11
10
9
8
7
6
5
4
3
2
1
147
152
157
162
167
172
182
187
2.7.3 GRAFICO DE FRECUENCIAS ACUMULADAS
Para
representar las frecuencias acumuladas
absolutas o relativas,
ubicamos en el eje horizontal los intervalos ( K )
y en el eje vertical las
frecuencias acumuladas absolutas (𝐹𝑖 ) o relativas (𝐻𝑖 ), luego en el extremo
superior de cada intervalo se levanta un segmento cuya altura es igual a la
respectiva frecuencia acumulada por ultimo partiendo del extremo inferior
del primer intervalo se unen con segmentos de recta, los extremos de los
segmentos verticales obteniéndose una línea poligonal que a partir de la
última frecuencia se extiende paralelo al eje horizontal.
47
Ing. Rolando W. Rivera Olivera
50
45
˚
˚
˚
˚
PERSONAS
40
35
30
˚
25
OJIVA DE
20
GALTON
˚
15
10
5
˚
149,5
154,5
159,5
164,5
169,5
174,5
179,5
184,5
ESTATURA - INTERVALOS
2.7.4 REPRESENTACIÓN TABULAR DE LOS DATOS CUANTITATIVOS
DISCRETOS:
Cuando la variable es discreta o discontinua la distribución de la tabla
de frecuencias tiene la siguiente estructura.
Ejemplo No. 4 .- Los siguientes datos corresponden al número de
hijos por familia en una muestra de 40 familias de un barrio del distrito
de Bustamante y son los siguientes:
5
3
2
5
3
3
2
1
2
3
1
3
2
3
2
3
2
4
48
2
3
2
3
5
3
3
4
4
3
4
2
4
4
3
2
4
2
Ing. Rolando W. Rivera Olivera
Tabla No. 5
xi
fi
hi
Fi
Hi
%S
%A
1
2
0,05
2
0,05
5
5
2
11
0,275
13
0,325
28
33
3
15
0,375
28
0,7
38
71
4
8
0,20
36
0,9
20
91
5
3
0,075
39
0,975
7
98
6
1
0,025
40
1
2
100
40
1,00
100
x i = valor de variable
hi = frecuencia relativa
f i = frecuencia absoluta
Fi = frecuencia absoluta acumulada
Hi = frecuencia relativa acumulada
%S, %A = porcentaje simple y Acumulado
HISTOGRAMA
12
11
10
9
8
7
6
5
4
3
2
1
1
2
3
4
5
6
49
7
Ing. Rolando W. Rivera Olivera
2.7.5 GRÁFICOS PARA DATOS CUANTITATIVOS DISCRETOS:
Representación:
Si los datos pertenecen a una variable cuantitativa discreta los
diagramas más utilizados son el diagrama de puntos y el diagrama de
barras.
2.7.5.1
DIAGRAMA DE PUNTOS:
Para su construcción en el eje de abscisas se consignan los distintos
valores de la variable en este caso el número de hijos en el eje vertical u
ordenada las frecuencias correspondientes.
40
35
30
25
20
15
˚
10
5
˚
˚
˚
˚
1
2
˚
˚
˚
˚
˚
˚
˚
3
4
5
6
˚
˚
7
8
˚
2.7.5.2
DIAGRAMA DE BARRAS:
Son muy similares a los diagramas de puntos solo que en su lugar se
construye las barras que son espacios rectangulares y permiten colocar
el puntaje en el techo de las mismas.
HISTOGRAMA
12
11
10
9
8
7
6
5
4
3
2
1
1
2
3
4
5
6
50
7
Ing. Rolando W. Rivera Olivera
2.7.5.3
GRAFICAS PARA LAS FRECUENCIAS ACUMULADAS:
Para los datos cuantitativos discretos se utilizan la variable o los datos
del intervalo en la abscisa y el valor de la frecuencia acumulada, absoluta o
relativa en la ordenada la cual se llama diagrama en escalera, bastante
similar a la ojiva.
40
˚
˚
˚
30
˚
20
10
˚
˚
1
2
3
4
5
6
7
8
OBSERVACIONES:
1. Cuando la variable discreta adquiere muchos valores distintos, para
abreviar, con justa arbitrariedad y con una pérdida de precisión puede
tratarse
estos datos como variables cuantitativas continuas teniendo
cuidado en la interpretación de los mismos.
2. En un estudio descriptivo los datos muéstrales son siempre discretos,
aun si la variable es continua, porque si los valores están expresados en
fracciones bastara trabajar en función del último orden decimal, es decir
que los datos de una variable continua, pueden tratarse también como
datos discretos por cierto grado de imprecisión (por ejemplo marcas de
clase siempre enteros, no fracciones).
51
Ing. Rolando W. Rivera Olivera
3. En términos generales se prefiere la distribución de frecuencia que no
presenta perdidas de información cuando:
a. Los datos son números enteros
b. El rango es pequeño menor de 15
c. Cuando se desea estimar algún parámetro desconocido de una
población.
4. Por otro lado es útil una distribución de frecuencias en las que al
agruparse produce una pérdida de información cuando:
a. Intervienen tanto números enteros como no enteros o únicamente
no enteros.
b. Intervienen solamente enteros pero existe demasiados números
diferentes.
c. La pérdida de información es menos importante por lo contrario
se gana en visión de conjuntos que es el propósito de la
estadística
2.7.6 ELABORACIÓN DE DISTRIBUCIÓN DE FRECUENCIAS
PARA
DATOS CUALITATIVOS O ATRIBUTOS:
Los datos cualitativos son los más fáciles de representar ya que las
clases se ponen de manifiesto con facilidad y los cálculos también son
mínimos ej.: consideremos la tabla nro. 5 en la que se consignan los
resultados de un proceso de evaluación de 72 estudiantes.
CATEGORIA
fi
hi
%
Aprobados
45
0,625
63
Desaprobados
18
0,25
25
Retirados
9
0,125
12
TOTAL
72
1,00
100
2.7.7 REPRESENTACIÓN GRAFICA DE LAS VARIABLES CUALITATIVAS:
52
Ing. Rolando W. Rivera Olivera
a. Gráfico de barras
b. Diagrama circulares y en algunos aspectos suelen representarse con
cartogramas.
LEYENDA
APROBADO
DESAPROBADO
RETIRADO
63%
225°
90°
90°
45°45°
12%
25%
360
72
X
45
𝑥=
360 . 45
72
fi
∝
%
45
225°
63
18
90°
25
9
45°
12
72
360°
100
= 225°
53
Ing. Rolando W. Rivera Olivera
𝑥=
360 . 18
72
= 90°
x =
54
360 . 9
72
= 45°
Ing. Rolando W. Rivera Olivera
EJERCICIOS PROPUESTOS N° 2
1. Los siguientes datos obtenidos mediante una encuesta realizada por la
Empresa AMC en el mes de Febrero del 2015 corresponden a una
muestra aleatoria de 40 empresas de la ciudad de Arequipa según
motivo del uso de Internet:
P
O
P
RP
O
P
P
P
Donde; P: “Publicidad”
F
F
P
F
F
F
RP
RP
F
F
O
P
F: “Facturación”
P
O
P
P
F
P
P
P
RP
RP
F
F
RP: “Recepciones”
O:
Otros
Se pide :
a. Identificar la unidad de observación y la variable en estudio.
b. Construir una distribución de frecuencias (absolutas y porcentuales).
c. Graficar el diagrama circular correspondiente.
d. Dibujar la ojiva de Gálton.
e. Interpretar 𝑓2 ; ℎ2 y % s
2. Los sueldos mensuales (en dólares) de 60 empleados de la empresa
Diamante SAC en el año 2013 fueron los siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 607 382 667 512 492 560
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
a. Construya la tabla de frecuencias.
b. Identifique la población, muestra y la variable con su tipo de escala
3. Se distribuye el número de empresas según sus inversiones en millones
de soles:
55
Ing. Rolando W. Rivera Olivera
𝑳𝒊
−
𝑳𝒔
𝒇𝒊
4
-
10
1
10
-
16
3
16
-
22
6
22
-
28
12
28
-
34
11
34
-
40
5
40
-
46
2
¿Cuántas empresas intervienen en menos de 25 millones de soles?
4. Se tiene las temperaturas observadas en el hemisferio norte durante 24
días en °C.
𝑳𝒊
−
𝑳𝒔
-19
-
-17
-17
-
-15
2
-15
-
-13
8
-13
-11
-
-11
-
-9
𝒇𝒊
0,125
-9
-
𝐡𝐢
4
-7
0,2083
a. ¿Durante cuántos días se obtuvo una temperatura de -16 a -10 en
promedio?
b. Cómo es la tabla de frecuencias completa?
5. Completar la tabla de distribución para una muestra de 4308 elementos,
si se sabe que a partir de la segunda frecuencia absoluta se cumple que
cada frecuencia es la quinta parte de la anterior más dos. Además se
conoce que:
k= 5
𝑌1 = 60
𝑌4 = 105
6. Dada la siguiente distribución de frecuencias:
56
Ing. Rolando W. Rivera Olivera
(𝐿𝑖 - 𝐿𝑠 )
𝑓𝑖
𝐹𝑖
ℎ𝑖
𝐻𝑖
30
m
n
0,15
z
70
p
q
w
a
- 90
r
s
0,25
b
10
u
x
0,7
30
v
y
50
-
70
90 110 -
50
110
130
Hallar:
a. m + n
b. r – p + a
7. La compañía ABC, muestreó sus registros de embarque durante cierto
día, obteniendo los siguientes resultados con respecto al tiempo
transcurrido desde la recepción de la orden hasta la entrega (en días).
20
12
5
8
19
14
10
11
15
6
24
7
7
13 29
13
6
4
11
11
a. ¿Qué afirmación puede hacer sobre la eficacia del procesamiento de
pedidos a partir de la distribución de frecuencias?
b. Si la compañía quiere asegurarse de que la mitad de sus entregas se
realicen en diez o menos días, ¿puede usted determinar mediante la
distribución de frecuencias si la compañía ha alcanzado su meta?
8. En una fábrica se sabe que el jornal mínimo es S/. 115, si se conoce
además que: 20 obreros ganan por lo menos S/. 155, pero menos de
S/165, 68 obreros ganan por lo menos S/. 145 ; 106 obreros ganan por
lo menos S/. 135; 135 obreros ganan por lo menos S/.125 y el restante
10% de los obreros ganan menos de S/. 125. Además se sabe que el
rango es 50. Completar la tabla de distribución de frecuencias.
9. Una compañía tiene 60 trabajadores. El sueldo mínimo de un trabajador
es $100 y el máximo $590 mensuales. El 80% de los trabajadores ganan
57
Ing. Rolando W. Rivera Olivera
por lo menos $210; 18 perciben haberes inferiores a $390 mensuales;
20% son profesionales y reciben un haber de por lo menos $490
mensuales. Construir la tabla de distribución de frecuencias relativas.
10. La tabla muestra la distribución del ingreso familiar correspondiente a 80
familias.
-
𝐿𝑠 )
160
-
170
170
-
180
180
-
190
(𝐿𝑖
190 200
-
𝑓𝑖
𝐹𝑖
48
60
ℎ𝑖
0,125
200
0,075
210
Determinar el número de familias que ganan menos de 200 nuevos
soles.
11. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente
número de artículos defectuosos por lote:
3
2
5
0
1
3
2
1
0
1
3
4
2
4
4
4
3
3 2
3
Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de
lotes tienen 2 o más pero menos de 4 artículos defectuosos?
12. En una prueba de estadística se evaluaron a “n” estudiantes y se obtuvo
el siguiente cuadro estadístico.
𝑌𝑖
45
ℎ𝑖
2𝑛
25
55
65
75
3𝑛
100
𝑛
50
3𝑛
50
85
𝑛
100
¿Qué porcentaje de estudiantes obtuvieron una nota menor que 60
puntos o mayor o igual a 80 puntos?
13. Dada la siguiente distribución de frecuencias en base al ingreso familiar
de 200 familias
(𝑳𝒊
-
𝑳𝒔 )
𝒇𝒊
58
𝑭𝒊
Ing. Rolando W. Rivera Olivera
12
-
270
-
300
90
30
330
126
-
-
50
¿Cuántas familias tienen un ingreso comprendido entre 260 y 320?
14. Se tiene la siguiente distribución simétrica:
(𝑳𝒊
-
𝑳𝒔 )
[12
𝒇𝒊
𝑭𝒊
𝒉𝒊
8
-
0,2
-
24[
17
-
Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo
[ 12 – 20 ]?
15. Los tiempos de vida útil (en días) de un tipo de bacteria, se tabuló en
una distribución de frecuencias de 5 intervalos de igual amplitud con
frecuencias relativas acumuladas: 0.10; 0.25; 0.55; 0.80; 1.00.
Determine la distribución de frecuencias absolutas, si la tercera
frecuencia absoluta acumulada es 11, si la segunda marca de clase es
6, y si el límite inferior del cuarto intervalo es 12.
16. En una fábrica se sabe que el jornal mínimo es S/.115, si se conoce
además que: 20 obreros ganan por lo menos S/.155, pero menos de S/.
165, 68 obreros ganan por lo menos S/. 145; 106 obreros ganan por lo
menos S/. 135; 135 obreros ganan por lo menos S/. 125 y el restante
10% de los obreros ganan menos de S/.125. además se sabe que el
rango es 50. Completar la tabla de distribución de frecuencias.
59
Ing. Rolando W. Rivera Olivera
17. La compañía ABC, muestreó sus registros de embarque durante cierto
día, obteniendo los siguientes resultados con respecto al tiempo
transcurrido desde la recepción de la orden hasta la entrega (en días).
20
12
5
8
19
14
10
11
15
24
7
7
13
29
13
6
4
6
11
11
a. Qué afirmación puede hacer sobre la eficacia del procesamiento de
pedidos a partir de la distribución de frecuencias?
b. Si la compañía quiere asegurarse de que la mitad de sus entregas
se realicen en diez o menos días, ¿puede usted determinar
mediante la distribución de frecuencias si la compañía ha alcanzado
sus metas?
18. El consumo mensual de agua de 150 hogares, se tabularon en una
distribución de frecuencias simétrica de 6 intervalos, siendo las
frecuencias 𝑓2 = 25; 𝐹3 = 75;
𝐹5 = 130. Si el límite inferior del sexto
intervalo es igual a 60, y si el 75% de los consumos son mayores de
42,5 𝑚3 , completar la distribución de frecuencias.
19. Los siguientes datos corresponden a los sueldos de los trabajadores de
una compañía
Número de
Sueldos
trabajadores
950 - 1000
5
1000 - 1050
12
1050 - 1100
9
1100 - 1150
8
1150 - 1200
4
1200 - 1250
10
1250 - 1300
6
a. Grafique un histograma.
b. Grafique un Polígono de frecuencias.
c. Grafique una Ojiva de Galton.
d. Grafique un diagrama circular.
60
Ing. Rolando W. Rivera Olivera
AUTOEV ALUACIÓN II
NOMBRE………………………………………………………CARRERA…………
1. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 20, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14,
13.
Construir la tabla de distribución de frecuencias y dibuja el polígono de
frecuencias.
2. El número de estrellas de los hoteles de una ciudad viene dado por la
siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2,
1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias y dibuja el diagrama de
barras.
3. Las calificaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3,
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribución de frecuencias y dibuja el diagrama de
barras y circular.
4. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente
tabla:
Peso:Kgs
[5 0, 6 0[
Nro. mp
Construir
[6 0, 7 0[
[7 0, 8 0[
[8 0, 9 0[
[9 0, 10 0[
[1 0 0, 1 1 0[
8
10
16
14
10
5
la tabla
de
frecuencias.
Y
Representar
[1 1 0, 12 0 [
2
el histograma,
el polígono de frecuencias y la ojiva de Galton.
5. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre
50, en un examen de Estadística General.
61
Ing. Rolando W. Rivera Olivera
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Construir la tabla de frecuencias, dibujar el histograma y el polígono de
frecuencias y la ojiva de Galton.
6. Los ingresos quincenales en dólares de 45 personas son:
63, 89, 36, 49, 56, 64, 59, 35, 78, 43, 53, 70, 57, 62, 43, 68, 62, 26, 64, 72, 52, 51, 62, 60,
71, 61, 55, 59, 60, 67, 57, 67, 61, 67, 51, 81, 53, 64, 76, 44, 73, 56, 62, 63, 60
.
Indique:
a. El número de intervalos y La Población.
b. La Unidad de análisis.
c. La frecuencia más alta.
d. Tipo de variable en estudio.
e. El porcentaje de los que ganan más de 70 dólares quincenales.
f. El tamaño de cada intervalo.
g. Qué indica la Marca de clase y Qué, la frecuencia relativa?
7. La compañía Luxos SAC, muestreó sus registros de embarque durante
cierto día, obteniendo los siguientes resultados con respecto al tiempo
transcurrido desde la recepción de la orden hasta la entrega (en días).
20
12
24
7
5
7
8
19
14
13
29
13
10
11
6
4
15
11
6
11
a. Qué afirmación puede hacer sobre la eficacia del procesamiento de
pedidos a partir de la distribución de frecuencias?
b. Si la compañía quiere asegurarse de que la mitad de sus entregas se
realicen en diez o menos días, ¿puede usted determinar mediante la
distribución de frecuencias si la compañía ha alcanzado sus metas?
c. Efectúe los gráficos correspondientes para visualizar mejor sus
respuestas.
62
Ing. Rolando W. Rivera Olivera
CAPITULO III
3
MEDIDAS DE CENTRALIZACIÓN
El objetivo principal de las medidas de tendencia central es poder representar por medio de un solo
número al conjunto de datos, es decir, dan valores representativos de la distribución de frecuencias,
situados en algún lugar intermedio, alrededor del cual, se encuentran los otros valores. Nos indican
dónde tienden a concentrarse los valores.
Existen tres medidas de tendencia central generales, que son, la Media
aritmética, la Mediana y la Moda; así como otras que se utilizan en casos
particulares como la Media ponderada, la Media Armónica, la Media
Geométrica, la Media Cuadrática las medidas de posición tales como los
Cuartiles, quintiles, deciles, percentiles y otros.
3.1. MEDIDAS DE TENDENCIA CENTRAL MÁS UTILIZADAS.
3.1.1.
MEDIA ARITMÉTICA x  :
Es el promedio de los datos, y su objetivo principal es encontrar
el valor que debería de estar en el centro. Su ventaja principal es
que es la única medida en la que
 x  x   0 , su inconveniente
es que se ve influida por valores extremos.
•
MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS:
Se dice Datos no agrupados a un conjunto pequeño de
datos con los cuales se trabaja directamente y no
necesitamos agruparlos ni construir tablas de frecuencias
por ejemplo para obtener nuestro promedio de asignatura,
63
Ing. Rolando W. Rivera Olivera
pocos exámenes y trabajos y fácilmente podemos sacar el
promedio.
X= cualquier dato
n
X
i
i 1
X=
n
Número total de datos
Ejemplo: Calcular la media aritmética de los números 10;
12; 36; 25; 58
x
•
10  12  36  25  58 121


5
5
24.2
PROMEDIO PARA DATOS AGRUPADOS:
❖ METODO DIRECTO:
Producto de la frecuencia Absoluta por la marca de
clase de cada intervalo
k
 f i *Y i
X=
i 1
n
Número total de datos
Donde: k = última clase o intervalo
Nota: La media muestral se denota X , la media poblacional se
conoce como  .
Ejemplo 1:
Calcular el
empresas:
salario promedio de 3
Salario
No. De Emp.
Xi
fi
$15,000
18
$20,000
35
$25,000
29
Total
82
64
Ing. Rolando W. Rivera Olivera
Como
x
f
i
 82  n sustituimos en la formula y se obtiene:
15000 *18  20000 * 35  25000 * 29  1695000  $20,670.70
82
82
❖ MÉTODO ABREVIADO
Se siguen los siguientes pasos:
1. Se elige una media supuesta u origen de trabajo
(generalmente es la marca de la clase central de la
distribución o el intervalo de mayor frecuencia).
2. Se halla las desviaciones (di) a partir de la media
supuesta u origen de trabajo. La división correspondiente
a la clase en que esta la media supuesta es cero, la de
las clases inferiores -1, -2, -3, … etc. Respectivamente,
las clases superiores serán 1, 2, 3, …etc.
3. Se halla los productos de las frecuencias por las
desviaciones (fi*di) respectivamente respetando la regla
de signos al multiplicar.
4. Luego se aplica la siguiente formula:
k
X = Yi  C
f . d
i 1
i
i
n
Ejemplo 2:
Hallar la Media Aritmética por los dos métodos de la estatura de
los 50 estudiantes, ejemplo de la Unidad anterior (Tabla No. 1
Unidad 2):
65
Ing. Rolando W. Rivera Olivera
Solución:
a. Método directo:
k
f
X=
Li
i
i 1
*Y i

n
-
X
Ls
8250
 X  165
50
Yi
fi
Yi . f i
di
f i .d i
149,5 – 154,9
152
3
456
-3
-9
154,5 – 159,5
157
8
1256
-2
-16
159,5 – 164,5
162
12
1944
-1
-12
164,5 – 169,5
167
14
2338
0
0
169,5 – 174,5
172
10
1720
1
10
174,5 – 179,5
177
02
354
2
4
179,5 – 184,5
182
01
182
3
3
50
8250
Total
-20
b. Método Abreviado: Utilizamos las dos columnas de la tabla de
arriba
 di
y f i .d i

k
X = Yi 
f . d
C
X  167 
i 1
i
i
n
5
 20
50


X  165
Ejemplo 3:
Hallar la media Aritmética por los dos métodos de las notas de la
tabla de 32 estudiantes
66
Ing. Rolando W. Rivera Olivera
Li
-
Ls
Yi
fi
Yi . f i
di
f i .d i
1,5 – 4,5
3
5
15
-1
-5
4,5 – 7,5
6
10
60
0
0
7,5 – 10,5
9
7
63
1
7
10,5 – 13,5
12
5
60
2
10
13,5 – 16,5
15
3
45
3
9
16,5 – 19,5
18
2
36
4
8
32
279
Total
29
a. Método directo:
k
f
X=
i 1
i
*Y i
n

X
279

32
X  8.72
b. Método Abreviado:
k
X = Yi  C
3.1.2.
f . d
i 1
i
n
i
 X 6  3
29
 X  8.72
32
MEDIANA (Me):
Es el valor central, el que delimita al 50% de los datos, es decir,
es el valor que se encuentra exactamente en la mitad de los
datos, dividiendo a los datos en dos partes simétricas.
50%
Xi
50%
Me
67
Xn
Ing. Rolando W. Rivera Olivera
a. MEDIANA PARA DATOS NO AGRUPADOS:
En los datos ordenados se aplica la siguiente relación, para
encontrar la posición de los datos.
posición 
n 1
; en donde n = número total de datos.
2
Entonces podemos tener sólo dos alternativas, que sea par o
impar
•
El valor de la posición puede ser entero y lo único que
debemos hacer es contar el número de lugares que nos indica
esta fórmula.
•
El valor de la posición nos da un valor decimal y entonces
debemos: sumar los valores involucrados y dividirlos entre 2.
Por ejemplo:
Si los datos son Pares: si tenemos los valores 5, 7, 8, 13 entonces
la posición nos da 2.5 por que tendremos que seleccionar a los
números 7 y 8 para luego sumarlos (15) y dividirlos entre 2 = 7,5
entonces:
Me = 7,5
Si los datos son Impares: Si tenemos los valores de 5, 6, 7, 8, 9 ; el
valor de la posición es 3, por tanto la mediana corresponde al dato
que ocupa el 3er lugar, así:
Me = 7
b. Mediana para datos Agrupados:
Se localiza la clase o renglón que contiene a la mediana, con la
siguiente condición
Fi 
n
2
, es decir debemos encontrar la primera frecuencia
acumulada que sea mayor a la posición, para posteriormente
aplicar la siguiente formula:
n
  Fi -1
Me  L i + C  2
fi









68
Ing. Rolando W. Rivera Olivera
Donde:
Li
: es la frontera o Límite inferior del intervalo mediano
Fi -1
: Frecuencia acumulada anterior al intervalo mediano
fi
: Frecuencia absoluta del intervalo mediano
C
: tamaño del intervalo en el intervalo mediano
Nota:
Si la posición, en los datos no agrupados, es decimal, se toma el
promedio del dato anterior y el siguiente, respectivamente
Ejemplo 1:
Calcular el sueldo mediano de los datos de la siguiente
tabla:
Fronteras($)
Salario
No. De emp.
Yi
fi
𝐿𝑖 − 𝐿𝑠
Fi
12,500 - 17,500
$15,000
18
18
17,500 - 22,500
$20,000
35
53
22,500 - 27,500
$25,000
29
82
TOTAL
82
Primero se obtiene la posición:
posición 
82
 41
2
Entonces buscamos el renglón de la mediana buscando la Fi
más grande de 41, como 18+35 = 53, entonces decimos que es
el segundo renglón o clase es donde se encuentra la mediana y
aplicamos la fórmula:
69
Ing. Rolando W. Rivera Olivera
n

 Fi -1 

 C
Me = L i +  2
fi






 41 - 18 
Me  17500  
 * 5000  entonces Me  $17828,571
 35 
Ejemplo 2:
Hallar la Mediana de la Tabla 1 del ejemplo de la Unidad 2
Recordemos el resumen de la tabla 1 , Unidad 2, de acuerdo a lo
que necesitamos:
𝐿𝑖
−
9,5 -
𝐿𝑠
154,5
𝑓𝑖
𝐹𝑖
3
3
154,5 -
159,5
8
11
159,5 -
164,5
12
23
164,5 -
169,5
14
37
169,5 -
174,5
10
47
174,5 -
179,5
2
49
179,5 -
184,5
1
50
TOTAL
50
Solución:
Necesitamos, primero dividir:
𝑛
2
= 25 con este resultado ubicamos
el intervalo mediano, buscando la frecuencia absoluta acumulada
70
Ing. Rolando W. Rivera Olivera
(𝐹𝑖 ) que contenga a dicho número, después de esto aplicamos la
fórmula de mediana.
n

 Fi -1 

 C
Me = L i +  2
fi






 25 - 23 
Me  164,5  5 
  entonces Me  $165,21
 14 
3.1.3.
MODA (Mo) :
Es el valor más frecuente, el que se observa mayor número de
veces en una distribución de datos.
a. MODA PARA DATOS NO AGRUPADOS: Después de ordenar
los datos buscamos el valor que más se repite.
Ejemplo 1: Encontrar la moda de; 47, 48, 49, 49, 49, 51, 51, 52.
Podemos observar que el número que más se repite es el 49. (
Mo = 49 )
Ejemplo 2: Los siguientes datos representan la
cantidad de pedidos diarios recibidos en un
período de 20 días, ordenados
en orden
ascendente
0
6
0
6
1
7
1
7
2
8
2 4 4 5 5
12 15 15 15
1
Mo = 15
9
La cantidad de pedidos diarios que más se repite es 15
71
Ing. Rolando W. Rivera Olivera
Ejemplo 3: La cantidad de errores de facturación por
día en un periodo de 20 días, ordenados en orden
ascendente es:
0
6
0
6
1
7
1
8
1
8
2
9
4
9
4 4 5
10 12 12
Esta distribución tiene 2 modas. Se la llama
distribución
bimodal.
Mo = 1 y Mo = 4
Nota: Si ningún valor se repite, no existe moda, el agrupamiento
sería amodal, si tuviera dos, bimodal; tres trimodal y varios polimodal.
72
Ing. Rolando W. Rivera Olivera
b. MODA PARA DATOS AGRUPADOS:
Se localiza la clase modal buscando la frecuencia más alta y
después se aplica la siguiente fórmula:
 1 

Mo  L i + C 



2 
 1
donde : 1  f i  f i anterior
 2  f i - f i posterior
Nota: La distribución puede ser:
-
amodal,
-
unimodal,
-
bimodal,
-
trimodal,....,
-
polimodal.
Ejemplo 1:
Calcular el salario que más se repite (Mo) en:
Fronteras($)
𝐿𝑖
−
𝐿𝑠
Salario
No. De
Yi
emp.
fi
12,500 - 17,500
$15,000
18
17,500 - 22,500
$20,000
35
22,500 - 27,500
$25,000
29
Observamos las frecuencias (No. de empleados) y decimos que la
clase modal es la segunda, porque 35 es la frecuencia más grande y
aplicamos:
73
Ing. Rolando W. Rivera Olivera
 1 
 17 
 C  17500  
Mo = L i + 
 5000  $21,195.65
 17  6 
 1   2 
donde : 1  f  f anterior  35  18  17
 2  f  f posterior  35  29  6
Ejemplo 2:
Hallar la Moda de la Tabla 1 del ejemplo de la Unidad 2
Recordemos el resumen de la tabla 1, Unidad 2:
𝐿𝑖
−
𝐿𝑠
𝑓𝑖
149,5 -
154,5
3
154,5 -
159,5
8
159,5 -
164,5
12
164,5 -
169,5
14
169,5 -
174,5
10
174,5 -
179,5
2
179,5 -
184,5
1
TOTAL
50
Solución:
Necesitamos recordar en la Tabla 1 de la Unidad 2 , el intervalo
que tiene la mayor frecuencia y luego aplicar la fórmula:
 1 

Mo  L i + C 
 1   2 


14  12
 2 
  164,5  5
Mo  164,5 + 5 
  166,16
2 4
 (14  12)  (14  10) 
74
Ing. Rolando W. Rivera Olivera
Luego la moda es:
3.1.4.
Mo = 166,16
Relación entre Media Aritmética, Mediana y Moda:
Para distribuciones unimodales que sean poco asimétricas:
X  Mo  3X  Me
HG X
Sus posiciones relativas, según la simetría de la distribución de
frecuencias es:
Relación
Simetría
Mo  Me  X
Simétrica
Mo < Me < X
Sesgo positivo
Mo  Me > X
Sesgo negativo
Nótese que en nuestros ejemplos tenemos:
Mo > Me > X
es decir : 166,16  165,21  165
Por tanto se da una asimetría negativa ó es una distribución
sesgada negativamente.
3.2. MEDIDAS DE TENDENCIA CENTRAL PARA CASOS ESPECIALES
3.2.1. MEDIA ARITMÉTICA PONDERADA ( X w ): Es el promedio de los
datos en donde se le da un peso o importancia específica a cada
observación. Se calcula:
Producto de cada uno de los datos por su ponderación o peso
75
Ing. Rolando W. Rivera Olivera
n
 W *X
Xw =
i
i 1
i
Suma de las ponderaciones
n
W
i 1
i
Ejemplo:
Se desea obtener el precio promedio en el siguiente cuadro
Precio del
Producto
Cantidad
en Kg.
$ 17.80
75
$ 35.90
56
$ 79.45
19
:
Aplicamos la fórmula:
n
W *X
X w=
i
i 1
n
W
i 1
i

(17.8 * 75)  (35.9 * 56)  (79.45 *19) 4854.95


75  56  19
150
$ 32.37
i
3.2.2. MEDIA GEOMÉTRICA (G):
Con cierto tipo de datos, la media aritmética no da el valor
promedio correcto. La media geométrica sirve para promediar los
crecimientos geométricos de una variable.
76
Ing. Rolando W. Rivera Olivera
Si suponemos que Y representa el factor de crecimiento
geométrico de la variable X, es decir: Yi 
Xi
, entonces el factor
X i 1
de crecimiento geométrico promedio de la variable X se puede
calcular como en el siguiente ejemplo.
Ejemplo.
Si los precios de la acción “Cemento Sur” en los últimos cuatro
días fueron; 4,75; 5,23; 4,78 y 6,32 calcule el factor de
crecimiento promedio y el crecimiento porcentual promedio.
Existen dos formas de resolverlo:
Primero calculamos el promedio Geométrico (G), con la
siguiente fórmula:
G  n X1 * X 2 ** X n , luego, reemplazamos en ella nuestros
datos
:
G  4 4,75 * 5.23 * 4.78 * 6,32 
G  4 750,482  5,234
Entonces G = 5,234
a) También se calcula por logaritmos:
log G 
log G =
 log X
n
log 4,75  log 5,23  log 4,78  log 6,32
4
log G 
0,6767  0,7185  0,6794  0,8007
4
2,8753
 0,7188
4
entonces log G  0,7188 
log G 
por tanto:
G = 5.2340
77
Anti log G  5,234
i
Ing. Rolando W. Rivera Olivera
b) Para calcular el factor de crecimiento con estos mismos datos
y el crecimiento porcentual se sigue el procedimientos
siguiente: La forma más ortodoxa o clásica, es:
G  n Y1 * Y2 *  * Yn  3
G  3 1.330526316 
5.23 4.78 6.32
*
*
4.75 5.23 4.78
1.099869493
Lo que acabamos de obtener es factor de crecimiento
promedio y para obtener el crecimiento se aplica la siguiente
formula:
crecimient o  (1  G ) *100  (1  1.099869493) *100  9.9869%
c) Otra forma es :
G  número de datos -1
último
6.32 3
3
 1.330526316  1.099869493
primero
4.75
Lo demás se repite del mismo modo, entonces el crecimiento
resulta = 9,9869 %
3.2.2.1.
APLICACIÓN DE LA MEDIA GEOMETRICA:
a. Media Geométrica ( G ) para datos No Agrupados:
G  n x1 * x 2 ** x n
log G =
 log x
i
n
78
Ing. Rolando W. Rivera Olivera
xi = corresponde a los datos no agrupados.
Ejemplo:
Hallar la media geométrica del siguiente conjunto de
números:
6; 7; 5; 3; 9 y 11
Solución:
❖ Aplicamos el método directo:
G  n x 1 * x 2 * * x n
G  6 6 * 7 *5 * 3* 9 * 11

6
62370
 G  6,2974
Aplicando logaritmos:
log G =
log G =
log G =
 log X
i
n
 log 6  log 7  log 5  log 3  log 9  log 11
6
4,79497574
6
= 0,7992
G = Antilog 0,7992
=
6,2975 , por tanto los
resultados son idénticos
b. Media Geométrica para datos Agrupados:
79
Ing. Rolando W. Rivera Olivera
G  n Y1f1 * Y2f2 *  * Ykfk
ó
log G =
f
i
log Yi
n
donde: k = última clase
Nota: Se puede demostrar que: X  G .
También puede calcularse la media geométrica ponderada.
Ejercicio:
Supóngase que se cuenta con la información diaria de los
incrementos porcentuales de una acción y que se
representan en la siguiente tabla:
Crecimiento
porcentual (%)
Frecuencias en días
10
14
20
15
30
48
77
a) Calcular los factores de crecimiento.
 crecimient o porcentual 
Yi  1  

100


b) Calcular el factor de crecimiento promedio
G  n Y1f1 * Y2f2 *  * Ykfk  77 1.1014 *1.2015 *1.30 48  1.2415965
crecimient o  (1  G ) *100  (1  1,2415965) *100  24.15965%
Ejemplo 2:
80
Ing. Rolando W. Rivera Olivera
Hallar la media Geométrica de la Tabla 1 del ejemplo de la
Unidad 2
Recordemos el resumen de la tabla 1 , Unidad 2:
𝑳𝒔
𝒀𝒊
𝒇𝒊
149,5 -
154,5
152
3
154,5 -
159,5
157
8
159,5 -
164,5
162
12
164,5 -
169,5
167
14
169,5 -
174,5
172
10
174,5 -
179,5
177
2
179,5 -
184,5
182
1
𝑳𝒊
−
TOTAL
50
Solución, necesitamos recordar la Tabla 1 de la Unidad 2 y luego
aplicar la fórmula:
log G =
f
i
log Yi
n
logG=
3 log 152  8 log 157  12 log 162  14 log 167  10 log 172  2 log 177  1log 182
50
log G =
log G =
110,8562411
50
2,217124823
Posteriormente se extrae el antilogaritmo de dicha cantidad
Antilog de 2,217124823 es el valor de G, por lo tanto: G = 164,86
81
Ing. Rolando W. Rivera Olivera
3.2.3. MEDIA ARMÓNICA (H):
Cuando los datos a promediarse están medidos en unidades
expresadas en forma de cocientes (km./hr., $/lt, etc.), lo más
adecuado es utilizar la media armónica, ya que la media
aritmética nos llevará a un promedio equivocado.
a. Media Armónica para datos No Agrupados:
H
n
n
1
X
i 1
i
Ejemplo 1 :
Si un vehículo se mueve de la ciudad A a la B a 65 Km./hr
y regresa de B a A a 98 Km./Hr a qué promedio se
desplazó.
H
n
n
1

i 1 X i

2
1 1

65 98
 78.1595
b. Media Armónica para datos Agrupados:
H
n
fi

i 1 Yi
k
Nota: Se puede demostrar que: X  G  H ; entonces señor
estudiante con este mismo ejemplo verifique lo planteado.
También puede calcularse la media armónica ponderada.
Ejemplo 1:
Supóngase que una flotilla de vehículos muestra la
siguiente información: Halle su media Armónica.
82
Ing. Rolando W. Rivera Olivera
Velocidad
promedio
en km/hr
Número
de
vehículos
50
15
60
28
75
31
La respuesta es:
H
n
74

 62,711864
15 28 31
fi
 

50
60 75
Y
i 1
i
k
Ejemplo 2:
Hallar la media Armónica de la Tabla 1 del ejemplo del
Capítulo 2
Recordemos el resumen de la tabla 1 , Capítulo 2:
𝐿𝑖
−
𝐿𝑠
𝑌𝑖
149,5 -
154,5
152
3
154,5 -
159,5
157
8
159,5 -
164,5
162
12
164,5 -
169,5
167
14
169,5 -
174,5
172
10
174,5 -
179,5
177
2
179,5 -
184,5
182
1
TOTAL
𝑓𝑖
50
83
Ing. Rolando W. Rivera Olivera
Aplicamos la fórmula de H para datos agrupados:
H
n
fi

i 1 Yi
H
50
3
8
12 14 10
2
1






152 157 162 167 172 177 182
H
50
0,3035
k
H  164,74
3.2.4. MEDIA CUADRÁTICA (MC):
La media cuadrática nació con el objetivo de poder obtener el
promedio de valores positivos y negativos al mismo tiempo,
además de ser una gran ayuda para poder calcular las
dispersiones promedio de los datos (ver medidas de dispersión).
a. Media Cuadrática para datos no agrupados:
n
MC 
x
i 1
2
i
n
Ejemplo:
Supóngase que se obtienen las ganancias y pérdidas del
precio de una acción durante una semana; - 4.00, - 3.50,
2.35, 6.20, 3.25 Calcular el promedio cuadrático:
84
Ing. Rolando W. Rivera Olivera
n
MC 
MC 
x
i 1
2
i
(4.0) 2  (3.5) 2  2.35 2  6.2 2  3.25 2
5

n
50.775
 3.186691
5
b. Media Cuadrática para datos agrupados
n
n
MC 

i 1
f i xi2
MC 
n
fY
i 1
ó
2
i i
n
Ejemplo 1:
Ahora deseamos obtener el promedio de una tabla de
distribución de frecuencias pero con datos positivos y
negativos; Así tenemos Ganancias y pérdidas del precio
por acción y días.
Ganancias y
Nro.de
pérdidas
días:
xi
fi
-7.25
25
2.75
14
12.75
2
n
MC 
fx
i 1
i
n
2
i

25 * ( 7.25) 2  14 * 2.75 2  2 *12.75 2
41
MC  6.5239
85
Ing. Rolando W. Rivera Olivera
Ejemplo 2:
Hallar la Media Cuadrática del ejemplo Tabla 1 del Capítulo 2.
𝐿𝑖
−
𝐿𝑠
𝑌𝑖
149,5 -
154,5
152
3
154,5 -
159,5
157
8
159,5 -
164,5
162
12
164,5 -
169,5
167
14
169,5 -
174,5
172
10
174,5 -
179,5
177
2
179,5 -
184,5
182
1
TOTAL
𝑓𝑖
50
n
MC 
 f .Y
i 1
i
2
i
n
MC 
3 * (152) 2  8 * 157 2  12 * 162 2  14 * 167 2  10 * 172 2  2 * 177 2  1 * 182 2
50
MC 
3 * (152) 2  8 *157 2  12 *1622  14 *167 2  10 *1722  2 *177 2  1 *1822
50
MC 
1363500
50
 MC  27270  MC  165,14
3.3. MEDIDAS DE POSICIÓN
Ayudan a localizar el valor de la variable que acumula cierto porcentaje
específico de datos.
86
Ing. Rolando W. Rivera Olivera
3.3.1. Cuartiles( Q x ): Encuentran el valor acumulado al 25%, 50% y 75%
respectivamente.
3.3.2. Deciles ( D x ): Representan el 10%, 20%, ... , 90% de los datos
acumulados respectivamente.
3.3.3. Percentiles ( Px ): Representan el 1%, 2%, ... , 99% de los datos
acumulados respectivamente.
Cada cuantil delimita dos regiones:
el p% de datos de menor valor (acumulados a la izquierda del cuantil
C)
el (1 - p)% de datos de mayor valor (acumulados a la derecha del
cuantil C).
3.4.
MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS:
En los datos ordenados: se debe calcular la posición mediante la
fórmula:
Posición 
x*n
r
donde :
x  Número de cuantil que se desea obtener
r  puede ser 4, 5, 10 ó 100 depende del cuantil que se desee obtener
n  número de datos
Después de calcular la posición se utiliza la siguiente fórmula
para encontrar el cuantil deseado:
dato menor  (dato mayor - dato menor) * fracción de la posición
Ejemplo:
Dados los números 3, 5, 7, 36, 45; obtener el número que
represente al 75% de los datos ( P75 )
87
Ing. Rolando W. Rivera Olivera
Solución:
1. Primero obtienes la posición
N=5
x = 75
r = 100
75 * 5
 3,75
100
2.
Identificamos que números están en la cuarta y quinta
posición, es decir el 36 y el 45
3. Aplicamos la fórmula:
36  (45  36) * 0.5  40.5
Es decir, el número que representa al 75% de los datos es el 40.5
o sea el P75  40.5
3.5.
MEDIDAS DE POSICIÓN PARA DATOS AGRUPADOS:
Primero calculamos la posición como en los datos no agrupados,
después buscamos en la tabla correspondiente la columna de
Frecuencia acumulada y ubicamos el primer valor de Fi 
posición y aplicamos la siguiente formula:
Posición del Cuantil
Frecuencia acumulada anterior al intervalo
seleccionado
.
  xn  


  Fi 1 
r 
C
Q x = Li +  


fi




Tamaño de intervalo del renglón seleccionado
Frecuencia del intervalo seleccionado
Frontera inferior
88
Ing. Rolando W. Rivera Olivera
Ejemplo 1:
a. Encontrar el cuartil 3 de la siguiente tabla:
3 * 1099
 824,25
4
•
Encontramos la posición: Posición 
•
Esta cantidad está incluida en la Tercera Fila, por tanto ésa es
la clase que contiene al Q3 y aplicamos la fórmula del cuartil.
Li
_ Ls
fi
Fi
100 - 200
389
389
200- 300
258
647
300 - 400
452
1099
Total
1099
  3 * (1099) 

  xn  



  647 
  Fi 1( anterior) 
4
 4 

 * 100  339.2146
  Q  300   
Qx = Li + C 
3




fi
452








Q3 =
339,2146
b. Encontrar el Decil 7 en la tabla anterior ( D 7 )
  xn  


  Fi 1( anterior) 
10 
 
D x = Li + C  


fi




89
Ing. Rolando W. Rivera Olivera
  7 * (1099) 


  647 
10

 *100  327,058
D 7  300   


452




c. Encontrar el Percentil 35 ( P35 ):
Observa que para el Percentil 35, la posición:
 351099 
 x n  

  384,65
 = 
 100 
 100 
Este valor indica la posición del Percentil 35:
Con este valor vemos que en la columna de Fi
éste se posiciona en el
1er. Intervalo de la tabla correspondiente, entonces:
Fi 1( anterior) = 0
  xn  

  35 * (1099) 



  Fi 1( anterior) 
0
100 
100

  P  100   
 *100  198,88
Px = L i + C  
35




fi
389








Ejemplo 2:
Hallar 𝑄3 ; 𝑄1 ; 𝐷4 ; 𝐷8 ; 𝑃35 𝑦𝑃40 de la Tabla 1 del ejemplo de la
Unidad 2
El resumen de la tabla 1, Unidad 2, de acuerdo a lo que se
necesita para su solución es:
90
Ing. Rolando W. Rivera Olivera
𝐿𝑖
−
9,5 -
𝐿𝑠
154,5
𝑓𝑖
𝐹𝑖
3
3
154,5 -
159,5
8
11
159,5 -
164,5
12
23
164,5 -
169,5
14
37
169,5 -
174,5
10
47
174,5 -
179,5
2
49
179,5 -
184,5
1
50
TOTAL
50
Solución, necesitamos, primero ubicar la posición correspondiente
a los cuantiles y con este resultado ubicamos el intervalo del
correspondiente cuantil y se busca en la frecuencia absoluta
acumulada (𝐹𝑖 ) que contenga a dicho número, después de esto
aplicamos la fórmula que corresponda, asi como vemos en la
solución que se muestra.
a. Cálculo de Cuartiles Q1 y Q3
Para calcular Cuartiles se usa la siguiente fórmula:
 xn

 Fi -1 

4
 C
Qx = Li + 
fi




 1(50)

 11 

 5  entonces Q1  160,125
Q1 = 159,5 +  4
12






 3(50)

- 37 

  entonces Q3  169,75
Q3  169,5  5  4
10






91
Ing. Rolando W. Rivera Olivera
b. Cálculo de Deciles: D4 y D8
 xn

 Fi -1 

 C
Dx = L i +  10
fi






 4(50)

 11 

  entonces D4  163,25
D4 = 159,5 + 5  10
12






 8(50)

- 37 

  entonces D8  171
D8  169,5  5  10
10






c. Cálculo de Percentiles: P35 y P40
 xn


Px = L i +  100
fi




Fi -1 
 C



 35(50)

 11 

  entonces P35  162,21
P35 = 159,5 + 5  100
12






 40(50)

- 11 


D40  159,5  5  100
12






 entonces P40  163,25
92
Ing. Rolando W. Rivera Olivera
EJERCICIOS PROPUESTOS N° 3
1. Una empresa grande de equipos deportivos está probando el efecto
de dos planes publicitarios sobre las ventas de los últimos 4 meses.
Dadas las ventas que se ven aquí, ¿cuál programa de publicidad
parce producir el crecimiento promedio más alto en ventas
mensuales?
Mes
Plan 1
Plan 2
Enero
1657,0
4735.0
Febrero
1998.0
5012.0
Marzo
2267.0
5479.0
Abril
3432.0
5589.0
2. Los estadísticos del programa de Meals on Wheels (comida sobre
ruedas), el cual lleva comidas calientes a enfermos confinados en
casa, desean evaluar sus servicios. El número de comidas diarias
que suministran aparece en la siguiente tabla de frecuencia. Calcular
la media, mediana y la moda e interprete sus resultados.
Número de comidas por
Número de días
día
[0 , 5[
3
[5 , 10[
6
[10 , 15[
5
[15 , 20[
8
[20 , 25[
2
[25 , 30]
3
3. Bill Karl compró 20 acciones a &15 cada una, 50 acciones a &20
cada una, 100 acciones a $30 cada una y 75 acciones a &35 cada
una. ¿Cuál es el precio promedio por acción?
93
Ing. Rolando W. Rivera Olivera
4. Las edades de 50 de los directores ejecutivos de las mejores
corporaciones de la nación reportadas aparecen en la siguiente tabla
de frecuencias. Calcule e interprete la media, la mediana y la moda.
Además, calcule e interprete: Q1, Q2, D10, D60, P15, P90,
Edades
Frecuencia
[50 , 55[
8
[55 , 60[
13
[60 , 65[
15
[65 , 70[
10
[70 , 75[
3
[75 , 80]
1
5. Dado el siguiente cuadro estadístico con ancho de clase constante
igual a 20. Determine la media de los datos.
Li - Ls
fi
Fi
Yi.fi
-
8
8
880
-
15
23
1950
-
12
35
1800
-
13
48
18
66
4
70
- 200[
Yi
6. En el curso de estadística y probabilidades; se tienen las notas de los
alumnos distribuidas según el siguiente histograma de frecuencias,
entonces la nota promedio del curso es:
94
Ing. Rolando W. Rivera Olivera
7. Dada la siguiente distribución de frecuencias, calcular el valor de “n”
sabiendo que la moda es 60 y pertenece al tercer intervalo.
(Li
-
Ls)
fi
( 16 - 32 )
6
( 32 - 48 )
n
( 48 - 64 )
8
( 64 - 80 )
3n
( 80 - 96 )
3
8. En un examen de estadística tomado el mismo día y hora a los tres
grupos del segundo Semestre de la carrera de Mantenimiento de la
institución: A B y C con un total de 150 alumnos se obtuvo una nota
promedio de 13,2; las notas promedio de los grupos A y B fueron 12
Y 14 respectivamente ; los registros del grupo C se extraviaron , pero
se sabe que el grupo A es el 36% del total y que el número de
alumnos del grupo B es la tercera parte de las matriculadas en el
grupo C
a. Hallar nota promedio del grupo C
b. Hallar la nota promedio del grupo C
c. Calcular la nota promedio de los grupos A y C juntos
9. La siguiente tabla de distribución de frecuencias muestra la edad de
un grupo de personas. Si además se sabe que la moda es 27,5
(Li
fi
Ls)
(10 - 20)
(20 - 30)
a
30
(30 -
40)
(40 -
a+10
50)
20
a. Hallar el valor de a
b. ¿Bajo qué edad se encuentra el 35% más joven
c. Cuantas personas tienen como mínimo 20 años Justifique
10. De un grupo de pequeñas empresas se sabe que ninguna tiene más
de 5 trabajadores ni menos de 2, la mayoría tiene 3 trabajadores, el
20% tiene 5 trabajadores, 2 de cada 20 empresas tiene 4
95
Ing. Rolando W. Rivera Olivera
trabajadores; la proporción de empresas que tienen 2 trabajadores es
0.25% Calcular e interpretar la media aritmética.
11. Dada la siguiente distribución de frecuencias:
(Li - Ls)
fi
(20 - 30)
(30
3
-
40) (40
1
-
50)
(50 -
2
6
60)
(60 -
70)
x
Hallar el valor de x, si se sabe que la mediana es 61,6
12. Los siguientes datos corresponden a los sueldos de los trabajadores
de una compañía
Sueldos
Número de trabajadores
950 - 1000
5
1000 - 1050
12
1050 - 1100
9
1100 - 1150
8
1150 - 1200
4
1200 - 1250
10
1250 - 1300
6
a)
Calcular la media aritmética
b)
Si a cada trabajador se le duplica el sueldo pero a la vez se le
hace un descuento de 150 soles ¿Cuál será el nuevo sueldo
promedio?
c)
Si cada trabajador recibe un incremento del 30% de su sueldo
¿Cuál sería el nuevo sueldo promedio?
d)
Si cada trabajador recibe un aumento de 270 soles y al mismo
tiempo se decreta un descuento del 3,5 % del nuevo haber
¿Cuál es el sueldo promedio?
13. En un examen tomado a 3 secciones de un curso de estadística de
91 alumnos el puntaje medio general fue de 69.3. los puntajes
medios de las secciones 1 y 2 fueron 70.4 y 64.2 respectivamente.
Se perdieron los archivos con la notas de la
sección 3 pero los
ayudantes recuerdan que las secciones 1 y 2 tenían exactamente el
mismo número de alumnos , mientras que el ayudante de la sección
96
Ing. Rolando W. Rivera Olivera
3 menciona que su sección tenía 5 estudiantes menos que la sección
1 ¿Cuál es el promedio de la sección 3?
14. Una fábrica de aparatos electrónicos ha comenzado un estudio para
mejorar su eficiencia. Efectuó para esto un
relevamiento en la
sección de armado de visores para computadora durante 10 días
consecutivos. La cantidad de visores armados diariamente fueron:
30; 20; 50; 80; 40; 50; 60; 30; 70 y 50
Calcule todas las medidas de tendencias central proporcionando un
significado a su valor de manera que sirva para los fines propuestos
en el estudio.
15. La siguiente información es relativa a los sueldos de un grupo de
trabajadores en una compañía donde el 12% de ellos ganan S/ 530,
el 24% gana S/ 560, el 20% ganan S/ 600, el 15% ganan S/ 650, el
13 %ganan S/ 680 y el resto ganan S/ 700. ¿Cuál es el salario
medio?
16. En un grupo hay 40 estudiantes varones con una edad promedio de
20 años, las mujeres son en promedio más jóvenes en un 10% .
¿Cuántas mujeres hay si la edad promedio de la clase es de 19
años?
17. El salario promedio mensual pagado a los trabajadores de una
compañía es de $ 200. Los salarios promedios mensuales pagados a
los hombres y mujeres de la compañía son$ 210 y $150
respectivamente. Determinar el porcentaje de hombres y mujeres
que trabajan en la compañía.
18. Las ganancias diarias de los establecimientos de un centro comercial
se presentan en una tabla de frecuencias con 6 intervalos de clase y
se sabe que la mínima ganancia es de $ 6 , el rango es de 36 , el
promedio de ganancias diarias es de $25,14, el 50% de los
establecimientos ganan más de 25,58 dólares diarios H 2 = 0,15; F2 =
120; h3 = 0,25; H5 = 0,93; f4 = 304; f2 = 2f1. Reconstruir la distribución
97
Ing. Rolando W. Rivera Olivera
de todas las frecuencias y hallar la ganancia más frecuente y la
ganancia promedio.
19. Una compañía minera tiene 100 trabajadores. Para los nombrados el
haber máximo es $450 y el mínimo $60. Hay un 5% de eventuales
(en prueba) que trabajan ad honorem o perciben compensaciones
inferiores a $60. Quince trabajadores nombrados perciben haberes
inferiores a $250 y el 85% ganan haberes inferiores a $400. Con esta
información, calcule las medidas de tendencia central posible.
20. Un grupo de 200 estudiantes con estatura media de 60,96pulg. se
divide en 2 grupos, un grupo con una estatura media de 63,4 pulg. y
el otro con 57,3 pulg. ¿Cuántos estudiantes hay en cada grupo?
21. El sueldo promedio de 200 empleados de una empresa es S/ 400. Se
proponen 2 alternativas de aumento: a) S/ 75 a cada uno, b) 15% de
su sueldo más 10 soles a cada uno. Si la empresa dispone a lo más
de S/ 94,000 para pagar sueldos, ¿Cuál alternativa es la más
conveniente?
22. De una central telefónica salieron 70 llamadas de menos de 3
minutos promediando 2,3 minutos, 40 llamadas de menos de 10
minutos pero no menos de 3 minutos, promediando 6,4 minutos y 10
llamadas de al menos 10 minutos promediando 15 minutos. Calcular
la duración promedio de todas las llamadas.
23. El sueldo medio de los obreros de una fábrica es de $286
a) ¿Qué porcentaje de hombres y mujeres trabajan en la fábrica si
sus sueldos medios respectivos son $300 y $260?
b) Si el 60% de los obreros tienen menos de 30 años y perciben el
20% del total de sus sueldos, ¿Cuánto es el sueldo medio de los
obreros de al menos 30 años?
98
Ing. Rolando W. Rivera Olivera
24. En una empresa donde el sueldo medio es de $400 se incrementa un
personal igual al 25% del ya existente con el sueldo medio igual al
60% de los antiguos. Si 3 meses más tarde se incrementan cada
sueldo en 20%, más $30, ¿Cuánto es el nuevo salario medio?
25. Una empresa que vende microcomputadoras ha llevado a cabo un
estudio para analizar el número de microcomputadoras que existe en
pequeñas empresas del distrito A. Para el efecto toma una muestra
aleatoria de 40 empresas, encontrando los siguientes resultados:
5; 7; 9; 7; 8; 5; 4; 4; 3; 7
8; 4; 9; 6; 8; 7; 6; 9; 8; 4
6; 4: 7; 4; 3; 5; 8; 5; 9; 6
7; 9; 4; 7; 5; 8; 7; 9; 6; 8
Hallar:
Asimetría
Me;
y
Mo;
H;G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 ,
explique
e
encontrados.
99
interprete
los
tipo
de
resultados
Ing. Rolando W. Rivera Olivera
100
Ing. Rolando W. Rivera Olivera
AUTOEV ALUACIÓN III
NOMBRE…………………………….……. CARRERA………………………………
1. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente
tabla
Peso Kgs
Núm.de Emp.
[50;60[
[60;70[
[70;80[
[80;90[
[90;100[
8
10
16
14
10
[100;110[
5
[110;120[
2
a. Calcular la Media Aritmética por dos métodos.
b. Calcular la Mediana.
c. Calcular Moda
d. Cuartil 3; Decil 7; Percentil 35.
e. Calcular la media Cuadrática, Geométrica, Armónica.
f. Efectuar un análisis estadístico de sus resultados
2. Una distribución que tiene los siguientes datos en la tabla:
𝑥𝑖
𝑓𝑖
61
5
64
18
67
42
70
27
73
8
Total
100
Hallar: Me; Mo; H; G;, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 y tipo de Asimetría
3. Calcular 𝑥̅ , Me, Mo, G, H, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷8 ; 𝑃40; 𝑃70 en la siguiente
serie de números
5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4
101
Ing. Rolando W. Rivera Olivera
4. La siguiente tabla de distribución de frecuencias muestra la edad de un
grupo de personas. Si además se sabe que la moda es 27,5:
[𝐿𝑖
𝐿𝑠 [
𝑓𝑖
[10 - 20[
[20 - 30[
a
[30 - 40[
30
[40 - 50[
a + 10
20
Hallar:
a.
Me, 𝑥̅ , Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60
b. ¿Bajo qué edad se encuentra el 35 % más joven?
c. ¿Cuántas personas tienen como mínimo 20 años? Justifique
5. Se sabe que la media Aritmética de la siguiente distribución es 11,5:
[𝐿𝑖
𝐿𝑠 [
𝑓𝑖
[4 - 6 [
[6 - 10[
[10 - 16[
[16 - 20[
[20 - 30[
5
x
3
1
4
Clacular:
a.
Me, Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60
b. Media cuadrática
c. Promedio ponderado
6. Dada la siguiente distribución de frecuencias, calcular el valor de “n”
sabiendo que la moda es 60 y pertenece al tercer intervalo, además calcule:
Me, Mo, H, G, 𝑄3 ; 𝑄1 ; 𝐷7 ; 𝐷4 ; 𝑃30; 𝑃60 .
(Li
-
Ls)
fi
[ 16 - 32 [
6
[ 32 - 48 [
n
[ 48 - 64 [
8
[ 64 - 80 [
3n
[ 80 - 96 ]
3
102
Ing. Rolando W. Rivera Olivera
CAPITULO IV
4.
MEDIDAS DE DISPERSIÓN.
Introducción:
Las Medidas de centralización ya estudiadas sólo nos revelan una parte
de la información que necesitamos saber acerca de las características
de los datos. Para aumentar nuestra confianza y entendimiento del
patrón de los datos, debemos medir también su dispersión, extensión o
variabilidad; por ello estas medidas nos permiten obtener información
adicional para juzgar la confiabilidad de nuestras medidas de tendencia
central. Si los datos se encuentran ampliamente dispersos como
veremos más adelante, la posición central es menos representativa de
los datos.
Las principales medidas de dispersión son:
4.1.
RANGO o alcance (o Intervalo: R ):
Es la distancia que existe entre el menor y mayor valor de los datos,
es fácil de entender y de encontrar, pero su utilidad como medida de
dispersión es limitada, porque sólo toma los extremos ignorando la
naturaleza de esta variación y/o la concentración de los datos, ve sólo la
influencia de los extremos.
4.1.1. Rango para Datos No Agrupados:
R = Dato Máx - Dato Mín.
103
Ing. Rolando W. Rivera Olivera
4.1.2. Datos Agrupados:
Rango  R  LS k  Li1
donde k = última clase
Ejemplo:
Dadas las dos series de datos:
15; 20; 25; 20; 25 el Rango es 10
15; 16; 20; 17; 18; 19; 20; 21; 23 y 25 el Rango sigue siendo 10
4.2.
RANGO INTER CUARTIL (RI):
Indica aproximadamente qué tan lejos de la mediana tenemos que ir
en cualquiera de las dos direcciones antes de que podamos recorrer
una mitad de los valores del conjunto de datos. El RI es una medida
que excluye el 25 % más alto y el 25% más bajo, dando un rango
dentro del cual se encuentra un 50 % central de los datos observados
y a diferencia del Rango no se encuentra afectada por los extremos,
su cálculo incluye el uso de la relación:
RI  Q3  Q1
4.3.
RANGO SEMI-INTER CUARTIL (RSIQ): (o Desviación Cuartil)
Mide el rango promedio de una cuarta parte de los datos (evita los
valores extremos)
RSIQ 
4.4.
Q 3  Q1
2
DESVIACIÓN MEDIA ABSOLUTa (DM): (o Desviación Absoluta
Promedio)
104
Ing. Rolando W. Rivera Olivera
Es la distancia promedio de los datos a su media.
4.4.1.
Datos No Agrupados:
n
 X X
DM =
4.4.2.
i
i 1
n
Datos Agrupados:
k
f
DM =
4.5.
i 1
i
Yi  X
n
VARIANZA:
❖ Poblacional ( 2 ): Es el promedio del cuadrado de la distancia de los
datos a su media
4.5.1. Datos No Agrupados: se puede calcular por cualquiera de las
formas:
 X  X 
N
2
i
a.
2 =
b.

2
  Xi
 2   i 1
 N


i 1
N
N


 X2



105
Ing. Rolando W. Rivera Olivera
4.5.2. Datos Agrupados:
 f Y  X 
k
2
i
i
a.
2 =
b.
 k
2
  f i *Y i
 2   i 1

N


i 1
N


 X2



❖ Para el caso muestral ( s 2 ): La suma de las distancias al cuadrado se
divide entre en número de datos menos uno ( N – 1 ):
4.5.3. Datos No Agrupados:
 x  x 
n
2
i
i 1
a.
s2 =
b.
 n 2
  xi 
 (n x ) 2 
2

s   i 1   
 n - 1   n  1 




n -1
4.5.4. Datos Agrupados:
k
a.
b.
Nota:
s2 =
 f y x 
i 1
2
i
i
n -1
 k
  f i y i2
s 2   i 1
 n -1




2
   (n x )
  n - 1





s 2 para muestras “chicas”. Para muestras grandes s 2 o 2
106
Ing. Rolando W. Rivera Olivera
prácticamente no difieren.
4.6.
DESVIACIÓN ESTÁNDAR:
Mide la variación de los datos en términos absolutos. Es la raíz
cuadrada positiva de la varianza.
  2
❖ Poblacional:
❖ Muestral:
La
desviación
𝑠 = √ s2
estándar
se
interpreta
construyendo
intervalos
alrededor del promedio:
a) Teorema de Chebyshev. Si la distribución no es simétrica y
unimodal.
•
Al menos el 75% de los valores cae dentro de 2 desviaciones
estándar alrededor de la media: X  2S
•
Al menos el 89% de los valores caen dentro de 3 desviaciones
estándar alrededor de la media: X  3S
b) Regla Empírica. Si la distribución es una curva acampanada, unimodal
y simétrica:
• Aproximadamente el 68% de los datos (población) se encuentran a
una desviación estándar alrededor de la media: X  S
• Aproximadamente el 95% de los datos (población) se encuentran a 2
desviaciones estándar alrededor de la media: X  2S
• Aproximadamente el 99% de los datos (población) se encuentran a 3
desviaciones estándar alrededor de la media: X  3S
107
Ing. Rolando W. Rivera Olivera
4.7.
COEFICIENTE DE VARIACIÓN (CV):
Mide la variación relativa de la variable con respecto a su promedio.
Mide la magnitud de la desviación estándar en relación con la magnitud
de la media. Se expresa en por cientos.
CV =
S
 100
X
Ejercicio de Aplicación de Medidas de dispersión:
Calcular a partir de la Tabla 1 del ejemplo del Capítulo 2 en que se
muestran todas las medidas de dispersión arriba mencionadas:
Interv. Li
-
Ls
Yi
fi
Yi  Y
fi Y  Y
i
1er
149,5 – 154,9
152
3
152 – 165
39
2do
154,5 – 159,5
157
8
157 - 165
64
3er
159,5 – 164,5
162
12
162 - 165
36
4to
164,5 – 169,5
167
14
167 - 165
28
5to
169,5 – 174,5
172
10
172 - 165
70
6to
174,5 – 179,5
177
02
177 - 165
24
7mo
179,5 – 184,5
182
01
182 - 165
17
Total
50
278
a. Calculo de desviación Media (DM): Para calcular la desviación
media se utiliza la siguiente fórmula:
n
 Y X
DM =
i 1
i
n
3152  165  8157  165  12162  165  14167  165  10172  165  2177  165  1182  165
50
278
DM 
50
DM =
108
Ing. Rolando W. Rivera Olivera
DM = 5,56
b. Para el cálculo de Desviación estándar o Típica, se calcula primero
la Varianza ( s 2 ) luego se saca la raíz cuadrada de este valor y se
obtiene la desviación típica:
 f y x 
k
S2 =
i 1
2
i
i
n
3152  165  8157  165  12162  165  14167  165  10172  165  2177  165  1182  165
2
S 
2
2
2
2
2
2
2
50
s2 =
507+512+108+56+490+288+289
50
=
2250
50
⇿ s 2 = 45 ; por tanto :
s = √45 = 6,71
c. Coeficiente de Variación (CV): este coeficiente de variación se halla
utilizando la siguiente relación e indica la homogeneidad o
heterogeneidad de la composición de datos; esto es si sobrepasa el
33% será heterogéneo y sino homogéneo:
CV =
S
6,71
 100 reemplazando en la Fórmula  CV 
x 100  CV  4,06 %
X
165
Lo que indica que es bastante Homogéneo, se encuentra lejos del 33
%.
4.8.
MEDIDAS DE FORMA
Proporcionan un valor numérico para saber hacia qué lado de la
distribución hay mayor acumulación de frecuencias y si la concentración
central de frecuencias es mayor que en los extremos o viceversa sin
tener que graficar los datos.
4.8.1. Momento Respecto de la Media: El r-ésimo momento respecto a
la media aritmética es:
109
Ing. Rolando W. Rivera Olivera
a. Datos No Agrupados:
 x
n
mr 
i 1
 x
r
i
n
b. Datos Agrupados:
 f x
n
mr 
i 1
i
 x
r
i
n
El primer momento respecto a la media (r=1) siempre es igual a
cero.
El segundo momento respecto a la media (r=2) es la varianza
poblacional.
4.8.2. SESGO: Es el grado de asimetría que tiene la distribución. La
distribución puede ser:
•
Insesgada: Si tiene forma de campana y el área acumulada del
centro de la distribución a la derecha es igual a la que se acumula
a la izquierda, además se dice que es una distribución normal en
las que: Moda=Mediana=Media
Insesgada
Moda=Mediana=Media
110
Ing. Rolando W. Rivera Olivera
•
Con sesgo positivo o a la derecha: Si tiene la mayor
acumulación de frecuencias a la izquierda y una cola larga a la
derecha.
Sesgo Positivo (a la derecha)
Moda
Mediana
Media
•
Con sesgo negativo o a la izquierda: Si la mayor acumulación
está a la derecha y tiene una cola larga a la izquierda.
Sesgo Negativo (a la izquierda)
Moda
Mediana
Media
•
Coeficiente Momento de Sesgo ( a 3 ): se calcula dividiendo el tercer
momento respecto a la media entre la desviación estándar al cubo:
Datos No Agrupados:
 x
n
a3 
m3

s3
i 1
 x
3
i
ns 3
Datos Agrupados:
 f x
k
a3 
m3

s3
i 1
i
 x
3
i
ns 3
111
Ing. Rolando W. Rivera Olivera
Coeficiente momento
de sesgo
Sesgo
a3 = 0
No hay sesgo. La
insesgada
distribución
es
a3 > 0
La distribución tiene sesgo positivo o a la
derecha.
a3 < 0
La distribución tiene sesgo negativo o a la
izquierda.
4.8.3. CURTOSIS: Mide qué tan puntiaguda es una distribución, con respecto
a la Normal o el grado de apuntalamiento. La distribución puede ser:
Mesocúrtica: solo la distribución Normal (es el término medio).
Leptocúrtica: Las distribuciones más puntiagudas que la Normal.
Platicúrtica: Las distribuciones menos puntiagudas que la Normal.
Leptocúrtica
Mesocúrtica
Platocúrtica
4.8.4. Coeficiente momento de curtosis ( a 4 ): se calcula dividiendo el cuarto
momento respecto a la media entre la varianza al cuadrado (o la
desviación estándar a la cuarta).
• Datos No Agrupados:
 x
n
m
a 4  44 
s
i 1
 x
4
i
ns 3
112
Ing. Rolando W. Rivera Olivera
•
Datos Agrupados:
 f x
 x
k
m
a 4  44 
s
Coeficiente
de curtosis
4.9
i 1
momento
i
4
i
ns 4
Curtosis
a4 = 3
La distribución es Mesocúrtica.
a4 > 3
La distribución es Leptocúrtica.
a4 < 3
La distribución es Platocúrtica.
MEDIDAS DE CONCENTRACIÓN
En una distribución, ni la media ni la varianza son explicativas de la
mayor o menor igualdad en el reparto; para esto usamos las medidas de
concentración.
Consideremos que la variable en cuestión es el salario. Una
distribución muy concentrada indica que pocos individuos reciben la
mayor parte del total, mientras que poca concentración supone que
todos los individuos tienen un reparto igualitario.
4.9.1.
Indice de Gini ( Ig ):
k 1
Ig 
 p
i 1
i
 qi 
k 1
p
i 1
i
donde:
k = número de clases o categorías
pi = la proporción acumulada de individuos =
113
fi
 100 =
n
fra x 100
Ing. Rolando W. Rivera Olivera
q i = la proporción acumulada del total del producto de f i*xi
0  Ig  1
Si Ig=0, la variable está menos concentrada (mejor repartida).
Si Ig=1, la variable está más concentrada (peor repartida).
4.9.2.
Curva de Lorenz:
Se grafican los valores de la proporción acumulada de individuos (p) y la
proporción acumulada del total de la variable (q).
La función identidad representa la igualdad absoluta, es decir, a la
variable cuando no está concentrada (la recta a 45 grados). La
desigualdad absoluta o máxima concentración de la variable indicaría
que un solo individuo tenga el total de la variable (el triángulo inferior).
Cuanto más se acerque la Curva de Lorenz a la diagonal, más igualitario
será el reparto (Ig = 0). Cuanto más se acerque la Curva de Lorenz al
triángulo inferior, más concentrada esta la variable (Ig = 1).
q
p
El Indice de Gini calcula el área entre la diagonal y la Curva de Lorenz,
como un porcentaje del área del triángulo inferior de la gráfica (mide la
desigualdad relativa).
Ejemplo:
La información que se presenta a continuación representa el salario de
los 300 empleados de una empresa y nos interesa saber la
concentración de los datos
114
Ing. Rolando W. Rivera Olivera
Salario
Mensual (en
miles)
No. de
empleados: f
Marca de
clase: Y
f*Y
𝒉𝒊
𝑯𝒊
8 - 10
190
9
1710
63.33
58.163
58.16
5.17
10 - 12
100
11
1100
96.67
37.42
95.58
1.09
12 - 14
10
13
130
100.00
4.42
100.00
0
k 1
Ig 
 p
i 1
i
 qi 
k 1
p
i 1

Q
P-Q
5.17  1.09
 0.0391
63.33  96.67
i
Como podemos observar el resultado refleja que no hay mucha
concentración de los datos, es decir, los datos se encuentran bien
distribuidos.
115
Ing. Rolando W. Rivera Olivera
116
Ing. Rolando W. Rivera Olivera
EJERCICIOS PROPUESTOS N° 4
1. Calcular todas las medidas de dispersión para los datos de la siguiente
distribución
𝑳𝒊
(0
𝑳𝒔
- (100
100)
𝒙𝒊
- ((200-
(300
300)
800)
200)
90
140
150
-
120
2. Calcular todas las medidas de dispersión para la siguiente distribución,
además la Mediana
𝒙𝒊
5
10
15
20
25
𝒇𝒊
3
7
5
3
2
3. Se utiliza 2 máquinas diferentes para fabricar conductos de salida de
papel destinados a copiadoras kodak. Los conductos de una muestra de
la primera máquina median: 12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11.3;
12.3 pulgadas. Los conductos hechos con la segunda maquina median:
12,2; 11,9; 11,5; 12,1; 12,2; 11,9 y 11,8 pulgadas. Si se desea utilizar la
máquina que produzca conductos de tamaños más uniformes; ¿Qué
maquina deberá utilizarse?
4. Se sabe que la media aritmética de la siguiente distribución es 11,5
Calcular la desviación estándar, La mediana, Moda y la Media Armónica.
𝑳𝒊
𝑳𝒔
𝒉𝒊
(4 -
6)
4
(6 - 10)
(10 - 16)
(16 - 20)
(20 - 30)
5
x
3
1
5. Si X es una variable que tiene media 15 y varianza 25; hallar la media,
varianza y desviación típica de Y en los siguientes casos.
a) Y = 4 + 16X
b) Y = 16 - 4X
117
Ing. Rolando W. Rivera Olivera
c) Y = ¼ + ¼X
6. Durante un periodo de diez años, los precios de un producto fueron en
promedio de $ 80 con una varianza de $ 12,00. En el periodo anterior de
10 años, el promedio fue de $ 50,00 con una varianza de 36 ¿En qué
periodo hubo mayor estabilidad?
7. Un grupo de trescientos alumnos llevan el curso de estadística y
probabilidad distribuidas en cuatro secciones. Si se sabe que el número
de alumnos por sección están en una progresión aritmética cuya razón
es 20 y además se conoce que las notas de las secciones A, C y D son
12; 14 y 11 mientras que las varianzas de los grupos A y C son 16 y 4 y
las desviaciones estándar de B y D son 3 y 1 respectivamente. Si la
nota promedio en el curso es 12,37; hallar e interpretar la desviación
estándar de las cuatro secciones juntas.
8. En una empresa donde los salarios tienen una media S/ 2500 y una
desviación estándar de S/ 300 el sindicato solicita que cada salario Xi se
transforme en Yi, mediante la siguiente relación:
Yi = 3.5 Xi + 10
El directorio acoge parcialmente la petición rebajando los salarios
propuestos por el sindicato en un 20% , lo que es aceptado. Se pide
calcular la varianza de la nueva distribución de salarios
9. Se tienen tres empresas con aproximadamente igual número de
trabajadores. El número de inasistencias registradas durante los últimos
seis meses en cada una de las tres empresas se da a continuación:
empresa:
A: 3; 19; 4; 5; 15; 6
B: 7; 8; 11; 9; 14; 16
C: 10; 17; 12; 2; 18; 13
118
Ing. Rolando W. Rivera Olivera
En cuál de estas tres empresas existe mayor variabilidad con respecto al
número de inasistencias
10. Una empresa de fabricación de productos cerámicos dispone de tres
centros de producción. En el centro A, el más grande y moderno, se
hace un estudio de los m2 de azulejos producidos al mes durante el año
pasado, obteniéndose una media de producción mensual 𝑋̅A = 250000
m2 con una desviación estándar SA = 15000 m2. Se sabe que el centro
B, por tener maquinaria más anticuada que A, produce cada mes un
tercio de la producción de A, y que el centro C , por tener un horno
menos que B, produce cada mes 25000 m 2 menos que B ¿Cuál es la
media y la varianza de la producción mensual de C?
11. Se utiliza dos máquinas diferentes para fabricar conductos de salida de
papel destinados a copiadoras kodak. Los conductos de una muestra de
la primera máquina medían
12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11,3; 12,3 pulgadas
Los conductos hechos con la segundan maquina medían
12,2; 11,9; 11,5; 12,1; 12,2; 11,9; 11,8 pulgadas
Si se desea utilizar la máquina que produzca conductos de tamaños más
uniformes; ¿Qué maquina deberá utilizarse?
12. Un entrenador de pista y de campo debe decidir a cuál de sus dos
velocistas seleccionará para los cien metros planos en una próxima
competencia. El entrenador basará la decisión en los resultados de cinco
carreras entre los dos atletas, celebrados en el periodo de una hora, con
descanso de 15 minutos. Los siguientes tiempos (en segundos) se
registraron para las cinco carreras:
Atleta
Carrera
1
2
3
4
5
Mendoza
11,1
11,0
11.0
15,8
11,1
Ramírez
11,3
11,4
11,4
11,5
11,4
119
Ing. Rolando W. Rivera Olivera
Con base en estos datos ¿A cuál de los dos velocistas debe seleccionar
el entrenador? ¿Por qué?
13. Las secciones A B y C del curso de estadística General rinden el
mismo examen parcial. Los resultados obtenidos se registran en las
siguientes tablas:
A
A
B
B
C
C
𝑌𝑖
𝐹𝑖
(𝐿𝑖
𝑌𝑖 . 𝑓𝑖
𝐻𝑖
ℎ𝑖 𝑌𝑖 2
2.5
3
2
-
6
16
0.1
2.5
7.5
8
6
- 10
144
0.2
10
12.5
22
10
- 14
240
0.8
86.4
17.5
30
14 - 18
240
1
45
𝐿𝑠 )
a.
En cuál de las secciones las notas son más homogéneas?
b.
Calcular e interpretar la desviación estándar para las tres
secciones juntas
14. Durante un periodo de diez años, los precios de un producto fueron en
promedio de $ 180 con una desviación estándar de $ 12. En el periodo
anterior de 10 años el promedio fue de $ 150 con una varianza de $64
¿En qué periodo hubo mayor estabilidad?
15. En la sección financiera de un diario apareció la distribución de la
variable discreta adjunta. Se decía en el texto del artículo que la media
aritmética era 120 y la varianza 25. Desafortunadamente la publicación
apareció con dos manchas de tinta, lo cual impedía comprobar
directamente la afirmación. ¿Son admisibles dichos valores de la media
y la varianza, teniendo en cuenta lo que puede
verse del cuadro?
Justificar.
𝑌𝑖
𝑓𝑖
105
110
115
120
125
130
37
90
95
85
60
135
140
16. Los alumnos de un grupo obtuvieron en matemática II una nota media
de 68.7 puntos con una desviación estándar de 15.4 y los del otro grupo
obtuvieron en la misma asignatura un promedio de 50.9 puntos con una
120
Ing. Rolando W. Rivera Olivera
desviación estándar de 19.6 ¿Cuál de los dos grupos tiene un
rendimiento más heterogéneo?
17. Si la nota media de unos estudiantes varones es 3 y la desviación
estándar de sus notas es 0.25 en tanto que las correspondientes cifras
para las estudiantes mujeres son 3.2 y 0.25.
¿Muestran menor
variabilidad las notas de los estudiantes varones? ¿Por qué?
18. En el siguiente conjunto de números, se proporcionan los pesos (
redondeados a la libra más próxima ) de los bebes nacidos durante un
cierto número de intervalo de tiempo en un hospital:
4; 8; 4; 6; 8; 6; 7; 7; 7; 8; 10: 9; 7; 6; 10; 8; 5; 9; 6; 3; 7; 6; 4; 7; 6
9; 7; 4; 7; 6; 8; 8; 9; 11; 8; 7; 10; 8; 5; 7; 7; 6; 5; 10; 8; 9; 7; 5; 6; 5
a. Calcular las medidas de tendencia central.
b. Calcular las medidas de dispersión incluyendo Desviación media,
sesgos y curtosis.
c. ¿Es esta una distribución sesgada? De ser así, ¿en qué dirección?
d. Encontrar el Percentil 24
19. Con el fin de observar la relación entre la inteligencia y el nivel
socioeconómico (medido por el salario mensual familiar) se tomaron dos
grupos, uno formado con sujetos de cociente intelectual inferior a 95 y
otro formado por los demás; De cada sujeto se anotó el salario mensual
familiar. Teniendo en cuenta los resultados que se indican en la tabla:
121
Ing. Rolando W. Rivera Olivera
Nivel socioeconómico
Sujetos con CI < Sujetos con CI
≥95
95
fi
fi
10
75
19
-
16
35
26
16
-
22
20
25
22
-
28
30
30
28
-
34
25
54
34
-
40
15
96
Li
-
4
-
10
Ls
a) Dibuje un gráfico que permita comparar ambos grupos
b) Calcule las medidas de tendencia central para aquellos sujetos con
CI < 95 y CI > 95
c) Calcular las medidas de dispersión para aquellos sujetos con CI <
95 y CI > 95
20. Un estudio consistió en anotar el número de palabras leídas en 15
segundos por un grupo de 120 sujetos disléxicos y
120 individuos
normales. Teniendo en cuenta los resultados de la tabla.
Disléxicos 𝒏𝑫
Normales 𝒏𝑵
35 o menos
56
1
26
24
9
27
16
21
28
12
29
29
10
28
30 o mas
2
32
Nro. de palabras
leídas
Calcule:
a) Las medias aritméticas de ambos grupos
b) Las medianas de ambos grupos
c) Las medias armónicas de ambos grupos.
d) La media Geométrica de ambos grupos
122
Ing. Rolando W. Rivera Olivera
e) El porcentaje de sujetos disléxicos que superaron la mediana de los
normales
f) Compare la variabilidad (CV) relativa de ambos grupos.
g) La Desviación media, Sesgo y curtosis y señale con gráfico.
123
Ing. Rolando W. Rivera Olivera
124
Ing. Rolando W. Rivera Olivera
AUTOEV ALUACIÓN IV
NOMBRE…………………………………………………
CARRERA………………….
1. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente
tabla
Peso Kgs
Núm.de
[50,60[ [60,70[ [70,80[ [80,90[ [90,100[ [100,110[ [110,20[
8
10
16
14
10
5
2
Empleads.
a. Calcular la Desviación Media.
b. Calcular el coificiente de Sesgo y Curtosis.
c. Calcular la Desviación Típica.
d. Rango Intercuartilico.
e. Exprese si son o no homogéneos?
2. Una distribución que tiene los siguientes datos en la tabla:
𝑥𝑖
𝑓𝑖
61
5
64
18
67
42
70
27
73
8
Total
100
Hallar: DM; Varianza; Desviación típ ica; Rango Intercuartílico,
y la concentración de los datos, El coeficiente de Variación.
3. Calcular ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
𝐷𝑀, 𝑠 2 , 𝑠, 𝑅𝐼, 𝐶𝑉: En la siguiente serie de números:
5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4
125
Ing. Rolando W. Rivera Olivera
4. La siguiente tabla de distribución de frecuencias muestra la edad de un
grupo de personas. Si además se sabe que la moda es 27,5:
[𝑳𝒊
𝑳𝒔 [
𝒇𝒊
[10
- [20
- [30
20[
30[
40[
a
30
- [40 - 50[
a + 10
20
Hallar:
a. Calcular la Desviación Media.
b. Calcular el coeficiente de Sesgo y Curtosis.
c. Calcular la Desviación Típica.
d. Rango Intercuartílico.
e. Exprese si son o no homogéneos?
5. Se sabe que la media Aritmética de la siguiente distribución es 11,5:
[𝑳𝒊
𝑳𝒔 [
𝒇𝒊
[4 - 6 [
[6 - 10[
4
[10
- [16
- [20
16[
20[
30[
5
x
3
-
1
Calcular:
a.
Halle las medidas de dispersión.
b. Exprese si los datos son homogéneos o heterogéneos,
por qué?
c. Cuáles son los coeficientes de sesgo y Curtosis?
6. Dada la siguiente distribución de frecuencias, calcular el valor de “n”
sabiendo que la moda es 60 y pertenece al tercer intervalo, además
calcule las medidas de dispersión y exprese su interpretación.
(Li
-
Ls)
fi
[ 16 - 32 [
6
[ 32 - 48 [
n
[ 48 - 64 [
8
[ 64 - 80 [
3n
126
Ing. Rolando W. Rivera Olivera
[ 80 - 96 ]
3
CAPITULO V
5
NUMEROS INDICES.
5.1
Concepto.
Un número índice es una medida estadística que señala los cambios en una
variable o un grupo de variables relacionadas con respecto al tiempo,
espacio geográfico o cualquier característica de comparación como la
rentabilidad, el costo de vida, la inflación, la natalidad, la mortandad, etc.
Las aplicaciones son múltiples por ejemplo para comparar el costo de la
canasta básica alimenticia en diferentes años, la producción de Papas, o la
cantidad de estudiantes inscritos en la institución durante un periodo de
tiempo similar al actual, aunque su principal aplicación está dirigida a los
negocios y a la economía, como se ha visto ésta se puede aplicar en todas
las disciplinas, se conoce también como series índices.
En esta parte nos interesa primordialmente los números índices que
muestran cambios con respecto a un tiempo determinado al que
llamaremos año o periodo base (𝑝𝑜 ) y (𝑝𝑛 ) al que se llama periodo dado.
5.2 Número índice simple de precio, cantidad y valor
Precio = p
𝑖 =
(𝑝𝑛 )
𝑥 100
(𝑝𝑜 )
127
Ing. Rolando W. Rivera Olivera
Cantidad = q
(𝑞𝑛 )
𝑥 100
(𝑞𝑜 )
𝑖 =
Valor = V
𝑖 =
( 𝑉𝑛 )
𝑥 100
(𝑉𝑜 )
5.3 Índices relativo de precios
En un determinado tiempo los números índices relativos de precios
fueron muy aplicados en medidas, en natalidad, índice de costo de vida,
índice de mortandad, índice de temperatura/presión, estas, expresan la
razón del precio de un bien determinado en un periodo dado a su precio en
otro periodo llamado periodo base o periodo de referencia, además se
suponen los precios constantes dentro de cualquier periodo, así tenemos
las siguientes aplicaciones:
-
Se aplica en el análisis de costo de vida
-
Índice de precios
-
Salud, índice de mortandad, natalidad, abortos.
-
Intereses, pagos de impuestos
-
Ingeniería
-
Economía, para medir indicadores económicos
Ejemplo 1:
I = 1,24 / 0,49 * 100 = 130,30%
I = 1,20 / 1,10 * 100 = 109,09%
I= 1,20/0,88 * 100 = 136,36%
𝑖 =
(𝑝𝑛 )
𝑥 100
(𝑝𝑜 )
128
Ing. Rolando W. Rivera Olivera
Año
Leche
Pan
Huevo
1995
0,99
1,10
0,88
2000
1,29
1,20
1,20
Propiedades básicas de los índices precios relativos
a. Propiedad de identidad. El precio relativo para un periodo dado con
respecto al mismo periodo es igual a 1 o al 100%, es decir:
𝑝𝑎 = 1
𝑎
b. Propiedad de tiempo inverso; cuando sus periodos se intercambian,
sus precios relativos resultan recíprocas entre sí, así:
𝑝𝑎 . 𝑝𝑏 = 1 ó
𝑏
𝑎
1
𝑝𝑎 = 𝑝
𝑏
𝑏
𝑎
c. Propiedad cíclica o circular
P a/b .Pb/c . Pc/a =1
P a/b . Pb/c . P c/d . P d/a =1
d. Propiedad cíclica o circular modificada
P a/b . P b/c = P a/c
Ejemplo 2
P a/b . P b/c . Pc/d = P a/d
Supongamos que 1 litro de leche que en 1995 y el 2000 fueron 25 y
30 céntimos respectivamente de dólar tomando como 1995 como año
base y 2000 como año dado. Halle el precio relativo
𝑖2000 =
0,30
𝑜,25
𝑥 100 = 120 %
129
Ing. Rolando W. Rivera Olivera
Esto significa que la leche en el año 2000 se incrementó en un 20%
respecto al año 1995.
5.4 Índice de cantidad o volumen relativo
Mide cuanto cambia en el tiempo el número o cantidad de volumen al
que se le llama una cantidad relativa o volumen relativo; del mismo
modo que los precios relativos, estas cantidades o volúmenes se
consideran constantes en cualquier tiempo o periodo. Si no lo fueran,
podría tomarse una apropiada media aritmética para el periodo y hacer
válido el supuesto, siempre que, en vez de comparar precios podemos
estar interesados en comparar las cantidades o volúmenes de
producción, consumo, exportaciones, etc.
𝑖 =
(𝑞𝑛 )
𝑥 100
(𝑞𝑜 )
5.5 Índice de valor
El índice de valor mide los cambios en el valor monetario total, o de una
variable .En efecto combina los cambios de precio y cantidad para
presentar un índice más informativo
y se compara el valor de una
mercancía en un periodo dado con el valor de la mercancía en otro
periodo tomado como base, esto se multiplica por 100.
𝑖 =
𝑖 =
(𝑝𝑛 𝑞𝑛 )
(𝑝𝑜 𝑞𝑜 )
𝑝
( 𝑉𝑛 )
𝑥 100
(𝑉𝑜 )
𝑞
= (𝑝𝑛) ( 𝑞𝑛) = precio relativo x cantidad relativa
𝑜
𝑜
Para resolver algunos problemas se asumen las mismas observaciones,
notaciones y propiedades que se han visto para los precios y cantidades
relativas.
En forma particular, si
(𝑝𝑎⁄𝑏 ) , (𝑞𝑎⁄𝑏 ) 𝑦 (𝑉𝑎⁄𝑏 ) denotan precios,
cantidades y valores relativos en el periodo b con respecto al periodo a,
entonces según lo expresado en la parte superior,
130
Ing. Rolando W. Rivera Olivera
(𝑉𝑎⁄𝑏 ) = (𝑝𝑎⁄𝑏 ) . (𝑞𝑎⁄𝑏 )
Al que se llama propiedad del factor inverso.
Ejemplo 3.
Los precios medios en dólares de carbón por tonelada corta de venta al
por menor en los Estados Unidos durante los años 2003 – 2008 se dan
en la siguiente tabla.
Año
2003 2004 2005 2006 2007 2008
Precio medio
de carbón
a.
Tomando
14,95 14,94 15,10 15,65 16,28 16,53
2003
como
base,
hallar
los
precios
relativos
correspondientes 2006 y 2008
𝑖2006 =
15,65
14,95
16,53
𝑥 100 = 104,68
𝑖2008 = 14,95 𝑥 100 =
110,6
En el 2006 subieron en un 4,7% en el 2008 en un 10,6% respecto al
año 2003.
b. Tomando 2006 como base .Hallar los precios relativos a todos los
años dados
2003 2004 2005 2006 2007
95.52 95,46 96,48 100
2008
104,02 105,6
c. Tomando 2003 al 2005 como base. Hallar los precios relativos a
todos los años dados: para responder a esta pregunta necesitamos
obtener el promedio del periodo base, es decir 2003 al 2005 y
131
Ing. Rolando W. Rivera Olivera
luego se divide sobre esta cantidad, los resultados se dan en la
siguiente tabla:
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑃𝑟𝑒𝑐𝑖𝑜𝑠2003−2005 =
14,95+14,94+15,10
3
= 15,00
2003 2004 2005 2006 2007 2008
99,7 99,6 100,6 104,3 105,5 110,2
5.6
Índices de Agregación Simple.
En este método el índice de precios se expresa como la suma total de los
precios de bienes en el año dado como porcentaje del total de los precios
de bienes en el año base, así:
Índice de precios de agregación simple =
∑ 𝑝𝑛
∑ 𝑝𝑜
en las que:
∑ 𝑝𝑛 = suma de los precios de bienes que corresponden al año dado
∑ 𝑝𝑛 = suma de los precios de bienes correspondientes al año base.
El resultado se expresa en términos porcentuales
Inconvenientes:
a. No considera el peso relativo de los bienes, así se incluyen como
iguales los precios de la leche o de la crema de afeitar o del betún para
calzados en el índice del costo de vida.
b. Las unidades utilizadas en las cotizaciones de los precios, afectan el
valor del índice correspondiente.
5.7
Método de media de Relativos simples.
Por éste método existen varias posibilidades dependiendo del promedio
empleado para expresar los precios relativos, tal como la media aritmética
media geométrica, armónica, mediana, etc.
132
Ing. Rolando W. Rivera Olivera
Índice de precios de media aritmética de relativos simples =
∑𝑝𝑛⁄𝑝𝑜
𝑁
∑ 𝑝𝑛⁄𝑝𝑜 Expresa la suma de todos los precios relativos de bienes.
𝑁 Número de precios relativos de bienes empleados.
5.8
Método de cálculo de los índices por agregación ponderada.
Para salvar las inconvenientes que presenta los números índices
calculados por el método de precios, cantidades y valores relativos y
simples se utilizan los métodos de agregación ponderada en la que se da
un peso al precio de cada bien mediante un factor adecuado, tomando a
menudo como la cantidad o volumen del bien vendido durante el año
base, el año dado o algún año típico que puede ser inclusive la media de
varios años.
Todos nos indican la importancia de cada bien en particular aparecen
básicamente tres posibles fórmulas, según que se utilicen la cantidad
del año base, del año dado a de un año típico que se denotan por:
𝑞𝑜 =cantidad base
𝑞𝑛 =cantidad dada
𝑞𝑡 =cantidad típica
5.8.1 Índice de Laspeyres
Método del año base. Índice de precios de agregación ponderada con
pesos de las cantidades del año base
Índice de precios de agregación ponderada año base =
5.8.2 Índice de Paashé
133
∑ 𝑝𝑛 𝑞𝑜
∑ 𝑝𝑜 𝑞𝑜
Ing. Rolando W. Rivera Olivera
Índice de precios de agregación ponderada o del año dado =
∑ 𝑝𝑛 𝑞𝑛
∑ 𝑝𝑜 𝑞𝑛
5.8.3 Método del año tipo o Típico
Índice de precios con pesos de cantidades del año tipo =
∑ 𝑝𝑛 𝑞𝑡
∑ 𝑝𝑜 𝑞𝑡
Nota: para t = 0 y t = n , ésta relación se convierte en Laspeyres y
Paasche, respectivamente.
5.8.4 Índice de Fisher
Este índice indica la media geométrica de los números índices de
Laspeyres y Paashe; como se puede apreciar este índice satisface las
pruebas del tiempo inverso y del factor inverso explicado en las
propiedades de los números de los índices, situación que le da ciertas
ventajas teóricas sobre otras forman de cálculos:
∑ 𝑝𝑛 𝑞𝑜
I F = √(∑
𝑝𝑜 𝑞𝑜
∑ 𝑝𝑛 𝑞𝑛
) (∑
𝑝𝑜 𝑞𝑛
)
Este índice corresponde a la media geométrica de los números de
Laspeyres y Paasche, dado anteriormente, también es necesario resaltar
que esta relación satisface las pruebas del tiempo inverso y del factor
inverso, lo que le da cierta ventaja sobre los otros métodos.
5.8.5 Índice de Marshal-Edgeworth
Este índice explica el método de agregación simple corregida, es decir
con precios, cantidades y valores ponderados en un año tipo, donde los
pesos se toman como la media aritmética de las cantidades del año base
y del año dado, es decir: 𝑞𝑡 = ½ (𝑞𝑜 + 𝑞𝑛 ), luego sustituyendo éste en la
134
Ing. Rolando W. Rivera Olivera
ecuanción del año tipo descrita en la parte superior, se tiene:
∑ 𝑝 (𝑞 + 𝑞 )
METODO
MEDIA
RELATIVOS PONDERADA
IndiceDE
de precios
deDE
Marshall-Edgeworth
= ∑ 𝑝𝑛 (𝑞𝑜 + 𝑞𝑛 )
5.9
𝑜
𝑜
𝑛
Para salvar los inconvenientes de los métodos de las medias relativas
simples se utiliza una media de relativos ponderada. El peso más
frecuente utilizado en este caso es la media aritmética ponderada,
aunque puede utilizarse en algunos casos la media geométrica
ponderada.
En este método se pesa cada precio relativo con el valor total del bien
en términos de alguna unidad monetaria tal como el dólar, el euro, etc.
Puesto que el valor de un bien se obtiene multiplicando el precio del
bien por la cantidad, los pesos vienen dados por p y q.
Aparecen así tres posibles fórmulas según se utilicen los valores del
año base, del año dado o de un año tipo, denotados por:
𝑝𝑜 𝑞𝑜 , 𝑝𝑛 𝑞𝑛 y
𝑝𝑡 𝑞𝑡
Media aritmética ponderada de precios relativos utilizando como en los
valores del año base.
Media aritmética ponderada de
∑(𝑝𝑛 ⁄𝑝𝑜 )(𝑝𝑜 .𝑞𝑜 )
precios relativos utilizando como
=
∑ 𝑝𝑜 .𝑞𝑜
=
∑ 𝑝𝑛 𝑞𝑜
∑ 𝑝𝑜 𝑞𝑜
pesos los valores del año base
Media aritmética ponderada de
precios relativos utilizando como
=
∑(𝑝𝑛 ⁄𝑝𝑜 ) (𝑝𝑛 . 𝑞𝑛 )
∑ 𝑝𝑛 . 𝑞𝑛
pesos los valores del año dado
Media aritmética ponderada de
precios relativos utilizando como
135
=
∑(𝑝𝑛 ⁄𝑝𝑜 ) (𝑝𝑡 . 𝑞𝑡 )
∑ 𝑝𝑡 . 𝑞𝑡
Ing. Rolando W. Rivera Olivera
pesos los valores del año tipo
OBSERVACIÓN: se puede advertir que la primera relación es lo
mismo que la fórmula de Laspeyres dada anteriormente.
5.10 NÚMEROS INDICES DE CANTIDAD O VOLUMEN.
Las formulas descritas anteriormente para calcular los números
índices de precios se modifican fácilmente para obtener números índices
de cantidad o de volumen por el simple intercambio de
p y q por
ejemplo:
El método de media de relativo simples queda para cantidades de la
siguiente manera:
Indice de Vol de media aritmética de relativos simples =
∑ 𝑞𝑛 / 𝑞𝑜
𝑁
Análogamente las formulas anteriores de laspeyres y paashe
quedarían de modo siguiente:
Índice de volumen de laspeyres =
Índice de volumen de paashé =
5.11
∑ 𝑞𝑛 𝑝𝑜
∑ 𝑞𝑜 𝑝𝑜
∑ 𝑞𝑛 𝑝𝑛
∑ 𝑞𝑜 𝑝𝑛
NUMEROS INDICES DE VALOR
Del mismo modo que se han obtenido fórmulas para índices de
precios y volúmenes por lo menos también se puede llegar a las
136
Ing. Rolando W. Rivera Olivera
fórmulas de índices de valor y el más clásico es el siguiente:
∑ 𝑝𝑛 𝑞𝑛
Índice de valor =
∑ 𝑝𝑜 𝑞𝑜
Ejemplo 4.
En el 2006 el precio medio de un bien fue 20% más que en el 2005,
20% menos que en el 2004 y 50% más que en el 2007. Reducir los
datos a los precios relativos, teniendo como base:
a = 2005
b = 2006
c = 2004-2005
Solución a:
Precio
del 2006 es 20% más que en
2005, el precio
correspondiente a 2006 es:
100 + 20 = 120, es decir, el precio de 2006 es el 120% del 2005.
Puesto que el precio en 2006 es 20% menos 2004 será 100 – 20 =
80% del 2004 entonces el precio de 2004 es: 1/0,8 = 5/4 = 125 %
del precio de 2006; es decir, el precio relativo del 2004 = 125% de
120 y esto es igual a 150 %.
El precio en 2006 es 50% más que en 2007, será 100+50 = 150%
de 2007.
Entonces el precio de 2007 es: 1/1,50 = 2/3 del precio de 2006; es
decir:
2/3 de 120 = 80 ; de esta manera se tiene los siguientes resultados
en resumen:
Año base: 2005
Año
2004
2005
2006
2007
150
100
120
80
Precio
relativo
Solución b:
137
Ing. Rolando W. Rivera Olivera
Se utiliza el método de cambio del periodo base dado en el ejemplo
1; se divide cada precio relativo de la tabla anterior por 120 que es
el año base y se expresa en tanto por ciento, lo que se reporta en
la tabla siguiente:
Año base: 2006 entonces para 2006 corresponde 100 %
Año
2004
2005
2006
2007
125%
83,3%
100%
66,67%
Precio
relativo
Solución c:
De la primera tabla en este problema se considera la media
aritmética de los precios de los años 2004 y 2005
es 125;
entonces se procede a dividir a toso los años dados po este valor,
de lo cual resulta la siguientes tabla:
Año base: 2004 al 2005 = 125
Año
2004
2005
2006
2007
80 %
96 %
64 %
Precio
relativo 120 %
138
Ing. Rolando W. Rivera Olivera
EJERCICIOS PROPUESTOS N° 5
1.
La siguiente tabla muestra los precios medios de venta al por
mayor de trigo durante varios años. Hallar el precio relativo para
(a) el año 2012 tomando 2002 como base, (b) los años 2003 y
2010 tomando 2004 como base, (c) los años 2009-2012 tomando
2001-2003 = 100.
( 1 fanega = 60 libs; 1 TQ = 2000 lbs)
Año
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
Prom. de trigo
2,66
2,50
2,24
2,29
2,41
2,45
2,49
2,56
2,50
2,39
2,35
2,23
en $ / fanega
FUENTE: Departament of commerce USA.
2. Demostrar que a) P a/b P b/c P c/d = 1; b) P a/b P b/c P c/d = P a/d
3. Demostrar que P c/d = P0/1 P 1/2 P 2/3 … P( n-1)n
4. Demostrar que la propiedad circular modificada se deduce directamente de
la propiedad circular y de la propiedad del tiempo inverso.
5. La siguiente tabla muestra los precios relativos de un bien con 1999 – 2001
= 100. Determinar los precios relativo con (a) 2008 = 100, (b) 2007-2008 =
100.
Año
2007
2008
2009
2010
2011
2012
Precio relativo
135
128
120
150
140
162
(2009-011=100)
6. El precio relativo para el año 2008 con 2010 como base es 62 ½, mientras
que el precio relativo para el año 2009 con 2008 como base es 133 1/3.
Hallar el precio relativo para el año 2010 con (a) 2009, (b) 2008-2009 como
base.
7. En el 2000 el precio medio de un bien disminuyó en un 25% de 1994, pero
se incrementó en un 50% del de 1986. Hallar el precio relativo para (a) 1986
y (b) 2000 con 1986 como base.
139
Ing. Rolando W. Rivera Olivera
8. La tabla muestra la energía eléctrica en miles de millones de kilovatios-hora
vendidos a particulares en Estados Unidos durante los años 1997-2008.
Reducir los datos a cantidades relativas con (a) 2003 y (b) 1997-1999 como
base.
Año
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
E.Elect.
3,68
4,25
4,84
5,59
6,42
7,23
8,09
9,04
10,04
11,15
12,26
13,25
M.M/Kw/h
9. En el 2006 la producción de un metal se incrementó en un 40% sobre la de
2005. En el 2007 fue de un 20% menor que la de 2006, pero 16 2/3 superior
a la del 2008. Hallar las cantidades relativas para los años 2005-2008 con
base ( a ) 2005 , (b) 2008, (c) 2005-2008.
10. En el problema anterior, si la producción del ml en el 2007 fue de 3,20
millones de toneladas cortas, determinar la producción para los años
(a)2005, (b) 2006 (c) 2008.
11. La siguiente tabla muestra los precios y cantidades consumidas en Estados
Unidos de distintos metales no férreos en los años 2007, 2014 y 2015.
Tomando 2007 como base calcular un índice de precios, mediante el
método de agregación simple, para el año (a) 2014, (b) 2015.
Metales
Precios (centavos por libra)
1949
1956
1957
Aluminio
17,00
26,01
27,52
Cobre
19,36
41,88
29,99
Plomo
15,18
15,81
14,46
Estaño
99,32
101,26
96,17
Cinc
12,15
13,49
11,40
140
Ing. Rolando W. Rivera Olivera
Metales
Cantidades (millones de libras)
1949
1956
1957
Aluminio
1357
3707
3698
Cobre
2144
2734
2478
Plomo
1916
2420
2276
Estaño
161
202
186
Cinc
1872
2018
1424
12. Demostrar que el número índice de agregación simple satisface las pruebas
del tiempo inverso y circular pero no satisface la prueba del factor inverso.
13. En la siguiente tabla se da la producción de trigo en millones de fanegas en
Estados Unidos durante los años 2007 – 2015. Reducir los datos a
cantidades relativas tomando como base (a) 2011 y (b) 2007 – 2010.
Año
2007 2008
2009 2010
2011 2012 2013 2014 2015
Producción de Trigo
1019 988
1306 1173
984
935
1004 951
1462
(millones de fanegas)
FUENTE: Departamento de agricultura.
14. La cantidad relativa de 2015 con 2006 como base es 105, mientras que la
cantidad relativa de 2015 con 2010 como base es 140. Hallar la cantidad
relativa del 2010 con 2006 como base.
15. La siguiente tabla muestra en Estados Unidos los precios medios al por
mayor y la producción de leche, mantequilla y queso para los años 2005,
2006 y 2014. Calcular un índice de precios al por mayor de agregación
simple de estos productos para el año 2014, utilizando como base (a) 2005
y (b) 2005 - 2006.
Precios (centavos por libra)
Cantidades producidas
(Millones de libras)
Productos
2005 2006
2014
2005
2006
2014
leche
3,95
3,89
4,13
9,675
9,717
10,436
Mantequilla
61,5
62,2
59,7
117,7
115,5
115,5
Queso
34,8
35,4
38,9
77,93
74,39
82,79
141
Ing. Rolando W. Rivera Olivera
16. Utilizar el método de media aritmética de relativos simples para calcular el
índice de precios al por mar de los productos del Problema anterior para el
año 2014 con base (a) 2005 (b) 2005 – 2006.
17. Calcular el número índice de precios de Laspeyre para los daos del
Problema 15 y para el año 2014 tomando como base (a) 2005 y (b) 2005 –
2006.
18. Mostrar que el índice ideal de Fisher es la media geométrica de los números
índice de Laspeyres y Paasche.
Año
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
E.Elect.
3,68
4,25
4,84
5,59
6,42
7,23
8,09
9,04
10,04
11,15
12,26
13,25
M.M/Kw/h
142
Ing. Rolando W. Rivera Olivera
AUTOEV ALUACIÓN V
NOMBRE…………………………….………………… CARRERA………………….
1. Un comerciante ha registrado las siguientes ventas anuales. Tomando
como base el año 1980. Calcular el índice de ventas para todos los
años dados.
Año
1980
Ventas ($) 200.000
1981
1982
1983
1984
250.000
200.000
190.000
220.000
2. Determine los índices simples de precios para el año 2000 de las tres
mercancías consideradas, usando como año base 1995:
Precios y consumo de tres mercancías en un área metropolitana
Tabla 1
Mercancía
Unidad de
Precio
Precio
Consumo
Consumo
cotización
1995
2000
1995
2000
Leche
Litro
0.99
1.29
15.0
18.0
Pan
Pieza de una
1.10
1.20
3.8
3.7
0.80
1.20
1.0
1.2
libra
huevos
Docena
3. tomando como referencia la tabla 1, determine:
a. Los índices simples de cantidad de las tres mercancías
consideradas el año 2000, usando 1995 como año base.
b. calcule los índices simples de valor para el año 2000, tomando
como base el año 1995
4. Calcular el índice agregado de precios de Laspeyres para el año 2000
de las tres mercancías tabla 1, usando como base el año 1995., se
recomienda
utilizar.∑
y
correrspondiente.
143
∑
aplicar
la
fórmula
Ing. Rolando W. Rivera Olivera
5. Calcule el índice agregado de precios Paasche para el año 2000 de las
tres mercancías de la tabla 1, usando como base el año 1995.
6. Tomando como base los resultados del problema anterior, encuentre el
valor del índice de Fisher.
7. La siguiente Tabla muestra el índice de Producción industrial de toda la
industria para los años 1997 al 2008 con 1997 – 1999 como periodo
base. Obtener un nuevo índice con:
a. 2001,
b. 2003 – 2006; como bases.
Año
Ind.Produc
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
3,68
4,25
4,84
5,59
6,42
7,23
8,09
9,04
10,04
11,15
12,26
13,25
1997-1999 = 100
144
Ing. Rolando W. Rivera Olivera
CAPITULO VI
6.
PROBABILIDAD.
La Probabilidad es un método por el cual se obtiene la frecuencia de un acontecimiento
determinado mediante la realización de un experimento aleatorio, del que se conocen todos
los resultados posibles, bajo condiciones suficientemente estables.
La probabilidad mide la frecuencia con la que aparece un resultado determinado
cuando se realiza un experimento. En otras palabras, su noción viene de
la necesidad de medir o determinar cuantitativamente la certeza o duda de
que un suceso dado ocurra o no.
La teoría de la Probabilidad se usa extensamente en áreas como
la estadística, la física, la matemática, las ciencias y la filosofía para sacar
conclusiones sobre la probabilidad discreta de sucesos potenciales y la
mecánica subyacente discreta de sistemas complejos, por lo tanto es la
rama de las matemáticas que estudia, mide o determina a los experimentos
o fenómenos aleatorios.
Ejemplo:
Lanzamos un dado al aire y queremos saber cuál es la probabilidad de que
salga un 2, o que salga un número par, o que salga un número menor que 4.
Para aplicar el principio de la probabilidad se tienen que cumplir ciertas
condiciones como:
6.1.
EXPERIMENTOS ALEATORIOS, Son aquellos sucesos que se
ejecutan y, que pueden presentar diversos resultados, dentro de un
conjunto posible de soluciones, y esto aun realizando el experimento
en las mismas condiciones. Por lo tanto, a priori no se conoce cuál de
los resultados se va a presentar:
Ejemplos:
145
Ing. Rolando W. Rivera Olivera
Lanzamos una moneda al aire: el resultado puede ser cara o
sello, pero no sabemos de antemano cuál de ellos va a salir o al
lanzar un dado en las mismas condiciones y formas veremos que
los resultados serán siempre diferentes.
La probabilidad está basada en el estudio del análisis combinatorio y
se considera
fundamento necesario de la estadística, además de
otras disciplinas como matemática, física u otra ciencia. En ellas se
aplica una teoría de probabilidades, la cual tiene como fin examinar
las formas y medios para obtener esas medidas de certeza, así como
encontrar los métodos de combinarlos cuando intervienen varios
sucesos en un experimento aleatorio o prueba.
Cada uno de los resultados obtenidos al realizar un experimento
recibe
el
nombre
de suceso
elemental. Se
llama espacio
muestral al conjunto de todos los sucesos elementales obtenidos, de
forma que todo subconjunto del espacio muestral es un suceso.
Cuando hablamos de probabilidad tenemos que diferenciar los tipos
de sucesos que pueden ocurrir, pueden ser: sucesos naturales, son
aquellos cuyo resultado podemos predecir; y sucesos por azar, cuyo
resultado no podemos predecir, pero que si se conoce los resultados
posibles que se pueden dar.
Los sucesos por azar se pueden clasificar en: suceso seguro, es
aquel que es cierto, que ocurrirá sin lugar a dudas. Por ejemplo, si
lanzamos un dado, es seguro que saldrá un número del 1 al
6. En suceso posible, es todo lo que compone un fenómeno
determinado. Por ejemplo, al lanzar una moneda, los sucesos
posibles son cara o sello.
Y de último, tenemos al suceso imposible, el que no pueden ocurrir y
se contraponen a un suceso seguro. Por ejemplo, que en una partida
de domino dos jugadores tengan la misma ficha, sería imposible
146
Ing. Rolando W. Rivera Olivera
porque son 28 fichas diferentes. La probabilidad es 0 cuando el
suceso es imposible y 1 cuando el suceso es seguro.
En la actualidad existen compañías de seguros que evalúan las
probabilidades de los sucesos que les interesan (accidentes de
coches, inundaciones, epidemias, etc.) y así poder asignar las cuotas
de manera justa. También, las probabilidades son importantes para
la ingeniería,
específicamente
la
Civil:
características
de
los
materiales, dimensiones de elementos estructurales, carga viva en
edificios, carga sísmica y de viento, tránsito de vehículos, entre otras.
Hay experimentos que no son aleatorios y por lo tanto no se les
puede aplicar las reglas de la probabilidad.
Ejemplo:
En lugar de tirar la moneda al aire, directamente seleccionamos la
cara. Aquí no podemos hablar de probabilidades, sino que ha sido
un resultado determinado por uno mismo.
Antes de calcular las probabilidades de un experimento aleatorio
hay que definir una serie de conceptos:
6.2.
SUCESO ELEMENTAL: hace referencia a cada una de las posibles
soluciones que se pueden presentar.
Ejemplo:
Al lanzar una moneda al aire, los sucesos elementales son la cara
y el sello. Al lanzar un dado, los sucesos elementales son el 1, el
2, .., hasta el 6.
6.3.
SUCESO COMPUESTO:
Es un subconjunto de sucesos elementales.
Ejemplo: lanzamos un dado y queremos que salga un número
par. El suceso "numero par" es un suceso compuesto, integrado
por 3 sucesos elementales: el 2, el 4 y el 6
O, por ejemplo, jugamos a la ruleta y queremos que salga "menor
o igual que 18". Este es un suceso compuesto formado por 18
sucesos elementales (todos los números que van del 1 al 18).
147
Ing. Rolando W. Rivera Olivera
Al
conjunto
de
todos
los
posibles
sucesos
elementales
lo
denominamos espacio muestral. Cada experimento aleatorio tiene
definido su espacio muestral (es decir, un conjunto con todas las
soluciones posibles).
Ejemplo: si tiramos una moneda al aíre una sola vez, el espacio
muestral será cara o sello.
Si el experimento consiste en lanzar una moneda al aire dos
veces, entonces el espacio muestral estaría formado por (caracara), (cara-sello), (sello -cara) y (sello -sello).
6.4.
RELACIÓN ENTRE SUCESOS
Entre los sucesos compuestos se pueden establecer distintas
relaciones:
6.4.1.
Un suceso puede estar contenido en otro: las posibles
soluciones del primer suceso también lo son del segundo, pero este
segundo suceso tiene además otras soluciones suyas propias.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a: que
salga el número 6, y b: que salga un número par. Vemos que el
suceso a está contenido en el suceso b. Siempre que se da el
suceso a se da el suceso b, pero no al contrario. Por ejemplo, si el
resultado fuera el 2, se cumpliría el suceso b, pero no el a.
6.4.2.
Dos sucesos pueden ser iguales: esto ocurre cuando
siempre que se cumple uno de ellos se cumple obligatoriamente el
otro y viceversa.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga número par, y b) que salga múltiplo de 2. Vemos que las
soluciones coinciden en ambos casos.
6.4.3. Unión de dos o más sucesos: la unión será otro suceso
formado por todos los elementos de los sucesos que se unen.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga número par y b) que el resultado sea mayor que 3. El suceso
148
Ing. Rolando W. Rivera Olivera
unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el
6
6.4.4. Intersección de sucesos: es aquel suceso compuesto por los
elementos comunes de dos o más sucesos que se intersectan.
Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a) que
salga número par, y b) que sea mayor que 4. La intersección de estos
dos sucesos tiene un sólo elemento, el número 6 (es el único
resultado común a ambos sucesos: es mayor que 4 y es número par).
6.4.5. Sucesos incompatibles: son aquellos que no se pueden dar al
mismo tiempo ya que no tienen elementos comunes (su intersección
es el conjunto vacío).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga un número menor que 3, y b) que salga el número 6. Es
evidente que ambos no se pueden dar al mismo tiempo.
6.3.6. Sucesos complementarios: son aquellos que si no se da uno,
obligatoriamente se tiene que dar el otro.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga un número par, y b) que salga un número impar. Vemos que si
no se da el primero se tiene que dar el segundo (y viceversa).
6.5.
CÁLCULO DE PROBABILIDADES
Como hemos comentado anteriormente, la probabilidad mide la
mayor o menor posibilidad de que se dé un determinado resultado
(suceso) cuando se realiza un experimento aleatorio.
La probabilidad toma valores entre 0 y 1 (o expresados en tanto por
ciento, entre 0% y 100%):
El valor cero corresponde al suceso imposible: lanzamos un dado
al aire y la probabilidad de que salga el número 7 es cero (al menos,
si es un dado certificado por la OMD, "Organización Mundial de
Dados").
149
Ing. Rolando W. Rivera Olivera
El valor uno corresponde al suceso seguro: lanzamos un dado al
aire y la probabilidad de que salga cualquier número del 1 al 6 es
igual a uno (100%).
El resto de sucesos tendrá probabilidades entre cero y uno: que
será tanto mayor cuanto más probable sea que dicho suceso tenga
lugar.
¿Cómo se mide la probabilidad?
Uno de los métodos más utilizados es aplicando la Regla de Laplace:
define la probabilidad de un suceso como el cociente entre casos
favorables y casos posibles.
P(A) = Casos favorables / casos posibles
𝑷(𝑨)
𝒉
=
𝒏
h : Casos favorables
n : Casos posibles ( espacio muestral)
EJEMPLOS:
a) Probabilidad de que al lanzar un dado salga el número 2: el
caso favorable es tan sólo uno (que salga el dos), mientras que
los casos posibles son seis (puede salir cualquier número del uno
al seis). Por lo tanto:
P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%)
b) Probabilidad de que al lanzar un dado salga un número
par: en este caso los casos favorables son tres (que salga el dos,
el cuatro o el seis), mientras que los casos posibles siguen siendo
seis. Por lo tanto:
P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
c) Probabilidad de que al lanzar un dado salga un número
menor que 5: en este caso tenemos cuatro casos favorables (que
salga el uno, el dos, el tres o el cuatro), frente a los seis casos
posibles. Por lo tanto:
P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%)
150
Ing. Rolando W. Rivera Olivera
d) Probabilidad de que nos toque la "TINKA" : tan sólo un caso
favorable, el número que jugamos (¡qué triste...¡), frente a
100.000 casos posibles. Por lo tanto:
P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%)
Merece la pena ...... Por cierto, tiene la misma probabilidad el
número 45.264, que el número 00001, pero ¿cuál de los dos
comprarías?
Para poder aplicar la Regla de Laplace el experimento aleatorio tiene
que cumplir dos requisitos:
a) El número de resultados posibles (sucesos) tiene que ser
finito. Si hubiera infinitos resultados, al aplicar la regla "casos
favorables / casos posibles" el cociente siempre sería cero.
b) Todos los sucesos tienen que tener la misma probabilidad.
Si al lanzar un dado, algunas caras tuvieran mayor probabilidad
de salir que otras, no podríamos aplicar esta regla.
A la regla de Laplace también se le denomina "probabilidad
apriori", ya que para aplicarla hay que conocer antes de realizar el
experimento cuales son los posibles resultados y saber que todos
tienen las mismas probabilidades.
¿Y si el experimento aleatorio no cumple los dos requisitos
indicados, qué hacemos?, ¿ponemos una denuncia?
No, no va a ser necesario denunciar a nadie, ya que en este caso
podemos acudir a otro modelo de cálculo de probabilidades que se
basa en la experiencia (modelo frecuentista):
Cuando se realiza un experimento aleatorio un número muy elevado
de veces, las probabilidades de los diversos posibles sucesos
empiezan a converger hacia valores determinados, que son sus
respectivas probabilidades.
Ejemplo: si lanzo una vez una moneda al aire y sale "cara",
quiere decir que el suceso "cara" ha aparecido el 100% de las
veces y el suceso "sello" el 0%.
Si lanzo diez veces la moneda al aire, es posible que el suceso
"cara" salga 7 veces y el suceso "sello" las 3 restantes. En este
151
Ing. Rolando W. Rivera Olivera
caso, la probabilidad del suceso "cara" ya no sería del 100%, sino
que se habría reducido al 70%.
Si repito este experimento un número elevado de veces, lo normal
es que las probabilidades de los sucesos "cara" y "sello" se vayan
aproximando al 50% cada una. Este 50% será la probabilidad de
estos sucesos según el modelo frecuentista.
En este modelo ya no será necesario que el número de soluciones
sea finito, ni que todos los sucesos tengan la misma probabilidad.
Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera
defectuosa (o estuviera trucada), es posible que al repetir dicho
experimento un número elevado de veces, la "cara" saliera con
una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos
valores serían las probabilidades de estos dos sucesos según el
modelo frecuentista.
A esta definición de la probabilidad se le denomina probabilidad a
posteriori, ya que tan sólo repitiendo un experimento un número
elevado de veces podremos saber cuál es la probabilidad de cada
suceso.
6.6.
PROBABILIDAD DE SUCESOS
Al definir los sucesos hablamos de las diferentes relaciones que
pueden guardar dos sucesos entre sí, así como de las posibles
relaciones que se pueden establecer entre los mismos. Vamos a ver
ahora cómo se refleja esto en el cálculo de probabilidades.
6.6.1. Un suceso puede estar contenido en otro: entonces, la
probabilidad del primer suceso será menor que la del suceso que lo
contiene.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que
salga el número 6, y b) que salga un número par. Dijimos que el
suceso a) está contenido en el suceso b).
P(A) = 1/6 = 0,166
P(B) = 3 / 6 = 0,50
152
Ing. Rolando W. Rivera Olivera
Por lo tanto, podemos ver que la probabilidad del suceso
contenido, suceso a), es menor que la probabilidad del suceso
que lo contiene, suceso b).
6.6.2. Dos sucesos pueden ser iguales: en este caso, las
probabilidades de ambos sucesos son las mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga número par, y b) que salga múltiplo de 2. Las soluciones
coinciden en ambos casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
6.6.3. Intersección de sucesos: es aquel suceso compuesto por los
elementos comunes de los dos o más sucesos que se intersectan. La
probabilidad será igual a la probabilidad de los elemntos comunes.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga número par, y b) que sea mayor que 3. La intersección de estos
dos sucesos tiene dos elementos: el 4 y el 6.
Su probabilidad será por tanto:
P(A ∩ B) = 2 / 6 = 0,33
6.6.4. Unión de dos o más sucesos: la probabilidad de la unión de
dos sucesos es igual a la suma de las probabilidades individuales de
los dos sucesos que se unen, menos la probabilidad del suceso
intersección
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga número par, y b) que el resultado sea mayor que 3. El suceso
unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el
6.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A ∩ B) = 2 / 6 = 0,33∪
Por lo tanto,
P (A ∪ B) = (0,50 + 0,50) - 0,33 = 0,666
153
Ing. Rolando W. Rivera Olivera
6.6.5. Sucesos incompatibles: la probabilidad de la unión de dos
sucesos incompatibles será igual a la suma de las probabilidades de
cada uno de los sucesos (ya que su intersección es el conjunto vacío
y por lo tanto no hay que restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que
salga un número menor que 3, y b) que salga el número 6.
La probabilidad del suceso unión de estos dos sucesos será igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
P(A ∪ B) = 0,33 + 0,166 = 0,50
6.6.6. Sucesos complementarios: la probabilidad de un suceso
complementario a un suceso (A) es igual a 1 - P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un
número par, luego su complementario, suceso (B), es que salga un
número impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
Se puede comprobar aplicando la regla de "casos favorables / casos
posibles":
P(B) = 3 / 6 = 0,50
6.6.7. Unión de sucesos complementarios: la probabilidad de la
unión de dos sucesos complementarios es igual a 1.
Ejemplo: seguimos con el ejemplo anterior: a) que salga un número
par, y b) que salga un número impar. La probabilidad del suceso
unión de estos dos sucesos será igual a:
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
P(A ∪ B) = 0,50 + 0,50 = 1
154
Ing. Rolando W. Rivera Olivera
6.7.
ANALISIS COMBONATORIO Y PROBABILIDAD.
Para aplicar la Regla de Laplace, el cálculo de los sucesos
favorables a partir de los sucesos posibles a veces no plantea ningún
problema, ya que son un número reducido y se pueden calcular con
facilidad.
Por ejemplo: Probabilidad de que al lanzar un dado salga el número
2. Tan sólo hay un caso favorable, mientras que los casos posibles
son seis.
Probabilidad de acertar al primer intento el horóscopo de una
persona. Hay un caso favorable y 12 casos posibles.
Sin embargo, a veces calcular el número de casos favorables y casos
posibles es complejo y hay que aplicar reglas matemáticas.
Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y
queremos calcular la probabilidad de que al menos los miembros de
un matrimonio se sienten junto. En este caso, determinar el número
de casos favorables y de casos posibles es complejo.
Las reglas matemáticas que nos pueden ayudar son el principio
fundamental del análisis combinatorio y que incluye el cálculo de
factoriales, cálculo de combinaciones, el cálculo de variaciones y el
cálculo de permutaciones.
6.7.1. TEORÍA ELEMENTAL DEL ANALISIS COMBINATORIO
En la mayoría de los problemas de análisis combinatorio se
observa que una operación o actividad aparece en forma repetitiva y
es necesario conocer las formas o maneras que se puede realizar
dicha operación. Para dichos casos es útil conocer determinadas
técnicas o estrategias de conteo que facilitarán el cálculo señalado.
El análisis combinatorio también se define como una manera
práctica y abreviada de contar las operaciones o actividades que se
155
Ing. Rolando W. Rivera Olivera
presentan (conteo de puntos muestrales) y son designadas como
eventos o sucesos.
Ejemplo :
Señalar las maneras diferentes de vestir de una persona,
utilizando un número
determinado de prendas de vestir
* Ordenar 5 artículos en 7 casilleros
* Contestar 7 preguntas de un examen de 10
* Designar 5 personas de un total 50 para integrar una comisión
* Sentarse en una fila de 5 asientos 4 personas
* Escribir una palabra de 7 letras utilizando 4 consonantes y 3
vocales
a. PRINCIPIO DE MULTIPLICACIÓN:
Si un evento o suceso "A" puede ocurrir , en forma independiente, de
"m" maneras diferentes y otro suceso de "n" maneras diferentes,
entonces el número de maneras distintas en que pueden suceder
ambos sucesos es "m . n"
Ejemplo 1:
En la etapa final de fútbol profesional de primera, cuatro equipos :
CRISTAL ( C ), MELGAR ( M ) ,ALIANZA ( A ), UNIVERSITARIO
(U), disputan el primer y segundo lugar (campeón y subcampeón).
¿De cuántas maneras diferentes estos equipos pueden ubicarse en
dichos lugares?
Solución :
METODO 1: utilizando el diagrama del árbol
1er lugar; 2do lugar y 1° ó 2°
156
Ing. Rolando W. Rivera Olivera
1°
C
2°
1° ó 2°
1°
M
2°
1° ó 2°
1°
A
2°
1° ó 2°
1°
U
2°
1° ó 2°.
Existen 12 maneras diferentes en que estos equipos se pueden
ubicar en el primer y segundo lugar.
METODO 2: Utilizando el principio de multiplicación.
1°; 2° y 1° ó 2° son 3 circunstancia y 4 Equipos ; entonces:
3 x 4
# maneras = 12
Ejemplo 2:
¿Cuántas placas para automóviles pueden hacerse si cada placa
consta de dos letras diferentes seguidas de tres dígitos
diferentes? (considerar 26 letras del alfabeto).
Solución:
157
Ing. Rolando W. Rivera Olivera
Letras
Dígitos
26 x 25 x 10 x 9 x 8
# placas = 468 000
b) PRINCIPIO DE ADICIÓN:
Supongamos que un evento A se puede realizar de "m" maneras y
otro evento B se puede realizar de "n" maneras diferentes, además,
no es posible que ambos eventos se realicen juntos, entonces el
evento A o el evento B se realizarán de ( m + n) maneras.
Ejemplo 1:
Un repuesto de automóvil se venden en 6 tiendas en la Calle Puno o
en 8 tiendas del Parque Industrial de Apima .¿De cuántas formas se
puede adquirir el repuesto?
Solución:
Por el principio de adición:
Puno ó Apima
6 formas + 8 formas = 14 formas
Ejemplo 2:
Se desea cruzar un río, para ello se dispone de 3 botes, 2 lanchas y
1 deslizador. ¿De cuantas formas se puede cruzar el río utilizando
los medios de transporte señalados?
Solución :
158
Ing. Rolando W. Rivera Olivera
Aplicando el principio de adición se tiene:
Bote , lancha , deslizador
3ó2ó1
# maneras = 3 + 2 + 1 = 6
6.7.2. FACTORIAL DE UN NÚMERO:
Dado un número natural n se define:
El factorial de n se denota por n! y se define por las multiplicaciones
sucesivas de n desde
el mismo número hasta 1 es decir:
n! = n (n -1)(n -2) … 1
❖ Algunas propiedades de factorial.
i.
Existe factorial sólo para números positivos es decir:
n > 0 y n debe ser N
𝑎
ii.
Existe 𝑏 ! sí y sólo si a ≠ b , además b es ≠ 0
iii.
El factorial de un número n es igual al producto entre
el factorial anterior y el mismo número
.
iv.
n! = n (n -1)!
8! = 8 . 7!
v.
1! = 1
ó
20! = 20 . 19!
y por convencionalismo 0! = 1
Ejemplos:
1. Simplificar:
7! . 19!
21!
159
=
7 .6! . 19!
21 .20 .19!
=
6!
3 . 20
=
6 .5 .4 .3 .2 .1
3 .20
= 12
Ing. Rolando W. Rivera Olivera
( 𝑛+2 ) !
(𝑛+2 ) . 𝑛!
2. Simplificar:
Aplicamos la propiedad iii al
numerador y simplificando en ambos términos, nos queda:
( 𝑛+2 ).(𝑛+1 ) .𝑛 !
= 𝑛+1
(𝑛+2 ) . 𝑛!
3. Hallar x en la siguiente expresión:
( 𝑥+2 ) !
= 10
(𝑥+1 ) !
( 𝑥+2 ) ( 𝑥 + 1 )!
= 10 ; Simplificando nos queda:
(𝑥 +1 ) !
𝑥 + 2 = 10
𝑙𝑢𝑒𝑔𝑜 𝑥 = 8
4. Hallar el valor de “x” en la expresión.
( 𝑥+2 ) !
=
𝑥!
( 𝑥+2 ) ( 𝑥+1 ) !
(𝑥+1 ) !
4!
2
=
Descomponiendo y aplicando las propiedades tenemos:
4 . 3!
Simplificando queda:
2
𝑥 + 2) (𝑥 + 1) = 12
𝑥 2 + 3𝑥 + 2 = 12
𝑥 2 + 3𝑥 − 10 = 0 luego resolvemos la Ec. Cuadrática:
( 𝑥 + 5) (𝑥 − 2 ) = 0
Luego
igualando
los
factores
a
0
tenemos
las
respuestas:
( 𝑥 = − 5) 𝑦 (𝑥 = 2 )
Como no hay factorial para números negativos, la respuesta es sólo 2
5. Hallar el valor de “x” en la siguiente expresión.
( 𝑥−2 )¡
(𝑥−3 ) ¡
.
( 𝑥+ 5)!
(𝑥+ 4 )!
( 𝑥−2 ) ( 𝑥−3 )¡
(𝑥−3 ) ¡
.
= 30
( 𝑥+ 5) ( 𝑥−4 )!
(𝑥+ 4 )!
(x – 2 ) (x + 5) = 30
Descomponiendo en sus factores:
= 30
Simplificando
Resolviendo el sistema:
𝑥 2 + 3𝑥 − 40 = 0
De la ecuación cuadrática queda:
(x +8 ) ( x – 5 ) = 0
por la propiedad i la respuesta es
sólo positiva.
160
Ing. Rolando W. Rivera Olivera
x=-8
y x=5
6.7.3. COMBINACIONES:
Se dice que existe una combinación de n objetos diferentes tomados de k en k
corresponde a una selección de k casos de los n objetos sin tener en cuenta a
la ordenación de los mismos y esta técnica se representa del modo siguiente:
𝑛𝐶𝑘 ; 𝐶(𝑛, 𝑘); 𝐶𝑛,𝑘 ; ( 𝑛𝑘 ) ó 𝐶𝑘𝑛
=
𝑛!
(𝑛−𝑘)! . 𝑘 !
=
𝑛𝑃𝑘
𝑘¡
Se llama combinaciones de n elementos tomados de k en k (n
≥ k) a todas las agrupaciones posibles que pueden hacerse con
los n elementos de forma que:
No entran todos los elementos.
No importa el orden.
No se repiten los elementos
Determina el número de subgrupos de 1, 2, 3, etc. elementos que se
pueden formar con los "n" elementos de una muestra. Cada subgrupo se
diferencia del resto en los elementos que lo componen, sin que influya el
orden.
Ejemplo
Calcular las posibles combinaciones de 2 elementos que se pueden
formar con los números 1, 2 y 3
3𝑪𝟐 =
𝟑!
(𝟑−𝟐)! . 𝟐!
=
𝟑!
𝟏! .𝟐!
=
𝟑 .𝟐.𝟏
𝟏.𝟐.𝟏
= 𝟑
Esto significa que se pueden establecer 3 parejas diferentes: (1,2),
(1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1)
se consideran idénticas, por lo que sólo se cuentan una vez.
Ejemplos:
20
a. Hallar: 𝐶17
:
Solución:
20
𝐶17
=
20!
20 . 19 . 18. 17!
20. 19. 18
=
=
= 1 140
(20 − 17)! 17!
3! . 17 !
3. 2. 1
161
Ing. Rolando W. Rivera Olivera
b. Si disponemos de 5 puntos no colineales, ¿cuál es el máximo
número de triángulos que se podrán formar?
Solución:
Para dibujar un triángulo solo es necesario 3 puntos en el plano, luego
se escogerán 3 puntos (k = 3) de un total de 8 puntos (n = 5). Además
no importa el orden, ya que el triángulo ABC es igual al CBA; por lo
tanto se trata de una combinación.
c. Una señora tiene 3 frutas: manzana, fresa y piña. ¿Cuántos sabores
diferentes de jugo podrá preparar con estas frutas?
Fresa (F), Piña (P), Manzana (M)
Solución:
Método 1 : (en forma gráfica)
Cuando se escoge una fruta de las tres, los sabores son 3: F, P, M
Cuando se escoge 2 de las tres frutas, los sabores son 3: FP, FM, PM
Cuando se escoge las 3 frutas los sabores son 1: FPM
Total de sabores diferentes: 3 + 3 + 1 = 7
Método 2 : (Empleando combinaciones)
Se puede escoger una fruta de las tres ó 2 frutas de las tres ó las tres
frutas de las tres, además en este caso no importan el orden; por lo
tanto usamos el principio de adición aplicado a la combinación:
Sabores diferentes =
3
Sabores diferentes = 1 +
3 .2
2 .1
+
3. 2. 1
3 . 2. 1
=
Total de sabores diferentes: 3 + 3 + 1 = 7
162
Ing. Rolando W. Rivera Olivera
d. Se desea formar un comité de 7 profesionales seleccionando 4 físicos
y 3 matemáticos de un grupo de 8 físicos y 6 matemáticos: a) ¿De
cuantas maneras podrá seleccionarse, si no se impone ninguna
restricción? b) De cuántas formas se seleccionará si un físico debe
pertenecer de hecho al comité? c) De cuántas maneras si 2 físicos y
un matemático no deben pertenecer al comité?
Solución 1:
1ro. Seleccionamos 4 físicos entre 8 en
formas
2º. Seleccionamos 3 matemáticos entre 6 en
Luego aplicamos el principio de multiplicación
= 70 . 20 = 1400 maneras
Solución 2:
➢ Seleccionamos sólo 3 e incluimos a un físico al comité 𝐶37 formas
7𝑥 6𝑥 5
𝐶37 = 3𝑥 2𝑥 1 = 35
➢ Con los matemáticos no pasa nada, permanecen las mismas
condiciones, es decir:
6𝑥 5𝑥 4
𝐶36 = 3𝑥 2𝑥 1 = 20
Luego aplicamos el principio de multiplicación
𝐶37 . 𝐶36 = 35 . 20 = 700 maneras
163
Ing. Rolando W. Rivera Olivera
Solución 3:
1° Sustraemos 2 físicos y seleccionamos 4 de lAs 6 restantes 𝐶46
formas:
6𝑥5
𝐶46 = 2 𝑥 1 = 15
2° Sustraemos un matemático y seleccionamos 3 de los 5 restantes
𝐶35 formas :
𝐶35 =
5𝑥4
2𝑥1
= 10
Luego aplicamos el principio de multiplicación
𝐶46 . 𝐶35 = 15 . 10 = 150 maneras
NOTA.
Existen también casos en que se presentan Combinaciones con
repetición:
Para calcular el número de combinaciones con repetición se aplica la
siguiente fórmula:
𝐶´𝑛, 𝑘 ; 𝐶𝑅𝑘𝑛 =
(𝑛 + 𝑘 − 1 ) !
𝑘! . (𝑛 − 1)!
Ejemplo:
Calcular 𝐶𝑅410 ó
C'10,4 son las combinaciones de 10
elementos con repetición, agrupándolos en subgrupos de
4, en los que 2, 3 o los 4 elementos podrían estar
repetidos:
Es decir, podríamos formar 715 subgrupos diferentes de 4
elementos.
164
Ing. Rolando W. Rivera Olivera
6.7.4. VARIACIONES :
Se denomina Variaciones simples de k objetos tomados de n objetos distantes,
a cada uno de los arreglos que se hagan con los n objetos, de manera que
estos arreglos difieran en algún elemento o en el orden de colocación.
El número de variaciones diferentes de k objetos tomados de n objetos
distintos está denotado por:
𝑉𝑘𝑛 =
𝑛!
(𝑛 − 𝑘)!
Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden
establecer con los "n" elementos de una muestra. Cada subgrupo se
diferencia del resto en los elementos que lo componen o en el orden de
dichos elementos (es lo que le diferencia de las combinaciones).
Ejemplo:
1. Calcular las posibles variaciones de 2 elementos que se
pueden establecer con los número 1, 2 y 3.
Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1),
(2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1)
se consideran distintos.
Con la fórmula se tendría lo siguiente:
3!
𝑉23 = (3−2)! =
3 . 2. 1
1
= 6
2. Calcular 𝑉410 son las variaciones de 10 elementos
agrupándolos en subgrupos de 4 elementos:
10 !
𝑉410 =(10−4)! =
10 .9.8 .7 .6 !
6!
= 5 040
Es decir, podríamos formar 5.040 subgrupos diferentes
de 4 elementos, a partir de los 10 elementos.
❖
Variaciones con repetición (VR):
Se denominan variaciones con repetición de k objetos tomados de n
objetos distintos a cada uno de los arreglos que se hagan con los k
165
Ing. Rolando W. Rivera Olivera
objetos, de manera que estos arreglos puedan efectuarse de uno mismo
de los n objetos.
Una variación con repetición se denota por 𝑉𝑅𝑘𝑛 y se expresa por la
siguiente relación:
𝑉´𝑛, 𝑘 = 𝑉𝑅𝑘𝑛 = 𝑛𝑘
Ejemplo:
Calcular 𝑽𝑹𝟏𝟎
𝟒 que son las variaciones de 10 elementos con
repetición, agrupándolos en subgrupos de 4 elementos:
4
𝑽𝑹𝟏𝟎
𝟒 = 10 = 10 000
Es decir, podríamos formar 10 000 subgrupos diferentes de
4 elementos.
6.7.5. PERMUTACIONES:
Se denomina permutación de n objetos a cada una de las variaciones de
los n objetos distintos, que se denotan por la siguiente expresión: 𝑷𝒏
𝑃𝑛 = 𝑉𝑛𝑛 = 𝑛!
Calcula las posibles agrupaciones que se pueden establecer con todos
los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo
del resto es el orden de los elementos.
Ejemplos.
a. Calcular las posibles formas en que se pueden ordenar
los números 1, 2 y 3.
Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3),
(2, 3, 1), (3, 1, 2) y (3, 2, 1)
𝑷𝟑 = 𝑽𝟑𝟑 = 𝟑 ! = 3 . 2. 1 = 6
|
b. Calcular 𝑷𝟏𝟎 que son las permutaciones de 10
elementos:
166
Ing. Rolando W. Rivera Olivera
𝑷𝟏𝟎 = 𝑽𝟏𝟎
𝟏𝟎 = 𝒏 ! = 10 ! = 10 . 9. 8. 7. 6. 5. 4. 3. 2. 1 = 3 628 800
Es decir, tendríamos 3.628.800 formas diferentes de
agrupar 10 elementos.
PERMUTACIONES CON REPETICIÓN:
Para calcular el número de permutaciones con repetición se aplica la
siguiente fórmula
𝑥 ,𝑥2 …𝑥𝑘
𝑃´ 𝑛1
𝑥 ,𝑥2 ….𝑥𝑘
= 𝑃𝑅𝑛1
=
𝑛!
𝑥1 ! 𝑥2 ! … . 𝑥𝑘 !
Son permutaciones de "n" elementos, en los que uno de ellos se repite "
𝑥1 " veces, otro " 𝑥2 " veces y así... hasta uno que se repite " 𝑥𝑘 " veces.
Ejemplo:
Calcular las permutaciones de 10 elementos, en los que
uno de ellos se repite en 2 ocasiones y otro se repite en 3
ocasiones:
Es decir, tendríamos 302,400 formas diferentes de agrupar
estos 10 elementos.
EJERCICIOS DE APLICACIÓN:
1. Calcular la probabilidad de acertar los 6 signos de la TINKA:
Solución:
Se aplica la Regla de Laplace (casos favorables / casos posibles). El
caso favorable es tan sólo uno (acertar los 6 signos). Los casos posibles
se calculan como variaciones con repetición de 6 elementos (1, 2, 3, 4, 5
y X ), tomados de los 45 signos que se nos da.
167
Ing. Rolando W. Rivera Olivera
Son variaciones y no combinaciones ya que el orden influye: no es lo
mismo (1, 1, X….) que (1, X, 1…..). Y son con repetición, ya que
cualquiera de los signos (1, X , ….., 2) se puede repetir hasta 6 veces.
Por lo tanto, los casos posibles son:
45
𝑽𝑹𝟒𝟓
= 1,039456375 𝑥 1035
𝟔 = 6
Y la probabilidad de acertar los 6 resultados es:
P(A) =
1
1,039456375 𝑥 1035
= 9,620413364 x
10− 36
No, demasiado elevada....pero el que la sigue la consigue.
2. Y la probabilidad de acertar 12 signos de la quiniela:
Solución:
Aplicamos nuevamente la Regla de Laplace. En este caso los casos
favorables se calculan como combinaciones de 14 elementos tomados
de 2 en 2, de esta manera obtenemos todas las posibles alternativas de
fallar 2 resultados de 14 (lo que equivale a acertar 12 resultados).
Utilizamos combinaciones y no variaciones ya que el orden no importa (da
lo mismo fallar el 3º y el 6º, que el 6º y el 3º)
Los casos posibles siguen siendo los mismos:
Por lo que la probabilidad de acertar 12 resultados es:
Por lo tanto, tenemos más probabilidades de acertar 12 resultados que 14
(¿será por eso por lo que pagan menos?).
3. Calcular la probabilidad de, en una carrera de 12 caballos, acertar los
3 que quedan primeros (sin importar cuál de ellos queda primero, cual
segundo y cual tercero).
168
Ing. Rolando W. Rivera Olivera
Solución:
Se aplica la Regla de Laplace. El caso favorable es tan sólo uno: los 3
caballos que entran en primer lugar. Los casos posibles se calculan
como combinaciones de 12 elementos tomados de 3 en 3 (es decir,
determinamos todas las posibles alternativas de 3 caballos que pueden
entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros
caballos no importa, utilizamos combinaciones en lugar de variaciones.
Por lo tanto, los casos posibles son:
Por lo que la probabilidad de acertar los 3 caballos ganadores es:
Algo mayor que en las quinielas.... Eso sí, se paga menos.
4. Y si hubiera que acertar, no sólo los 3 caballos que ganan, sino el
orden de su entrada en meta.
Solución:
El caso favorable sigue siendo uno: los 3 caballos que entran en primer
lugar, colocados en su orden correspondiente.
Los casos posibles se calculan ahora como variaciones (ya que el orden
influye) de 12 elementos tomados de 3 en 3 (calculamos todas las
posibles maneras en que los 12 caballos podrían ocupar las 3 primeras
posiciones.
Por lo que la probabilidad de acertar los 3 caballos ganadores es:
Menor que en el ejemplo 3º. Ya no vale acertar que 3 caballos entran en
primer lugar, sino que tenemos que acertar el orden de su entrada.
6.8.
PROBABILIDAD CONDICIONADA
169
Ing. Rolando W. Rivera Olivera
Las probabilidades condicionadas se calculan una vez que se ha
incorporado información adicional a la situación de partida:
Ejemplo 1: Se tira un dado y sabemos que la probabilidad de que
salga un 2 es 1/6 (probabilidad a priori). Si incorporamos nueva
información (por ejemplo, alguien nos dice que el resultado ha
sido un número par) entonces la probabilidad de que el resultado
sea el 2 ya no es 1/6.
Las probabilidades condicionadas se calculan aplicando la
siguiente fórmula:
P(B/A) =
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴)
Donde:
P (B/A) es la probabilidad de que se dé el suceso B condicionada
a que se haya dado el suceso A.
P (B ∩ A) es la probabilidad del suceso simultáneo de A y de B
P (A) es la probabilidad a priori del suceso A
En el ejemplo que hemos visto:
P (B/A) es la probabilidad de que salga el número 2 (suceso B)
condicionada a que haya salido un número par (suceso A).
P (B ∩ A) es la probabilidad de que salga el dos y número par.
P (A) es la probabilidad a priori de que salga un número par.
Por lo tanto:
P (B ∩ A) = 1/6
P (A) = 1/2
P (B/A) = (1/6) / (1/2) = 1/3
Luego, la probabilidad de que salga el número 2, si ya sabemos
que ha salido un número par, es de 1/3 (mayor que su
probabilidad a priori de 1/6).
Ejemplo 2: En un estudio sanitario se ha llegado a la conclusión
de que la probabilidad de que una persona sufra problemas
coronarios (suceso B) es el 0,10 (probabilidad a priori).
Además, la probabilidad de que una persona sufra problemas de
obesidad (suceso A) es el 0,25 y la probabilidad de que una
170
Ing. Rolando W. Rivera Olivera
persona sufra a la vez problemas de obesidad y coronarios
(suceso intersección de A y B) es del 0,05.
Calcular la probabilidad de que una persona sufra problemas
coronarios si está obesa (probabilidad condicionada P(B/A)).
P (B ∩ A) = 0,05
P (A) = 0,25
P (B/A) = 0,05 / 0,25 = 0,20
Por lo tanto, la probabilidad condicionada es superior a la
probabilidad a priori. No siempre esto es así, a veces la
probabilidad condicionada es igual a la probabilidad a priori o
menor.
Por ejemplo: probabilidad de que al tirar un dado salga el número
2, condicionada a que haya salido un número impar.
La probabilidad condicionada es en este caso es cero, frente a
una probabilidad a priori de 1/6.
PROBABILIDAD COMPUESTA
6.9.
La
probabilidad
compuesta
(o
regla
de
multiplicación
de
probabilidades) se deriva de la probabilidad condicionada:
La probabilidad de que se den simultáneamente dos sucesos (suceso
intersección de A y B) es igual a la probabilidad a priori del suceso A
multiplicada por la probabilidad del suceso B condicionada al
cumplimiento del suceso A.
La fórmula para calcular esta probabilidad compuesta es:
P(A∩B) = P(B/A) . P(A)
Ejemplo 1 : Estudiamos el suceso A (porcentaje de varones
mayores de 40 años casados) y el suceso B (varones mayores de
40 años con más de 2 hijos) y obtenemos la siguiente
información:
Un 35% de los varones mayores de 40 años están casados.
De los varones mayores de 40 años y casados, un 30% tienen
más de 2 hijos (suceso B condicionado al suceso A).
171
Ing. Rolando W. Rivera Olivera
Calcular la probabilidad de que un varón mayor de 40 años
esté casado y tenga más de 2 hijos (suceso intersección de A y
B).
Por lo tanto:
P (A) = 0,35
P (B/A) = 0,30
P (A∩ B) = 0,35 * 0,30 = 0,105
Es decir, un 10,5% de los varones mayores de 40 años están
casados y tienen más de 2 hijos.
Ejemplo 2: Estudiamos el suceso A (alumnos que hablan inglés)
y el suceso B (alumnos que hablan alemán) y obtenemos la
siguiente información:
Un 50% de los alumnos hablan inglés.
De los alumnos que hablan inglés, un 20% hablan también
alemán (suceso B condicionado al suceso A).
Calcular la probabilidad de que un alumno hable inglés y
alemán (suceso intersección de A y B).
Por lo tanto:
P (A) = 0,50
P (B/A) = 0,20
P (A ∩ B) = 0,50 * 0,20 = 0,10
Es decir, un 10% de los alumnos hablan inglés y alemán.
6.10.
TEOREMA DE LA PROBABILIDAD TOTAL
El Teorema de la probabilidad total nos permite calcular la
probabilidad de un suceso a partir de probabilidades condicionadas:
Ejemplo: supongamos que si llueve la probabilidad de que ocurra
un accidentes es x% y si hace buen tiempo dicha probabilidad es
y%. Este teorema nos permite deducir cuál es la probabilidad de
que ocurra un accidente si conocemos la probabilidad de que
llueva y la probabilidad de que haga buen tiempo.
La fórmula para calcular esta probabilidad es:
172
Ing. Rolando W. Rivera Olivera
Es decir, la probabilidad de que ocurra el suceso B (en nuestro
ejemplo, que ocurra un accidente) es igual a la suma de
multiplicar cada una de las probabilidades condicionadas de
este suceso con los diferentes sucesos A (probabilidad de un
accidente cuando llueve y cuando hace buen tiempo) por la
probabilidad de cada suceso A.
Para que este teorema se pueda aplicar hace falta cumplir un
requisito:
Los sucesos A tienen que formar un sistema completo, es decir, que
contemplen todas las posibilidades (la suma de sus probabilidades debe
ser el 100%).
Ejemplo 1: al tirar una moneda, el suceso "salir cara" y el suceso
"salir sello" forman un sistema completo, no hay más alternativas:
la suma de sus probabilidades es el 100%
Ejemplo 2: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no
forman un sistema completo, ya que no contempla todas las
opciones (podría salir el 5 o el 6). En este caso no se podría
aplicar el teorema de la probabilidad total.
Ejercicio 1:
En una urna existen 3 papeletas de tres colores, con las siguientes
probabilidades de ser elegidas:
a) Amarilla: probabilidad del 50%.
b) Verde: probabilidad del 30%
c) Roja: probabilidad del 20%.
Según el color de la papeleta elegida, podrás participar en diferentes
sorteos. Así, si la papeleta elegida es:
a) Amarilla: participas en un sorteo con una probabilidad de
ganar del 40%.
173
Ing. Rolando W. Rivera Olivera
b) Verde: participas en otro sorteo con una probabilidad de ganar
del 60%
c) Roja: participas en un tercer sorteo con una probabilidad de
ganar del 80%.
Con esta información, ¿qué probabilidad tienes de ganar el sorteo en
el que participes?:
1.- Las tres papeletas forman un sistema completo: sus
probabilidades suman 100%
2.- Aplicamos la fórmula:
Luego,
P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54
Por tanto, la probabilidad de que ganes el sorteo es del 54%.
Ejercicio 2:
De acuerdo a políticas de desarrollo se piensa en cambiar a tu jefe y se
barajan diversos nombres y tu esperas que te aumenten el sueldo, cuál
es esa probabilidad?:
a) Rolando, con una probabilidad del 60%
b) Jesús, con una probabilidad del 30%
c) Miguel, con una probabilidad del 10%
En función de quien sea tu próximo jefe, la probabilidad de que te suban
el sueldo es la siguiente:
a) Si sale Rolando: la probabilidad de que te suban el sueldo es del 5%.
b) Si sale Jesús: la probabilidad de que te suban el sueldo es del 20%.
c) Si sale Miguel: la probabilidad de que te suban el sueldo es del 60%.
En definitiva, ¿cuál es la probabilidad de que te suban el sueldo?:
1.- Los tres candidatos forman un sistema completo
2.- Aplicamos la fórmula:
P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15
Por tanto, la probabilidad de que te suban el sueldo es del 15%.
6.11.
TEOREMA DE BAYES
174
Ing. Rolando W. Rivera Olivera
El Teorema de Bayes viene a seguir el proceso inverso al que hemos
visto en el Teorema de la probabilidad total:
Teorema de la probabilidad total: a partir de las probabilidades del
suceso A (probabilidad de que llueva o de que haga buen tiempo)
deducimos la probabilidad del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido
un accidente) deducimos las probabilidades del suceso A (¿estaba
lloviendo o hacía buen tiempo?).
La fórmula del Teorema de Bayes es:
Tratar de explicar estar fórmula con palabras es un galimatías, así que
vamos a intentar explicarla con un ejemplo. De todos modos, antes de
entrar en el ejercicio, recordar que este teorema también exige que el
suceso A forme un sistema completo.
Ejercicio 1: Estamos en la ciudad de Puno y el parte meteorológico ha
anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Según estos posibles estados meteorológicos, la posibilidad de que
ocurra un accidente en la ciudad es la siguiente:
a) Si llueve: probabilidad de accidente del 10%.
b) Si nieva: probabilidad de accidente del 20%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estábamos en
la ciudad no sabemos qué tiempo hizo (nevó, llovió o hubo niebla). El
teorema de Bayes nos permite calcular estas probabilidades:
175
Ing. Rolando W. Rivera Olivera
Las probabilidades que manejamos antes de conocer que ha ocurrido un
accidente se denominan "probabilidades a priori" (lluvia con el 60%,
nieve con el 30% y niebla con el 10%).
Una vez que incorporamos la información de que ha ocurrido un
accidente, las probabilidades del suceso A cambian: son probabilidades
condicionadas
P
(A/B),
que
se
denominan
"probabilidades
a
posteriori".
Vamos a aplicar la fórmula:
a) Probabilidad de que estuviera lloviendo:
La probabilidad de que efectivamente estuviera lloviendo el día del
accidente (probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
La probabilidad de que hubiera niebla es del 7,1%.
6.12.
SUCESOS INDEPENDIENTES
Dos sucesos son independientes entre sí, si la ocurrencia de uno de
ellos no afecta para nada a la ocurrencia del otro:
Ejemplo: el suceso estatura de los alumnos de una clase y el
color del pelo son independientes: el que un alumno sea más o
menos alto no va a influir en el color de su cabello, ni viceversa.
176
Ing. Rolando W. Rivera Olivera
Para que dos sucesos sean independientes tienen que verificar al
menos una de las siguientes condiciones:
❖ P (B/A) = P (B) es decir, que la probabilidad de que se dé el
suceso B, condicionada a que previamente se haya dado el
suceso A, es exactamente igual a la probabilidad de B.
Ejemplo: la probabilidad de que al tirar una moneda salga cara
(suceso B), condicionada a que haga buen tiempo (suceso A), es
igual a la propia probabilidad del suceso B.
❖ P (A/B) = P (A) es decir, que la probabilidad de que se dé el
suceso A, condicionada a que previamente se haya dado el
suceso B, es exactamente igual a la probabilidad de A.
Ejemplo:
La probabilidad de que haga buen tiempo (suceso A),
condicionada a que al tirar una moneda salga cara (suceso B), es
igual a la propia probabilidad del suceso A.
P (A ∩ B) = P (A) * P (B) es decir, que la probabilidad de que se dé el
suceso conjunto A y B es exactamente igual a la probabilidad del suceso
A multiplicada por la probabilidad del suceso B.
Ejemplo:
La probabilidad de que haga buen tiempo (suceso A) y salga cara
al tirar una moneda (suceso B), es igual a la probabilidad del
suceso A multiplicada por la probabilidad del suceso B
Si el suceso A es independiente del suceso B, entonces el suceso B
también es independiente del suceso A.
Ejemplo 1: analicemos dos sucesos A y B:
Suceso A: la probabilidad de que haga buen tiempo es del 0,4
Suceso B: la probabilidad de tener un accidente es del 0,1
Suceso intersección: la probabilidad de que haga buen tiempo y
tener un accidente es del 0,08
177
Ing. Rolando W. Rivera Olivera
Veamos si se cumple alguna de las condiciones señaladas:
P (B/A) = P (A ∩ B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P
(B))
P (A/B) = P (A ∩ B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a
P (A))
P (A ∩ B) = 0,08 (que no es igual a P (A) multiplicado por P (B))
Por lo tanto, no se cumple ninguna de las tres condiciones
señaladas
por
lo
que
estos
dos
sucesos
no
son
independientes, sino que existe algún grado de dependencia
entre ellos.
Ejemplo 2: analicemos otros dos sucesos:
Suceso A: la probabilidad de que haga buen tiempo es del 0,4
Suceso B: la probabilidad de salir cara al lanzar una moneda es
del 0,5
Suceso intersección: la probabilidad de que haga buen tiempo y
que salga cara es 0,2
Veamos si se cumple alguna de las condiciones señaladas:
P (B/A) = P (A ∩ B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B))
P (A/B) = P (A ∩ B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A))
P (A ∩ B) = 0,2 (igual a P (A) multiplicado por P (B))
Por lo tanto, estos dos sucesos sí son independientes.
6.13.
DISTRIBUCIONES DISCRETAS: BERNOUILLI
Las distribuciones discretas son aquellas en las que la variable puede
pude tomar un número determinado de valores:
Ejemplo: si se lanza una moneda al aire puede salir cara o sello;
si se tira un dado puede salir un número de 1 al 6; en una ruleta el
número puede tomar un valor del 1 al 32.
Las distribuciones continuas son aquellas que presentan un número
infinito de posibles soluciones:
178
Ing. Rolando W. Rivera Olivera
Ejemplo: El peso medio de los alumnos de una clase puede
tomar infinitos valores dentro de cierto intervalo (42,37 kg,
42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de
una población (72,5 años, 7,513 años, 72, 51234 años).
Distribuciones discretas: Bernouilli
Es aquel modelo que sigue un experimento que se realiza una sola vez
y que puede tener dos soluciones: acierto o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0
Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire
(sale cara o no sale); probabilidad de ser admitido en una
universidad (o te admiten o no te admiten); probabilidad de
acertar una quiniela (o aciertas o no aciertas)
Al haber únicamente dos soluciones se trata de sucesos
complementarios:
A la probabilidad de éxito se le denomina "p"
A la probabilidad de fracaso se le denomina "q"
Verificándose que:
p+q=1
Veamos los ejemplos anteriores:
Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al
aire:
Probabilidad de que salga cara: p = 0,5
Probabilidad de que no salga cara: q = 0,5
p + q = 0,5 + 0,5 = 1
Ejemplo 2: Probabilidad de ser admitido en la universidad:
Probabilidad de ser admitido: p = 0,25
Probabilidad de no ser admitido: q = 0,75
p + q = 0,25 + 0,75 = 1
179
Ing. Rolando W. Rivera Olivera
Ejemplo 3: Probabilidad de acertar una quiniela:
Probabilidad de acertar: p = 0,00001
Probabilidad de no acertar: q = 0,99999
p + q = 0,00001 + 0,99999 = 1
6.14.
DISTRIBUCIONES DISCRETAS: BINOMIAL
La distribución binomial parte de la distribución de Bernouilli:
La distribución de Bernouilli se aplica cuando se realiza una sola vez
un experimento que tiene únicamente dos posibles resultados (éxito o
fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y el 0
La distribución binomial se aplica cuando se realizan un número "n" de
veces el experimento de Bernouiili, siendo cada ensayo independiente del
anterior. La variable puede tomar valores entre:
0: si todos los experimentos han sido fracaso
n: si todos los experimentos han sido éxitos
Ejemplo:
Si se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido
ninguna la variable toma el valor 0; si han salido dos caras la variable
toma el valor 2; si todas han sido cara la variable toma el valor 10
La distribución de probabilidad de este tipo de distribución sigue el
siguiente modelo:
¿Alguien entiende esta fórmula? Vamos a tratar de explicarla con un
ejemplo:
Ejemplo 1:
¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10
veces?
180
Ing. Rolando W. Rivera Olivera
"k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada
acierto decíamos que la variable toma el valor 1: como son 6 aciertos,
entonces k = 6)
“n" es el número de ensayos. En nuestro ejemplo son 10
“p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la
moneda. Por lo tanto p = 0,5
La fórmula quedaría:
Luego,
P (x = 6) = 0,205
Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar
10 veces una moneda.
Ejemplo 2:
¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un
dado ocho veces?
" k " (número de aciertos) toma el valor 4
" n" toma el valor 8
" p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)
La fórmula queda:
Luego,
P (x = 4) = 0,026
Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el
números 3 al tirar un dado 8 veces.
6.15.
DISTRIBUCIONES DISCRETAS: POISSON
La distribución de Poisson parte de la distribución binomial:
Cuando en una distribución binomial se realiza el experimento un número
"n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo
es reducida, entonces se aplica el modelo de distribución de Poisson:
181
Ing. Rolando W. Rivera Olivera
Se tiene que cumplir que:
" p " < 0,10
" p * n "< 10
La distribución de Poisson sigue el siguiente modelo:
Explicando tendríamos que:
El número "e" es 2,71828
"
" = n * p (es decir, el número de veces " n " que se realiza el
experimento multiplicado por la probabilidad " p " de éxito en cada
ensayo)
" k " es el número de éxito cuya probabilidad se está calculando
Veamos un ejemplo:
La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que
se viaja, si se realizan 300 viajes, ¿cuál es la probabilidad de tener 3
accidentes?
Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es
menor que 10, entonces aplicamos el modelo de distribución de Poisson.
Luego,
P (x = 3) = 0,0892
Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes
es del 8,9%
Otro ejemplo:
La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la
probabilidad de que entre 800 recién nacidos haya 5 pelirrojos?
182
Ing. Rolando W. Rivera Olivera
Luego,
P (x = 5) = 4,602
Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién
nacidos es del 4,6%.
183
Ing. Rolando W. Rivera Olivera
184
Ing. Rolando W. Rivera Olivera
EJERCICIOS PROPUESTOS N° 6
1. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4
tienen algún tipo de defecto. Un cliente muy exigente quiere comprar 3
de tales artículos pero le explica al comerciante que si alguno contiene
defectos devolverá la compra y pedirá la devolución de su dinero. Si el
comerciante escoge al azar y a la vez 4 de tales artículos, ¿cuál es la
probabilidad
de
que
con
esos
4
artículos
pueda
atender
satisfactoriamente al cliente?
2. Se va a seleccionar a 3 alumnos de 10 alumnos candidatos compuesto
de 7 hombres y 3 mujeres para una determinada tarea. El seleccionador
no sabe que los 10 alumnos están calificados de 1 a 10, según su
eficiencia en esa tarea. Calcular la probabilidad de que la terna contenga
a. Uno de los 2 mejores y dos de los 3 peores candidatos.
b. Por lo menos una mujer.
3. En una muestra de 120 arequipeños se encontró que el 60% sufre
alguna enfermedad, el 30% tienen al menos 30 años, y el 20% son
menores de 30 años y sanos. i uno de tales arequipeños es escogido al
azar, ¿cuál es la probabilidad:
a. De que sufra alguna enfermedad y tenga al menos 30 años?
b. De que sufra alguna enfermedad si tiene al menos 30 años?
4. A un departamento de mercadeo se le ha solicitado que diseñe códigos
de color para las 42 líneas de discos compactos vendidos por Godoy
Records. Se han de utilizar tres colores en cada línea, pero una
combinación de tres colores empleados para una de ellas no puede
reordenarse y ser utilizada para identificar una distinta línea de CD.
a. ¿serán adecuados siete colores tomados tres a la vez para codificar
por color todas las líneas?
185
Ing. Rolando W. Rivera Olivera
b. ¿Cuántos colores serían suficientes?
5. Al montar un equipo electrónico, seis alambres se conectan a una caja
que tiene seis terminales. ¿De cuántas formas pueden conectarse los
alambres a las terminales si sólo entra un alambre en cada terminal?
6. ¿De cuántas maneras puede un maestro escoger uno o más estudiantes
a partir de seis elegibles?
7. Suponga que hay ocho maquinas disponibles pero solo tres espacios en
el piso del taller donde se han de instalar tales maquinas. ¿de cuántos
modos diferentes pueden colocarse las ocho en los tres espacios
disponibles?
8. Un entrenador de fútbol tiene un equipo formado por 11 jugadores de los
cuales uno es su hijo. ¿Cuántos quintetos de basquetbol se pueden
formar si su hijo siempre debe estar dentro del quinteto?
9. En un edificio de 10 pisos entran al ascensor, en el primer piso, 3
personas, cada una baja al azar a partir del segundo piso. ¿De cuántas
maneras posibles éstas personas pueden bajar en pisos diferentes?
10. Una caja contiene 8 dulces de piña, 6 de naranja y 4 de fresa. ¿Cuántos
elementos tiene el espacio muestral que resulta de extraer un dulce al
azar de cada sabor?
11. Hallar los siguientes ejercicios:
a. Simplificar E =
9!+8!
7!
– ( 5! – 40)
b. Calcular x.
(𝑥+2)
𝑥!
=
3!
3
c. Hallar x en:
(𝑥−5)!
𝑥−5
= 720
186
Ing. Rolando W. Rivera Olivera
d. Calcular x en la siguiente ecuación.
(𝑛 + 4)! (𝑛 + 3)!
(𝑛 + 5)
. [
] = 720
(𝑛 + 3)! + (𝑛 + 4)!
(𝑛 + 4)
e. De la siguiente relación:
8!
= 14
𝑎! 𝑏!
Calcular: (𝑎2 + 𝑏 2 )
12. Una compañía desea ascender a 3 de sus 10 gerentes a posiciones de
vicepresidentes de ventas, de manufacturas y de finanzas. Halar el
número de formas distintas de efectuar los ascensos.
13. Un microbús tiene 29 asientos para pasajeros, distribuidos en 6 filas de
4 asientos cada uno, con un pasillo en el medio y al final 5 asientos
juntos. ¿de cuántas maneras diferentes podrán ubicarse 25 pasajeros
de modo tal, que los 14 asientos que dan a las ventanillas queden
ocupados?
14. La empresa de rodajes ZQF ha producido un lote de 50 rodajes
especiales. Estos han sido colocados en tres cajas para enviarlos a los
proveedores. Al proveedor A le enviarán 25 rodajes, al proveedor B 10
rodajes y al proveedor C los restantes. El supervisor sabe que existen 4
rodajes defectuosos. Determine el número de formas posibles de hacer
los envíos si se quiere que los cuatro rodajes defectuosos lleguen al
mismo proveedor.
15. Un estudiante planea matricularse en los cursos A, B y C. Los horarios
de a son a las 8, 11 y 15 horas. Los de B son a las 8, 10 y 15 horas y los
de C a las 10, 12 y 15 horas. Si las clases son de una hora, ¿cuántos
horarios distintos puede preparar en los 3 cursos de manera que no
haya cruces?
187
Ing. Rolando W. Rivera Olivera
16. ¿de cuántas formas pueden instalarse en línea 5 focos blancos y 6 focos
rojos si deben colocarse
a. Alternadamente.
b. Los blancos juntos?
17. Un sistema está formado por dos componentes A y B. Si la probabilidad
de que A falle es 0,7 y la de que B fracase es 0,8 ¿qué probabilidad hay
de que:
a. El sistema siga funcionando bien
b. Ambos compontes fallen
c. Falle cualquiera de ellos.
18. En una fábrica de calzado se manufacturan independientemente costura
(toda la parte superior del calzado relacionada con el cuero) , suela y
tacón, siendo estas partes armadas aleatoriamente en cada zapato. Se
sabe que en este proceso, el 5% de las costuras, el 4% de las suelas y
el 1% de los tacones tienen falla; ¿qué porcentaje de pares de zapatos
resulta:
a. Con fallas en sus tres componentes
b. Sin fallas en sus tres componentes
19. Cuatro amigos que se dirigen a un lugar, toman 4 rutas diferentes de
acuerdo al riesgo que se corre de tener algún accidente. Si se le asignan
las probabilidades de riesgo para cada ruta: 0,2; 0,15; 0,25; 0,10. Hallar
la probabilidad:
a. Que ninguno tenga dificultades
b. Que los cuatro sufran accidentes.
c. Que los dos primeros sufran accidentes y los restantes no
20. Un experimento estadístico consiste en lanzar dos dados una o dos
veces. Un jugador gana si consigue la suma 7 en el primer lanzamiento;
pierde si saca 2 o 12; si consigue otras sumas no pierde n gana, en este
último caso tiene opción para un segundo lanzamiento y si en este
188
Ing. Rolando W. Rivera Olivera
segundo lanzamiento consigue la suma 7 pierde, en caso contrario gana
y termina el juego. ¿Cuál es la probabilidad que el jugador pierda?
21. Entre los doscientos empleados de un departamento Hay 150
graduados, 60 del total consagran parte de su tiempo por lo menos a
trabajos de estadística y 40 de los 150 graduados dedican parte de su
tiempo por lo menos a trabajos de estadística. Si se toma al azar uno de
estos empleados, ¿cuál es la probabilidad de que no sea graduado y no
trabaje en estadística?
22. En una encuesta de opinión se encontró que el 25% de los electores
votarían por el candidato E. De los que no votarían por E el 20% son
mujeres y el resto son hombres. Además la probabilidad de que un
elector elegido al azar sea hombre es de 0,7. Si se elige un elector al
azar y resulta ser mujer, ¿cuál es la probabilidad de que no vote por E?
23. Un lote contiene n objetos. La probabilidad de que al menos uno sea
defectuoso es 0,06; mientras que la probabilidad de que al menos dos
sean defectuosos es 0,04. Calcular la probabilidad de que:
a. Todos los objetos sean no defectuosos
b. Exactamente un objeto sea defectuoso
24. En un supermercado el 70% de las compras las realizan las mujeres; de
las compras realizadas por estas, el 80% supera los $200, mientras que
de las compras realizadas por hombres sólo el 30% supera esa
cantidad.
a. Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que
supere los $200?
b. Si se sabe que el ticket de compra no supera los $200 ¿Cuál es la
probabilidad de que la compra haya sido hecha por una mujer?
189
Ing. Rolando W. Rivera Olivera
25. Se ha determinado que las probabilidades de que un televidente vea los
programas A, B y C son: 0.5,0.4 y 0.7, respectivamente. ¿Cuál es el
porcentaje de televidentes que ven por lo menos dos de los programas?
Se asume que cada persona ve los programas independientemente uno
del otro.
26. En una oficina hay dos computadoras A y B que trabajan de manera
independiente. Si en un momento cualquiera la probabilidad de que la
máquina B esté en mal estado es ¼ y la probabilidad de que solo la
maquina A esté en mal estado es 3/10, ¿cuál es la probabilidad de que
solo la máquina B esté en malas condiciones?
27. Un sistema está formado por dos componentes electrónicos cuyas
duraciones varían aleatoriamente e indistintamente entre 0 y 5 años,
pero la segunda componente actúa como respaldo de la primera tan
solo cuando la primera deja de funcionar. Si la primera componente
tiene mayor duración, calcular la probabilidad de que ésta dure dos o
más años que la segunda.
28. En una etapa de la producción de un artículo se aplica soldadura y para
eso se usan tres diferentes robots. La probabilidad de que la soladura
sea defectuosa varía para cada uno de los tres, así como la proporción
de artículo que cada uno procesa, de acuerdo a la siguiente tabla.
Robots defectuosos art. procesados
ROBOT
DEFECTUOSOS
ARTÍCULOS
PROCESADOS
A
0.002
18%
B
0.005
42%
C
0.001
40%
a. ¿cuál es la proporción global de artículos defectuosos producida por
las tres máquinas?
190
Ing. Rolando W. Rivera Olivera
b. Si tomo un artículo al azar y resulta con defectos en la soldadura,
¿cuál es la probabilidad de que haya sido soldado por el robot C?
29. Carolina está indecisa con relación a que si se matricula en el curso de
estadística o en el curso de Química. aunque Carolina
realmente
prefiere matricularse en química estima que su probabilidad de aprobar
estadística es ¼ mientras que su probabilidad de aprobar química es
1/3. Si Carolina decide matricularse en uno de estos cursos mediante el
lanzamiento de una moneda, ¿cuál es la probabilidad de que ella
apruebe el curso de química?
30. Un sistema de comunicación binario transmite 0 o 1. Por causas del
ruido del sistema a veces n 0 transmitido se recibe como un 1 y
viceversa. Suponiendo que la probabilidad de que un 0 se transmita
incorrectmente es 0.06, que la probabilidad de que un 1 se transita
correactamente es 0.90 y que la probabilidad de transmitir un 0 es de
0.45. Calcular la probabilidad de que en una transmisión no haya error.
31. La probabilidad de que Brunela estudie para su examen final de
estadística es 0,20. Si estudia, la probabilidad de que apruebe el
examen es 0,80 en tanto que si no estudia la probabilidad es de sólo
0,50.
a. ¿Cuál es la probabilidad de que Brunela apruebes su examen final
de estadística?
b. ¿Dado que Brunela aprobó su examen, ¿cuál es la probabilidad de
que ella hay estudiado?
32. Un ingeniero toma un autobús o un microbús para ir a su trabajo con
probabilidades 0.3 y 0.7 respectivamente. 30% de las veces que toma el
autobús llega tarde al trabajo, mientras que 20% de las veces que toma
el microbús llega tarde a su trabajo.
a. Si llega tarde al trabajo en un día particular, ¿cuál es la probabilidad
de que haya tomado el autobús?
191
Ing. Rolando W. Rivera Olivera
b. Si llega temprano al trabajo un día cualquiera, ¿cuál es la
probabilidad que haya tomado el microbús?
33. Al examinar los registros anteriores de los balances de una compañía,
un auditor descubre que el 15% contienen errores. Además 60% de
estos balances incorrectos fueron considerados valores inusuales
basándose en los datos anteriores. El 20% de todos los balances se
consideraron también valores inusuales. Si los datos de un determinado
balance parecen ser inusuales, ¿cuál es la probabilidad de que sea
incorrecto?
34. El Señor Rivera tiene tres secretarias con diferentes niveles de
competencia. La secretaria A ha escrito el 20% de un trabajo, la
secretaria B el 40% y la secretaria C el 40%. Hay un error ortográfico
que irrita en especial al señor Rivera, y éste ha calculado que A lo
comete el 90% de las veces que tiene que escribir la palabra en
cuestión, que B lo comete el 40% de las veces y C nunca.
a. ¿Cuál es la probabilidad que no encuentre error?
b. Si el señor Rivera encuentra ese error en una página del trabajo,
¿cuál es la probabilidad de que esa página lo haya escrito la
secretaria A?
c. Si no encuentra error, ¿cuál es la probabilidad de que dicha página
haya sido escrita por la secretaria B?
35. El precio del bien A puede tomar cualquier valor entre 0 y 6 soles,
mientras que el precio del bien B puede tomar cualquier valor entre 0 y
12 soles. Si usted está dispuesto a gastar más de 6 soles comprando
tales bienes, calcule la probabilidad de que pueda comprar 2 unidades
de A y 3 unidades de B.
36. Dos gerentes
deciden encontrarse en cierto lugar para cerrar un
negocio entre las 8pm y las 9pm de un día determinado. Si convienen
que cada uno de ellos debe esperar al otro a los más 10 minutos, ¿Cuál
es la probabilidad de que se encuentren?
192
Ing. Rolando W. Rivera Olivera
37. Cierta enfermedad en drogadictos se caracteriza por la ocurrencia e al
menos uno de dos trastornos. La probabilidad de que ocurra el primer
trastorno en un drogadicto es 0.10; y la probabilidad de que ocurra solo
el segundo trastorno es 0.29. determinar la probabilidad de que ocurra
dicha enfermedad en un drogadicto.
38. Un cuadro clínico se manifiesta por la ocurrencia de tres síntomas (1, 2
y 3). Un grupo de pacientes que posiblemente presenten este cuadro
ingresan en un hospital especializado, la probabilidad de que uno de
estos pacientes posea el síntoma 1 es 0.95. Uno de cada cuatro
pacientes que presentan el síntoma 1 también presentan el síntoma 2.
Además se sabe que el 755 de estos pacientes que presentan los
síntomas 1 y 2 también presentan el síntoma 3. ¿Cuál es la probabilidad
de que un paciente posea el cuadro clínico?
39. Se debe realizar dos inversiones. La probabilidad de que se realice la
inversión 1 s 0.3. Si se realiza la inversión I, la probabilidad de ganar
5000 soles es 0.4. si se realiza la inversión II, la probabilidad de ganar
5000 soles es 0.1.
a. ¿Cuál es la probabilidad de que se realice la inversión I y se gane
5000 soles?
b. ¿Cuál es la probabilidad de que se realice la inversión II y se gane
5000 soles?
c. Si se ganó 5000 soles, ¿cuál inversión es la más probable de haber
sido realizada?
40. El profesor Medina dicta un curso de estadística y quiere tomar una
prueba en cada clase. Sabedor de que a veces se olvida de ir a hacer su
clase, ha dado instrucciones a su jefe e prácticas que se haga cargo de
la clase cuando él está ausente. Si el profesor Medina hace la clase, la
probabilidad es 0,70 de que tome la prueba en tanto que i el jefe de
193
Ing. Rolando W. Rivera Olivera
prácticas hace la clase, eta probabilidad es de sólo 0,10. Si el profesor
Medina falta el 80% de las clases
a. ¿Cuál es la probabilidad de que haya una prueba en una clase
dada?
b. Suponiendo que hubo prueba en una clase determinada, ¿cuál es la
probabilidad de que el profesor Medina haya estado ausente?
41. Tres máquinas, A, B y C, producen el 45%,30% y 25%, respectivamente,
del total de las piezas producidas en una fábrica. Los porcentajes de
producción defectuosa de estas máquinas son del 3% , 4% y 5%,
respectivamente.
a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea
defectuosa.
b. Tomamos al azar, una pieza y resulta ser defectuosa; calcula la
probabilidad de haber sido producida por la máquina B.
c. ¿Qué máquina tiene la mayor probabilidad de haber producido la
citada pieza defectuosa?
194
Ing. Rolando W. Rivera Olivera
AUTOEV ALU ACIÓN VI
NOMBRE…………………………….………………… CARRERA………………….
1. Hallar:
a. La probabilidad de obtener al menos un 4 en dos lanzamientos de un
dado.
b. La probabilidad de obtener 2 Ases (Unos)
c. Cuál es lo más difícil de acertar en dicho lanzamiento de los dos
dados?
2. Asuma que en un sorteo de rifa por el día del padre que la probabilidad
de de ganar el primer premio es 2/5 y la probabilidad de ganar el
segundo premio es 3/8. Si la probabilidad de ganar al menos uno de los
dos premios es ¾, calcular la probabilidad de ganar:
a. Sólo uno de los premios.
b. Ninguno de los premios
3. Una urna que contiene 5 fichas similares de las cuales 3 son de color
rojo y 2 de color azul. Si de esa urna se extraen al azar 3 fichas a la vez,
calcular la probabilidad de que sólo una de ellas sea de color rojo.
4. La de manad de dos productos A y B varía aleatoriamente en un rango
de 1 000 a 5 000 kilogramos. El distribuidor decide bajar el precio de
venta de ambos productos, si la suma de sus demandas varía de 3 000
a 5 000 kilogramos. Hallar la probabilidad de que el precio de venta de
ambos productos baje.
5. En un campo de esquí artificial pára navidades, la experiencia indica que
hay un tiempo soleado sólo del 15 % de los días. Por otro lado, se ha
calculado que cuando un día es soleado, hay una probabilidad del 20 %
de que el día posterior también lo sea. Calcular la probabilidad de que,
en navidades, un fin de semana completo sea soleado.
195
Ing. Rolando W. Rivera Olivera
6. Asuma que en un proceso de producción se utilizan las máquinas, 1 y 2,
que trabajan en forma independiente para producir cierto bien. Si la
probabilidad de que ambas máquinas fallen es 1/5 y de que falle sólo la
2 es 2/15, Cuál es la probabilidad de que….
a. Falle sólo la máquina 1?
b. La producción continúe?
7. Se asume que la probabilidad de que una empresa B tenga éxito al
comercializar un producto es de 0,95; si la empresa que es su más
cercano competidor en la misma línea de producción A no interviene
esta vez en el mercado y es de 0,15 si ésta (La empresa A) interviene en
el mercado. Si se estima que A intervendría en el mercado con
probabilidad de 0,7:
a. ¿Cuál es la probabilidad de que la Empresa B tenga éxito?
b. Si la empresa B no tuviera éxito, ¿En cuánto
probabilidad de que A intervenga en el mercado?.
8. Calcular, simplificar o deducir según sea el caso:
a. E =
b.
c.
d.
1!+2!+3!
0!
+
(𝑛+7)! (𝑛+5)!
(𝑛+6)! +(𝑛+5)!
(𝑛+9)! (𝑛+7)!
(𝑛+8)! +(𝑛+7)!
(1+𝑛!) 𝑛!
6+𝑛!
4!+5!+6!
4!
= 15!
= 14!
= 20
196
se estima la
Ing. Rolando W. Rivera Olivera
BIBLIOGRAFÍA
Spiegel M. R. (2000). ESTADÍSTICA. México: McGraw – Hill
Córdova B. Isaac (2009). Estadística aplicada a la investigación. Lima – Perú. Ed. San Marcos.
Levin Richard. (1996). ESTADÍSTICA para ADMINISTRADORES. México: Prentice – Hall
Hispanoamericana S.A.
Moya C. Rufino (2010). Estadística descriptiva, conceptos y aplicaciones. Lima – Perú. Editorial San
Marcos.
Quezada N. Lucio (2012). Estadística con SPSS 20. Lima - Perú. MACRO E.I.R.L.
Pérez L. César. (2011). Métodos estadísticos avanzados con SPSS. México. Editorial Thomson.
Sánchez P. (2006). Métodos estadísticos aplicados. Barcelona. España.
Kohler Heinz (1996). ESTADÍSTICA para negocios y economía. México: Compañía Editorial
Continental, S.A. de C.V.
Gutiérrez D. (2009), “ESTADÍSTICA Y PROBABILIDADES”. Arequipa: Editorial UTP.
Benito, A. (2003). Citas y referencias. Nueva York: Contoso Press
García, M.A. (2006). Cómo escribir una bibliografía. Chicago: Publicaciones Raiman.
197
Ing. Rolando W. Rivera Olivera
198
Ing. Rolando W. Rivera Olivera
Universidad Autónoma San Francisco
Avda. Parra N° 219, Cercado Arequipa
Teléf.(054)225918
www.uasf.edu.pe
199
Descargar