UNIDAD N°12 ESTADISTICA 20 DE OCT 2014

Anuncio
República de Panamá
Ministerio de Educación
DIRECCIÓN NACIONAL DE EDUCACIÓN MEDIA PROFESIONAL Y TÉCNICA
Tel.: 958-5804
Instituto Profesional y Técnico de Veraguas
Nombre del Alumno o la Alumna: _____________________________Grupo:10º ______
Sección: Bachiller Industrial  Segundo Ciclo Industrial
Especialidad: _____________________
UNIDAD DE APRENDIZAJE Nº 12
La Estadística
12.0 ÁREA: Estadística
12.1 OBJETIVOS

Formular y resolver problemas relacionados con interpretación y organización de datos.

Representar gráficamente diferentes problemas relacionados con su entorno e interpretar
los resultados.

Distinguir en los problemas de aplicación las diferentes medidas de tendencia central.

Identificar cada uno de los términos estadísticos.
12.2 INTRODUCCIÓN
La palabra Estadística procede del vocablo Estado, pues era función principal de los Gobiernos
de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas,
etc. La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de
existencia han debido hacerse sentir desde que se establecieron sociedades humanas
organizadas
La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos
de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma
aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que
permite llevar a cabo el proceso relacionado con la investigación científica.
La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos,
así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis.
12.3 ORIGENES DE LA ESTADÍSTICA
Es difícil conocer los orígenes de la Estadística, ya que desde los comienzos de la civilización
humana han existido formas sencillas de Estadística, pues existe evidencia de que ya se
utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes
de cuevas para contar el número de personas, animales o ciertas cosas.
La razón de esto, es se estaba formando recién la sociedad y era
algo inherente la necesidad de saber cosas elementales como:
cuántos habitantes tiene la tribu, con cuantos bienes se cuenta,
etc.
La
Estadística
improviso,
no
sino
surgió
de
mediante
un
proceso largo de desarrollo y evolución, desde hechos de simple
recolección de datos hasta la diversidad y rigurosa interpretación
de los datos que se dan hoy en día. Su origen se remonta a los
comienzos de la historia y esto se sabe tanto a través de crónicas,
datos escritos y restos arqueológicos.
En la Isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los Nuragas
(quienes fueron los primeros habitantes de la Isla); que constan de bloques de basalto
superpuestos sin mortero y en cuyas paredes se encontraban grabados toscos signos que han
sido interpretados con mucha verosimilidad como muescas que servían para llevar cuenta del
ganado y la caza.
Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla
para recopilar datos en tablas sobre la producción agrícola y de los géneros
vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la
población y la renta del país mucho antes
de construir las pirámides en el siglo XXXI
a.C.
En los antiguos monumentos egipcios se
encontraron interesantes documentos en
que se demostraban la
sabia
organización
administración
pueblo;
ellos
llevaban
cuenta
de
los
movimientos
de
y
este
poblacionales
y
continuamente hacían censos.
Fue Sargón II, Rey de Asiria, quien fundó una biblioteca en Nínive. En esta
biblioteca no se guardaban poemas u obras literarias; sino simplemente era
una
recopilación
de
hechos
históricos,
religiosos,
importantes
datos
estadísticos sobre producción, cuentas; así como también datos de medicina, astronomía, etc.
En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el
censo que realizó Moisés después de la salida de Egipto.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
2
“Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por
linajes, describiendo por cabezas los nombres de todos los varones aptos para el
servicio de armas en Israel…”
Igual tipos de datos se expresan, en varios libros que conforman la Biblia.
Otra de las civilizaciones en trabajar la Estadística fueron los chinos,
quienes efectuaron censos hace más de cuarenta siglos.
En China, el escritor Confucio, en unos de sus obras clásicas “ShuKing” escrito hacia el año 550 a. C., nos narra cómo el Rey Yao en el
año 2238 (del año chino) mandó hacer una estadística agrícola,
industrial y comercial.
Los griegos, también tuvieron importantes observaciones estadísticas
en lo que se refiere a la distribución de terreno, el servicio militar, etc. Hecho, existe evidencia de
esto, ya que los griegos Sócrates, Herodoto y Aristóteles, a través de sus escritos incentivaron
la Estadística por su importancia para el Estado. Los griegos efectuaron censos periódicamente
con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres
disponibles). Las investigaciones históricas revelan que en Grecia se realizaron 69 censos para
calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Los romanos, maestros de la organización política, fueron
quienes mejor supieron emplear los recursos de la Estadística.
El Imperio Romano fue el primer gobierno que recopiló una
gran cantidad de datos sobre la población, superficie y renta
de todos los territorios bajo su control.
Cada cinco años realizaban un censo de la población y sus
funcionarios públicos tenían la obligación de anotar: los
nacimientos, defunciones y matrimonios, hacían recuentos
periódicos del ganado y las riquezas contenidas en las tierras
conquistadas.
Durante los años siguientes a la caída del Imperio Romano se realizaron muy pocas
contribuciones a la Estadística con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y Carlomagno en 762 D.C.
En la Edad Media, los métodos estadísticos permanecieron casi olvidados, a pesar de los
esfuerzos de Carlomagno, en Francia y de Guillermo el Conquistador, en Inglaterra, quienes
trataron de revivir la técnica romana.
En 1200 a 1527 D.C. los Incas del Perú establecieron un procedimiento muy particular para
registrar los nacimientos, las defunciones y otros sucesos cuya responsabilidad incumbía a las
autoridades públicas. Esta cultura de América, tiene el mérito de haber sido la primera que
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
3
registró sucesos vitales.
Ya que sabían por ejemplo
exactamente la cantidad, la edad y el sexo de los habitantes
en las diferentes provincias.
Los
Incas
no
tenían
caracteres
escritos,
utilizaban
entrelazados cintas de colores y nudos para registrar los
hechos “quipus”.
Este sistema quedo interrumpido por la
llegada de los españoles en 1531.
La Iglesia, viendo la importancia de la Estadística es que después del Concilio de Trento
estableció la obligación de la inscripción de nacimientos, matrimonios y defunciones.
El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y fue
realizado por Gaspar Neumann, un profesor alemán que vivió en Breslau, que se propuso
eliminar la antigua creencia popular de que en los años terminados en siete moría más personas
que en los restantes, y para lograr su investigación, buscó
pacientemente en los archivos parroquiales de la ciudad. Después de
revisar miles de partidas de defunción pudo demostrar que en tales
años no fallecían más personas que en los demás.
Los procedimientos de Neumann fueron conocidos por el astrónomo
inglés Halley, descubridor del cometa que lleva su nombre, quien los
aplicó al estudio de la vida humana. Sus cálculos sirvieron de base
para las tablas de mortalidad que hoy utilizan todas las compañías de
seguros.
Leonardo de Vinci, Nicolás Copérnico, Galileo Galilei, William Harvey, Sir Francis Bacon y
René Descartes, hicieron grandes operaciones al Método Científico, de tal forma que cuando se
crearon los estados Nacionales y surgió como fuerza el comercio internacional existía ya un
método capaz de aplicarse a los datos económicos.
Por el año 1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos
nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y
poderío militar.
Durante el siglo XVII se aportó indicaciones más concretas de métodos de
observación y análisis cuantitativo y se amplió los campos de la Inferencia
y la Teoría Estadística.
Jacques Quételect fue quien aplicó la Estadística a las Ciencias
Sociales.
Fue el primero en realizar la aplicación práctica de todo el
método estadístico.
En el periodo del 1800 al 1820 se desarrollaron dos conceptos
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
4
matemáticos fundamentales para la Teoría Estadística: la teoría de los
errores de observación, aportada por Laplace y Gauss; y la teoría de los
mínimos cuadrados desarrollada por Laplace, Gauss y Legendre.
En nuestros días la Estadística se ha convertido en un método efectivo
para describir con exactitud los valores de datos económicos, políticos,
sociales, psicológicos, biológicos y físicos, y sirve como herramienta para
relacionar y analizar dichos datos.
12.4 DEFINICIÓN DE ESTADÍSTICA
Es una rama de la Matemática que conjunta herramientas para recolectar, organizar, presentar y
analizar datos numéricos u observacionales.
Según Esperanza Moret, la Estadística es el conjunto de teorías y métodos que han sido
desarrollados para tratar la recopilación, organización y análisis de datos o hechos numéricos,
con el fin de sacar conclusiones.
12.5 TERMINOLOGÍA ESTADÍSTICA
La Estadística es una ciencia que tiene como finalidad facilitar la solución de problemas en los
cuales necesitamos conocer algunas características sobre el comportamiento de algún suceso o
evento. Características que nos permiten conocer o mejorar el conocimiento de ese suceso.
Además nos permiten inferir el comportamiento de sucesos iguales o similares sin que estos
ocurran.
12.5.1 DATOS ESTADÍSTICOS: son conjuntos de números que son recolectados por
observación, referidos a una misma característica, que guardan entre sí relaciones significativas,
por lo tanto pueden ser comparadas, analizadas e interpretadas sus relaciones.
Se pueden
clasificar en: cualitativos, cuantitativos, cronológicos y geográficos.
 Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de
clase y no de cantidad. Por ejemplo: si deseamos clasificar los estudiantes que cursan la
Materia de Matemática 10° del IPTV por su condición, observamos que pueden existir
aprobados, reprobados, retirados.
 Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos.
Por ejemplo: se clasifican los estudiantes de
décimo grado del IPTV de acuerdo a sus notas, observamos que los valores (notas del
1,0 al 5,0) representan diferentes magnitudes.
 Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o
períodos de tiempo, los datos son reconocidos como cronológicos.
Por ejemplo: al
registrar los promedios de notas de los estudiantes de décimo grado del IPTV en los
diferentes trimestres.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
5
 Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen
que son datos geográficos. Por ejemplo: el número de estudiantes los estudiantes de
décimo grado del IPTV en los distintos distritos de la Provincia de Veraguas.
12.5.2 POBLACIÓN: es el conjunto de todos los individuos (personas, objetos, animales, etc.)
que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos la edad, o
el peso.
12.5.3 MUESTRA: es un subconjunto de la población seleccionado de acuerdo con un criterio, y
que sea representativo de la población. Por ejemplo, elegir 30 personas por cada barriada de la
Ciudad de Santiago, para saber sus edades, y este será representativo para la ciudad.
12.5.4
INDIVIDUO: es cualquier elemento que porte información sobre el fenómeno que se
estudia.
Así, si estudiamos la altura de los estudiantes de décimo grado del IPTV, cada
estudiante es un individuo; si estudiamos la edad de cada habitante, cada habitante es un
individuo.
12.5.5 VARIABLE: fenómeno que puede tomar diversos valores. Las variables pueden ser de
dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo:
nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos
anuales).
12.5.6
ESTADÍSTICA DESCRIPTIVA: tienen por objeto fundamental describir y analizar las
características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de
compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una
población (observación exhaustiva) sino también a la descripción de los elementos de una
muestra (observación parcial).
La Estadística Descriptiva proporciona herramientas, como tablas, diagramas, medidas de
tendencia, con las cuales se pueden analizar el comportamiento de datos recopilados.
12.5.7 TOMA DE DATOS: es la obtención de una colección de datos que no han sido ordenados
numéricamente. Por ejemplos: el peso de los estudiantes, o la preferencia de los refrescos, etc.
12.5.8
ORDENACIÓN DE DATOS: es el arreglo de los datos en forma ordenada es una
colocación de los datos numéricos tomados en orden creciente (ascendente) o en orden
decreciente (descendente).
Ejemplo 1: se ofrece los pesos (en kg) de los estudiantes de un grupo de 20 estudiantes de
Décimo Grado de Autotrónica del IPTV (10° S):
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
6
TABLA N°1 PESOS EN KG DE LOS ESTUDIANTES DEL 10° S DEL IPTV
54
55
55
55
56
57
57
58
58
59
60
60
62
63
65
65
65
65
67
68
12.5.9 RANGO DE LOS DATOS O RECORRIDO: es la diferencia entre mayor valor y el menor.
Por ejemplo, según la Tabla N°1, el mayor valor es 68 y el menor 54, luego el rango es:
Rango  68  54  14
Rango  14
12.5.10 FRECUENCIA: es la representación de la cantidad de respuestas, o número de veces en
que se repite un dato, de un hecho o situación investigada.
La frecuencia puede ser absoluta, relativa, acumulada y porcentual.

Frecuencia Absoluta: es el número de veces que se repite un determinado valor o
resultado dentro de todos los valores observados. Por ejemplo en la Tabla N°1, se puede
observar ¿Cuál es el menor peso?, 54kg. ¿Cuál es el mayor peso?, 68kg ¿Cuál es el peso
más común?, 65kg, ya que 4 estudiantes tienen ese peso.
TABLA N°2 LA FRECUENCIA ABSOLUTA DE LOS ESTUDIANTES DEL 10° S DEL IPTV
54
/
60
//
55
///
62
/
56
/
63
/
57
//
65
////
58
//
67
/
59
/
68
/
TABLA N°3 NÚMERO DE ESTUDIANTES QUE TIENEN EL MISMO PESO 10° S DEL IPTV
PESO
(kg)
54
FRECUENCIA
(f)
1
PESO
(kg)
60
FRECUENCIA
(f)
2
55
2
62
1
56
1
63
1
57
2
65
4
58
2
67
1
59
1
68
1
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
7

Frecuencia Acumulada: es la suma de las frecuencias absolutas, entre los diferentes
valores.
TABLA N°4 LA FRECUENCIA ACUMULADA DE LOS ESTUDIANTES DEL 10° S DEL IPTV
PESO FRECUENCIA
(kg)
ABSOLUTA
54
1

FRECUENCIA
ACUMULADA
1
PESO
(kg)
60
FRECUENCIA
ABSOLUTA
2
FRECUENCIA
ACUMULADA
11
55
2
3
62
1
13
56
1
4
63
1
14
57
2
6
65
4
18
58
2
8
67
1
19
59
1
9
68
1
20
Frecuencia Relativa: es el cociente que se obtiene entre la frecuencia absoluta y el
número total de datos o muestra investigada. FR 

Frecuencia Absoluta
Número de Observacio nes
Frecuencia Porcentual: es el cociente que se obtiene entre la frecuencia absoluta y el
número total de datos o muestra investigada FP  FR * 100 
Frecuencia Absoluta
 100
Número de Observacio nes
TABLA N°5 LA FRECUENCIA RELATIVA DE LOS ESTUDIANTES DEL 10° S DEL IPTV
PESO FRECUENCIA
(kg)
ABSOLUTA
FRECUENCIA
RELATIVA
PESO FRECUENCIA
(kg)
ABSOLUTA
FRECUENCIA
RELATIVA
54
1
1
20
 100  0,05  100  5
60
2
2
20
 100  0,10  100  10
55
2
2
20
 100  0,10  100  10
62
1
1
20
 100  0,05  100  5
56
1
1
20
 100  0,05  100  5
63
1
1
20
 100  0,05  100  5
57
2
2
20
 100  0,10  100  10
65
4
4
20
 100  0,0  100  20
58
2
2
20
 100  0,10  100  10
67
1
1
20
 100  0,05  100  5
59
1
1
20
 100  0,05  100  5
68
1
1
20
 100  0,05  100  5
12.5.11 DISTRIBUCIÓN DE FRECUENCIAS: muestra el número de veces que ocurre cada
observación.
Ejemplo 2: se elaboró una encuesta al 10° S del IPTV y ésta informó que las mascotas más
comunes que tienen los estudiantes son perros, gatos, peces, conejos y pericos.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
8
TABLA N°6 MASCOTAS PREFERIDAS DE LOS ALUMNOS DEL 10° S DEL IPTV
Perro
Gato
Perro
Conejo
Perico
Conejo
Gato
Perro
Conejo
Gato
Perico
Gato
Perro
Perro
Conejo
Perico
Perro
Perro
Perico
Gato
A continuación se muestra la distribución de frecuencias absolutas, relativas y porcentuales de las
mascotas más comunes de los estudiantes del 10° S del IPTV:
TABLA N°7 LAS FRECUENCIAS DE LOS ESTUDIANTES DEL 10° S DEL IPTV
MASCOTA
FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA
FRECUENCIA PORCENTUAL
Perro
7
0,35
35%
Perico
4
0,20
20%
Conejo
4
0,20
20%
Gato
5
0,25
25%
12.6 LAS MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central: son valores numéricos que localizan el centro de los datos.
La tendencia central se refiere al punto medio de una distribución.
Las medidas de tendencia central se conocen como medidas de posición.
12.6.1 LA MEDIA ARITMÉTICA DE UN CONJUNTO DE DATOS: es el resultado que se obtiene
al dividir la suma de esos datos entre el número total de ellos.
La media aritmética también se le conoce como de media o promedio, y se representa
con el símbolo X . Es la medida de posición central más utilizada.
Media 
Suma de Datos
Número Total de Datos
 X
x1  x 2  x 3  ...  x n

n
fx
n
La media es el punto en una distribución de medidas, alrededor del cual las desviaciones
sumadas son iguales a cero. Es el valor promedio de una muestra o población.
La media es muy sensible a mediciones extremas que no estén balanceadas en ambos
lados.
Se pueden calcular diversos tipos de media, siendo las más utilizadas: la media aritmética y
la media geométrica.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
9
Ejemplos 3:
1) El grupo de 10° X del IPTV, realizó cinco pruebas parciales de Matemática, si uno de los
estudiantes obtuvo las siguientes notas:
aritmética o promedio es: M 
2,0; 3,5; 4,5; 5,0; 4,7 , entonces la media
2,0  3,5  4,5  5,0  4,7 19,7

 3,94
5
5
2) En una semana, en la Ciudad de Santiago, se han registrado las siguientes temperaturas:
Lunes
23°C
Viernes
27°C
Martes
18°C
Sábado
30°C
Miércoles
25°C
Domingo
24°C
Jueves
21°C
La media aritmética o promedio es: M 
23  18  25  21  27  30  24 168

 24
7
7
12.6.2 LA MEDIANA: es aquel valor que está en la mitad (posición central) de todos los datos
ordenados. La mediana divide el conjunto de datos en dos partes iguales; es decir, por debajo
de ella están la mitad de los datos y por encima, la otra mitad. Ya que es el valor que separa por
la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son
menores que la mediana y el otro 50% son mayores.
Se representa con el símbolo Me .

Si el número de datos es impar, la mediana coincide con el valor central.

Si el número de datos es par, la mediana es el promedio o media aritmética de los valores
centrales.
Ejemplos 4:
1) En el grupo de 10° A del IPTV, siete estudiantes realizaron la tercera prueba parcial de
Matemática, y los resultaron fueron los siguientes: 4,0; 3,5; 2,0; 4,5; 5,0; 3,7; 3,8 .
Los resultados ordenados son:
2,0; 3,5; 3,7; 3,8; 4,0; 4,5; 5,0

Mediana
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
10
La mediana es Me  3,8 ya que antes y después de esta nota, tenemos acumulados la
mitad de las demás notas.
2) Los resultados ordenados de la calificación de diez estudiantes del 10°B del IPTV, en la
cuarta prueba parcial de Matemática, fueron los siguientes:
2,7; 3,0; 3,5; 3,7
4,0; 4,1



4,3; 4,5; 5,0; 5,0
Valores Centrales
La mediana es el promedio de los valores centrales 4,0 y 4,1 es decir:
Me 
4,0  4,1 8,1

 4,05
2
2
La Mediana es de la siguiente forma, si los datos están agrupados:
n

 2   fi 
Mediana  Me  LRI  
c
f
mediana




Donde: LRI es la frontera inferior de la clase de la mediana.
n es el número de datos (frecuencia total).
f
f
i
es suma de frecuencia de las clases inferiores a la de la mediana
mediana
es la frecuencia de la clase de la mediana
c es la anchura del intervalo de la clase de la mediana
12.6.3 LA MODA DE UN CONJUNTO DE DATOS: es aquel valor, en la observación, que más
se repite, es decir, el valor más común, el que aparece con más frecuencia.
La moda puede no existir cuando los números se repiten el mismo número de veces.
Se
representa con el símbolo Mo .
La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la
frecuencia de clase mayor.
Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal.
Ejemplos 5:
1) Las edades de un grupo de diez estudiantes de décimo grado del 10° Y IPTV son:
14, 16,
15, 16, 15, 16, 15, 17, 14, 18 .
Si ordenamos el conjunto de los datos, tenemos: 14, 14, 15, 15, 15, 16, 16, 16, 17, 18 
Las modas en este conjunto de datos son: 15 y 16 , pues ambas aparecen 3 veces.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
11
2) Los resultados obtenidos en la calificación del segundo trimestre del 10° U fueron:
 4,0;
3,0; 3,0; 2,5; 3,2  , se observa que 3,0 se repite dos veces, por lo tanto, la moda
es: Mo  3,0
12.7 CONSTRUCCION DE TABLAS ESTADÍSTICAS
12.7.1 DISTRIBUCIÓN AGRUPADA DE FRECUENCIAS: es la distribución de frecuencias en
la que los valores de la variable se han agrupado en clases. Esto se debe principalmente a la
disposición de gran número de datos.
Las razones por las que se elaboran este tipo de
agrupación de datos son por economía, practicidad, y baja frecuencia de algunos puntajes.
12.7.2
AGRUPACIÓN DE DATOS: para elaborar las tablas estadísticas, se debe seguir un
procedimiento preciso:
1. Estos son algunos métodos para obtener datos:

Censo: se entiende por censo aquella numeración que se efectúa a todos y cada uno de
los caracteres componentes de una población.

Encuesta: se entiende por encuesta las observaciones realizadas por muestreo, es
decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias
sociales y parte de la premisa de que si queremos conocer algo snnnnnnnnnobre el
comportamiento de las personas, lo mejor, más directo y simple es preguntárselo
directamente a ellas.
2. Toma de datos: es la obtención de una colección de datos por medio de encuestas,
preguntas, sondeos etc., que no han sido ordenados numéricamente y que dicha información
se extrae al azar, es decir, de tal forma que cada miembro de la población tenga la misma
oportunidad de ser elegida o seleccionada.
3. Ordenación de datos: es una colocación de los datos numéricos tomados en orden
creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los números
se llama rango o recorrido de datos. Rango  Mayor valor  Menor valor
4. Cálculo de tamaño de clase (Intervalo de clase): pequeña sección de la escala, según se
agrupan las puntuaciones de una distribución de frecuencia. Para calcular el tamaño de
clase es necesario calcular primeramente el número de clases utilizando la Regla de
Sturges y después se obtiene el tamaño de clase dividiendo el rango entre el número de
clases.
Número de Clases  1  3,322 log N (La Regla de Sturges)
Tamaño de Clases 
Rango
Número de Clases
5. Límites de clase (Límite del intervalo): son los valores extremos que tiene el intervalo de
clase: inferior y superior, entre los cuales van a estar los valores de los datos agrupados en
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
12
ese intervalo de clase, representan el tamaño de cada clase. El límite inferior (L.I.) de la
primera clase toma el valor del dato menor de la colección de datos, para obtener el límite
inferior de la clase siguiente, se suma al límite inferior de la clase anterior, el tamaño de
clase.
6. Límites reales de clase: se obtienen sumando al límite superior (L.S.) de la clase el L.I. de
la clase contigua superior y dividiendo entre dos.
7. Marca de clase: Es el punto medio de la clase y se obtiene sumando el límite inferior y
límite superior de la clase y dividiendo entre 2. La marca de clase también se llama punto
medio de la clase.
12.8 REPRESENTACIÓN GRÁFICA DE DATOS
La Gráfica: es un elemento que muestra datos sobre alguna cosa. Es una representación de la
relación entre variables.
Las gráficas a partir de los años sesentas empezaron a evolucionar, empezando como puntos
perforados que daban la sensación de una gráfica, pero eran difíciles, difíciles de leer, por lo que
en los años ochenta ya se pudieron crear gráficas desde la computadora.
El uso de gráficas en encuestas es esencial debido a que la gráfica es utilizada para hacer
dibujitos o diagramas y así representar el porcentaje o número de votos de alguna encuesta.
Muchos tipos de gráficos aparecen en numerosas aplicaciones, según la naturaleza de los datos
involucrados y el propósito del gráfico.
Entre ellos podemos mencionar los gráficos de
columnas, de barras, las circulares, los histogramas, etc.
Los gráficos tienen por objeto ilustrar, mediante el uso de figuras, los
resultados de una investigación estadística.
12.8.1 TIPOS DE GRÁFICAS
Según su relación con el tiempo (cronológico) podemos distinguir dos tipos de gráficas: las
estáticas y las dinámicas.

Las gráficas estáticas: son aquellas que muestran una situación en un instante
determinado de tiempo; reflejan el estado o relación de una o más variables en un mismo
momento.
Por ejemplos: la composición de ventas por sector para un determinado
período, el resultado de las elecciones; y en general, la composición de cualquier conjunto
en un instante determinado.
Para este tipo de muestra se puede utilizar cualquier
diagrama, aunque son preferibles las gráficas circulares o las de barras apiladas.

Las gráficas dinámicas: muestran el desarrollo de una variable a través de un período o
lapso de tiempo.
Estas gráficas tienen una escala temporal en uno de sus ejes
(generalmente el eje horizontal). Puede ser en horas, minutos, años, meses, etc. según la
necesidad de la ilustración. Por ejemplos: las ventas de una empresa, pero detalladas mes
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
13
a mes para un ejercicio comercial; la evolución de la producción de la fábrica a lo largo del
mes, la evolución de un proceso químico, etc. Para este tipo de ilustración se suelen
utilizarse los diagramas de barras, de puntos o lineales.
12.8.1.1 GRÁFICAS LINEALES: es un estilo de gráfica en la que se utiliza una línea para
representar los datos que se quieran mostrar.
Es un tipo de gráfico muy utilizado, dado la
sencillez de su construcción, la versatilidad de sus aplicaciones y por la facilidad de
interpretación. Es especialmente conveniente para los gráficos dinámicos, y en especial cuando
se necesitan mostrar más de una serie de datos en los que deben ser todos visibles y claramente
relacionados para cada serie. La gráfica puede responder a una función lineal, exponencial, etc.
Tal el caso de la función de la recta: y  mx  b , aplicable a múltiples situaciones de la vida real.
12.8.1.2 GRÁFICAS DE BARRAS: es un tipo de gráfica en donde los datos son representados
en barras verticales u horizontales.
ocurrencia de las observaciones.
Es una forma de gráfica para indicar la frecuencia de
Para construirla se constituye el eje Y por las frecuencias
absolutas y el eje X por los límites inferior y superior de cada clase, dejando un espacio entre
barra y barra; generalmente verticales.
12.8.1.3 GRÁFICAS DE CÓNICAS: es un tipo de gráfica en la que los datos se representados
en conos, por lo que la gente piensa en estalactitas, estalagmitas o dientes de tiburón tamaño
jumbo. La gráfica se ve cortada en algún pedazo cuando el dato es de algún número inferior, y se
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
14
ve con punta cuando el dato es mucho más grande. Esta gráfica se divide en 2 partes: base y
punta. La base representa el inicio y la punta no siempre es representada, por lo que hay conos
con una sola parte.
12.8.1.4 GRÁFICAS DE ANILLOS O ANULARES: es un estilo de gráfica en la que los datos
representados, lógicamente, se parecen a un anillo, solo que dividido en partes, cada uno
peleando por la mayor parte y representando un colorcito distinto.
Esta gráfica resulta muy
conveniente para mostrar las composiciones porcentuales, aunque la lectura de sus datos, en la
representación no sea muy precisa.
12.8.1.5
GRÁFICA CIRCULAR O GRÁFICA DE PASTEL: aquella gráfica, que según su
proporción, ocupan cierto territorio circular por más pequeño que sea. Como en las gráficas de
anillo, se pelean por ver quien tiene el trozo más grande. Es una de las más utilizadas. Para la
gente obesa este tipo de gráficas ocasiona antojo a pastel, por lo que es recomendable que no se
les deje al alcance de ellos.
Los inversionistas usan frecuentemente las gráficas de pastel,
aunque no sepan como dividirlas.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
15
12.8.1.6 HISTOGRAMA: forma gráfica de barras que emplea variables con escala de intervalos o
de proporciones. Para realizarla, se toma en cuenta para el eje X, los Límites reales, y para el eje
Y, las frecuencias absolutas.
12.8.1.7
POLÍGONO DE FRECUENCIAS: forma gráfica que representa una distribución de
frecuencias en la forma de una línea continua que traza un histograma. Para su elaboración, se
consideran las marcas de clase en el eje X y las frecuencias absolutas en el eje Y.
12.9 EJEMPLOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA
12.9.1 EJEMPLO DE TABLAS ESTADÍSTICAS:
Ejemplo 6: supongamos que se realizó una investigación sobre “Los autobuses en la Terminal de
Santiago”.
1) Toma de datos: Los siguientes datos corresponden a la cantidad de asientos vacíos que
reportaron 50 autobuses en la Terminal de Santiago en un domingo.
12 11
10 1
8 7
5 6
4
1
8
6
6
2
4
4
6 11
4 5
10 4
12 8
3
2
2
1
10 12
4 4
6 2
12 1
4
8
9
7
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
16
7
6
8
4
6
9
3
7
7
5
4
4
4
4
5
5
5
6
6
6
6
6
6
6
7
7
7
7
7
8
8
8
8
8
9
9
10
10
10
11
11
12
12
12
12
2) Ordenación de datos
1
1
1
1
2
2
2
2
3
3
4
4
4
4
4
3) Rango
Rango  Mayor valor  Menor valor
Rango  12  1
Rango  11
3) Tamaño de clase
Número de Clases  1  3,322 log N  6
Tamaño de Clases 
Rango
11

 1,8  2
Número de Clases
6
TABLA N°8 LA MEDIA Y LAS FRECUENCIAS: ABSOLUTA, RELATIVA Y PORCENTUAL
Intervalo
Clase
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Porcentual
X
f x
8
0,16
16 %
1,95
15,60
4,95
11
0,22
22 %
3,95
43,45
4,95
6,95
10
0,20
20 %
5,95
59,50
8,9
6,95
8,95
10
0,20
20 %
7,95
79,50
9
10,9
8,95
10,95
5
0,10
10 %
9,95
49,75
11
12,9
10,95
12,95
6
0,12
12 %
11,95
71,70
50
1
100 %
41,70
319,50
LRI
LRS
LI
LS
1
1
2,9
0,95
2,95
2
3
4,9
2,95
3
5
6,9
4
7
5
6
f
Total
12.9.2 EJEMPLOS DEL CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL
Ejemplo 7: Hallar la media y mediana, en la tabla estadística anterior:
Mediana
Media
X

f x
n
319,50
X
 6,39
50
n

 2   fi 
Me  LRI  
c
f
 mediana 


 25  8 
17 
Me  2,95  
2  2,95    2  2,95  3,10  6,05

 11 
 11 
Ejemplo 8: Hallar la media aritmética, la mediana y la moda; de una estudiante del 10° P, si tiene
las siguientes notas en el tercer trimestre, en Matemática: 2,0; 3,5; 3,5; 1,0; 2,5; 1,5
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
17
X 
2,0  3,5  3,5  1,0  2,5  1,5
14

 2,33
6
6
Haciendo una ordenación de las notas, se tiene que: 1,0; 1,5; 2,0; 2,5; 3,5; 3,5
1,0; 1,5
2,0; 2,5



3,5; 3,5
Valores Centrales
La mediana (promedio de los valores centrales 2,0 y 2,5 ) es: Me 
2,0  2,5 4,5

 2,25
2
2
La nota que más se repite es 3,5 , por lo tanto la moda es: Mo  3,5
Ejemplo 9: Hallar la media aritmética de la siguiente tabla de frecuencia que trata sobre el largo
de 63 árboles de mango:
TABLA N°9 LA DISTRIBUCIÓN DE FRECUENCIA DE 63 ÁRBOLES DE MANGO
LARGO (en m)
FRECUENCIA ABSOLUTA
LARGO POR FRECUENCIA ABSOLUTA
x
f
f x
5
10
5 X 10 = 50
6
15
6 X 15 = 90
7
20
7 X 20 = 140
8
12
8 X 12 = 96
9
6
9 X 6 = 54
n  63
 f x  430
Calculando la media aritmética, será: X 
fx
n
 X 
430
 6,825
63
Observación: Se debe recordar que la frecuencia absoluta indica cuántas veces se repite
cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la
frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Ejemplo 10: Hallar la media aritmética, la mediana y la moda de un conjunto de datos ordenados
en forma decreciente, de mayor a menor, así: 21; 19; 18; 15; 13; 11; 10; 9; 5; 3
La media aritmética o promedio es: X 
21; 19; 18; 15;
13 11

Valores Centrales
21  19  18  15  13  11  10  9  5  3 124

 12,4
10
10
10; 9; 5; 3 La mediana es: Me 
13  11 24

 12
2
2
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de
valores no tiene moda.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
18
Ejemplo 11: Encuentre la media aritmética, la moda y la mediana si en una prueba de Geometría,
los estudiantes del 10º J y el 10º K obtuvieron las siguientes calificaciones:
Calificaciones
Frecuencias
1,0
2,0
3,0
4,0
5,0
1
4
15
8
2
El promedio o media aritmética del grupo es igual a la sumas de todas las calificaciones entre
el número total de frecuencias:
M X 
1  1  2  4  3  15  4  8  5  2
1  4  15  8  2

1  8  45  32  10 96

 3,2
1  4  15  8  2
30
La calificación que obtuvieron la mayoría de los estudiantes de ambos grupos, fue 3,0 por lo
tanto la moda es: Mo  3,0
La calificación, que se encuentra exactamente a la mitad de los datos agrupados, será el valor
de la mediana, en este caso, como la cantidad de datos es par, entonces la mediana es la
suma de los dos valores del centro entre dos, así:
1 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5
Me 
33
 3,0
2
Ejemplo 12: Encuentre la media aritmética, la moda y la mediana, del siguiente conjunto de
datos: 15,
17, 17, 17, 18, 21, 21, 26, 28
El promedio o media aritmética es:
X 
115  317   118  221  126  128 15  51  18  42  26  28 180


 20
1  4  15  8  2
9
9
El dato que más se repite es el 17, por lo tanto la moda es: Mo  17
La mediana, en este caso, como la cantidad de datos es impar, y el valor central es 18,
entonces la mediana es: Me  18
12.9.3 EJEMPLOS DE DISTRIBUCIONES DE FRECUENCIAS Y GRÁFICAS
Ejemplo 13: Distribución de frecuencias con datos sin agrupar
Colectivo: 20 familias.
N  20
Variable
X : ingresos anuales expresados en miles de Balboas.
Valores observados:
18, 20, 22, 19,
18, 20, 18, 19,
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
19
21, 20, 20, 21,
18, 20, 21, 19,
20, 21, 18, 20
TABLA N°10 DISTRIBUCIÓN DE FRECUENCIAS
Frecuencias
xi
Ingresos
X1
X2
X3
X4
X5
X
18
19
20
21
22
Absoluta
ni
5
3
7
4
1
N  20
Absoluta
Acumulada
Ni
5
5+3=8
5 + 3 + 7 = 15
5 + 3 + 7 + 4 = 19
5 + 3 + 7 + 4+ 1 = 20
Relativa
fi 
ni
N
0,25
0,15
0,35
0,20
0,05
1
Relativa
Acumulada
Fi 
Ni
N
0,25
0,40
0,75
0,95
1,00
REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS:
Ejemplo 14: Distribución de frecuencias con datos agrupados en intervalos
Colectivo: 60 cilindros fabricados por una máquina.
N  60
Variable
X : longitud en centímetros.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
20
Valores observados: 239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248, 250, 258,
252, 251, 250, 253, 247, 243, 245, 251, 247, 250, 248, 250, 259, 249,
249, 250, 251, 253, 241, 251, 249, 252, 250, 247, 251, 259, 250, 246,
252, 238, 251, 238, 236, 259, 249, 257, 249, 247, 251, 246, 245, 243,
250, 249, 242, 238
TABLA N°11 FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOS
Frecuencias
Intervalos Marcas de clase
Frecuencias Relativas
Absolutas
Li  1  Li
ci
235-240
240-245
245-250
250-255
255-260
237,50
242,50
247,50
252,50
257,50
ni
Ni
fi
Fi
5
8
27
15
5
5
13
40
55
60
0,08
0,13
0,45
0,25
0,08
1
0,08
0,22
0,67
0,92
1
N  60
REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS:
Ejemplo 15: Distribución de frecuencias con datos agrupados en intervalos
Colectivo: 1000 empresas de un sector.
N  1000
Variable
X : ventas mensuales en miles de Balboas.
Valores observados: se han agrupado en intervalos.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
21
Intervalos
Li  1  Li
0-50
50-100
100-200
200-400
400-800
hi 
TABLA N°12 DISTRIBUCIÓN FRECUENCIAS
Frecuencias
Amplitud
Marcas de
Absolutas
Relativas
Intervalo
clase
ci
ni
Ni
25
75
150
300
600
100
250
400
200
50
100
350
750
950
1000
N  1000
fi 
ni
N
0,10
0,25
0,40
0,20
0,05
1
Fi 
Ni
N
0,10
0,35
0,75
0,95
1
I  Li  Li  1
50
50
100
200
400
Alturas
hi 
ni
Ii
2
5
4
1
0,125
ni
(La altura o densidad de frecuencias es igual a la frecuencia entre la amplitud intervalo).
Ii
REPRESENTACIÓN GRÁFICA
12.9.4 EJEMPLO DE INTERPRETACIÓN GRÁFICA
Dada la siguiente gráfica de barra, que se refiere a los puntajes obtenidos por los estudiantes de
un grupo de décimo en un taller de Matemáticas:
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
22
Realizando una interpretación del gráfico de barras podemos deducir que:
5 alumnos obtienen puntaje de 62
5 alumnos obtienen puntaje de 67
8 alumnos obtienen puntaje de 72
12 alumnos obtienen puntaje de 77
16 alumnos obtienen puntaje de 82
4 alumnos obtienen puntaje de 87
Eso, hace un total de 50 alumnos.
Sabemos que la mediana se obtiene así: Me 
50  1 51

 25,5 lo cual significa que la
2
2
mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo
cual vemos en el siguiente cuadro:
ALUMNOS
PUNTAJE
ALUMNOS
PUNTAJE
ALUMNOS
PUNTAJE
1
62
18
72
35
82
2
62
19
77
36
82
3
62
20
77
37
82
4
62
21
77
38
82
5
62
22
77
39
82
6
67
23
77
40
82
7
67
24
77
41
82
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
23
8
67
25
77
42
82
9
67
26
77
43
82
10
67
27
77
44
82
11
72
28
77
45
82
12
72
29
77
46
82
13
72
30
77
47
87
14
72
31
82
48
87
15
72
32
82
49
87
16
72
33
82
50
87
17
72
34
82
El alumno 25 obtuvo puntaje de 77
El alumno 26 obtuvo puntaje de 77
Entonces, como el total de alumnos es par, debemos promediar esos puntajes:
Me 
77  77 144

 77
2
2
La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo
y 25 alumnos obtuvieron puntaje de 77 hacia arriba.
Material de Estadística. Elaborado por la Profesora: Xenia Batista ([email protected]) I. P. T. Veraguas, 2014
24
Descargar