Subido por Juan Fernando

Guia-estadistica-10°-Periodo-1

Anuncio
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
GUIA No. 1
ÁSIGNATURA: ESTADÍSTICA
GRADO: Decimo
Nombre del estudiante:
Docente:
Período:
Primero
Inicia: 15/03/2021
Finaliza: 24/04/2021
Objetivos de Aprendizaje:
● Identificar las medidas de tendencia central para datos agrupados.
● Hacer uso de las medidas de tendencia central para obtener información representativa de la muestra
poblacional.
● Encontrar las medidas de tendencia central en un conjunto de datos cuantitativos.
MEDIDAS DE TENDENCIA CENTRAL PARA
DATOS AGRUPADOS
INTRODUCCIÓN
La estadística es la ciencia de la recolección y el análisis de datos. Tiene muchas aplicaciones en
varios campos, relacionados con el desarrollo de la sociedad. Teniendo en cuenta el área específica,
los diferentes conceptos estadísticos tienen una aplicación en la cual cada interpretación se
elabora según las características de la población o la muestra y claro, las variables que se desean
estudiar.
El uso de las medidas de tendencia central se ha generalizado a tal punto que hoy en día es
necesario en los grupos de futbol profesional conocer el
rendimiento de sus jugadores y de los demás equipos
rivales para generar estrategias ganadoras. Esto por
medio del análisis de los datos cuantitativos recopilados
desde medios físicos y virtuales. Así mismo, el uso del
análisis de datos agrupados y cuantitativos permite
tener elementos de peso para la toma de decisiones en
momentos cruciales de la vida y en algunos casos,
decisiones trascendentales como el proceso de paz con
los grupos armados ilegales.
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
¿QUÉ SABES?
VARIABLE
ESTADÍSTICA
Es una característica
de una población que se
puede medir para hacer
un análisis de la misma.
Permite clasificar a los
individuos
de
una
población. Estas pueden
ser de dos tipos, como
se
muestra
a
continuación:
Para caracterizar una
variable cuantitativa se utilizan las medidas de tendencia central, las tablas de frecuencias y las
representaciones gráficas. Para representar los resultados de un estudio, se debe tener en cuenta
si la variable es discreta o es continua.
Los datos cuantitativos se pueden trabajar como datos sueltos (datos no agrupados) si no son
demasiados o cuando no son tan distintos; de lo contrario, lo mejor es agruparlos en tablas de
frecuencias con intervalos.
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
RECUERDA
Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias.
Los tipos de frecuencia pueden ser:
- Frecuencia Absoluta (fa o fi).- Es el número de veces que se repite el valor de cada variable.
La suma de frecuencias absolutas es siempre al total de datos observados (n o N).
- Frecuencia Relativa (fr o hi).- Indica la proporción con que se repite un valor. Es el cociente
(división) entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias
relativas es aproximadamente 1.
𝑓𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝑓𝑟 =
=
𝑛
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
- Frecuencia Acumulada (Fa o Fi).- Indica el número de valores que son menores o iguales que
el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la
tercera, y así sucesivamente.
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
- Frecuencia Porcentual o Porcentaje (f%).- Llamada también frecuencia relativa porcentual.
Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales
es siempre 100%. Se calcula así:
% = 𝑓𝑟 × 100
- Frecuencia Relativa Acumulada (Fra o Hi).- Es la suma de la frecuencia relativa primera con
la segunda, este valor con la tercera, y así sucesivamente.
Otro concepto importante que debes tener claro es:
Marca de clase (Xi o Mi): también
conocida como punto medio, es el valor
medio o promedio de cada intervalo. es
el valor que
representa
a
todo
el intervalo para
el cálculo de
algunos parámetros como
la media
aritmética o la desviación típica. Se
halla de la siguiente manera:
𝑋𝑖 =
𝐿𝑖 + 𝐿𝑠 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
=
2
2
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
¡OBSERVO, LEO Y APRENDO!
El uso de las medidas de tendencia central se ha generalizado a tal punto que hoy en día es
necesario en los grupos de futbol profesional conocer el rendimiento de sus jugadores y de los
demás equipos rivales para generar estrategias ganadoras. Esto por medio del análisis de los datos
cuantitativos recopilados desde medios físicos y virtuales. Así mismo, el uso del análisis de datos
agrupados y cuantitativos permite tener elementos de peso para la toma de decisiones en
momentos cruciales de la vida y en algunos casos, decisiones trascendentales como el proceso de
paz con los grupos armados ilegales.
Las medidas de tendencia central o de centralización son los parámetros que indican el valor hacia
el que tienden a ubicarse los datos de un conjunto o distribución. Permiten analizar los datos en
torno a un valor central.
Las medidas de tendencia central son:
❑ Media aritmética (𝑥)
❑ Moda y clase modal (Mo; 𝑥̂)
❑ Mediana y clase mediana (Me; 𝑥̃)
1. MEDIA ARITMETICA (𝑥)
Denominada promedio o simplemente media, es la medida de localización central más importante.
Se calcula dependiendo si los datos están agrupados o no
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
Datos Agrupados
La media para datos agrupados en clases se calcula sumando todos los productos de cada marca
de clase (𝑥𝑖 ) y su correspondiente frecuencia (𝑓𝑖 ) y dividiendo ese resultado entre el número total
de datos (𝑁)
∑
𝑥𝑖 𝑓𝑖
𝑥=
𝑁
Ejemplo:
En un puesto de control de una autopista, se registraron las velocidades de algunos vehículos que
transitaron durante cierto día de la semana.
¿Cuál fue la velocidad promedio?
S// En la tabla de frecuencias dada podemos construir una columna adicional para representar el
producto de la marca de clase (𝑥𝑖 ) por la frecuencia (𝑓𝑖 )
𝑥=
∑
𝑥𝑖 𝑓𝑖
𝑁
=
10 075
= 118,5 𝑘𝑚/ℎ
85
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
La velocidad promedio a la que transitaron ese día los 5 vehículos que se registraron fue de 118,5
km/h.
2. MEDIANA Y CLASE MEDIANA
La mediana (𝑀𝑒, 𝑥̃) de una variable estadística es una medida que divide la muestra en dos partes
porcentualmente iguales, es decir, el número de valores menores que ella es igual al número de
valores mayores.
La mediana depende del orden de los datos y no de su valor.
Datos Agrupados
Para calcular la mediana en datos agrupados por clases es necesario primero ubicar en la columna
𝑁
de frecuencia absoluta acumulada (𝐹𝑖 ) de la tabla de distribución la posición 2 . Ese intervalo se
conoce como intervalo de la mediana y corresponde a la CLASE MEDIANA
𝑁
Si el valor 2 no aparece o coincide con alguno de la tabla se toma el valor que lo supera por primera
vez.
La mediana de un conjunto de datos agrupados se calcula así:
𝑁
( 2 − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
∙𝐴
𝑓𝑖
Donde;
𝐿𝑖 : limite inferior del intervalo que contiene a
𝑁
2
𝐹𝑖−1 : frecuencia acumulada anterior a la clase mediana
𝑓𝑖 : frecuencia absoluta del intervalo de la mediana
𝐴: amplitud del intervalo
Ejemplo:
El tiempo, en segundos, que tardan en conectarse los usuarios de una
determinada página web, a lo largo de un día, viene dado por la tabla.
Calcule la mediana y la clase mediana
Tiempo en
segundos
[0, 30)
[30, 60)
[60, 90)
[90, 120)
[120, 150)
[150, 180)
Número
de usuarios
3
7
10
9
8
3
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
S//
1. Construimos la tabla de distribución frecuencias para datos agrupados. Con la columna de
frecuencia absoluta acumulada.
2. Calculamos la posición
𝑁
2
y la ubicamos en la columna 𝐹𝑖
𝑁 40
=
= 20
2
2
La clase mediana seria el intervalo [60, 90)
3. Nos concentramos en el intervalo de la mediana para identificar los valores de la fórmula de
la mediana
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
𝑁
( 2 − 𝐹𝑖−1 )
𝑀𝑒 = 𝐿𝑖 +
∙𝐴
𝑓𝑖
Donde; a partir del intervalo mediana
𝐿𝑖 = 60
𝐹𝑖−1 = 10
𝑓𝑖 = 10
𝐴 = 30
𝑀𝑒 = 90 𝑠
La mediana indica que el 50% de los usuarios tarda menos de 90 s en conectarse a la página web.
3. MODA Y CLASE MODAL
La moda (𝑀𝑜, 𝑥̂) de una variable estadística es el valor de la variable que tiene mayor frecuencia
absoluta.
En las tablas de frecuencias con datos agrupados por clases se habla de intervalo modal y
representa la clase modal.
Una distribución puede tener una moda (unimodal), dos modas (bimodal), tres modas (trimodal),
etc. Si todos los valores se repiten el mismo número de veces, se considera que la distribución no
tiene moda.
Datos Agrupados
Para estimar la moda en datos agrupados se siguen los siguientes pasos:
❖ Encontrar el intervalo en el cual se encuentra la moda, que es el intervalo con mayor
frecuencia absoluta (𝑓𝑖 ).
❖ Usar la siguiente fórmula para estimar el valor de la moda
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 +
∙𝐴
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
Donde;
𝐿𝑖 : limite inferior de la clase modal
𝑓𝑖−1: frecuencia absoluta anterior a la clase modal
𝑓𝑖+1: frecuencia absoluta posterior a la clase modal
𝐴: amplitud del intervalo
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
Ejemplo:
El tiempo, en segundos, que tardan en conectarse los usuarios de una determinada página web, a
lo largo de un día, viene dado por la tabla.
1. Se identifica el intervalo con la más alta frecuencia absoluta
La clase modal seria [60, 90)
2. Se identifican los siguientes valores en la clase modal
𝐿𝑖 = 60
𝑓𝑖 = 10
𝑓𝑖−1 = 7
𝑓𝑖+1 = 9
𝐴 = 30
3. Se reemplaza en la formula y se estima el valor de la moda
10 − 7
3
3 × 30
90
𝑀𝑜 = 60 +
∙ 30 = 60 +
× 30 = 60 +
= 60 +
= 60 + 22,5 = 82,5
(10 − 7) + (10 − 9)
3+1
4
4
𝑀𝑜 = 82, 5 𝑠
El tiempo más frecuente que se tardan en conectarse los usuarios a la página web es 82,5 s
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
ACTIVIDADES DE APLICACIÓN Y DEMOSTRACIÓN
1.
2.
3. Calcular la media, mediana y moda en la siguiente tabla de datos:
PAGE
\*
I.E SEMILLA DE LA ESPERANZA
Resolución de aprobación No. 1796 de septiembre 4 de 2002
Código DANE 276520005248 NIT. 815004247-7
Código: GAC-DC-O220
Versión: 01
Fecha: mayo-2020
EVALÚO MI PROCESO
a. ¿Aprendiste el tema?
____________________________________________________________________
b. ¿Comprendiste las explicaciones y conceptos?
____________________________________________________________________
c. ¿Las actividades fueron fáciles de resolver?
____________________________________________________________________
d. ¿Qué se puede mejorar para la siguiente guía?
____________________________________________________________________
PAGE
\*
Descargar