Medidas de posición no central: percentiles, deciles y cuartiles Sesión N°04 LOGRO DE LA SESIÓN: Al finalizar la sesión, el estudiante calcula e interpreta medidas de tendencia no central para datos agrupados y no agrupados haciendo uso de procedimientos adecuados de forma correcta. MEDIDAS DE TENDENCIA NO CENTRAL SECCIÓN DE REFERENCIA REFLEXIÓN DESDE LA EXPERIENCIA MEDIDAS DE POSICIÓN Si la talla de una niña es inferior al percentil 30 para su edad, significa que el 70% de las niñas de la misma edad miden más, a la niña también se le denomina “pequeña para su edad”. MEDIDAS DE TENDENCIA NO CENTRAL El colesterol se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales ¿Entre qué valores se encuentran los individuos normales? 10 5 0 frecuencia 15 20 Percentiles 5 y 95 180 200 220 Colesterol en 100 personas 240 260 MEDIDAS DE TENDENCIA NO CENTRAL Las medidas de tendencia central son en realidad, un caso particular de un tipo de medidas más amplias, llamadas “de posición “ Estas medidas de posición, tienen la propiedad de ubicarse entre los dos extremos de variación de los datos, pero ya no necesariamente hacia el centro del intervalo como las de tendencia central. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles; Deciles y Percentiles. Se utilizan principalmente para indicar la posición relativa de un dato dentro del conjunto de datos previamente ordenados. MEDIDAS DE TENDENCIA NO CENTRAL SECCIÓN DE REFERENCIA DATOS NO AGRUPADOS Para obtener sus valores depende como se presentan los datos. 117 353 161 123 Sin Intervalos DATOS AGRUPADOS Con Intervalos 116 376 138 194 MEDIDAS DE TENDENCIA NO CENTRAL CUARTILES: QK Son valores de la variable que dividen a la distribución de datos en cuatro partes iguales, en donde cada parte incluye el 25% de los datos. Vmax. Vmin. 25% MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos no agrupados 1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn 𝒌∗(𝒏+𝟏) 𝟒 2.- Obtener la posición correspondiente del cuartil. , 𝐤: 𝟏, 𝟐, 𝟑 3.- Calculo de los cuartiles E: parte entera de 𝐐𝐤 = ? 𝑘∗(𝑛+1) 4 𝐐𝐤 = XE + d*(X(E+1) – XE) 𝒌 ∗ (𝒏 + 𝟏) 𝟒 𝐤: 𝟏, 𝟐, 𝟑 d: parte decimal de 𝑘∗(𝑛+1) 4 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos no agrupados EJEMPLO: Se han recopilado los minutos que un calmante hace efecto a un grupo de 7 personas. Xi : 14,15,16,18,7,8,15 Calcule los cuartiles: 𝑄1 , 𝑄2 , 𝑄3 X1 X2 X3 X4 X5 X6 X7 Xi : 7, 8, 14, 15, 15, 16, 18 E= 2 𝐐𝟏 = ? 𝟏∗(𝟕+𝟏) 𝟒 𝐐𝟏 = X2 + 0*(X(2+1) – X2) = X2 = 2.0 𝐐𝟏 = X2 = 8 minutos D=0 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados por frecuencias Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖 Paso 2: Calcular la posición del Qk : 𝐤∗𝐧 𝟒 Paso 3: El cuartil 𝑄𝑘 = Xi es el valor de la variable; cuya 𝑭𝒊 > 𝐤 𝟒 El cuartil 𝑄𝑘 = Xi +(X(i+1) – Xi)* ; cuya n: número de datos. 𝐤∗𝐧 𝑭𝒊 = 𝟒 𝐤∗𝐧 𝟒 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados sin intervalos Los datos de la tabla muestran información sobre la variable X que representa el número de años de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística: 𝐐𝟏 = ? Años de consumo de estupefacientes: Xi 1 2 3 Q1 4 Q2 5 6 Q3 7 8 Total Paso 1: Calcular las frecuencias absolutas acumulada. fi Fi Paso 2: Calcular la posición del 𝐐𝟏 : 𝑭𝟑 ≥12.5 4 4 8 7 5 10 7 5 50 4 8 16 23 28 38 45 50 𝟏∗𝟓𝟎 𝟒 = 12.5 𝐐𝟐 = ? Paso 1: Calcular las frecuencias absolutas acumulada. Paso 2: Calcular la posición del 𝐐𝟐 : 𝑭𝟓 ≥ 25 𝟐∗𝟓𝟎 𝟒 = 25 𝐐𝟑 = ? Paso 1: Calcular las frecuencias absolutas acumulada. 𝟑∗𝟓𝟎 Paso 2: Calcular la posición del 𝐐𝟑 : = 37.5 𝑭𝟔 ≥ 37.5 CUARTIL VALOR Q1 Q2 Q3 3 años 5 años 6 años 𝟒 INTERPRETACIÓN MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos Los cuartiles se calculan utilizando la siguiente fórmula: 𝑘∗𝑛 − 𝐹(𝑖−1) 𝑄𝑘 = 𝐿𝑖 + 𝐶 ∗ 4 𝑓𝑖 K = 1,2,3 Donde: : Cuartil k ésimo : Intervalo de clase que contiene el QK 𝒌𝒏 : Posición del QK 𝟒 Li : Limite real inferior de la clase que contiene el QK . A : Amplitud de la clase que contiene QK . 𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el QK . 𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el QK QK .i MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos EJEMPLO: La siguiente distribución corresponde a los sueldos quincenales de los trabajadores de una clínica privada. SUELDOS NUMERO DE TRABAJADORES fi Fi [400 - 420> [420 - 440> [440 - 460> [460 - 480> [480 - 500> [500 - 520> [520 - 540> 80 120 125 99 88 78 10 80 200 325 424 512 590 600 TOTAL 600 ¿Cuál es el sueldo que supera el 25% de los trabajadores? ¿Cuál es el sueldo que supera el 75% de los trabajadores? MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos ¿Cuál es el sueldo que supera el 25% de los trabajadores? Q1 = ? 1∗𝑛 − 𝐹(𝑖−1) 𝑄1 = 𝐿𝑖 + 𝐶 ∗ 4 𝑓𝑖 Paso 1: Calcular las frecuencias absolutas acumulada Fi SUELDOS NUMERO DE TRABAJADORES fi Fi [400 - 420> 80 80 L2 = [420 - 440> 𝒇𝟐 = 120 200 [440 - 460> 125 325 [460 - 480> 99 424 [480 - 500> 88 512 [500 - 520> 78 590 [520 - 540> 10 600 TOTAL 600 Paso 2: Calcular la posición del 𝐐𝟏: = F1 = F2 A = 440 – 420 = 20 𝟏∗𝟔𝟎𝟎 𝟒 = 150 Paso 3: Identificar el intervalo de clase que contiene el 𝐐𝟏 : Como F2 > 𝟏∗𝟔𝟎𝟎 𝟒 i = 150, entonces, i = 2. Paso 4: Reemplazando i = 2 en la formula: 1∗𝑛 − 𝐹(2−1) 𝑄1 = 𝐿2 + 𝐶 4 𝑓2 1∗𝑛 − 𝐹1 𝑄1 = 𝐿2 + 𝐶 4 𝑓2 Paso 5: Reemplazando los datos en la formula: 𝑄1 = 420 + 20 ∗ 150−80 120 = 432 soles MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos Q3 = ? ¿Cuál es el sueldo que supera el 75% de los trabajadores? 3∗𝑛 − 𝐹(𝑖−1) 𝑄3 = 𝐿𝑖 + 𝐶 ∗ 4 𝑓𝑖 Paso 1: Calcular las frecuencias absolutas acumulada Fi SUELDOS NUMERO DE TRABAJADORES fi Fi Paso 2: Calcular la posición del 𝐐𝟑: [400 - 420> 80 80 Paso 3: Identificar el intervalo de clase que contiene el 𝐐𝟑 : Como F5 [420 - 440> 120 200 [440 - 460> 125 325 [460 - 480> 99 424 = F4 L5 = [480 - 500> 𝒇𝟓 = 88 512 = F5 [500 - 520> 78 590 [520 - 540> 10 600 TOTAL 600 > 𝟑∗𝟔𝟎𝟎 𝟒 𝟑∗𝟔𝟎𝟎 𝟒 = 450 i = 450, entonces, i = 5. Paso 4: Reemplazando i = 5 en la formula: C = 500 – 480 = 20 3∗𝑛 − 𝐹(5−1) 𝑄3 = 𝐿5 + 𝐶 4 𝑓5 3∗𝑛 − 𝐹4 4 𝑄3 = 𝐿5 + 𝐶 𝑓5 Paso 5: Reemplazando los datos en la formula: 𝑄1 = 480 + 20 ∗ 450−424 88 = 486 soles MEDIDAS DE TENDENCIA NO CENTRAL DECILES: DK Son valores de la variable que dividen a la distribución de datos en diez partes iguales, en donde cada parte incluye el 10% de los datos. V. min._10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ V. máx. D1 D2 D3 D4 D5 Q2 Me D6 D7 D8 D9 Primer decil : D1 , el 10% de los datos esta por debajo del D1 Segundo decil: D2 , el 20% de los datos esta por debajo del D2 Tercer Decil : D3 , el 30% de los datos esta por debajo del D3 ……. Quinto Decil : D5 , el 50% de los datos esta por debajo del D5 ……. Noveno Decil : D9 , el 90% de los datos esta por debajo del D9 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos no agrupados 1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn 𝒌(𝒏+𝟏) 𝟏𝟎 2.- Obtener la posición correspondiente del decil. , 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗 3.- Cálculo de los deciles E: parte entera de 𝐃𝐤 = ? 𝑘(𝑛+1) 10 𝐃𝐤 = XE + d*(X(E+1) – XE) 𝒌(𝒏 + 𝟏) 𝟏𝟎 𝐤: 𝟏, 𝟐, 𝟑, …, 9 d: parte decimal de 𝑘(𝑛+1) 10 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos no agrupados EJEMPLO: Se han recopilado los minutos que un calmante hace efecto a un grupo de 10 personas. Xi : 14,15,16,18,7,8,15, 7, 20, 11 Calcule los cuartiles: 𝐷1 , 𝐷7 X1 X2 X3 X4 Xi : 7, 7, 8, 11, X5 X6 X7 X8 X9 14, 15, 15, 16, 18, X10 20 E= 1 𝐃𝟏 = ? 𝟏∗(𝟏𝟎+𝟏) 𝟏𝟎 D1 = X1 + 0.1*(X(1+1) – X1) D1 = X1 + 0.1*(X(2) – X1) 𝐃𝟏 = 7 + 0.1*(7 – 7) = 7 minutos = 1.1 D = 0.1 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos no agrupados EJEMPLO: Se han recopilado los minutos que un calmante hace efecto a un grupo de 10 personas. Xi : 14,15,16,18,7,8,15, 7, 20, 11 Calcule los cuartiles: 𝐷1 , 𝐷7 X1 X2 X3 X4 Xi : 7, 7, 8, 11, X5 X6 X7 X8 X9 14, 15, 15, 16, 18, X10 20 E= 7 𝐃𝟕 = ? 𝟕∗(𝟏𝟎+𝟏) 𝟏𝟎 D7 = X7 + 0.7*(X(7+1) – X7) D7 = X7 + 0.7*(X8 – X7) 𝐃𝟕 = 15 + 0.7*(16 – 15) = 15.7 minutos = 7.7 D = 0.7 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos agrupados sin intervalos Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖 Paso 2: Calcular la posición del Dk : 𝐤∗𝐧 𝟏𝟎 Paso 3: .- El decil 𝐷𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 > .- El decil 𝐷𝑘 = Xi +(X(i+1) – Xi)* n: número de datos. 𝐤 𝟏𝟎 ; cuya 𝐤∗𝐧 𝑭𝒊 = 𝟏𝟎 𝐤∗𝐧 𝟏𝟎 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos agrupados sin intervalos Los datos de la tabla muestran información sobre la variable X que representa el número de años de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística: Años de consumo de estupefacientes: Xi 1 D1 2 3 4 5 D7 6 7 8 Total fi Fi 𝐃𝟏 = ? Paso 1: Calcular las frecuencias absolutas acumulada. 4 4 8 7 5 10 7 5 50 4 8 16 23 28 38 45 50 Paso 2: Calcular la posición del 𝐃𝟏 : 𝑭𝟐 > 5 𝟏∗𝟓𝟎 𝟏𝟎 =5 𝐃𝟕 = ? Paso 1: Calcular las frecuencias absolutas acumulada. Paso 2: Calcular la posición del D𝟕 : 𝑭𝟔 > 35 DECIL D1 D7 VALOR 2 años 6 años 𝟕∗𝟓𝟎 𝟏𝟎 = 35 INTERPRETACIÓN MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos agrupados con intervalos Los deciles se calculan utilizando la siguiente fórmula: 𝑘∗𝑛 − 𝐹(𝑖−1) 𝐷𝑘 = 𝐿𝑖 + 𝐶 ∗ 10 𝑓𝑖 K = 1,2,3, … ,9 Donde: : Decil k ésimo : Intervalo de clase que contiene el DK 𝒌∗𝒏 : Posición del DK 𝟏𝟎 Li : Limite real inferior de la clase que contiene el DK . C : Amplitud de la clase que contiene DK . 𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el DK . 𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el DK DK .i MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los deciles para datos agrupados con intervalos EJEMPLO: La siguiente distribución corresponde a los sueldos quincenales de los trabajadores de una clínica privada. SUELDOS NUMERO DE TRABAJADORES fi Fi [400 - 420> [420 - 440> [440 - 460> [460 - 480> [480 - 500> [500 - 520> [520 - 540> 80 120 125 99 88 78 10 80 200 325 424 512 590 600 TOTAL 600 ¿Cuál es el sueldo que supera el 30% de los trabajadores? ¿Cuál es el sueldo que supera el 80% de los trabajadores? MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos ¿Cuál es el sueldo que supera el 30% de los trabajadores? D3 = ? 3∗𝑛 − 𝐹(𝑖−1) 𝐷3 = 𝐿𝑖 + 𝐶 10 𝑓𝑖 Paso 1: Calcular las frecuencias absolutas acumulada Fi SUELDOS NUMERO DE TRABAJADORES fi Fi [400 - 420> 80 80 L2 = [420 - 440> 𝒇𝟐 = 120 200 [440 - 460> 125 325 [460 - 480> 99 424 [480 - 500> 88 512 [500 - 520> 78 590 [520 - 540> 10 600 TOTAL 600 Paso 2: Calcular la posición del D𝟑: = F1 = F2 C = 440 – 420 = 20 𝟑∗𝟔𝟎𝟎 𝟏𝟎 = 180 Paso 3: Identificar el intervalo de clase que contiene el D𝟑 : Como F2 ≥ 𝟑∗𝟔𝟎𝟎 𝟏𝟎 i = 180, entonces, i = 2. Paso 4: Reemplazando i = 2 en la formula: 3∗𝑛 − 𝐹(2−1) 𝐷3 = 𝐿2 + 𝐶 10 𝑓2 3∗𝑛 − 𝐹1 𝐷3 = 𝐿2 + 𝐶 10 𝑓2 Paso 5: Reemplazando los datos en la formula: 𝑄1 = 420 + 20 ∗ 180−80 120 = 437 soles MEDIDAS DE TENDENCIA NO CENTRAL PERCENTILES: PK Son valores de la variable que dividen a la distribución de datos en cien partes iguales, en donde cada parte incluye el 1% de los datos. V. mín._ 1%_._ 1%_. …._ ._ …… P1 P2 …. P25 Q1 _._ 1%_._ P51 …..... P50 Q2 Me …… …..... ._ … P75 ...... Q3 ._1%_ V. máx. P99 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos no agrupados 1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn 𝒌∗(𝒏+𝟏) 𝟏𝟎𝟎 2.- Obtener la posición correspondiente del decil. , 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗𝟗 3.- Calculo de los deciles E: parte entera de 𝐏𝐤 = ? 𝑘(𝑛+1) 100 𝐏𝐤 = XE + d*(X(E+1) – XE) 𝒌 ∗ (𝒏 + 𝟏) 𝟏𝟎𝟎 𝐤: 𝟏, 𝟐, 𝟑, …, 99 d: parte decimal de 𝑘(𝑛+1) 100 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos no agrupados EJEMPLO: Se han recopilado los minutos que un calmante hace efecto a un grupo de 10 personas. Xi : 14,15,16,18,7,8,15, 7, 20, 11 Calcule los cuartiles: 𝑃10 , 𝑃69 X1 X2 X3 X4 Xi : 7, 7, 8, 11, X5 X6 X7 X8 X9 14, 15, 15, 16, 18, X10 20 E= 1 𝐏𝟏𝟎 = ? 𝟏𝟎∗(𝟏𝟎+𝟏) 𝟏𝟎𝟎 P10 = X1 + 0.1*(X(1+1) – X1) P10 = X1 + 0.1*(X(2) – X1) 𝐏𝟏𝟎 = 7 + 0.1*(7 – 7) = 7 minutos = 1.1 D = 0.1 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos agrupados sin intervalos Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖 Paso 2: Calcular la posición del Pk : 𝐤∗𝐧 𝟏𝟎𝟎 Paso 3: .- El percentil 𝑃𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 > .- El percentil 𝑃𝑘 = Xi +(X(i+1) – Xi)* n: número de datos. 𝐤 𝟏𝟎𝟎 ; cuya 𝐤∗𝐧 𝑭𝒊 = 𝟏𝟎𝟎 𝐤∗𝐧 𝟏𝟎𝟎 MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos agrupados sin intervalos Los datos de la tabla muestran información sobre la variable X que representa el número de años de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística: Años de consumo de estupefacientes: Xi 1 2 3 P19 4 5 P69 6 7 8 Total fi Fi 𝐏𝟏𝟗 = ? Paso 1: Calcular las frecuencias absolutas acumulada. 4 4 8 7 5 10 7 5 50 4 8 16 23 28 38 45 50 Paso 2: Calcular la posición del 𝐏𝟏𝟗 : 𝑭𝟑 ≥ 9.5 𝟏𝟗∗𝟓𝟎 𝟏𝟎𝟎 = 9.5 𝐏𝟔𝟗 = ? Paso 1: Calcular las frecuencias absolutas acumulada. Paso 2: Calcular la posición del P𝟕 : 𝑭𝟔 ≥ 34.5 DECIL P19 P69 VALOR 3 años 6 años 𝟔𝟗∗𝟓𝟎 𝟏𝟎𝟎 = 34.5 INTERPRETACIÓN MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos agrupados con intervalos Los percentiles se calculan utilizando la siguiente fórmula: 𝑘∗𝑛 − 𝐹(𝑖−1) 𝑃𝑘 = 𝐿𝑖 + 𝐶 ∗ 100 𝑓𝑖 K = 1,2,3, … ,99 Donde: : Percentil k ésimo : Intervalo de clase que contiene el PK 𝒌∗𝒏 : Posición del PK 𝟏𝟎𝟎 Li : Limite real inferior de la clase que contiene el PK . C : Amplitud de la clase que contiene PK . 𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el PK . 𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el PK PK .i MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los percentiles para datos agrupados con intervalos EJEMPLO: La siguiente distribución corresponde a los sueldos quincenales de los trabajadores de una clínica privada. SUELDOS NUMERO DE TRABAJADORES fi Fi [400 - 420> [420 - 440> [440 - 460> [460 - 480> [480 - 500> [500 - 520> [520 - 540> 80 120 125 99 88 78 10 80 200 325 424 512 590 600 TOTAL 600 ¿Cuál es el sueldo que supera el 43% de los trabajadores? ¿Cuál es el sueldo que supera el 89% de los trabajadores? MEDIDAS DE TENDENCIA NO CENTRAL Cálculo de los cuartiles para datos agrupados con intervalos P89 = ? ¿Cuál es el sueldo que supera el 89% de los trabajadores? 𝑃89 89 ∗ 𝑛 − 𝐹(𝑖−1) = 𝐿𝑖 + 𝐶 100 𝑓𝑖 Paso 1: Calcular las frecuencias absolutas acumulada Fi SUELDOS NUMERO DE TRABAJADORES fi Fi Paso 2: Calcular la posición del P𝟖𝟗: [400 - 420> 80 80 Paso 3: Identificar el intervalo de clase que contiene el D𝟖𝟗 : Como F6 [420 - 440> 120 200 [440 - 460> 125 325 [460 - 480> 99 424 [480 - 500> 88 512 = F5 L6 = [500 - 520> 𝒇𝟔 = 78 590 = F6 [520 - 540> 10 600 TOTAL 600 > 𝟖𝟗∗𝟔𝟎𝟎 𝟏𝟎𝟎 𝟖𝟗∗𝟔𝟎𝟎 𝟏𝟎𝟎 = 534 i = 534, entonces, i = 6. Paso 4: Reemplazando i = 6 en la formula: C = 520 – 500 = 20 𝑃89 89 ∗ 𝑛 − 𝐹(6−1) = 𝐿6 + 𝐶 100 𝑓6 𝑃89 89 ∗ 𝑛 − 𝐹5 = 𝐿6 + 𝐶 100 𝑓6 Paso 5: Reemplazando los datos en la formula: 𝑄1 = 500 + 20 ∗ 534−512 78 = 506 soles MEDIDAS DE TENDENCIA NO CENTRAL CASOS PARTICULARES DE CUANTILES PERCENTIL DECIL P10 P20 P25 P30 P40 P50 P60 P70 P75 P80 P90 D1 D2 CUARTIL Q1 D3 D4 D5 D6 D7 Q2 Q3 D8 D9 Me DIAGRAMA DE CAJAS (BOX PLOT) Es un grafico representativo que permite visualizar tanto la dispersión como la forma (simetría de los datos) de una variable y detectar valores atípicos (outliers). Asimismo, es especialmente útil para comparar diferentes distribuciones de manera simultanea. DIAGRAMA DE CAJAS (BOX PLOT) ¿QUÉ INDICA EL BOX PLOT? Mientras más larga la caja y los bigotes, más dispersa es la distribución de datos. La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media aritmética) puede variar. DIAGRAMA DE CAJAS (BOX PLOT) ¿QUE INDICA EL BOX PLOT? Al igual que el histograma y el gráfico de Tallos y Hojas permite tener una idea visual de la distribución de los datos (simetría y variabilidad) CASO 1.- La línea que representa la mediana indica la simetría. Si está relativamente en el centro de la caja la distribución es simétrica. CASO 2.- Si por el contrario se acerca al tercer cuartil, la distribución pudiera ser sesgada a la izquierda (asimétrica negativa). CASO 3.- Si por el contrario se acerca al primer, la distribución pudiera ser sesgada a la derecha (asimétrica positiva). DIAGRAMA DE CAJAS (BOX PLOT) ¿QUÉ INDICA EL BOX PLOT? La mediana puede inclusive coincidir con los cuartiles o con los límites de los bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto. DIAGRAMA DE CAJAS (BOX PLOT) ¿QUE INDICA EL BOX PLOT? Identifica con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. A estas observaciones se les conoce como valores atípicos. outliers (valores extremos). DIAGRAMA DE CAJAS (BOX PLOT) Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores DIAGRAMA DE CAJAS (BOX PLOT) Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores Tabla I. Distribución de frecuencias de la edad en 100 pacientes. Edad Q1 = Q2 = Q3 = Min. = 18 Máx. = 42 Q1 = 23; Mediana = Q2 = 26; Q3 = 31 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 41 42 Nº de pacientes 1 3 4 7 5 8 10 8 9 6 6 4 3 4 5 3 2 3 1 2 3 1 1 1 Fi 1 4 8 15 20 28 38 46 55 61 67 71 74 78 83 86 88 91 92 94 97 98 99 100 DIAGRAMA DE CAJAS (BOX PLOT) Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores Máx. Los valores para obtener el diagrama: Min. = 18 Máx. = 42 Mediana = 26 Q1 = 23 ; Q3 = 31 ; RIC = Q3 - Q1 = 31 – 23 = 8 Calculando los extremos de los bigotes: Extremo inferior = (Q1 – 1,5RIC) = 23 - 1,5(8) = 11 Extremo superior=(Q3 + 1,5RIC)= 31 + 1,5(8) = 43 Q3 RIC Q2 = Me Q1 Como los valores máximo y mínimo se encuentran entre estos extremos, los bigotes se graficarán hasta 18 y 42, no existiendo ningún valor atípico (outlier) Mín. APLIQUEMOS LO APRENDIDO La siguiente tabla muestra el tiempo (en minutos) que demora 60 médicos de consulta externa en un centro hospitalario de Trujillo (La Libertad). Tiempo (minutos) Numero de médicos 8- 13 10 14- 17 30 18- 21 12 22– 25 8 ¿Qué medida de resumen se utilizará para determinar que un medico se ubique en el 25% de los mas rápidos? a. Calcular la media. b. Calcular la mediana. c. Determinar el cuartil 3. d. Determinar el cuartil 1. e. Faltan datos. APLIQUEMOS LO APRENDIDO Con respecto al Gráfico de Cajas responda las siguientes preguntas: ¿Qué grupo tiene mayor mediana?....................... ¿Qué grupo presenta mayor dispersión?............. ¿Qué grupo es más simétrico?.............................. ¿Qué grupo presenta valores discordantes?......... APLIQUEMOS LO APRENDIDO El siguiente grafico de box plot muestra los tiempos de espera de tres restaurantes de comidas rápidas en cuarentena. INTERES: .- Identificar el restaurante con mayor rango de espera .......................................................... .- Identificar el restaurante que minimiza el tiempo de espera........................................................... .- Si se establece un tiempo de espera de 8 minutos, ¿Qué restaurante ofrece mejor servicio? ¿Por qué? ……………………….…………………………. …………………………………………………... SECCIÓN DE REFERENCIA APLIQUEMOS LO APRENDIDO Una asociación recaba información sobre sueldos anuales iniciales de los recién egresados de universidades de acuerdo con su especialidad. El salario anual inicial de los administradores de empresas es S/. 39580. A continuación se presentan muestras de los sueldos anuales iniciales de especialistas en marketing y en contabilidad (los datos están en miles): Egresados de marketing: 34.2; 45.0; 39.5; 28.4; 37.7; 35.8; 30.6; 35.2; 34.2; 42.4 Egresados de contabilidad: 33.5; 57.1; 49.7; 40.2; 44.2; 45.2; 47.8; 38.0; 53.9; 41.1; 41.7; 40.8; 55.5; 43.5; 49.1; 49.9 Realice una descripción comparativa usando las medidas de posición de tendencia no central y el diagrama de box plot. SECCIÓN DE REFERENCIA INTEGREMOS LO APRENDIDO ¿Qué es un decil? ¿Qué es un percentil? ¿Qué es un rango intercuartílico? Actividad Asincrónica (virtual) Resolver el cuestionario virtual de la semana 4 SECCIÓN DE REFERENCIA REFERENCIAS BIBLIOGRÁFICAS Anderson, D. (2008). Estadística para administración y economía. México, D. F.: Cengage Learning. 10ª edición. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EfmckGutuRVEmTlp_PFA2sgBe6-Gdu3J7-Ct0rYCLZSK8Q Johnson, R. (2004). Estadística elemental: lo esencial. México, D. F.: International Thomson. Disponible en Biblioteca: 519.5 / J67 / 2004. Martínez, C. (2012). Estadística y muestreo. Bogotá: Ecoe Ediciones. Disponible en Biblioteca: 519.52 / M26 / 2012. Palacios C., Severo. (2010). Estadística experimental. Aplicada a ciencia e ingeniería. 1ª. Edición. Concytec. Disponible en Biblioteca: https://grupoeducad-my.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/EejSxiCIZo5Mmz284ZjriEB5JkTJwJPoZ7JkAqOVg8X9A?e=ZTN4Ey Salazar, C. Del Castillo, S. (2018). Fundamentos básicos de estadística. 1ª edición. Disponible en Biblioteca: https://grupoeducadmy.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EX7CejlZbBZKukecWJpvRaIBy06W6cs1qX2fG0CxlWcwSQ Triola, M. (2018). Estadística. México, D. F.: Pearson Educación. 12ª edición. Disponible en Biblioteca: https://grupoeducadmy.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EWWDv2kMz_NOsnHN6OaNyVYBOCVZIFLGBFaQqmrXUGmg3Q Walpole, R.; Myers, R.; Myers, S; Ye, K. (2012) Probabilidad y estadística para ingeniería y ciencias. 9ª edición. Disponible en Biblioteca: https://grupoeducadmy.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/ESqzEQPTJSNCiWzRQ3xtcxsBhDRarSKofShxY9d5uLyyVQ?e=CyCmyl