Percentil q (pq) Una medida de posición muy útil para describir una

Anuncio
Percentil q (pq)
Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva
podemos decir que es un valor tal que supera un determinado porcentaje de los miembros de la población.
Por ejemplo, considere un curso de cuarenta alumnos que se forma en línea por orden de estatura, primero los
grandes y al final los chicos. Suponga, además, que se considera ‘chico’ a un alumno de la cuarta parte final de esta
línea.
Éste es un concepto relativo a este curso, con toda seguridad variará al referirse a otro. Es fácil aceptar que los
‘chicos’ de octavo básico tienen menor estatura que los ‘chicos’ de cuarto medio.
Como la cuarta parte corresponde al 25% de la población, en el ejemplo que se menciona, los chicos de un curso,
son aquellos cuya estatura no supera el ‘percentil veinticinco’ de la población formada por los alumnos del curso.
Si una variable pudiese asumir muchos valores, la representación de la proporción del total, menor o igual que un
valor, tendría una forma creciente parecida a la siguiente:
Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple
Como puede verse, el valor de la variable bajo el cual se encuentra un 20% de los valores, es algo mayor que 2.
En forma aproximada se podría conocer los percentiles usando este tipo de gráfico.
La descripción intuitiva de ‘percentil’ en una población continua, como la anterior, no es difícil de entender. Sin
embargo, la definición en una muestra de tamaño finito puede resultar más difícil porque, en este caso, los valores
que representan las proporciones acumuladas tienen una representación gráfica en forma de escalera.
Ejemplo.
Considere los siguientes datos de una muestra de tamaño 10.
4 8 11 12 13 16 18 19 21 22
En una muestra de tamaño n, cada dato representa 1 enésimo del total. En este caso, en que hay diez datos, esta
proporción es un décimo. En el gráfico, puede observarse que la gráfica muestra un salto de un décimo (10%) en
cada dato muestral. El primer salto se observa en el número 4,el menor de los datos. Antes del valor 4, la curva
asume el valor cero y a partir de él, un décimo. El segundo salto se produce en 8, a partir del cual la gráfica
comienza a valer dos décimos. Así se producen los saltos hasta alcanzar el valor uno (100%) a partir del último dato
muestral 22.
Si en este ejemplo se decide calcular el percentil 25, se observa que la recta horizontal trazada a la altura del 25%,
cruza la gráfica de escalera justo al llegar al tercer dato ordenado (11), por lo tanto, éste es el valor buscado.
(Nótese que percentiles cercanos, mayores que 20 y menores que 30, tienen el mismo valor 11).
Sin embargo, si se desea calcular un percentil que coincida con una proporción asociada a un dato de la muestra,
se produce una indefinición. Tómese el caso del percentil 20. En este caso la línea horizontal que busca cortar la
gráfica de escalera, coincide justamente con un tramo horizontal de ésta; el que corre a la altura del 20% entre los
datos muestrales 8 y 11. Cualquier valor entre 8 y 11 podría ser considerado como el percentil 20.
Más adelante se usará una convención para encontrar salidas a esta indefinición.
La presentación gráfica hecha anteriormente corresponde a la siguiente definición de percentil:
Definición.
Sea q un número real tal que 0<=q<=100. El percentil q ( pq ). es un valor del recorrido de las observaciones
tal que:
1º. A lo menos q% de las observaciones son menores o iguales que p q.
2º. A lo menos (100-q)% de las observaciones son mayores o iguales que p q.
Para calcular un percentil, no es práctico usar esta definición.
Resulta más conveniente usar la siguiente regla que se deduce de la misma.
Para obtener el percentil q (0<q<100), se ordenan los datos de menor a mayor y se calcula el número
Si
no es entero, el percentil está dado por:
Esto es, el dato cuyo orden es el entero inmediatamente superior a
Si
.
es entero, el percentil cumple la siguiente condición:
Es decir, pq se encuentra entre dos datos de orden consecutivo. El menor es el de orden dado por
mayor es el dato siguiente en la muestra ordenada.
y el
En el caso del ejemplo anterior, el percentil 25 se obtuvo calculando en primer lugar el 25% de 10, dado que éste es
el tamaño n de la muestra. Entonces,
está dado por
. Por lo tanto, el entero inmediatamente
superior es 3. En consecuencia, el percentil 25 es el tercer dato en el orden creciente; es decir 11. Tal como ya se
determinó gráficamente.
Al calcular el percentil 20, tenemos que
, valor entero. Por lo tanto, el percentil 20 es cualquier número
entre el segundo y tercer dato ordenado. Es decir, cualquier número entre 8 y 11.
NOTA.
El cálculo de un percentil de una muestra presenta algunas dificultades por tratarse de un conjunto de datos en que
se producen incrementos de la proporción acumulada en forma de saltos, y no suavemente como en el caso de una
variable continua. Estos saltos representados por un gráfico de escalera son los que producen situaciones
indefinidas en los casos que se indicó anteriormente.
Sin embargo, el uso inicial del gráfico de escalera y alguna ejercitación con la fórmula de cálculo, ayudan a entender
un procedimiento que en un comienzo aparece mucho más difícil.
CÓMO DECIDIR EN EL CASO DE MÚLTIPLES SOLUCIONES PARA UN PERCENTIL.
Como se viO anteriormente, existen situaciones en el cálculo de un percentil muestral en las que todo un intervalo
de números reales cumple con las condiciones de ser el percentil buscado. Esta respuesta no es útil porque
habitualmente se necesita un único valor como resultado.
Para obtener este único resultado hay diversas soluciones. Aquí se usará aquella que calcula un punto de intervalo
entregado por el cálculo anterior usando el mismo porcentaje que define al percentil.
El procedimiento es el siguiente:
1. Se calcula la longitud del intervalo
mediante la diferencia de sus extremos.
2. La longitud calculada anteriormente se multiplica por el porcentaje que define el percentil.
3. El valor obtenido en 2. se suma al límite inferior del intervalo calculado. Este resultado es el percentil buscado.
Ejemplo.
Como se vio en los cálculos precedentes, el percentil 20 del conjunto de datos usado se encuentra entre 8 y 11.
Aplicando el procedimiento recién descrito, calculamos la longitud del intervalo.
Ésta resulta ser 11 - 8 = 3.
A continuación calculamos el 20% de 3 y obtenemos 0.6.
En consecuencia, el percentil 20 para este caso es 8 + 0.6 = 8.6.
Comentario.
No hay sólo un criterio para calcular percentiles muestrales. De hecho, importantes programas de
computación estadística entregan resultados diferentes debido a que usan criterios similares, pero no
iguales. No debe causar sorpresa, entonces, encontrar estas diferencias originadas por la falta de un
procedimiento universalmente aceptado.
Algunos ejemplos de percentiles.
Mediana.
La mediana
es el percentil 50.
Cuartiles.
El primer cuartil
, es el percentil 25.
El tercer cuartil
, es el percentil 75.
Deciles.
El k-ésimo decil, k entero entre 0 y 10, es el percentil 10*k.
Ejemplo.
En la tabla siguiente se presentan treinta datos simulados y ordenados, que permitirán practicar el cálculo de
percentiles muestrales.
Fre cuencias
Gráficas
Polígonos
Centralización
Posición
Dispe rsión
C. v.
8
135
592
678
806
945
58
190
651
717
880
960
65
217
674
730
888
970
119
260
675
738
903
980
129
491
677
741
944
983
C a l c u lo de C ua r t il e s , d e ci le s y per c e n ti le s
C u a r t il e s
Lo s cuartil es so n los tres v alo res de la v ariab le qu e divi de n a un con junto de
datos o rden ados en c uat ro part es i gu ales .
Q1, Q2 y Q3 deter minan lo s va lo res c orresp ond iente s a l 25%, al 50% y al 75%
de los dat os.
Q2 c oinc ide c on la m e diana.
C á l c u l o de l o s c u a r t i l e s
1 Orden amos lo s datos d e m eno r a m ayo r .
2
Buscamos
el
lug ar
.
Número i m par de datos
2, 5, 3, 6, 7, 4, 9
Número par de dat os
que
ocup a
cada
cuartil
med ia nte
la
expresión
2, 5, 3, 4, 6, 7, 1, 9
C á l c u l o d e l o s c u a r t i l e s p a r a da t o s a gr u pa d os
En primer lugar bus ca mo s la clas e donde se encu entra
tabla de l as frecuencias acum uladas .
Ejercicio de cu artiles
Calcu lar los cu artil es de la d istr ib uc ió n de la tab la:
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
, en la
[100, 110)
5
63
[110, 120)
2
65
65
Cálcu lo del prim er cuartil
Cálcu lo del s egun do cu artil
Cálcu lo del tercer cuartil
D e c i le s
Lo s deciles s on lo s nuev e v alo res que div ide n la se rie de dat os en diez partes
igu ales.
Lo s decil es dan los va lor es co rresp ond ient es al 1 0%, al 2 0%... y al 90% de lo s
datos.
D5 co in cid e c on la me di an a.
C á l c u l o de l o s de c i l e s
En primer lugar buscamos la clase donde se encuentra
tabla de la s frec uen cias ac um ula das.
Ejercicio de deciles
Calcu lar los deciles de la d istr ibu ción de la tabla:
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
, en la
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
5
63
[110, 120)
2
65
65
Cálcu lo del prim er decil
Cálcu lo del s egun do decil
Cálcu lo del tercer decil
Cálcu lo del cu arto decil
Cálcu lo del qu into decil
Cálcu lo del s exto decil
Cálcu lo del s éptim o decil
Cálcu lo del octav o decil
Cálcu lo del noveno decil
P e r ce n ti le s
Lo s pe rcent iles so n lo s 99 v alo res que div ide n la serie de datos en 100 part es
igu ales.
Lo s pe rcenti les d an lo s va lore s c orre spo ndientes a l 1%, a l 2 %... y al 9 9% de lo s
datos.
P50 c o inc ide c on la me di ana.
C á l c u l o de l o s pe r c e n ti l e s
En pr imer lug ar b us cam os la c la se d onde se encue ntra
tabla de la s frec uen cias ac um ula das.
, en la
Ejercicio de percentil es
Calcu lar e l perc entil 35 y 60 de la d istr ibu ción de la tab la:
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
5
63
[110, 120)
2
65
65
Percentil 35
Percentil 60
Descargar