INFERENCIA ESTADÍSTICA

Anuncio
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Unidad 1: Estadística Descriptiva
La estadística es entendida como un conjunto de técnicas que nos permiten, por un lado,
recoger, representar, clasificar, resumir datos de un colectivo (Estadística descriptiva). Por
otro lado, nos permiten obtener conclusiones a partir de esos datos (Estadística inferencial).
El análisis descriptivo, constituye el primer nivel de análisis, y sus funciones son las de
establecer cuál es la forma de distribución de una, dos o tres variables en el ámbito global del
colectivo, cuántas unidades se distribuyen en categorías naturales o construidas de esas
variables, cuál es la magnitud de ella expresada en forma de una síntesis de valores, cuál es
la dispersión con que se da entre las unidades del conjunto, etc.
La estadística descriptiva se encarga de las muestras.
Las muestras provienen de poblaciones, sin embargo, el objetivo de la estadística descriptiva
no son las poblaciones. La estadística descriptiva no afirma ni niega nada en relación a las
poblaciones de origen, ni sobre los fenómenos generales.
Las distribuciones de datos son el resultado de la recogida de información en los
experimentos. Las distribuciones de datos organizan por medio de variables. La estadística
descriptiva se encarga de cuantificar características de las variables asociadas a las
muestras.
Antes de proseguir daremos algunas definiciones de conceptos.
Individuos o elementos: personas u objetos que contienen cierta información que se desea
estudiar.
Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.
En relación al tamaño de la población, ésta puede ser:
• Finita,
• Infinita,
Muestra: subconjunto representativo de una población, esto significa que la muestra debe
ser como un modelo a escala de la población, es decir, debería verse reflejada la
diversidad de rasgos presente en la población.
Parámetro: función definida sobre los valores numéricos de características medibles de
una población.
Estadístico: función definida sobre los valores numéricos de una muestra.
Caracteres: propiedades, rasgos o cualidades de los elementos de la población. Estos
caracteres pueden dividirse en cualitativos y cuantitativos.
Modalidades: diferentes situaciones posibles de un carácter. Las modalidades deben ser a
la vez exhaustivas y mutuamente excluyentes (cada elemento posee una y sólo una de las
modalidades posibles).
Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad
pertenece a una y sólo una de las clases.
1
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
TIPOS DE VARIABLES
Cuando hablemos de variable hacemos referencia a un símbolo (X, Y, X1, X2, .. ,) que
puede tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos
dominio de la variable. En función del tipo de dominio, las variables las clasificamos del
siguiente modo:
Variables cualitativas o no métricas, son las que tienen por modalidades cantidades no
numéricas, por lo que no podemos hacer operaciones aritméticas con ellas. Dentro de este
tipo de variables podemos distinguir escalas de medidas:
Escala Nominal, en este caso los valores asignados a cada característica se comportan
como etiquetas. Por ejemplo, Lugar de nacimiento (Talcahuano, Concepción, Chillán, etc),
Bebida favorita (Fanta, Sprite, Coca cola, etc).
Las variables medidas en escala nominal no admiten puntuaciones numéricas ordenadas
significativamente, aunque para efectos principalmente de procesos computacionales
asignamos números a estas categorías.
Por ejemplo, si medimos el genero de una persona, podemos asignar 1 al valor hombre y 2
al valor mujer. Esto no significa la mujer sea mayor que el hombre (2>1) ni el doble (2=2x1)
como tampoco que existan personas intermedias (1,5).
Una exigencia básica de las escalas nominales es que los objetos han de poder clasificarse
en categorías que sean mutuamente excluyentes y exhaustivas, es decir, un objeto debe
poder asignarse a una y sólo una categoría, y todos los elementos han de poder
clasificarse en las categorías existentes.
Ordinales, son las que, aunque sus modalidades son de tipo nominal, es posible
establecer un orden entre ellas. Ejemplo, clase social (indigente, baja, media y alta).
La variable “actitud hacia el aborto legal” podría ordenar el grado de acuerdo mediante el
uso de categorías de respuestas; totalmente de acuerdo, de acuerdo, no sabe, en
desacuerdo, totalmente en desacuerdo. Este conjunto de valores ampliamente utilizado
se denomina escala de Likert.
Aquí también podemos usar número para indicar los valores de las categorías, sin
embargo estos tienen el sentido de distinguir y ordenar, pero no las diferencias ni las
razones.
Variables cuantitativas, son las que tienen por modalidades cantidades numéricas con
las que podemos hacer operaciones aritméticas. Dentro de este tipo de variables
podemos distinguir dos grupos:
Variables Discretas, sólo pueden tomar un número un número determinado de valores
en un intervalo determinado. En general, las variables discretas se asocian a variables
que indiquen un conteo.
Variables Continuas, pueden tomar un número infinito de valores en un intervalo dado.
Por otra parte las variables cuantitativas se clasifican en dos grupos de acuerdo a su escala
de medición; de Intervalo y de Razón.
2
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Una escala de intervalo posee las característica de una nominal (diferentes valores
representan diferentes características de los objetos) y de la ordinal (mayor valor representa
mayor presencia de la característica). Sin embargo, la escala de intervalo, añade una nueva
propiedad; la diferencia también tiene sentido.
Las variables de intervalo identifican las diferencias en monto, cantidad, grado o distancia.
Las variables de intervalo dan sentido de “cuánto” o “de que tamaño”, qué tan caliente, que
tan obstinado, qué tan conservador, que tan deprimido, que tan largo, que tan pesado.
Una de las características de las escalas de intervalo es que, el cero es arbitrario, es decir,
no es absoluto.
En estas escalas no tienen sentido las razones, por ejemplo, si medimos la temperatura en
grados celsius y un objeto mide 20°C y otro 10°C podemos decir que uno tiene el doble de
temperatura que otro, pero si estas mismas temperaturas las medimos en grados Fahrenheit
no es cierto ya que 20°C ⇔ 68°F y 10°C ⇔ 50°F, en el que obviamente 68°F no es doble
de 50°F.
Una escala de razón tiene las mismas propiedades de las escalas de intervalos pero,
además, las razones si tienen sentido. Estas escalas tienen un valor base cero natural.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
A fin de fijar ideas comenzaremos con un ejercicio:
Ejercicio: El jefe de producción de una compañía dedicada a la fabricación de alfombras con
más de 500 telares, tiene que medir la producción diaria (en metros) de cada telar. El
consciente de lo tedioso del problema registra la producción diaria de sólo 30 telares a fin de
llegar a una conclusión sobre su problema. A continuación se muestran los datos obtenidos
de medir los 30 telares:
16.2
15.7
16.4
15.4
16.4
15.8
16.0
15.2
15.7
16.6
15.8
16.2
15.9
15.9
15.6
15.8
16.1
15.9
16.0
15.6
16.3
16.8
15.9
16.3
16.9
15.6
16.0
16.8
16.0
16.3
Observe el conjunto de datos, ¿qué puede indicar?.
Los datos presentados son conocidos como información cruda y no como conocimientos en
sí. La secuencia que va desde los datos hasta el conocimiento es:
Datos Æ
Información Æ
Hechos Æ Conocimiento
Los datos se convierten en información, cuando se hacen relevantes para la toma de
decisión a un problema. La información se convierte en hecho, cuando es respaldada por
los datos. Los hechos son lo que los datos revelan. Sin embargo el conocimiento
instrumental es expresado junto con un cierto grado estadístico de confianza.
3
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Un primer paso en el estudio es determinar la variable de medición, que tipo de variables es,
en qué escala está medida y en que objeto (unidad experimental) estamos efectuando la
medición. La identificación de estos elementos nos indicará por una parte que pasos
debemos seguir y por otra nos ayudará en la interpretación de nuestros resultados.
En nuestro ejemplo, la variable de medición es la producción diaria, variable continua,
medida en escala de razón.
Cuando se examina la distribución de los datos, debemos buscar algunas características
importantes, tales como forma, ubicación, variabilidad, y valores inusuales.
Transformar los datos en información implica realizar procesos que ayuden a la toma de
decisiones. Un primer paso es conocer las características más importantes de la variable en
estudio como por ejemplo, la distribución de los datos, la forma, ubicación, variabilidad,
valores inusuales, etc.
Un primer paso, tal vez, es ordenar los datos en orden ascendente, así
15.2
15.7
15.9
16.0
16.2
16.4
15.4
15.7
15.9
16.0
16.3
16.6
15.6
15.8
15.9
16.0
16.3
16.8
15.6
15.8
15.9
16.1
16.3
16.8
15.6
15.8
16.0
16.2
16.4
16.9
¿Qué se observa ahora?
A pesar de las ventajas que muestra el ordenamiento de los datos este en si no resulta útil
puesto que da una lista de todos los valores, lo cual es una forma incómoda de mostrar
grandes cantidades de datos. Necesitamos comprimir aún más la información y ser capaces
de utilizarla para su interpretación y para la toma de decisiones.
Una forma de comprimir los datos es la tabla de distribución de frecuencias que
corresponde a una lista de clases o categorías de datos junto con el número de valores que
caen dentro de cada una.
Tabla de distribución de frecuencias para variables continuas:
No existe una regla fija para determinar el número apropiado de clases para una
distribución de frecuencias, pero en general estas deben ser entre 5 y 20. Dos reglas
bastante usadas para determinar el número aproximado k de clases son:
i)
Determinar el número k (k ∈ Ζ +) de clases tal que 2 k > n.
ii)
Determinar el número k (k ∈ Ζ +) de clases tal que k ≈ 1+3,3log10n
(regla de Sturge)
donde n representa el total de observaciones.
El número de clases debe ser un entero positivo, luego, como regla practica, toda vez que el
valor de K no resulte entero este será aproximado al entero siguiente independiente del
decimal resultante.
4
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Una vez fijado el número de clases se deben construir las clases, ojalá de igual amplitud para
facilitar su interpretación.
Las clases corresponden a intervalos cerrados de la forma [a , b] donde a es llamado limite
inferior de la clase y b el limite superior. Se debe tener en cuenta que las clases deben ser
inclusivas y mutuamente excluyentes, es decir, por una parte deben incluir todos los valores
del conjunto de datos y por otra, un dato debe pertenecer claramente a una y sólo una clase.
Calculo de la amplitud, A.
Rango
A=
k
donde Rango = valor máximo – valor mínimo
k : número de clases
Como criterio y como una forma de facilitar la interpretación, la amplitud deberá presentarse
con la misma cantidad de decimales que los datos originales por lo tanto está debe
aproximarse hacia arriba de acuerdo al formato de los datos.
Para escribir las clases, un criterio es comenzar a anotar los limites inferiores de cada clase,
correspondiendo al limite inferior de la primera clase el valor mínimo luego a este sumamos
la amplitud y obtenemos el limite inferior de la segunda clase y por sumas sucesivas de la
amplitud al valor obtenido vamos obteniendo los restantes limites inferiores de las clases
siguientes.
Para escribir los limites superiores de cada clase se procede de la siguiente forma:
El limite superior de la primera clase corresponde al valor del limite inferior de la segunda
clase menos una unidad de paso (up), donde
 1 si los datos son enteros
 0,1 si los datos tienen un decimal

up =  0,01 si los datos tienen dos decimales


 y así sucesivamente
Una vez escrita las k clases, llamadas también intervalos de clases o limites aparentes,
debemos contar cuantos datos pertenecen a cada clase, a estos valores los llamaremos
frecuencia absoluta de la clase y lo denotaremos por ni (frecuencia absoluta de la clase i).
De nuestro ejemplo tenemos:
n= 30
k= 1 + 3,3 log1030=5,87 ≈ 6
A=
16,9 − 15,2
=0,283 ≈ 0,3 (los datos se presentan con un decimal)
6
5
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Así la tabla de distribución de frecuencias es:
Intervalos de clase
15,2
15,5
15,8
16,1
16,4
16,7
-
frecuencia
absoluta
2
5
11
6
3
3
15,4
15,7
16,0
16,3
16,6
16,9
Observe la tabla de distribución de frecuencias ¿qué puede comentar ahora?.
Trabajar con cifras absolutas no da una idea de la real dimensión respecto de la importancia
del dato, de aquí, que se acostumbra a agregar a la tabla de distribución de frecuencias una
columna con las frecuencias relativas fi. Adicionalmente, también se agregan las columnas
con las frecuencias absolutas acumuladas Ni, frecuencias relativas acumuladas Fi y las
marcas de clases mi, donde:
fi =
ni
n
i
Ni = ∑ n j
Fi =
j =1
Ni
=
n
i
∑f
j =1
j
mi =
lim . inf i + lim.sup i
2
Con estas nuevas columnas las tabla de distribución de frecuencias anterior queda:
Intervalos
clase
15,2
15,5
15,8
16,1
16,4
16,7
-
15,4
15,7
16,0
16,3
16,6
16,9
de
frecuenc
ia
absoluta
ni
2
5
11
6
3
3
Frecuencia
relativa
Frecuencia
absoluta acum.
Frecuencia
relativa acum.
Marca de
clases
fi
Ni
Fi
mi
0,067
0,167
0,367
0,200
0,100
0,100
2
7
18
24
27
30
0,067
0,234
0,601
0,801
0,901
1,000
15,3
15,6
15,9
16,2
16,5
16,8
Comente e interprete algunos valores.
6
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Tabla de distribución de frecuencias para variables cualitativas.
Cuando se trate de variables cualitativas, las clases serán naturales, correspondiendo cada
modalidad de la variable a una clase.
Ejemplo. En una encuesta realizada a un grupo de empleados de una empresa se les
solicitó que marcaran una actividad de mayor preferencia, para realizar el día viernes,
después de terminar su jornada laboral.
Las opciones eran:
1.- Salir a bailar
2.- Hacer deporte
3.- Jugar juego de salón.
4.- Ir al cine
5.- Ir a casa a descansar
6.- Otro no especificado
Las respuestas de esta encuesta fueron las siguientes:
2 2 3 6 5 2 6 1 3 2 2 1 1 1 5
2 1 3 5 2 3 5 2 3 2 1 2 1 1 2
4
5
5
6
6
3
2
4
3
6
Escriba la tabla de distribución de frecuencias.
Ya tenemos claro que la variable de estudio es cualitativa, si embargo aún nos faltan algunas
preguntas que responder: ¿en que escala está medida?, ¿cuál es la unidad experimental?
Respondida estas preguntas estamos en condiciones de escribir la tabla de distribución de
frecuencias.
Clases
Salir a bailar
Hacer deportes
Jugar juego de salón
Ir al cine
Ir a casa a descansar
Otro no especificado
Total
frecuencia absoluta
8
12
7
2
6
5
40
Observe la tabla de distribución de frecuencias y comente.
7
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Tabla de distribución de frecuencias para variables discretas.
Para agrupar los datos de una variable discreta se recomienda en primer término contar el
número de valores diferentes de la variable. Si este es menor o igual a 10, la variable es
tratada como una variable cualitativa, en caso contrario es tratada como variable continua.
Ejemplo: En un centro de computación se registra el número de veces que un computador se
detiene por errores de hardware. Durante un periodo de 63 días se obtuvieron los siguientes
datos:
5
1
0
2
0
7
3
2
2
5
1
0
0
0
1
0
0
0
0
0
0
4
1
1
3
3
0
2
0
6
1
2
0
2
0
0
0
0
1
1
3
0
6
1
2
4
2
0
3
2
0
3
0
4
1
0
4
4
0
2
0
1
2
Escriba la tabla de distribución de frecuencias. Comente e interprete algunos valores.
A continuación se proporcionan dos ejercicios para su desarrollo.
Ejercicio 1: Rob Whitner, propietario de Whitner Pontiac, está interesado en reunir
información sobre los precios de ventas de los vehúlos vendidos en su agencia. Los datos
que se muestran a continuación corresponden al precio pagado por 80 clientes para cada
vehículo. Ayude Ud. a Rob Whitner.
20.197
16.587
15.8
15.9
15.10
15.11
26.760
15.8
20.372
20.169
16.873
16.688
18.981
18.722
29.492
27.655
17.454
32.851
22.251
20.657
21.052
16.331
15.890
19.442
20.591
16.251
22.277
23.613
22.799
19.817
18.740
14.891
23.651
17.047
25.034
17.895
12.794
16.766
19.374
17.818
24.453
21.285
21.533
17.203
15.263
17.633
21.571
23.237
14.266
21.324
24.443
20.765
33.625
17.962
22.449
17.445
15.021
21.609
16.889
22.783
14.399
19.845
25.337
18.556
25.683
25.670
17.004
23.661
14.968
23.285
17.642
18.639
27.872
12.546
14.357
29.277
17.356
24.896
20.613
21.296
Ejercicio 2: Los siguientes registros corresponden 80 determinaciones de la emisión diarias
(en toneladas) de óxidos de azufre de una planta industrial.
15.826.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2 22.7 9.8 6.2 14.7
17.5 26.1 12.8 28.6 17.6 23.7 26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4
16.7 10.7 19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0 18.5 23.0
24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5 14.4 29.6 19.4 17.0 20.8 24.3
22.5 15.9 24.6 18.4 18.1 8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7
31.8 25.9 10.5 27.5 18.1 17.9 9.4 24.1 20.1 28.5
8
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Representación Gráfica
Para transmitir un sentido de proporción se describe numéricamente la distribución de una
variable de manera porcentual. Las distribuciones numéricas, sin embargo, tienen sentido
sólo si una persona tiende a pensar de manera proporcional. Por consiguiente a menudo nos
valemos de recursos gráficos para motivar directamente el sentido proporcional. Los gráficos
constituyen un excelente soporte al célebre refrán “Una imagen dice más que mil palabras”.
La gráfica a realizar depende del tipo de variable:
Gráficos para variables continuas.
Los gráficos más utilizados en este tipo de variable son el histograma, el polígono de
frecuencias y la ojiva.
El histograma es un conjunto de barras rectangulares, de ancho igual a la amplitud y de
altura igual a la frecuencia absoluta o relativa.
Para dibujar el histograma en el eje de las abscisas ubicamos los limites reales y en el eje de
las ordenadas la frecuencia.
Para obtener los limites reales procedemos de la siguiente forma:
1
1
up
lim. real sup.j = lim. sup.j + up
2
2
Del ejemplo de las emisiones de azufre el histograma queda:
lim. real infj = lim. inf.j -
j = 1, ....,n
Distrib u ció n d e las em isio n es d iarias
20
18
16
N º de días
14
12
10
8
6
4
2
0
6,15
9,45
12,75
16,05
19 ,35
22 ,65
25 ,9 5
29 ,25
32 ,55
E misiones diarias (en toneladas)
El Polígono de frecuencias es un gráfico que muestra un perfil más suavizado de la forma
de la distribución de la variable. Para dibujar el polígono de frecuencias ubicamos en el eje
de las abscisas las marcas de clases y en el eje de las ordenadas la frecuencia absoluta o la
frecuencia relativa, luego mediante trazos rectos unimos dichos puntos. Esta gráfica se
muestra como una curva cerrada, luego bajamos un trazo a ambos extremos de la curva.
El polígono de frecuencias se puede dibujar de manera independiente o junto al histograma.
9
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
D ist rib ución de las em isiones de a z ufre
0 .23
0 .23
0 .17
0 .17
fre cuen ci a relativa
frec uenc ia relativa
D istrib ución de las em isio nes de a zufre
0 .11
0 .06
0 .00
0 .11
0 .06
0 .00
E m is io n (en toneladas )
E m is io n (en tone ladas )
La Ojiva es una gráfica en que se representan las frecuencias acumuladas y se usa para
determinar cuántas observaciones hay mayores o menores que un valor determinado en una
distribución. Para dibujar la ojiva, en el eje de las abscisas se ubican los limites reales de
cada clases y en el eje de las ordenadas las frecuencias relativas acumuladas. Cada punto
de la gráfica es unido mediante una curva suavizada.
O jiva, ejem plo em isión de a zufre
Fi
1
0.8
0.6
0.4
0.2
0
6.15
9.45
12.75
16 .0 5
19.35
22.65
25 .9 5
2 9.25
32.55
Em i si on e s d e a z ufre (tone l a d a s)
Ojiva, ejemp lo emisión de azufre
Ojiva, eje mp lo em isión de azu fre
Fi
Fi
1
1
0. 8
0 .8
0. 6
0 .6
0. 4
0 .4
0. 2
0
9.45
12.75
16 .05
5 9,0%
0 .2
55,1 %
6 .1 5
1 0,3%
19.35
22 .65
25 .9 5
Em isione s de a zu fr e (tone la d a s)
29.25
32.55
3 0,7%
0
6.15
9.45
1 2.7 5
16.05
1 9.3 5
22.65
25.95
2 9.2 5
3 2.55
Em ision e s de a z u fre (tone lad a s)
10
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Gráficos para variables cualitativas
Los gráficos más utilizados en este tipo de variable son el gráfico de barras, el gráfico de
torta o pastel y el pictograma.
El gráfico de barras es un conjunto de rectángulos de ancho arbitrario (pero único) y de
altura igual a la frecuencia absoluta o relativa. En el eje de las abscisas ubicamos cada
categoría de la variable y en el eje de las ordenadas la frecuencia.
Ejemplo: En una consulta a personas de 50 años o más acerca de una pregunta “¿a cuántos
minutos de recorrido en auto considera Ud. que debe estar el hospital más cercano a su casa
cuando se jubile?, se obtuvo el siguiente gráfico de barras.
D is trib uc ió n d e lo s min u to s en a uto
160
Nº de p erso na s
140
120
100
80
150
60
128
94
40
67
47
20
0
5 m inu to s o
6 a 10
11 a 15
16 a 20
m ás d e 20
m e nos
m inu to s
m inu to s
m inu to s
m inu to s
Gráfico de torta o de pastel, es una forma efectiva de desplegar los porcentajes en que se
dividen los datos. Este tipo de gráfico es particularmente útil cuando se quiere hacer hincapié
en los tamaños relativos de las componentes de los datos.
Para determinar la porción del pastel que corresponde representar de una categoría
determinada se usa la expresión:
x 0 = 360
ni
= 360 f i
n
Del ejemplo anterior el gráfico de torta es:
D istribució n de los minutos en auto
19%
10%
5 m inutos o m enos
6 a 10 minutos
31%
14%
11 a 15 m inutos
16 a 20 m inutos
26%
más de 2 0 m inutos
11
Apunte preparado por el profesor Sr. Rosamel Sáez Espinoza con fines de docencia
Pictogramas: Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. Generalmente estos dibujos se hacen representado a diferentes
escalas un mismo dibujo.
Producción de carne de conejo por criadero
40 kg.
C riadero A
70 kg.
C riadero B
110 kg.
C riadero C
Gráficos para variables discretas
Para representar las variables discretas debemos tomar en cuenta lo mencionado
anteriormente, es decir, primero contar el número de valores diferentes de la variable. Si este
es menor o igual a 10 la variable es tratada como una variable cualitativa, en caso contrario
es tratada como variable continua.
Estadísticos descriptivos o Estadígrafos
Anteriormente ya resumimos un conjunto de datos en un grupo de clases a fin de estudiar su
comportamiento, posteriormente representamos dicha información gráficamente.
Ahora veremos algunas medidas que resumen la información en un único valor, tales
medidas se clasifican en tres categorías: Las medidas de tendencia central, las de variación
y las de posición relativa.
Antes de dar las definiciones describiremos la notación a ser usada.
Una observación cualquiera de un conjunto de datos es descrita mediante la notación xi,
mientras que un conjunto de n observaciones será descrito por la notación x1,x2,...,xn. Las
observaciones descritas por estas notaciones corresponden a los datos en bruto, no siguen
ningún orden sino que aparecen tal como han sido registradas. Si el conjunto de datos
anterior, procedemos a ordenarlo en forma ascendente entonces usaremos por notación x(1),
x(2),...,x(n), donde se cumple que x(1) ≤ x(2) ≤ ... ≤ x(n). El número entre paréntesis indica la
posición del número dentro del conjunto de datos ordenados.
Medidas de tendencia central
Son medidas que describen el centro de un conjunto de datos,es decir, medidas de ubicación
que dan la información sobre el lugar hacia donde existe la tendencia central dentro de un
grupo de números. Las tres medidas de tendencia central más comunes son la media o
promedio, la mediana y la moda.
12
Descargar