Conceptos de población y muestra

Anuncio
Conceptos de población y muestra
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
⇒
INVESTIGACIÓN: estudio de una (al menos) característica de interés.
ATRIBUTO o VARIABLE: la característica de interés.
INDIVIDUO: unidad sobre la cual es posible valorar el atributo.
EXPERIMENTO SIMPLE: observación de la variable en un individuo.
VALORES DE LA VARIABLE: las diferentes observaciones que pueden aparecer al realizar un experimento
simple.
DATOS: las observaciones que se obtienen al realizar en la práctica experimentos simples.
POBLACIÓN: conjunto de individuos en el que estamos interesados. Conjunto de valores de la variable que
resulta de observar TODOS los individuos.
MUESTRA: conjunto de individuos objeto del experimento (a los que se observa la variable). Conjunto de datos
observados.
Ejemplo: antitérmico del Dr. Martí
⇒ INVESTIGACIÓN: estudio de la efectividad del antitérmico.
⇒ ATRIBUTO o VARIABLE: disminución de la temperatura.
⇒ INDIVIDUO: adulto con síntomas gripales.
⇒ EXPERIMENTO SIMPLE: administrar el fármaco y tomar la temperatura.
⇒ VALORES DE LA VARIABLE: cualquier valor posible de la disminución de la temperatura.
⇒ DATOS: Las disminuciones de los 50 individuos observados.
⇒ POBLACIÓN: individuos adultos con síntomas gripales, o disminuciones de temperatura de
individuos adultos con síntomas gripales.
⇒ MUESTRA: los 50 adultos con síntomas gripales o las disminuciones de temperatura de los 50
individuos adultos con síntomas gripales.
Ejemplo
⇒ En una encuesta se le pregunta a 3000 personas: “¿Está de acuerdo con la actual política social del
gobierno? Se publican los resultados como representación de la opinión general.
⇒ INVESTIGACIÓN: estudio de conformidad o no, por parte de los votantes, de la política social del
gobierno.
⇒ ATRIBUTO o VARIABLE: conformidad de los votantes…
⇒ INDIVIDUO: cada votante.
⇒ EXPERIMENTO SIMPLE: preguntar a un individuo.
⇒ VALORES DE LA VARIABLE: totalmente, en la mayor parte, mitad y mitad, sólo en parte, casi en
nada, en absoluto, no sabe no contesta…
⇒ DATOS: Las respuestas realmente obtenidas.
⇒ POBLACIÓN: TODOS los votantes (“posibles”) o las respuestas de TODOS los votantes.
⇒ MUESTRA: las 3000 personas encuestadas o las respuestas de las 3000 personas encuestadas.
Ejemplo
⇒ Control de calidad: en una fábrica de bombillas se producen 10000 unidades diarias. Se examinan
100. Si los resultados no son buenos, se devuelve todo el producto.
⇒ INVESTIGACIÓN: control de la resistencia de un cierto tipo de bombillas (control de calidad).
⇒ ATRIBUTO o VARIABLE: resistencia (en horas) de las bombillas.
⇒ INDIVIDUO: cada bombilla.
⇒ EXPERIMENTO SIMPLE: encender las bombillas y esperar a que se fundan.
⇒ VALORES DE LA VARIABLE: desde las 0 horas hasta…
⇒ DATOS: los valores obtenidos en la prueba.
⇒ POBLACIÓN: TODAS las bombillas producidas ese día, 10000.
⇒ MUESTRA: las 100 seleccionadas para la prueba.
Datos interesantes
⇒ Por sí mismos
⇒ Ejemplo: en la elección de delegado de un grupo, sólo nos interesan los votos de las
personas de ese grupo, los otros grupos no nos interesan para nada.
⇒ Por representar una población ALCANZABLE:
⇒ Ejemplo: queremos saber la opinión sobre la comida de un hospital.
⇒ Población: los 20000 pacientes que están en él a lo largo del año.
⇒ No vamos a preguntarles a TODOS, tomaremos una muestra y les preguntaremos a ellos.
Esperamos que los datos obtenidos representen la opinión de todos los pacientes.
⇒
⇒
⇒
⇒
⇒ Por representar una población inalcanzable
⇒ Ejemplo: queremos saber el efecto de una droga sobre una cierta clase de ratones.
⇒ Obviamente no podemos administrar la droga a todos los ratones  tomaremos una
muestra.
POBLACIÓN: aquello en lo que estamos interesados.
MUESTRA: lo que usamos para aprender sobre la población.
Estamos acostumbrados a generalizar a partir de muestras en nuestra vida cotidiana pero, sin embargo, hacer
esto siempre entraña un riesgo. La ESTADÍSTICA intenta conseguir que este riesgo sea mínimo.
INFERENCIA ESTADÍSTICA: es el “arte” de utilizar las muestras para extraer conclusiones sobre las
poblaciones con una cierta fiabilidad.
¿Es representativa la muestra?
⇒ Un paso inicial en una investigación estadística es definir claramente la población que va a ser estudiada:
⇒ Población objetivo: grupo que pretendemos estudiar.
⇒ Población muestreada: grupo del que realmente extraemos la muestra.
⇒ Una importante parte del éxito de un estudio estadístico radica en conseguir que la población objetivo
coincida lo máximo posible con la muestreada, esto corresponde al diseño estadístico.
⇒ Ejemplo: incidencia de la hepatitis B en los años 80 en la comunidad Valenciana.
⇒ Población objetivo: personas de la CV que tuvieron la hepatitis B entre 1980 y 1989.
⇒ Población muestreada: la misma.
⇒ Ejemplo: eficacia del fármaco A, totalmente nuevo, en enfermos de SIDA.
⇒ Población objetivo: enfermos de SIDA.
⇒ Población muestreada: monos enfermos de SIDA.
Población objetivo
Población muestreada
⇒ Ejemplo: eficacia del fármaco A en enfermos de SIDA.
⇒ Población objetivo: enfermos de SIDA.
⇒ Población muestreada: enfermos de SIDA en USA.
Población objetivo
Población muestreada
⇒ Algunas veces, después de haber hecho un estudio, uno se plantea a qué población pueden aplicarse
razonablemente los resultados inferidos de una cierta muestra.
⇒ Después de identificar la población que hemos de estudiar tenemos que extraer de ella una muestra de un
modo razonable  se utiliza el muestreo aleatorio (“SORTEO”)
⇒ Necesitamos “buenas” muestras (representativas de la población), pero ¿cómo podemos obtenerlas?
⇒ No son útiles todas las muestras, por ejemplo: voluntarios, disponibles… pueden conducir a conclusiones
erróneas (ya que suelen ser “diferentes” a los que no lo son por alguna causa que puede influir a la hora de
sacar conclusiones.
⇒ Voluntarios: se desea saber el grado de consumo de drogas en un instituto. Si se realizan las
pruebas a los VOLUNTARIOS el resultado será CONSUMO = 0.
⇒ Individuos disponibles: sondeos pre-electorales para la presidencia de USA en 1936: Landon,
Roosevelt. Una revista americana envió 10 millones de papeletas a propietarios de automóviles,
abonados de teléfonos… contestaron 2 millones y el resultado era claramente a favor de Landon. El
ganador fue Roosevelt debido a la influencia del estatus socioeconómico de los encuestados.
⇒ Este ejemplo sirve también para poner de manifiesto que
⇒ La representatividad de la muestra no se consigue con el tamaño (grande); una muestra grande puede no
ser representativa.
Muestreo aleatorio y representatividad de la muestra
⇒ El muestreo aleatorio es un procedimiento de selección de los elementos que constituyen la muestra que trata
de garantizar su representatividad.
⇒ Procedimiento de muestreo: método de obtención de las muestras de una población.
⇒ Procedimiento de muestreo aleatorio: podemos imaginarlo como un sorteo en el cual:
⇒ Todos los individuos de la población tienen la misma probabilidad de ser elegidos.
⇒ Las posibilidades de cada individuo de ser seleccionado no dependen de cuáles son los individuos
seleccionados en la misma muestra.
⇒ Observamos el valor de la variable para todos estos individuos y obtenemos una muestra aleatoria.
⇒ MUESTRA ALEATORIA: muestra obtenida mediante muestreo aleatorio.
⇒ MUESTREO ALEATORIO SIN REEMPLAZAMIENTO: en cada etapa, el elemento seleccionado es eliminado
definitivamente de la población y no vuelve a participar en las siguientes etapas del muestreo.
⇒ MUESTREO ALEATORIO CON REEMPLAZAMIENTO: en cada etapa, el elemento seleccionado no se elimina
de la población y participa de nuevo en la siguiente etapa; un individuo de la población puede entrar varias
veces en la muestra.
⇒ El muestreo con reemplazamiento permite simular una población infinita (o muy grande) a parit r de una
población con M individuos (M <<<<< ∞)
⇒ Ejemplo: encuesta en un centro hospitalario con intención de saber la opinión:
⇒ En una semana determinada  sin reemplazamiento
⇒ A lo largo de un año  con reemplazamiento
⇒ Así nos aproximamos a los casos interesantes en los que N <<<< M.
⇒ N = tamaño de la muestra; M = tamaño de la población.
⇒ Ejemplo:
⇒ X = variable con posibles valores 0 y 1
0
1
M=2
01
00
M=4
01
01
01
M=6
⇒ En las tres poblaciones finitas tenemos 50% de 0 y 50% de 1.
⇒ Tomamos M = 2 y queremos una muestra de tamaño N = 2
⇒ Seleccionamos uno al azar: sale el 0
⇒ Seleccionamos el 2º al azar
⇒ Sin reemplazamiento  obligatoriamente el 1
⇒ Con reemplazamiento  puede salir 0 ó 1
⇒ Muestras posibles
⇒ Sin reemplazamiento  {0,1}
⇒ Con reemplazamiento  {0,0}, {1,1}, {0,1}
⇒ Con M = 2 y con reemplazamiento podemos obtener muestras de tamaño N = 5 > M
Extracción de una muestra aleatoria mediante tablas de dígitos aleatorios
⇒ Numerar la población de 1 a M
⇒ Decidir el tamaño de la muestra N (N < M)
⇒ En la tabla de dígitos aleatorios,
⇒ Elegimos cualquier dígito de la tabla como punto de partida
⇒ Elegimos cualquier dirección
⇒ Consideramos N números (válidos) de tantos dígitos como los que tiene M (de esta modo permitimos
que pueda salir cualquier individuo de la población).
⇒ Así:
⇒ Si M ≤ 9, tomamos N números con un dígito
⇒ Si 10 ≤ M ≤ 99, tomamos N números con dos dígitos.
⇒ Sólo sirven (válidos) los números observados entre 1 y M.
⇒ Si se trata de muestreo con reemplazamiento admitimos repeticiones.
⇒ Buscamos los valores de la variable correspondientes a los individuos de la población con los números
elegidos.
⇒ Los números que aparecen en la tabla están agrupados para leerlos mejor, pero no son números de 2 cifras. La
primera fila es: 53180213818824358611488586636… Son números generados al azar:
⇒ Ejemplo. M = 850; N = 10
⇒ Empezamos con el primer dígito y en el sentido de la lectura:
533, 180, 213, 818, 824, 358, 611, 488, 586, 636
⇒ Ejemplo. M = 500; N = 10
⇒ Empezamos con el primer dígito y en el sentido de la lectura:
533, 180, 213, 818, 824, 358, 611, 488, 586, 636, 431, 054, 957, 032, 036, 099, 430
⇒ Ejemplo. M = 100; N = 10
⇒ Empezamos con el primer dígito y en el sentido de la lectura:
533, 180, 213, 818, 824, 358, 611, 488, 586, 636, 431, 054, 957, 032, 036, 099, 430, 763, 204, 026, 005, 138…
⇒ Ejemplo
⇒ M = número de alumnos en clase = 84
⇒ N = 10
⇒ Estudio:
⇒ % mujeres y hombres
⇒ % alumnos con gafas
⇒ % alumnos con lentillas
⇒ Muestreo aleatorio:
⇒ 53, 31, 80, 21, 38, 18, 82, 43, 58, 61
⇒ Representación de los datos en una tabla:
Número
53
31
80
21
38
18
82
43
58
61
Sexo
M
M
M
M
M
M
M
M
H
H
⇒ Resultados
⇒ Sexo:
⇒ 80% mujeres
⇒ 20% hombres
⇒ Gafas: 20%
⇒ Lentillas: 10%
⇒ Nada: 50%
⇒ No en estos momentos: 20%
¿Gafas?
NO
NO
NO
NO
SI
NO
SI
NO
NO
NO
¿Lentillas?
NO
NO
NO
SI
NO
NO
NO
NO*
NO
NO*
* No en estos momentos
Descargar