Conceptos de población y muestra ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ ⇒ INVESTIGACIÓN: estudio de una (al menos) característica de interés. ATRIBUTO o VARIABLE: la característica de interés. INDIVIDUO: unidad sobre la cual es posible valorar el atributo. EXPERIMENTO SIMPLE: observación de la variable en un individuo. VALORES DE LA VARIABLE: las diferentes observaciones que pueden aparecer al realizar un experimento simple. DATOS: las observaciones que se obtienen al realizar en la práctica experimentos simples. POBLACIÓN: conjunto de individuos en el que estamos interesados. Conjunto de valores de la variable que resulta de observar TODOS los individuos. MUESTRA: conjunto de individuos objeto del experimento (a los que se observa la variable). Conjunto de datos observados. Ejemplo: antitérmico del Dr. Martí ⇒ INVESTIGACIÓN: estudio de la efectividad del antitérmico. ⇒ ATRIBUTO o VARIABLE: disminución de la temperatura. ⇒ INDIVIDUO: adulto con síntomas gripales. ⇒ EXPERIMENTO SIMPLE: administrar el fármaco y tomar la temperatura. ⇒ VALORES DE LA VARIABLE: cualquier valor posible de la disminución de la temperatura. ⇒ DATOS: Las disminuciones de los 50 individuos observados. ⇒ POBLACIÓN: individuos adultos con síntomas gripales, o disminuciones de temperatura de individuos adultos con síntomas gripales. ⇒ MUESTRA: los 50 adultos con síntomas gripales o las disminuciones de temperatura de los 50 individuos adultos con síntomas gripales. Ejemplo ⇒ En una encuesta se le pregunta a 3000 personas: “¿Está de acuerdo con la actual política social del gobierno? Se publican los resultados como representación de la opinión general. ⇒ INVESTIGACIÓN: estudio de conformidad o no, por parte de los votantes, de la política social del gobierno. ⇒ ATRIBUTO o VARIABLE: conformidad de los votantes… ⇒ INDIVIDUO: cada votante. ⇒ EXPERIMENTO SIMPLE: preguntar a un individuo. ⇒ VALORES DE LA VARIABLE: totalmente, en la mayor parte, mitad y mitad, sólo en parte, casi en nada, en absoluto, no sabe no contesta… ⇒ DATOS: Las respuestas realmente obtenidas. ⇒ POBLACIÓN: TODOS los votantes (“posibles”) o las respuestas de TODOS los votantes. ⇒ MUESTRA: las 3000 personas encuestadas o las respuestas de las 3000 personas encuestadas. Ejemplo ⇒ Control de calidad: en una fábrica de bombillas se producen 10000 unidades diarias. Se examinan 100. Si los resultados no son buenos, se devuelve todo el producto. ⇒ INVESTIGACIÓN: control de la resistencia de un cierto tipo de bombillas (control de calidad). ⇒ ATRIBUTO o VARIABLE: resistencia (en horas) de las bombillas. ⇒ INDIVIDUO: cada bombilla. ⇒ EXPERIMENTO SIMPLE: encender las bombillas y esperar a que se fundan. ⇒ VALORES DE LA VARIABLE: desde las 0 horas hasta… ⇒ DATOS: los valores obtenidos en la prueba. ⇒ POBLACIÓN: TODAS las bombillas producidas ese día, 10000. ⇒ MUESTRA: las 100 seleccionadas para la prueba. Datos interesantes ⇒ Por sí mismos ⇒ Ejemplo: en la elección de delegado de un grupo, sólo nos interesan los votos de las personas de ese grupo, los otros grupos no nos interesan para nada. ⇒ Por representar una población ALCANZABLE: ⇒ Ejemplo: queremos saber la opinión sobre la comida de un hospital. ⇒ Población: los 20000 pacientes que están en él a lo largo del año. ⇒ No vamos a preguntarles a TODOS, tomaremos una muestra y les preguntaremos a ellos. Esperamos que los datos obtenidos representen la opinión de todos los pacientes. ⇒ ⇒ ⇒ ⇒ ⇒ Por representar una población inalcanzable ⇒ Ejemplo: queremos saber el efecto de una droga sobre una cierta clase de ratones. ⇒ Obviamente no podemos administrar la droga a todos los ratones tomaremos una muestra. POBLACIÓN: aquello en lo que estamos interesados. MUESTRA: lo que usamos para aprender sobre la población. Estamos acostumbrados a generalizar a partir de muestras en nuestra vida cotidiana pero, sin embargo, hacer esto siempre entraña un riesgo. La ESTADÍSTICA intenta conseguir que este riesgo sea mínimo. INFERENCIA ESTADÍSTICA: es el “arte” de utilizar las muestras para extraer conclusiones sobre las poblaciones con una cierta fiabilidad. ¿Es representativa la muestra? ⇒ Un paso inicial en una investigación estadística es definir claramente la población que va a ser estudiada: ⇒ Población objetivo: grupo que pretendemos estudiar. ⇒ Población muestreada: grupo del que realmente extraemos la muestra. ⇒ Una importante parte del éxito de un estudio estadístico radica en conseguir que la población objetivo coincida lo máximo posible con la muestreada, esto corresponde al diseño estadístico. ⇒ Ejemplo: incidencia de la hepatitis B en los años 80 en la comunidad Valenciana. ⇒ Población objetivo: personas de la CV que tuvieron la hepatitis B entre 1980 y 1989. ⇒ Población muestreada: la misma. ⇒ Ejemplo: eficacia del fármaco A, totalmente nuevo, en enfermos de SIDA. ⇒ Población objetivo: enfermos de SIDA. ⇒ Población muestreada: monos enfermos de SIDA. Población objetivo Población muestreada ⇒ Ejemplo: eficacia del fármaco A en enfermos de SIDA. ⇒ Población objetivo: enfermos de SIDA. ⇒ Población muestreada: enfermos de SIDA en USA. Población objetivo Población muestreada ⇒ Algunas veces, después de haber hecho un estudio, uno se plantea a qué población pueden aplicarse razonablemente los resultados inferidos de una cierta muestra. ⇒ Después de identificar la población que hemos de estudiar tenemos que extraer de ella una muestra de un modo razonable se utiliza el muestreo aleatorio (“SORTEO”) ⇒ Necesitamos “buenas” muestras (representativas de la población), pero ¿cómo podemos obtenerlas? ⇒ No son útiles todas las muestras, por ejemplo: voluntarios, disponibles… pueden conducir a conclusiones erróneas (ya que suelen ser “diferentes” a los que no lo son por alguna causa que puede influir a la hora de sacar conclusiones. ⇒ Voluntarios: se desea saber el grado de consumo de drogas en un instituto. Si se realizan las pruebas a los VOLUNTARIOS el resultado será CONSUMO = 0. ⇒ Individuos disponibles: sondeos pre-electorales para la presidencia de USA en 1936: Landon, Roosevelt. Una revista americana envió 10 millones de papeletas a propietarios de automóviles, abonados de teléfonos… contestaron 2 millones y el resultado era claramente a favor de Landon. El ganador fue Roosevelt debido a la influencia del estatus socioeconómico de los encuestados. ⇒ Este ejemplo sirve también para poner de manifiesto que ⇒ La representatividad de la muestra no se consigue con el tamaño (grande); una muestra grande puede no ser representativa. Muestreo aleatorio y representatividad de la muestra ⇒ El muestreo aleatorio es un procedimiento de selección de los elementos que constituyen la muestra que trata de garantizar su representatividad. ⇒ Procedimiento de muestreo: método de obtención de las muestras de una población. ⇒ Procedimiento de muestreo aleatorio: podemos imaginarlo como un sorteo en el cual: ⇒ Todos los individuos de la población tienen la misma probabilidad de ser elegidos. ⇒ Las posibilidades de cada individuo de ser seleccionado no dependen de cuáles son los individuos seleccionados en la misma muestra. ⇒ Observamos el valor de la variable para todos estos individuos y obtenemos una muestra aleatoria. ⇒ MUESTRA ALEATORIA: muestra obtenida mediante muestreo aleatorio. ⇒ MUESTREO ALEATORIO SIN REEMPLAZAMIENTO: en cada etapa, el elemento seleccionado es eliminado definitivamente de la población y no vuelve a participar en las siguientes etapas del muestreo. ⇒ MUESTREO ALEATORIO CON REEMPLAZAMIENTO: en cada etapa, el elemento seleccionado no se elimina de la población y participa de nuevo en la siguiente etapa; un individuo de la población puede entrar varias veces en la muestra. ⇒ El muestreo con reemplazamiento permite simular una población infinita (o muy grande) a parit r de una población con M individuos (M <<<<< ∞) ⇒ Ejemplo: encuesta en un centro hospitalario con intención de saber la opinión: ⇒ En una semana determinada sin reemplazamiento ⇒ A lo largo de un año con reemplazamiento ⇒ Así nos aproximamos a los casos interesantes en los que N <<<< M. ⇒ N = tamaño de la muestra; M = tamaño de la población. ⇒ Ejemplo: ⇒ X = variable con posibles valores 0 y 1 0 1 M=2 01 00 M=4 01 01 01 M=6 ⇒ En las tres poblaciones finitas tenemos 50% de 0 y 50% de 1. ⇒ Tomamos M = 2 y queremos una muestra de tamaño N = 2 ⇒ Seleccionamos uno al azar: sale el 0 ⇒ Seleccionamos el 2º al azar ⇒ Sin reemplazamiento obligatoriamente el 1 ⇒ Con reemplazamiento puede salir 0 ó 1 ⇒ Muestras posibles ⇒ Sin reemplazamiento {0,1} ⇒ Con reemplazamiento {0,0}, {1,1}, {0,1} ⇒ Con M = 2 y con reemplazamiento podemos obtener muestras de tamaño N = 5 > M Extracción de una muestra aleatoria mediante tablas de dígitos aleatorios ⇒ Numerar la población de 1 a M ⇒ Decidir el tamaño de la muestra N (N < M) ⇒ En la tabla de dígitos aleatorios, ⇒ Elegimos cualquier dígito de la tabla como punto de partida ⇒ Elegimos cualquier dirección ⇒ Consideramos N números (válidos) de tantos dígitos como los que tiene M (de esta modo permitimos que pueda salir cualquier individuo de la población). ⇒ Así: ⇒ Si M ≤ 9, tomamos N números con un dígito ⇒ Si 10 ≤ M ≤ 99, tomamos N números con dos dígitos. ⇒ Sólo sirven (válidos) los números observados entre 1 y M. ⇒ Si se trata de muestreo con reemplazamiento admitimos repeticiones. ⇒ Buscamos los valores de la variable correspondientes a los individuos de la población con los números elegidos. ⇒ Los números que aparecen en la tabla están agrupados para leerlos mejor, pero no son números de 2 cifras. La primera fila es: 53180213818824358611488586636… Son números generados al azar: ⇒ Ejemplo. M = 850; N = 10 ⇒ Empezamos con el primer dígito y en el sentido de la lectura: 533, 180, 213, 818, 824, 358, 611, 488, 586, 636 ⇒ Ejemplo. M = 500; N = 10 ⇒ Empezamos con el primer dígito y en el sentido de la lectura: 533, 180, 213, 818, 824, 358, 611, 488, 586, 636, 431, 054, 957, 032, 036, 099, 430 ⇒ Ejemplo. M = 100; N = 10 ⇒ Empezamos con el primer dígito y en el sentido de la lectura: 533, 180, 213, 818, 824, 358, 611, 488, 586, 636, 431, 054, 957, 032, 036, 099, 430, 763, 204, 026, 005, 138… ⇒ Ejemplo ⇒ M = número de alumnos en clase = 84 ⇒ N = 10 ⇒ Estudio: ⇒ % mujeres y hombres ⇒ % alumnos con gafas ⇒ % alumnos con lentillas ⇒ Muestreo aleatorio: ⇒ 53, 31, 80, 21, 38, 18, 82, 43, 58, 61 ⇒ Representación de los datos en una tabla: Número 53 31 80 21 38 18 82 43 58 61 Sexo M M M M M M M M H H ⇒ Resultados ⇒ Sexo: ⇒ 80% mujeres ⇒ 20% hombres ⇒ Gafas: 20% ⇒ Lentillas: 10% ⇒ Nada: 50% ⇒ No en estos momentos: 20% ¿Gafas? NO NO NO NO SI NO SI NO NO NO ¿Lentillas? NO NO NO SI NO NO NO NO* NO NO* * No en estos momentos