Muestreo estadı́stico. Relación 1 Curso 2007-2008 1. Consideramos una urna con 3 bolas etiquetadas con los números 1, 2 y 3. Considerando que todas las bolas son equiprobables Determinar todas las posibles muestras de tamaño 2 que se pueden obtener con reemplazo y teniendo en cuenta la ordenación de los elementos en la muestra. Calcular la distribución en el muestreo del estimador media muestral. Calcular la esperanza y la varianza de dicho estimador. 2. Para medir la variable nivel de concentración de sustancias tóxicas en suspensión en una determinada zona industrial, se dispone de un marco de 4 zonas industriales cuyos niveles de concentración de sustancias tóxicas en suspensión actuales son 6, 4, 3 y 8 gramos/m3 . Estimar el nivel medio de concentración de sustancias tóxicas en suspensión extrayendo muestras de tamaño 2 sin reposición y sin tener en cuenta el orden de los elementos de la muestra. Considerando como posibles estimadores para este parámetro las medias aritmética, armónica y geométrica. Especificar el diseño muestral y la distribución en el muestreo de los tres estimadores. Identificar los estimadores insesgados y calcular el error cuadrático medio asociado a cada estimador. Justificar qué estimador es el más adecuado para estimar el nivel medio de concentración de sustancias tóxicas en suspensión. 3. Enumerar todas las posibles muestras de tamaño 2 sin reposición y sin importar el orden de selección que se pueden seleccionar de la población {1, 2, 3, 4}. Calcular la varianza de la población σ 2 y la varianza del estimab̄ para comprobar por cálculos directos que se cumple la siguiente dor V (X) relación 2 b̄ = N − n σ , V (X) N −1 n teniendo en cuenta que las unidades son equiprobables. 4. Dada la variable X con distribución de Bernouilli de parámetro 1/3. Determinar la distribución en el muestreo de la media muestral a partir de una muestra de tamaño 3 con repetición y teniendo en cuenta el orden de los elementos de la muestra. 5. Consideremos el experimento aleatorio de lanzar un dado no trucado dos veces y de forma independiente. Describir el espacio muestral asociado a dicho experimento aleatorio y obtener la distribución en el muestreo para 1 el estimador Tb1 “suma de la puntuación de las dos tiradas”. Con dicho estimador Tb1 se pretende estimar el parámetro poblacional T1 “suma de todas las caras del dado”. ¿Es Tb1 un estimador insesgado de T1 ?. Calcular la varianza de Tb1 . 6. Se considera la población formada por las 6 caras de un dado trucado, en el cual las caras pares tienen el doble de probabilidad de salir que las impares. En esta población, se selecciona un muestra aleatoria de tamaño 2 con reposición y teniendo en cuenta el orden de la tirada. Identificar todas las muestras posibles y determinar la probabilidad de cada una de ellas. 7. Para la población Ω = {u1 , u2 , u3 , u4 , u5 } consideramos el siguiente proceso de selección de muestras de tamaño 3. De una urna con 3 bolas numeradas del 1 al 3 se extraen al azar y sin reposición 2 bolas. A continuación de otra urna con 2 bolas numeradas con el 4 y el 5 se extrae una bola. Se pide: Espacio muestral asociado a este experimento de muestreo y probabilidades de las muestras. Consideramos por analogı́a el estimador θb “suma de los subı́ndices de unidades de las muestras” para estimar la caracterı́stica poblacional θ “suma de los subı́ndices de las unidades de la población”. Calcular la precisión del estimador y hallar un intervalo de confianza al 95 %. Se considera el estimador por analogı́a b̄ θ “media de los subı́ndices de unidades de las muestras” para estimar la caracterı́stica poblacional θ̄ “media de los subı́ndices de las unidades de la población”. Calcular la precisión de este estimador y hallar un intervalo de confianza al 95 %, ¿qué estimación es mejor? 8. Consideramos una población de tres unidades Ω = {u1 , u2 , u3 } cuyas probabilidades de selección son iguales. Se extraen muestras de tamaño 2 con reposición sin tener en cuenta el orden de colocación de sus elementos. Se pide: Obtener el diseño muestral. Se estima por analogı́a el parámetro poblacional θ “número de unidades distintas en la población” mediante el estimador θb “número de unidades distintas en la muestra”. Hallar la distribución en el muestreo del estimador θb de θ. Analizar la precisión de θb para los valores θ = 1, θ = 2 y θ = 3 del parámetro poblacional θ. Se estima por analogı́a el parámetro poblacional θ̄ “número medio de unidades distintas en la población” mediante el estimador por θ “número medio de unidades distintas en la muestra”. Haanalogı́a b̄ llar la distribución en el muestreo del estimador b̄ θ y analizar su precisión para los valores θ̄ = 1, θ̄ = 2 del parámetro poblacional θ̄. 2 Hallar intervalos de confianza para ambos estimadores θb y b̄ θ al 95 %. 9. Para la población Ω = {u1 , u2 , . . . , u12 } consideramos el siguiente proceso de selección de muestras de tamaño 3. Se selecciona un entero al azar en el conjunto {1, 2, 3, 4} y siendo δ este número se forma la muestra {uδ , uδ+4 , uδ+8 }. Considerando la variable Xi = X(ui ) = i, se pide la distribución, esperanza y varianza de los estimadores T1 = M ax(Xi ) y P T2 = 2( Xi )/n − 1 suponiendo que cada unidad tiene la misma probabilidad de ser elegida. 10. En una población con N = 3 unidades Ω = {u1 , u2 , u3 } la variable T medida sobre cada unidad toma los valores (1, 3, 5). Se considera un proceso de muestreo sin reposición en el que todas las unidades tienen la misma probabilidad de ser seleccionadas seleccionando muestras de tamaño n = 2 sin tener en cuenta el orden de colocación en las muestras. Se pide: b = Ti + Tj , Distribuciones en el muestreo de los estimadores X b b Y = M in(Ti , Tj ), Z = (Ti + Tj )/2 utilizados para estimar el total poblacional, el menor valor de la población y con Z la media poblacional. b Yb y Z b basados Hallar intervalos de confianza para los estimadores X, en una muestra cualquiera para un nivel de confianza del 95 %. 11. De una población Ω = {u1 , u2 , . . . , uN } se genera una muestra por el siguiente procedimiento: se seleccionan aleatoriamente unidades hasta que aparezca la unidad u1 . La muestra está formada por los individuos seleccionados hasta el momento (incluido el individuo u1 ). Obtener la media de la variable aleatoria Y=“tamaño muestral”. Suponiendo que N = 3 medimos una caracterı́stica X sobre los individuos de la población obteniendo como resultados Ω X u1 1 u2 2 u3 3 Utilizando este procedimiento de muestreo probar que la media muestral no es un estimador insesgado de la media poblacional. Calcular el sesgo de dicho estimador y sus errores absoluto y relativo. 12. Sea Ω una población con N elementos Ω = {u1 , u2 , . . . , uN } y sea p un número real con p ∈ (0, 1). Consideramos el siguiente procedimiento de obtención de una muestra: se recorre secuencialmente la población desde el elemento u1 hasta el elemento uN y para cada elemento ui se lanza una moneda con probabilidad de cara p. Si sale cara, seleccionamos el elemento ui . Si sale cruz, no lo seleccionamos. De esta forma, al finalizar la inspección de todos los elementos, los que han sido seleccionados constituyen la muestra. Se supone que las sucesivas tiradas de la moneda son independientes. 3 a) Obtener la probabilidad de obtener una muestra con N elementos. b) Supongamos que N = 4 y p = 1/2. Obtener la media y la varianza de la variable aleatoria X=“tamaño muestral” 13. Sea Ω una población con 5 elementos Ω = {u1 , u2 , u3 , u4 , u5 } y sea p un número real con p ∈ (0, 1). Consideremos el siguiente procedimiento de muestreo: Lanzamos sucesivamente una moneda con probabilidad de cara p y contamos el número de lanzamientos hasta que sale la primera cara. Si la primera cara se obtiene en el lanzamiento i-ésimo (i ≥ 1), la muestra se forma con los i primeros elementos de la población, es decir, {u1 , u2 , . . . , ui }. Si en 5 tiradas no sale cara, en este caso la muestra estarı́a formada por todos los elementos de la población. Suponiendo que todos los lanzamientos de la moneda son independientes, se pide: Obtener el diseño muestral de este procedimiento de muestreo Considerando el caso particular p = 1/2, determinar la esperanza de la variable aleatoria X=“tamaño muestral” para este procedimiento de muestreo. 14. De una población Ω = {u1 , u2 , . . . , uN } se genera una muestra por el siguiente procedimiento de muestreo. Se lanza una moneda con probabilidad de cara p (0 ≤ p ≤ 1). Si sale cara, se toma una muestra aleatoria simple de tamaño n1 y si sale cruz se toma una muestra aleatoria simple de tamaño n2 . Hallar las probabilidades de inclusión de primer y segundo orden de los individuos, ası́ como la media y la varianza de la variable aleatoria X=“tamaño muestral”. 4