Práctica 3.Distribuciones de variables aleatorias discretas 1 Práctica 3 DISTRIBUCIONES DE VARIABLES ALEATORIAS DISCRETAS Objetivos: En esta práctica utilizaremos el paquete SPSS para generar una muestra de una población con una distribución conocida y para calcular probabilidades conocida una distribución determinada. Índice: 1. Generación de muestras aleatorias. 2. Área de la cola 3. Ejercicios complementarios Práctica 3.Distribuciones de variables aleatorias discretas 2 1. Generación de muestras aleatorias En este apartado consideraremos la generación de una muestra de una población con distribución conocida pero de la que no disponemos de datos. Por ejemplo, de una población con distribución Binomial con n=6 y p=0.5 vamos a generar 100 datos. En primer lugar, necesitamos crear un nuevo banco de datos (Archivo/Nuevo/Datos), al que podemos llamar Normal. SPSS genera los datos de una determinada distribución y los sitúa en una columna con la longitud que tenga el banco de datos; es decir, el número de filas con datos que aparezcan en el Editor de datos. Dado que acabamos de crear el fichero, no contendrá ningún dato, por lo que la primera operación a realizar será el rellenar la primera columna con datos. Para ello basta con que nos situemos en la casilla correspondiente a la columna 1, fila 100 (Datos/Ir a Caso) e insertemos un número cualquiera. Seleccionamos Transformar/Calcular y nos aparece la ventana de calcular variables. En el campo Variable de destino, escribimos m1 como nombre de la variable que vamos a crear. De la lista de funciones que nos ofrece el SPSS, seleccionamos RV.BINOM(n,prob) y , con el puntero la situamos en el campo Expresión numérica. Vemos, entonces que en lugar de n y p aparecen unos interrogantes, que sustituiremos por los valores n y p de la distribución Binomial de la que pretendemos simular una muestra, en este caso, n=6 y p=0.5. Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS genera una muestra que añade en la primera columna libre del editor de datos. 3 Práctica 3.Distribuciones de variables aleatorias discretas La siguiente tabla muestra algunas de las funciones que proporcionan un valor aleatorio de una distribución determinada. Los argumentos son los parámetros de la distribución. Pueden consultar la ayuda del SPSS para obtener una lista exhaustiva de todas las funciones disponibles. Expresión RV.BERNOUILLI (p) RV.BINOM(n,prob) RV.GEOM(prob) RV.NEGBIN (umbral,p) RV.HYPER(total,muestra,aciertos) RV:POISSON(media) Descripción Devuelve un valor aleatorio del distribución de Bernoulli, con el parámetro de probabilidad especificado. Devuelve un valor aleatorio de la distribución binomial, con el número de intentos y el parámetro de probabilidad especificados. Devuelve un valor aleatorio de una distribución geométrica, con el parámetro de probabilidad especificado. Devuelve un valor aleatorio de la distribución binomial negativa, con el umbral y la probabilidad especificados. Devuelve un valor aleatorio de la distribución Hipergeométrica, con los parámetros especificados. Devuelve un valor aleatorio de la distribución de Poisson, con el parámetro de media/tasa especificada. Ejercicio 1: Generar muestras de tamaño 100 para las distribuciones discretas siguientes: Bernoulli (0.2), Binomial (8,0.3), Geométrica (0.6), Binomial negativa (9,0.3), Hipergeométrica ( 20, 8, 0.3 ), Poisson (6). 2. Área de la Cola En este apartado vamos a ver cómo calcular el área de la cola de una distribución conocida. En concreto consideramos la expresión P(x a) siendo x una variable aleatoria y a un valor determinado. Utilizamos el mismo procedimiento que en apartado anterior. Seleccionamos Transformar/Calcular y nos aparece la ventana de calcular variables. En el campo Variable de destino, escribimos el nombre de la variable que vamos a crear . De la lista de funciones que nos ofrece el SPSS, consideramos las que comienzan por cdf, escogemos la que queramos y, con el puntero la situamos en el campo Expresión numérica. En la tabla siguiente se muestran algunas de las funciones que podemos utilizar: Expresión RV.BERNOUILLI (c,p) RV.BINOM(c,n,p) Descripción Devuelve la probabilidad acumulada de que un valor de la distribución de Bernoulli, con el parámetro de probabilidad especificado, sea menor o igual que la cantidad c. Devuelve la probabilidad acumulada de que el número de éxitos en los n intentos, con una probabilidad de éxito p para cada intento, sea menor o igual que la cantidad c. 4 Práctica 3.Distribuciones de variables aleatorias discretas RV.GEOM(c,p) RV.NEGBIN (c,umbral,p) RV.HYPER(c,total,muestra,aciertos) RV:POISSON(c,media) Devuelve un valor aleatorio de una distribución geométrica, con el parámetro de probabilidad especificado. Devuelve la probabilidad acumulada de que el número de intentos para obtener un éxito, con el parámetro umbral especificado y la probabilidad de éxito p, sea menor o igual que la cantidad c. Devuelve la probabilidad acumulada de que el número de objetos con la característica especificada sea menor o igual que la cantidad c, cuando los objetos de muestra son seleccionados aleatoriamente de un universo, de tamaño igual a un total, en el que los aciertos tienen la característica especificada. Devuelve la probabilidad acumulada de que un valor de la distribución de Poisson, con el parámetro de tasa o media especificado, sea menor o igual que la cantidad c. Por ejemplo para obtener el valor de P(x 5) para una variable x con distribución Binomial(6, 0.5), seleccionaremos la función CDF.BINOM(c,n,p) y reemplazaremos el primer campo por 5, el segundo por 6 y el tercero por 0.5. Es importante notar que el valor de P(x a) coincide con el de P(x < a) si la función de distribución es continua como en el caso de la Normal o la t de Student, pero no coincide si es discreta como en el caso de la Binomial. Ejercicio 2: Obtener el valor de P(x 3), P(x 5) y P(x = 9) para una distribución Binomial de parámetros n =20 y p =0.3. Obtener el valor de P(x 1), P(x 2) y P(x >2) para una distribución de Poisson de media 5. Práctica 3.Distribuciones de variables aleatorias discretas 5 3. Ejercicios 1. 2. 3. 4. 5. 6. Un agente de seguros vende pólizas a 5 individuos, todos de la misma edad. De acuerdo con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años más es de 3/5. Determinar la probabilidad de que dentro de 30 años vivan: a. Al menos 3 individuos b. Como mucho 2. El número medio de automóviles que llega a una estación de suministro de gasolina es de 210 por hora. Si dicha estación puede atender a un máximo de 10 automóviles por minuto, determinar la probabilidad de que en un minuto dado lleguen a la estación de suministro más automóviles de los que puede atender. La proporción de individuos de una población con renta superior a los dos millones de pesetases de 0,005%. Determinar la probabilidad de que entre 5000 individuos consultados haya como mucho 2 con ese nivel de renta, supuesto que todos los consultados respondan. La probabilidad de que un paciente se recupere de una enfermedad sanguínea es 0,4. Si se sabe que 15 personas han contraído esta enfermedad, ¿cuál es la probabilidad de que: a. sobrevivan al menos 10? b. sobrevivan entre 3 y 8 inclusive? c. sobrevivan exactamente 5? Supongamos que repetimos indefinidamente el lanzamiento de una moneda. Entonces considerando la variable aleatoria: “Número del lanzamiento en que aparece cara por primera vez “, calcular la probabilidad de que: a. La cara aparezca en el lanzamiento 3. b. La cara aparezca entre el lanzamiento 6 y 8, ambos inclusive. c. La cara aparezca entre los seis primeros lanzamientos. d. La cara aparezca después del lanzamiento3. Dado el experimento aleatorio consistente en extraer simultáneamente 4 bolas de una urna que contiene 5 bolas blancas, 3 rojas y 1 negra, consideramos la variable aleatoria: “Número de bolas blancas en la muestra de tamaño 4”. Calcular la probabilidad de: a. Hayan 2 bolas blancas b. Hayan al menos tres bolas blancas c. El número de bolas blancas esté entre 2 y 4 ambos inclusive.