Práctica de VARIABLES ALEATORIAS (MODELOS) 1. Objetivos de la práctica En esta práctica veremos cómo obtener probabilidades y cuantiles asociados a una distribución de probabilidad prefijada. Veremos también cómo obtener una representación gráfica de una función de distribución y de densidad y cómo generar observaciones (pseudo)aleatorias de dichos modelos. Haremos especial énfasis en las distribuciones Normal y Binomial. 2. Selección del modelo En el menú superior pinchamos en Graficar y dentro de las opciones que nos aparecen Distribuciones de Probabilidad. Nos aparecerá entonces un extenso vamos a menú con numerosos modelos de distribuciones. La distribución que está seleccionada por defecto es la Normal y si pinchamos en Aceptar, nos pide los parámetros que deseamos establecer. En el caso de la Normal, los parámetros son media µ y la desviación típica σ. Para otro modelo de distribución nos pediría otros parámetros. El Statgraphics nos permite trabajar con cinco distribuciones (conjuntos de parámetros) para el mismo modelo. 3. Representación gráfica Una vez que hemos fijado los parámetros de la distribución, podemos pedir Tablas (probabilidades, cuantiles y generación de observaciones aleatorias) o bien Gráficos. Los gráficos consisten en funciones de distribución y de probabilidad (masa) para los modelos discretos, y funciones de distribución y densidad para los continuos. En la gráfica inferior, hemos representado las funciones de densidad y de distribución (probabilidad acumulada) de cinco distribuciones normales, ya que cinco es el número máximo de pares de parámetros que podemos fijar. En concreto están reflejadas N(µ=0,σ=1), N(µ=0,σ=0.5), N(µ=0,σ=2), N(µ=1,σ=1) y N(µ=−1,σ=1). En la gráfica inferior aparecen representadas las funciones de probabilidad y distribución de tres Binomiales, B(n=20,p=0.2), B(n=10,p=0.4) y B(n=20,p=0.5). Observa que el Statgraphics ordena los parámetros de forma inversa a como lo hacemos nosotros, primero coloca la probabilidad de éxito p y luego el número de ensayos n. 4. Probabilidades y cuantiles Para cualquier modelo de probabilidad de los que aparecen en la tabla de la Sección 2, con cualesquiera parámetros prefijados de la manera explicada también en la Sección 2, podemos obtener las probabilidades de que una variable aleatoria asuma un valor menor o mayor que uno dado. Además para las distribuciones discretas obtenemos también la probabilidad de que la variable aleatoria sea igual al valor dado y para las continuas, la función de densidad evaluada en dicho valor. 4.1 Variables aleatorias continuas (Normal) Para una distribución Normal prefijada, en este caso X con distribución N(µ=1,σ=2), veamos cómo obtener las probabilidades P(X<2), P(X>2) y el valor de la función de densidad evaluada en 2. Una vez que hayamos seleccionado la distribución deseada, le pedimos al Statgraphics el Resumen del Análisis (que sirve para que nos recuerde qué distribución y parámetros hemos seleccionado) y las Distribuciones Acumuladas. Hacemos click con el botón derecho del ratón en la ventana de resultados correspondiente a la Distribución Acumulada y seleccionamos Opciones de Ventana para indicar que queremos las probabilidades (de cola inferior, densidad y cola superior) asociadas al valor 2. Observad que podéis fijar hasta cinco valores. Una vez hemos aceptado, obtenemos los valores deseados. Así P(X<2)=0.691464, P(X>2)=0.308536 y la densidad evaluada en 2 es 0.176033. La función cuantil (función acumulada inversa) la obtenemos seleccionando Distribuciones Acumuladas Inversas una vez hemos fijado el modelo y los parámetros. Por defecto, el Statgraphics nos da los cuantiles 0.01, 0.1, 0.5 (la mediana), 0.9 y 0.99 de una distribución. Si queremos cualquier otro cuantil, debemos hacer click con el botón derecho del ratón sobre la ventana de resultados correspondiente a la FDA Inversa y seleccionar Opciones de Ventana. El cuantil 0.01 de una variable aleatoria X con distribución N(µ=1,σ=2) es −3.6527 y esto debe interpretarse como P(X<−3.6527)=0.01. La interpretación de cualquier otro cuantil es análoga a ésta. 4.2 Variables aleatorias discretas (Binomial) Cuando trabajamos con una distribución discreta y queremos obtener la probabilidad de que una variable aleatoria cumple una condición que expresamos a través de una desigualdad, debemos ser cuidadosos y observar si la desigualdad de estricta o no. Así, si X sigue distribución Binomial B(n=10,p=0.1), las probabilidades P(X<1) y P(X≤1) son distintas. Para obtenerlas, seleccionamos la distribución Binomial con el Statgraphics. Observa que los parámetros que tiene fijados por defecto son precisamente probabilidad de éxito p=0.1 y número de ensayos n=10. Le pedimos la Distribución Acumulad, hacemos click con el botón derecho del ratón sobre la parte de la ventana de resultados correspondiente a la Distribución Acumulada, seleccionamos Opciones de Ventana y fijamos el valor 1 para obtener: De donde se tiene que P(X<1)=0.348678 y P(X≤1)=P(X<1)+P(X=1)=0.348678+0.38742=0.736098. 5. Generación de números (pseudo)aleatorios Los números generados por un ordenador mediante un algoritmo completamente determinista nunca serán aleatorios (obtenidos completamente al azar), sino a lo sumo podrán tener apariencia de aleatorios, por eso lo más correcto es referirse a ellos como pseudoaleatorios. No obstante, por economía en el término, nosotros hablaremos de números aleatorios y de generación de los mismos. Fijado cualquier modelo de distribución, con los parámetros que deseemos (Sección 2), podemos seleccionar Números Aleatorios y el Statgraphics nos permitirá obtener 100 observaciones aleatorias del modelo prefijado. Si queremos generar una muestra de observaciones con tamaño distinto de 100, hacemos click con el botón derecho del ratón en la parte de la vetana de resultados correspondiente a los Números Aleatorios, seleccionamos Opciones de Ventana y escribimos otro tamaño. Para finalizar la generación de las observaciones aleatorias (y guardarlas) pinchamos el icono de salvar de la barra de herramientas del análisis, que aparece rodeado por un círculo rojo en la imagen inferior. Debemos indicarle al Statgraphics dónde guardar las observaciones que acabamos de generar, para ello activamos Números Aleatorios para Dist. 1 y le indicamos (a la derecha) que los guarde en la Hoja de Datos que deseamos (habitualmente la A, que es la primera). Una vez guardadas las observaciones recién generadas, podemos trabajar libremente con la variable (columna) recién creada y realizar cualquier tipo de análisis estadístico. Una manera alternativa para generar observaciones aleatorias consiste en pinchar en Herramientas en el menú superior para luego ir a Simulationes Monte Carlo– Generación de Números Aleatorios. 6. Ejercicios 1. 2. 3. 4. 5. Dibuja la función de densidad de una N(2,10) y una N(3,4). Dibuja la función de densidad de una Exponencial con media 5. Dibuja tres funciones de densidad diferentes indicando las que has elegido. Dibuja la función de masa de probabilidad para una binomial de n=15 p=0,1 Calcula las siguientes probabilidades: a. X es N(3,4): i. P(X<5) = ii. P(X=0)= iii. P(X>6)= iv. P(5<X<6)= b. X es exponencial de media 5 i. P(X<4)= ii. P(X=0)= iii. P(X>5)= iv. P(x<4<5)= c. X es Binomial n=10 p=0.06 i. P(X=1)= ii. P(X=0)= iii. P(X≤2)= iv. P(X>1)= d. Elige una distribución de probabilidad continua y calcula tres probabilidades. 6. Genera 100 números aleatorios de una N(170,10) y calcula la media, mediana, desviación típica, mínimo y máximo. Dibuja el histograma de los números aleatorios.