1 Práctica de MODELOS DE PROBABILIDAD 1. Objetivos: Los objetivos que persigue esta práctica son: • Representar distribuciones de probabilidad conocidas e interpretar sus parámetros. • Generar variables aleatorias que se ajusten a los modelos de probabilidad conocido. 1. Comandos de Statgraphics ® necesarios: Para poder realizar los ejercicios planteados más adelante es necesario conocer el manejo de los siguientes comandos: a) Comandos para dibujar distribuciones: PLOT / PROBABILITY DISTRIBUTIONS / marcar la distribución correspondiente. En el Botón Derecho del Ratón, ANALYSIS OPTIONS se modifican los valores de los parámetros. Opciones gráficas: GRAPHICAL OPTIONS / DENSITY/MASS FUNCTION (función de probabilidad) y CDF (función de distribución). b) Comandos para generar números aleatorios siguiendo una determinada distribución: PLOT / PROBABILITY DISTRIBUTIONS / marcar la distribución correspondiente TABULAR OPTIONS / RANDOM NUMBERS / SAVE RESULTS. c) Comandos para ajustar datos a distribuciones: DESCRIBE / DISTRIBUTION FITTING /UNCENSORED DATA. En el Botón Derecho, en ANALYSIS OPTIONS, se elige la distribución a la que se quiere ajustar. Elegir FRECUENCY HISTOGRAM. 2 3. Representación de probabilidad conocidas. algunas distribuciones de 3.1. Distribución Normal: En primer lugar vamos a proceder a representar una distribución Normal, que es la distribución que por defecto Statgraphics nos ofrece. Así debemos en el menú principal seleccionar PLOT / PROBABILITY DISTRIBUTIONS. Se selecciona la distribución normal y pulsamos OK: Obteniéndose el siguiente resultado: 3 Se recuerda que el valor mean o average corresponde a la media aritmética y std. dev. A la desviación típica. Por defecto, Statgraphics genera una normal (0,1). Para ver la forma de las funciones de densidad f(x) y de la de distribución F(x), pulsamos sobre el icono Graphical Options , seleccionando: Density/Mass function y CDF respectivamente: De esta forma obtendremos: 4 Para cambiar los parámetros que caracterizan a esta distribución, pulsamos con el botón derecho del ratón sobre la salida principal: 5 Y seleccionamos la opción Analysis Options, con lo que a continuación se nos muestra el menú donde podemos generar hasta cinco variables normales con diferentes parámetros. Para este ejercicio vamos a generar tres distribuciones normales, todas ellas con media 0 y con desviaciones típicas de 0,3; 0,5 y 1,2 respectivamente: Así si representamos las funciones de densidad de estas variables obtenemos lo siguiente: 6 3.2. Distribución Binomial: A continuación vamos a generar tres variables binomiales donde p va a tomar siempre el valor 0,2; mientras que n va a ser 5, 10 y 20. Así tendremos las siguientes distribuciones: B(5; 0,2); B(10; 0,2) y B(20; 0,2). Para ello pulsamos PLOT / PROBABILITY DISTRIBUTIONS y seleccionamos distribución binomial: Una vez hecho esto y pulsando con el botón derecho del ratón sobre la ventana de Probability Distributions, se abre un menú donde se seleccionan los parámetros de la variable conforme a lo indicado: De esta manera ya hemos generado tres distribuciones de probabilidad binomiales, todas ellas con p=0,2 y donde lo que cambia es el número de veces que repetimos el experimento (5, 10 y 20 veces respectivamente). 7 Para ver el efecto de aumentar el número de veces que repito el experimento, represento las funciones de densidad, mediante Graphical Options Function. , seleccionando Density/Mass Binomial BinomialDistribution Distribution Event prob.,T Event prob.,Tr 0,2,5 0,2,5 0,2,10 0,2,10 0,2,20 0,2,20 probability probability 0,5 0,5 0,4 0,4 0,3 0,3 0,2 0,2 0,1 0,1 0 0 0 0 4 4 8 8 x 12 12 16 16 20 20 x Se observa claramente que el repetir el experimento produce un desplazamiento de la media hacia la derecha (1 , 2 y 4 respectivamente), así como un aumento de la simetría de la función de densidad, ‘pareciéndose’ cada vez más a una Normal, de acuerdo al Teorema Central del Límite. 4. Generación de números aleatorios distribuciones de probabilidad conocidas: conforme a A continuación y una vez que sabemos representar distribuciones de probabilidad conocidas, vamos a proceder a generar variables aleatorias que se comporten de acuerdo a estas distribuciones de probabilidad conocidas. 4.1. Generación de números aleatorios conforme a la distribución de Poisson Para la generación de números aleatorios conforme a distribuciones de probabilidad conocidas, lo primero que he de hacer, es representar la variable como hemos hecho en el punto 1 de esta práctica. Así selecciono PLOT/PROBABILITY DITRIBUTIONS y selecciono la distribución de Poisson: 8 Por defecto Statgraphics representa una distribución de Poisson donde λ=10 Para cambiar el parámetro hago clic con el botón derecho y marco como parámetro por ejemplo λ=3. En el caso de la distribución de Poisson el parámetro λ coincide con la media y con la varianza. 9 Para generar los números aleatorios conforme a esta distribución conocida hay que hacer clic sobre el icono (Save Results), desplegándose el siguiente cuadro de menú: Para que los datos se generen hay que marcar Random Numbers for Dist.1 y además conviene nombrar la serie de manera que nos sea fácil reconocer los datos que se van a generar. Si pulsamos y nos vamos a la hoja de datos podemos ver que en la primera hoja me aparecen 100 números aleatorios que se comportarán de manera parecida a una distribución de Poisson donde la media y varianza deberán estar cercanos a tres: 10 Importante: Dado que se están generando números aleatorios, cada vez que repita esta operación encontraré diferentes números, pero siempre estos datos habrán de asemejarse a la distribución conforme a la cual hemos generado los datos. Para comprobar si efectivamente la media y varianza son tres se puede hacer un análisis descriptivo de los datos generados, mediante DESCRIBE / NUMERICAL DATA / ONE VARIABLE ANALYSIS y seleccionamos la variable (POIS1) De manera que si observamos el resumen de estadísticas y con los datos generados encontraremos resultados parecidos (nunca iguales al ser números aleatorios) a lo siguiente: 11 Observamos que efectivamente tanto la media como la varianza están cercanos al valor teórico de λ =3. El histograma de los datos sería: Histogram for POIS1 24 frequency 20 16 12 8 4 0 0 2 4 6 POIS1 8 10 12 4.2. Generación de números aleatorios conforme a una distribución Binomial (100; 0,2) Para generar estos números vamos en primer lugar a representar la variable teórica conforme a lo establecido en el punto 1.2, mediante PLOT / PROBABILITY DISTRIBUTIONS: En primer lugar he de cambiar los parámetros n=100 y p=0,2, por lo que hago clic con el botón derecho del ratón pulso analysis options e introduzco los parámetros característicos de la variable a generar: (Save Results), marcando la serie correspondiente y Pulso OK y selecciono el icono dando el nombre a la nueva serie generada: 13 Una vez pulsamos OK y vamos sobre la hoja de datos observo la nueva serie generada: 14 Así en la columna BIN1, tengo 100 datos que se deberían comportar como una BIN (100; 0,2). Si mis datos están de acuerdo con la distribución teórica deberán tener una media, que tendrá que ser cercano a n·p= 100·0,2=20 y varianza n·p·q=16. Para comprobarlo vamos a hacer un análisis descriptivo de los datos generados a través de DESCRIBE/NUMERICAL DATA / ONE VARIABLE ANALYSIS, seleccionando la variable BIN1, así deberemos tener unos resultados similares a: Su histograma: Histogram for BIN1 frequency 40 30 20 10 0 11 15 19 23 BIN1 27 31 35 15 Ejercicios propuestos • Generar las siguientes tres distribuciones Binomiales: o B (100; 0,1) o B (100; 0,5) o B (100; 0,8) ¿Qué se puede comentar a la vista de las funciones de densidad? • Generar las siguientes distribuciones de Poisson o P (2) o P (5) o P (10) ¿Qué se puede comentar a la vista de las funciones de densidad?