DECISIONES BAJO RIESGO: MÉTODOS PROBABILÍSTICOS Escuela de la Ingeniería de la Organización INTRODUCCIÓN Por qué el uso de las probabilidades? Para qué medir el riesgo? Estadística Descriptiva Medidas de tendencia central Medidas de dispersión Histogramas de frecuencias Distribuciones de probabilidad Estimación de parámetros Métodos de pronóstico Simulación Montecarlo. PROBABILIDAD Probabilidades Objetivas: Pueden concluirse a partir de una serie de observaciones. Pueden ser: A priori: Son aquellas que pueden ser computadas antes del experimento, porque la naturaleza del evento que ocurrirá es previamente reconocido. Ej. Lanzar un dado y sacar el numero 2. Ej2. Lanzar dos dados y sacar la suma 1 y 1. Éstas deben poder ser conocidas sin un gran número de experimentos ni grandes bases de datos. Empíricas: Son aquellas que se basan sobre grandes cantidades de datos históricos, que permiten construir tablas de frecuencias relativas de ocurrencia. Ej. Probabilidades de incendios, accidentes, producción, demandas de productos, muertes, etc. PROBABILIDAD Probabilidades Subjetivas: Son aquellas cuya valoración se basa en la información histórica que pudiese existir, ajustada por las creencias racionales de un tomador de decisiones inteligente, que está familiarizado con la naturaleza de la situación La información histórica no es suficiente para usar el concepto de probabilidades empíricas o de tablas de frecuencia. Ej. Cuál es la probabilidad de que al lanzar un nuevo servicio financiero dirigido a estudiantes universitarios, este producto sea muy demandado, medianamente demandado o no tenga ninguna demanda? (existen servicios similares, pero diferentes). TOMA DE DECISIONES CON PROBABILIDADES - - Criterio de la Máxima Posibilidad: Consiste en identificar el estado de la naturaleza más probable (“A priori”), y luego seleccionar la alternativa asociada al mayor pago: Ejemplo: Qué ocurre con los pagos altos de alternativas asociadas a eventos menos probables? (riesgo / rentabilidad) Qué ocurre si existen muchos eventos, y el evento más probable, tiene por si mismo una baja probabilidad? TOMA DE DECISIONES CON PROBABILIDADES - Regla de decisión de Bayes: Usando las mejores estimaciones disponibles de las probabilidades de los estados de la naturaleza (A priori) se calcula el valor esperado del pago de cada alternativa. Se selecciona la alternativa asociada al mayor valor esperado. Qué precauciones debería tenerse con este método? Probabilidad simple, condicional, conjunta y marginal Probabilidad simple: Es aquella que no está condicionada a la ocurrencia de otro evento (Ej. P(a)) Probabilidad Condicional: Dado que otro evento ya ocurrió, cuál es la probabilidad de que el evento ocurra? (Ej. P(A/B)) Probabilidad Conjunta: Es la probabilidad de que ocurra una serie de eventos de forma simultánea. (Ej. P(AB)) Probabilidad Marginal: Corresponde a la suma de las probabilidades conjuntas para un evento, y corresponde a una probabilidad simple. (Ej. Si el evento A puede ocurrir con el evento B o sin el evento B, entonces P(A) = P(A.B) + P(A. no B) EJEMPLO 1 ACCIDENTES AUTOMOBILÍSTICOS Suponga que se ha recolectado un largo número de datos de accidentes automovilísticos en una cierta área geográfica, y que se ha clasificado la información en accidente serios (si ocurrió una fatalidad) y no serios (si no ocurrió una fatalidad). Suponga también que fue posible identificar si el conductor había estado tomando bebidas alcohólicas justo antes del accidente. A partir de la anterior tabla, identifique las probabilidades marginales (simples) conjuntas y condicionales. Dependencia e Independencia Estadística Si los eventos A y B son independientes, la ocurrencia de uno de los eventos, no tendrá influencia ni proveerá de mayor información acerca de la probabilidad de ocurrencia del otro evento. Pero si los eventos son estadísticamente dependientes, entonces la ocurrencia de uno de los eventos afectará la probabilidad de ocurrencia del otro evento. Si los eventos A y B son independientes, entonces: P(A) = P(A/B) P(B) = P(B/A) La independencia o dependencia estadística, no deberá ser confundida con relaciones de causa – efecto. EJEMPLO 2 Composición de los asistentes a un seminario Suponga que un seminario de administración contiene 50 estudiantes. 30 de éstos son hombres. 40 tienen un grado en ingeniería y los demás un grado en ciencias. Hay 6 científicos hombres. A partir de los datos, identifique si existe o no, independencia estadística entre el sexo de los asistentes y el tipo de grado que éstos tienen. Construya la tabla de proporciones, y a partir de esta, compare la probabilidad de que un asistente al seminario seleccionado aleatoriamente sea un hombre, con la probabilidad de que este estudiante además sea hombre dado que tiene estudios en ingeniería. PROBABILIDAD: ALGUNAS RELACIONES MATEMÁTICAS COMPLEMENTACIÓN: La probabilidad marginal de que un evento ocurra o no ocurra. P(A) + P(Ā) = 1 MULTIPLICACIÓN: La probabilidad conjunta de que dos eventos estadísticamente independientes ocurran simultáneamente. P(AB) = P(A y B) = P(A) * P(B) Y si no son estadísticamente independientes, entonces: P(AB) = P(B) * P(A/B) = P(A) * P(B/A) ADICIÓN: La probabilidad de que ocurra el evento A o el evento B (si son mutuamente excluyentes). P(A ó B) = P(A) + P(B) Y si no son mutuamente excluyentes P(A ó B) = P(A) +P(B) – P(AB) TOMA DE DECISIONES CON EXPIREMENTACIÓN Para mejorar las estimaciones preliminares de las probabilidades cada uno de los estados de la naturaleza, es frecuente realizar pruebas experimentales, que arrojen mayor información acerca de la posibilidad de que ocurran los estados de la naturaleza, según los resultados de las pruebas. A partir de la información obtenida, realizamos los cálculo de las probabilidades posteriores (“A posteriori”). Para esto, utilizamos el análisis Bayesiano. Finalmente con esta información, podremos encontrar los pagos esperados con información muestral, y a su vez diseñar una estrategia óptima de decisión. Miremos un ejemplo. TEOREMA DE BAYES n = número posible de estados de la naturaleza P( Estado = estado i ) = Probabilidad a priori de que el estado de la naturaleza verdadero, sea el estado i. (i = 1,2,3,…n) Resultado j = Un valor posible del resultado de la prueba. P( estado i / Resultado j ) = Probabilidad posterior de que el estado de la naturaleza verdadero sea el estado i (i = 1,2,3,…n) , dado que el resultado de la prueba fue el resultado j. Si se conoce experimentalmente, las probabilidades P( Resultado j / Estado i) y P( estado i), entonces: ¿CONTRATAR UN ESTUDIO ADICIONAL? Valor de la experimentación (2 métodos) •Valor esperado de la información perfecta (VEIP): Este método, consiste en determinar el valor potencial de realizar un experimento previo. En este caso se supone que la experimentación eliminará toda la incertidumbre sobre cuál es el estado verdadero de la naturaleza. Pago esperado con IP =∑(pago máximo del estado i)*P(estado i) para todo estado i. VEIP = pago esperado con información perfecta – pago esperado sin experimentación (Regla de Bayes) •Valor esperado de la experimentación (VEE): Consiste en involucrar los pagos esperados según los resultados de la experimentación VEE = Pago esperado con experimentación – Pago esperado sin experimentación, donde: Pago esperado con experimentación = ∑P(resultado j)*E(pago*/resultado j) •Deberán tomarse los pagos SIN costos de experimentación. EJEMPLO 3: PROYECTO DE CAPITAL DE RIESGO Los proyectos de capital de riesgo tienen como objetivo fomentar industrias particulares que implican un alto riesgo para el inversionista acerca de los resultados, y a su vez estados de la naturaleza con retornos muy atractivos. Un compañía administradora de inversiones, tiene la posibilidad de invertir en un proyecto de capital semilla. Después de realizar un análisis, se enfrenta a la siguiente situación: Inicialmente, realice un árbol de decisión para representar los pagos, los estados de la naturaleza y las decisiones. (continua …) EJEMPLO 3: EL ÁRBOL DE DECISÓN SIN EXPERIMENTACIÓN PAGOS TOTALES (S1) CONSERVADOR (d1) 2 PAGOS TOTALES (S1) 1 MODERADO (d2) 3 PAGOS PARCIALES (S2) PAGOS TOTALES (S1) AGRESIVO (d3) 4 8 PAGOS PARCIALES (S2) PAGOS PARCIALES (S2) 4 14 1 30 -10 Los cuadros son utilizados como nodos de decisión. Los círculos son utilizados como nodos de probabilidad. Las ramas son utilizadas para nombrar las decisiones y los resultados. El primer paso para resolver un problema complejo es descomponerlo en una serie de subproblemas más pequeños. Los árboles de decisión facilitan la construcción de una estrategia para enfrentar un problema de toma de decisiones en un contexto probabilístico. TOMA DE DECISIONES CON EXPERIMENTACIÓN EJEMPLO 3: Suponga que una firma consultora ofrece una serie de pruebas e investigaciones económicas, que pronostique si los resultados del proyecto del capital semilla serán o no satisfactorios. Igualmente, esta firma nos indica que con base en su experiencia los resultados de las pruebas que han realizado son : P(Resultado = Favorable/ Estado = Pagos Totales) = 0.9 P(Resultado = Favorable / Estado = Pagos Parciales) = 0.25 El costo del estudio es de 3 millones de USD. Diseñe una estrategia óptima de decisión, y calcule el valor máximo que usted pagaría por el informe de la firma consultora. TOMA DE DECISIONES CON EXPERIMENTACIÓN EJEMPLO 3: ARBOL DE DECISIÓN Una forma de representar las decisiones y los posibles pagos, sería la siguiente. Calcule las probabilidades “A posteriori”, y desarrolle el árbol de decisión de derecha a izquierda. Concluya a cerca de las decisiones a tomar. VARIABLES ALEATORIAS EXPERIMENTO: Es un procedimiento estable, que puede reproducirse repetitivamente. El riesgo se presenta en éste, pues cada que se genera el proceso, los resultados no necesariamente son los mismos. VARIABLE ALEATORIA: Es la “regla” que se usará para la asignación numérica de cada uno de los eventos posibles. Cada uno de los valores que toma la variable aleatoria, corresponde a uno de los posibles eventos del experimento. Ejemplos: Número de pasajeros en un vuelo. – Sexo de un estudiante (Hombre o Mujer) – Productos vendidos por hora – etc. VARIABLES DISCRETAS Vs. VARIABLES CONTINUAS: Para una variable aleatoria discreta, es posible identificar el número de eventos posibles, en un rango particular. Una variable aleatoria continua, puede tomar infinitos valores en un rango específico. Para cada una de las variables aleatorias se deberá definir su función de probabilidad. MEDICIÓN DE RIESGO • EVALUACIÓN DE CRITERIOS ECONÓMICOS: Los indicadores económicos de cada uno de los métodos, serán evaluados a través de medidas estadísticas de tendencia central y de dispersión. Por ejemplo, para identificar la bondad del indicador, usaremos el valor esperado. (Ej. VPN, TIR, etc.) N X= ∑X i N i =1 ó N X = ∑ Xi . Pi i =1 Para identificar la dispersión del indicador económico (Ej. los flujos, el VPN, etc), utilizaremos la varianza y la desviación estándar. 2 N VAR(X) = ∑[Xi - X] i =1 N ó VAR(X) = N 2 ∑[Xi - X] . Pi i =1 El coeficiente de variación también lo utilizaremos para comparar la bondad de diferentes alternativas. Mide la dispersión relativa de los datos en relación a la media: CV= σ X Regrese al ejercicio de la Planta de juguetes, y conteste la pregunta 2. GENERACIÓN DE NÚMEROS ALEATORIOS •Para la generación de números aleatorios en excel, es posible utilizar varios métodos: •Generados de número aleatorios: Herramientas – análisis de datos – generación de números aleatiorios. Por este método, los números aleatorios son generados como valores (Debe estar activado el complemento Herramientas para análisis). Otra posibilidad, es generar el número aleatorio directamente desde la hoja de cálculo con las funciones: = Aleatorio() Genera números aleatorios provenientes de una distribución uniforme entre 0 y 1 = Aleatorio. Entre (inferior;Superior) Genera números aleatorios de una distribución uniforme entre los valores especificados HERRAMIENTAS DE ANÁLISIS DE UNA SERIE RESUMEN ESTADÍSTICO DE UNA SERIE: En excel es posible realizar un análisis de una serie de datos, a través de la estadística descriptiva. Cada uno de estos valores también pueden ser calculados a través de las funciones de hoja de cálculo. Realice el ejericio, para verificar sus resultados. HISTOGRAMA En el menú de Análisis de Datos, también se encuentra disponible la construcción de un Histograma. Esta herramienta es útil para asociar la distribución de una serie de datos con una función de distribución conocida. 80 Frecuencia 70 60 Frecuencia Histograma 50 40 30 20 10 .3 9 -2 -2 .7 6 94 4 77 47 6 - 2 209 .0 22 898 97 -1 204 .6 9 49 -1 73 .2 42 76 - 0 496 .9 03 351 -0 258 .5 30 502 - 0 020 .1 56 653 78 0. 28 21 04 64 5 0. 58 504 5 96 92 0. 89 96 4 29 30 1. 7 33 61 43 68 1. 5 70 94 92 06 2. 08 441 26 2. 44 45 29 58 82 2. 13 82 9 91 19 98 7 0 Clase Esto también se puede realizar directamente en la hoja de cálculo, a través de la función FRECUENCIA en forma matricial. DISTRIBUCIÓN DE PROBABILIDAD EMPÍRICA DISCRETA Consiste en construir la función de densidad y la función de distribución acumulada, a partir del conjunto de datos con que se cuenta. Se recomienda esta distribución cuando la variable aleatoria no se ajuste a una distribución de probabilidad, y/o cuando la variable aleatoria toma un número muy limitado de valores discretos. Con el fin de simular el comportamiento de la variable aleatoria, se realiza lo siguiente: 1. Se establece en qué rango de probabilidades se encontraría un número aleatorio generado (función de distribución acumulada) 2. Se genera un numero aleatorio. Este número aleatorio corresponde a un valor de la distribución acumulada. 3. Se identifica cuál es el valor de la variable aleatoria, que le corresponde a la probabilidad simulada. 4. Se repite el proceso. EJEMPLO 3: DISTRIBUCIÓN DE PROBABILIDAD EMPÍRICA DISCRETA Se estima que la vida útil de un proyecto de inversión (carretera nacional) puede ser de 3, 5, 7 o 10 años, con las siguientes probabilidades respectivamente: 20%, 40%, 25%, 15%. Construya para esta variable: 1. La función de densidad (grafique) 2. La función de probabilidad acumulada (grafique) 3. Encuentre la Media y la Desviación Estándar de la variable aleatoria. 4. Genere un proceso de simulación sobre la variable y genere un histograma de frecuencia sobre los datos obtenidos. RECOMENDACIÓN: Utilizar el generador de números aleatorios de Excel. Utilice la función BUSCARV para encontrar los valores simulados de la V.A. EJEMPLO 4: THE NEWSPERSON PROBLEM Se necesita determinar cuántos Calendarios del año 2006 ordenar desde este mes. El costo es de $2 USD por calendario, el precio de venta es de $4.50 USD. Después del 1º de Enero, los calendarios que no se vendan son reintegrados por $0.75 USD. La mejor estimación de la demanda de los calendarios, sigue las siguientes probabilidades: Cuántos calendarios deberían ordenarse? Para el análisis realice una simulación montecarlo para cada una de las posibles decisiones. Calcule, el promedio de los ingresos netos en cada decisión, la desviación estándar, y el coeficiente de variación. INTERVALO DE CONFIANZA 600 500 400 300 200 100 0 125 312.5 500 Para cada una de las series simuladas es posible calcular un valor de la media. Sin embargo, se puede considerar éste como un valor apropiado? FRECUENCIA PROMEDIO Si se realiza un nuevo proceso de simulación se obtendrá nuevos valores para la media, por lo que no es posible conocer con exactitud el valor de la media desde ninguna simulación. Así pues qué tan apropiado es la estimación de la media? Solo se puede estar un 95% seguro de que el promedio de la media estará entre: PROMEDIO ± 2 * DESVIACION ESTANDAR / RAIZ (nº iteraciones) Si se desea determinado nivel de precisión en la estmación de la media, entonces se deberá despejar el número de iteraciones así: 2 * DESVIACIÒN ESTÁNDAR / RAIZ (nº iteraciones) = márgen deseado del intervalo de confianza. DISTRIBUCIÓN BINOMINAL La variable aleatoria (x) representa el número de éxitos en un numero fijo (n) de intentos, experimentos de Bernulli. La probabilidad de estos resultados en cada ensayo es constante y los ensayos son independientes. 1. La variable aleatoria solo puede tomar 2 posibles valores (Éxito ó Fracaso) 2. La probabilidad de los posibles resultados, permanece constante de un experimento a otro. 3. En la secuencia de experimentos, los resultados de uno de ellos no tiene efecto sobre el resultado de algún otro. Probabilidad de éxito (P), probabilidad de fracaso q=(1-P): n n-x p(x) = p x (1 - p ) x µ = n.p si x = 1,2,......, n y σ = n.p.q EJEMPLO: Se conoce que en una gran ciudad, el 25% de la población está subscrita al periódico local. Una muestra de 20 habitantes es seleccionada aleatoriamente. Cuál es la probabilidad de que 2 o menos de las personas seleccionadas estén subscritas al periódico?, cuál es la probabilidad de que más de dos y hasta 5 personas estén inscritas? NOTA: La distribución binomial requiere del supuesto de “muestreo con reemplazo”. En Excel puede usarse la función =DISTR.BINOM DISTRIBUCIÓN HIPERGEOMÉTRICA A diferencia de la distribución binomial, en esta distribución el muestreo es llevado a cabo sin reemplazo. Esta distribución describe la probabilidad de encontrar x exitos en una muestra aleatoria de tamaño n, que se selecciona sin reemplazo de una población N, en donde se sabe que K resultados de la población N son éxitos, y N - K fracasos. E(x) = np V(x) =n.p.q.(N-p)\(N-1) EJEMPLO: Un lote de 40 componentes electrónicos se considera aceptable, sino contiene más de 3 componentes defectuosos. Actualmente se usa un procedimiento de muestreo del lote, tal que se seleccionan 5 componentes y se rechaza el lote si se encuentra uno defectuoso. Cuál es la probabilidad de que exactamente 1 componente defectuoso se encuentre en la muestra si se conoce que existen 3 defectuosos en todo el lote? EN EXCEL PUEDE USARSE LA FUNCIÓN DISTR.HIPERGEOM DISTRIBUCIÓN POISSON La distribución de Poisson describe el número de veces “x” que un evento ocurre en un intervalo de tiempo dado. Por ejemplo, el ritmo promedio al que llegan los vehículos a un peaje, demanda promedio de un articulo en un almacén, etc. Caracterizado por un valor “lambda” igual a el número de ocurrencias por unidad de tiempo (media). P(x ) = λx e − λ x! x = 1,2,... Media = Varianza = lambda * t A diferencia de la distribución binomial, en este caso no se conoce la proporción de éxitos en la población, y además no se tiene un n definido. EJEMPLO: Suponga que el paso de vehículos por un peaje, se ajusta a una distribución de Poisson, y que en promedio pasan 200 carros por hora. Cuál es la probabilidad de que no pase un carro en el próximo minuto? EN EXCEL PUEDE USARSE LA FUNCIÓN POISSON DISTRIBUCIÓN NORMAL Describe muchos fenómenos aleatorios que ocurren en la vida diaria. Es simétrica y su media es igual a la mediana. El Rango de “x” no esta limitado pero los valores se centran alrededor de la media. e − (x − µ ) 2 f (x) = / 2σ 2Π σ N σ (X) = ∑ [X i=1 N i - 2 -∞ < x < ∞ 2 µ ] 2 N µ = ∑ Xi i=1 N Distribución Normal Estándar Z= X - X σ Distribución Normal Estándar µ =0 σ =1 Probabilidades normales seleccionados de Z para valores Distribución Lognormal Se usa en situaciones donde los valores se sesgan positivamente. Por ejemplo precios de acciones, valuación de seguros, etc. La variable incierta puede incrementarse sin limite pero no puede caer por debajo de cero. La variable se sesga positivamente pero la mayoría de valores se encuentran cerca al limite inferior. El Ln de la variable incierta produce una distribución normal. En Excel pueden usarse las funciones: DISTR.LOG.INV y la función DISTR.LOG.NORM Distribución Triangular La distribución triangular no puede generarse con una función especifica de Excel, sin embargo puede programarse utilizando la función de densidad y la función acumulativa de la distribución. Distribución basada en una posición pesimista, probable y optimista. La distribución esta definida por tres parámetros: valor mínimo (a), Valor probable (b), valor máximo (c). Variando el parámetro mas probable la distribución puede ser simétrica o asimétrica. Parámetros: P(x) h a b c 1 µ = (a + b + c) 3 1 2 2 2 σ= a + b + c − ab- ac- bc 18 ( ) Distribución Triangular La función de densidad define la probabilidad de ocurrencia de cada valor x. Función de Densidad f(x) 2 (x - a) a ≤ x≤ b (c- a)(b- a) - 2 (x - c) b ≤ x≤ c (c- a)(c- b) f(x)= h A1 A2 a c b Distribución Triangular La Función Acumulativa define probabilidad acumulada hasta el valor x Función Acumulativa F(x)= (x - a)2 (c- a)(b- a) 2 1- la F(x) a ≤ x≤ b (c- x) b ≤ x≤c (c- a)(c- b) 1 R a xb c Distribución Triangular Es utilizada cuando hay información incompleta de la variable o como aproximación a otras distribuciones. El resultado simulado se basa en: Generación del numero aleatorio R y este será igual a F(x) (Valor entre 0-1) Comparar R con A1 (probabilidad acumulada entre a – b) y determinar si es mayor o menor. Calcular el valor (x) de la función acumulativa dependiendo si R es mayor o menor que A1. p(x) 2 b-a , A1 = c-a c-a si R < A1 ∴ x = a + R.(c - a).(b - a) h= h A1 A2 si R > A1 ∴ x = c - (1 - R).(c - a).(c - b) a b c Distribución Uniforme La variable aleatoria se mueve entre un valor mínimo y máximo todas con igual nivel de probabilidad . Se usa frecuentemente cuando hay poco conocimiento de la variable. (b- a)2 a +b y σ= Parámetros: µ = 2 12 1 a ≤x≤b b-a x -a a ≤x≤b Funcion Acumulativa : F(x) = b-a Funciónde probabilidad : f(x) = p(c < x < d) = d-c b-a f(x) a c d b Distribución Exponencial Se usa para describir eventos que ocurren aleatoriamente en el tiempo. Describe la cantidad de tiempo entre ocurrencias. La distribución no se afecta por eventos previos. En Excel puede usarse la función DISTR.EXP TEOREMA DE LIMITE CENTRAL El Teorema del Límite Central indica que, bajo condiciones muy generales, la distribución de la suma de variables aleatorias tiende a una distribución gaussiana cuando la cantidad de variables es muy grande. Si se está realizando el muestreo de una población con distribución desconocida, sea finita o infinita, la distribución muestral de ẍ será aproximadamente normal con media µ y varianza σ2/n dado que el tamaño de la muestra es grande. Teorema: Si ẍ es la media de una muestra aleatoria de tamaño n, que se toma de una población con media µ y varianza finita σ2, entonces la forma del límite de la distribución de se distribuye aproximadamente como una variable, o de manera equivalente, TEOREMA DE CHEBYSHEV El matemático Ruso P.L. Chebyshev descubrió que la fracción del área entre cualquiera de dos valores simétricos alrededor de la media, se relaciona con la desviación estándar. La probabilidad de que cualquier variable aleatoria X, asuma un valor dentro de k desviaciones estándar de la media, es al menos 1-1/k2 . O sea: P(µ-kσ < X < µ+kσ ) ≥ 1 – 1/k2 Ejemplo: Suponga que el VPN de un proyecto tiene media µ = 8’ y varianza σ2=9’, y una distribución de probabilidad desconocida. Encuentre: a) P(-4’ < VPN < 20’) b)P(abs(VPN-8)≥6) PRUEBAS DE BONDAD DE AJUSTE Prueba de Normalidad: Jarque Bera Esta prueba se basa en la curtosis y la simetría de la muestra. S representa el coeficiente de asimetría, k-3 es el excedente de curtosis y n el tamaño de la muestra. H0: Los datos se distribuyen normalmente H1: Los datos no se distribuyen normalmente. α: Nivel de Significancia de la prueba. Estadístico de prueba: La prueba se rechaza a un nivel de confianza de 1-α si JB >= X2(2,α). Recuerde que la curtosis de una distribución normal es 3. Ejemplo: Realice una prueba de normalidad sobre la serie de números aleatorio normales generada con anterioridad. En Excel puede usar la función PRUEBA.CHI.INV. Utilice un n grande. PRUEBAS DE BONDAD DE AJUSTE Chi cuadrado Esta prueba aplica solo sobre distribuciones de probabilidad discretas como la Poisson o la binomial (distribuciones univariadas). También puede aplicarse también sobre muestras continuas agrupadas en clases. Los datos deben organizarse en k clases ascendentes. Esta prueba no es precisa si en alguna clase existe una frecuencia observada o esperada menor al 5%. Definición de la prueba: Oi :Es la frecuencia observada para la clase i Ei :Es la frecuencia esperada en la clase i. H0: Los datos siguen una distribución específica dada H1: Los datos no siguen una distribución específica. Estadístico de prueba: PRUEBAS DE BONDAD DE AJUSTE Chi cuadrado Donde Oi es la frecuencia observada para la clase i y Ei es la frecuencia esperada en la clase i. La frecuencia esperada se calcula como: F, es la función de probabilidad acumulada de los datos que se desean probar, Yu es el límite superior de la clase i, YL es el límite inferior de la clase i, N es el total de las observaciones. Ejemplos Iniciales de Simulación Montecarlo 1.Estimación del número pi. 2. Swap DTF – IPC 3.The Hippo Example