AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS 1. Objetivos: a) b) c) d) e) f) Aprender a calcular probabilidades de las distribuciones Normal y Chi-cuadrado. Estudio de la función de densidad de la distribución Normal ~ N(µ;σ) Cálculo de la función de distribución de la distribución Normal ~ N(µ;σ) Estudio de la función de densidad de la distribución Chi-cuadrado. Cálculo de la función de distribución de la distribución Chi-cuadrado. Resolución de problemas con ambos tipos de distribuciones. 2. Introducción a variables aleatorias continuas: El la práctica anterior se hizo una introducción a las variables aleatorias. Esquemáticamente: Sea X una v.a. definida sobre el espacio probabilístico ( S, P) y sea F su función de distribución. La v.a. X podrá ser de tipo discreto o de tipo continuo. VARIABLE ALEATORIA X V.A. CONTINUA V.A. DISCRETA FUNCION DE DENSIDAD f(x) ESPERANZA Y VARIANZA UNIFORME NORMAL CHI-CUADRADO T DE STUDENT Y F SNEDECOR i. ii. X será una v.a. discreta cuando sólo puede tomar un número finito o infinito, pero numerable, de valores. Estas v.a. fueron objeto de estudio en esta práctica1. X será una v.a. continua cuando puede tomar todos los valores posibles de un intervalo, finito o infinito. A este tipo de variables va dedicada esta práctica. DEFINICIÓN : Diremos que una variable aleatoria X : Ω → ℜ es de tipo continuo si existe una función real positiva f : ℜ → ℜ , que llamaremos función de densidad, tal que : x F ( x) = ∫ f (t )dt −∞ PROPIEDADES: i. f ( x) ≥ 0 1 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS +∞ ∫ f ( x)dx = 1 ii. −∞ b P (a ≤ X ≤ b ) = ∫ f (t )dt iii. a iv. Si f(x) es continua en a, entonces F’(a) = f(a) Las dos primeras propiedades caracterizan a las funciones de densidad ya que si una función cualquiera las verifica, puede construirse una v.a. de tipo continuo para la que será su función de densidad. Estas propiedades únicamente indican que una función de densidad es una función real positiva que encierra bajo ella área 1. En la propiedad tercera pueden intercambiarse los menores o iguales por menores estrictos y la propiedad se sigue cumpliendo. La propiedad cuarte proporciona una forma de calcular la función de densidad a partir de una función de distribución continua en toda la recta real y derivable en casi todos los puntos. 3. Características de una variable aleatoria continua 3.1. Esperanza Matemática o valor esperado Se representa por E(X) y se calcula, en el caso continuo, mediante la fórmula: E(X ) = +∞ ∫ x ⋅ f ( x)dx −∞ Gráficamente, la esperanza de una variable aleatoria continua coincide con el centro de gravedad del área encerrada entre la función de densidad y el eje OX. 3.2. Varianza Se representa por Var(X)=σ2 y se calcula, en el caso continuo, mediante la fórmula: ( ) Var ( X ) = E X 2 − E ( X ) 2 +∞ ( ) ∫x donde E X 2 = 2 ⋅ f ( x)dx . −∞ La desviación típica σ se calcula como la raíz cuadrada de la varianza. 4. Modelos de variables aleatorias continuas 4.1. Distribución Uniforme : X~U(a;b) Esta distribución, también llamada rectangular por el aspecto de su función de densidad, fue utilizada por primera vez por Bayes en 1763 y por Laplace en 1812. Según la definición de esta variable, cualquier elección de números reales al azar en un intervalo de longitud finita, es una v.a. uniforme. CARACTERÍSTICAS: i. Parámetros : a, b, con a < b 2 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS ii. Función de densidad : f ( x) = iii. Media : E(X) = iv. Varianza : Var (X)= a+b 2 1 si a ≤ x ≤ b b−a (b − a )2 12 Si una v.a. tiene función de distribución F(x), la variable Y=F(x) es U(0;1). Esta propiedad es fundamental en la generación de números aleatorios y técnicas de simulación. 4.2. Distribución Normal: X~N(µ;σ) “Si los griegos la hubiesen conocido, la habrían adorado como a un dios”. Galton (1822-1911) Esta distribución, en su versión más simple N(0;1), fue introducida por primera vez por De Moivre en 1733 como aproximación de la distribución binomial. Posteriormente, Laplace y Gauss la hallaron empíricamente estudiando la distribución de los errores de medición, y tras sus trabajos se convirtió en la distribución más utilizada. CARACTERÍSTICAS: i. Parámetros : − ∞ < µ < ∞ ; 0 < σ < ∞ ii. Función de densidad: f ( x) = iii. iv. Media : E(X) = µ Varianza : Var (X)= σ2 1 σ 2π − ( x − µ )2 e 2σ 2 si − ∞ < x < ∞ 4.3. Distribuciones relacionadas con la Normal Son distribuciones que surgen teóricamente como resultado del proceso de inferencia estadística. 4.3.1. Distribución CHI-CUADRADO ( ℵ 2 ) de Pearson Esta distribución surge cuando se desea conocer la distribución de la suma de los cuadrados de variables independientes e igualmente distribuidas con distribución Normal. DEFINICIÓN : Sean X 1 , X 2 ,........., X n , n variables aleatorias independientes N(0;1). Entonces la variable n aleatoria X 12 + X 22 + .......... + X n2 = ∑ X i2 sigue una distribución ℵ 2 (chi-cuadrado) con n i =1 grados de libertad. CARACTERÍSTICAS: i. ii. iii. Función de densidad: mediante tablas. Media : E(X) = n Varianza : Var (X)= 2n 3 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS 4.3.2. Distribución t de STUDENT El origen de esta distribución se encuentra en la estimación de esperanzas de distribuciones normales cuando su desviación típica es desconocida. Gosset (1876-1937), quien publicó bajo el seudónimo de Student, la propuso y tabuló en 1908. DEFINICIÓN : Sean X y X 1 , X 2 ,........., X n , variables aleatorias independientes N(0;1). Entonces la variable X sigue una distribución t de Student con n grados de aleatoria t = X 12 + X 22 + .......... + X n2 n libertad. CARACTERÍSTICAS: i. ii. iii. Función de densidad: mediante tablas. Media : E(X) = 0 si n>1 n Varianza : Var (X)= si n >2 n−2 4.3.3. Distribución F de SNEDECOR DEFINICIÓN : Sean X e Y variables aleatorias independientes con distribución ℵ 2 de n y m grados de X libertad, respectivamente . Entonces la variable aleatoria Fn , m = n sigue una distribución F Y m de Snedecor con n grados de libertad en el numerador y m grados de libertad en el denominador. 5. Variables aleatorias continuas usando EXCEL: 5.1. Distribución Normal = DISTR.NORM(x;media;desv_estándar;acum) Devuelve la distribución normal para la media y desviación estándar especificadas. Esta función tiene un gran número de aplicaciones en estadística, incluidas las pruebas de hipótesis. ¾ Sintaxis DISTR.NORM(x;media;desv_estándar;acum) X es el valor cuya distribución desea obtener. 4 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS Media es la media de la distribución. Desv_estándar es la desviación típica de la distribución. Acum es un valor lógico que determina la forma de la función. ¾ Si el argumento acum = FALSO devuelve el valor de la función de densidad. ¾ Si el argumento acum =VERDADERO devuelve el valor de la función de distribución. ¾ Ejemplo Datos Descripción A2 =42 Valor cuya distribución desea obtener A3 = 40 Media de la distribución A4 = 1,5 Desviación típica de la distribución Fórmula Descripción (Resultado) =DISTR.NORM(A2;A3;A4;VERDADERO) Función de distribución : F(42)= 0,908789 para N(40;1,5) =DISTR.NORM(A2;A3;A4;FALSO) Función de densidad: 5.2. Inversa de la Función de distribución Normal =DISTR.NORM.INV(probabilidad;media;desv_estándar) Devuelve el inverso de la distribución acumulativa normal para la media y desviación estándar especificadas. ¾ Sintaxis DISTR.NORM.INV(probabilidad;media;desv_estándar) Probabilidad es una probabilidad correspondiente a la distribución normal. Media es la media de la distribución. Desv_estándar es la desviación típica de la distribución. • Si media = 0 y desv_estándar = 1, DISTR.NORM.INV utiliza la función de distribución normal estándar (vea DISTR.NORM.ESTAND.INV). 5 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS ¾ Ejemplo Datos Descripción A2 = 0,908789 Probabilidad correspondiente a la distribución normal A3 = 40 Media de la distribución A4 =1,5 Desviación típica de la distribución Fórmula Descripción (Resultado) =DISTR.NORM.INV(A2;A3;A4) Inversa de la Función de distribución normal: K= 42 cumple que P( X ≤ K ) = 0.908789 5.3. Tipificación = NORMALIZACION(x;media;desv_estándar) Devuelve un valor tipificado de una distribución Normal de media =µ y desviación típica=σ2. ¾ Sintaxis NORMALIZACION(x;media;desv_estándar) X es el valor que se desea tipificar. Media es la media de la distribución. Desv_estándar es la desviación típica de la distribución. ¾ Ejemplo Datos Descripción A2 = 42 Valor que se desea tipificar A3 = 40 Media de la distribución A4= 1,5 Desviación típica de la distribución Fórmula Descripción (Resultado) =NORMALIZACION(A2;A3;A4) Valor TIPIFICADO de 42 = 1,333333 5.4. Distribución CHI-CUADRADO = DISTR.CHI(x;grados_de_libertad) 6 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS Devuelve la probabilidad de una v.a. que sigue una distribución chi cuadrado. Concretamente DISTR.CHI nos calcula P(X>x) = 1- F(x), donde X es una variable aleatoria chi-cuadrado con n grados de libertad . ¾ Sintaxis =DISTR.CHI(x;grados_de_libertad) x es el valor al que se desea evaluar de la distribución. Grados_de_libertad es el número de grados de libertad. ¾ Ejemplo Datos Descripción A2= 18,307 Valor que se desea evaluar la distribución A3= 10 Grados de libertad Fórmula Descripción (Resultado) =DISTR.CHI(A2;A3) Nos calcula el área a la derecha del punto: 5.5. Inversa de la función de distribución de una Chi-cuadrado = PRUEBA.CHI.INV(probabilidad;grados_de_libertad) Devuelve, para una probabilidad dada, el valor de la variable aleatoria siguiendo una distribución chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...), entonces PRUEBA.CHI.INV(probabilidad,...) = x. ¾ Sintaxis PRUEBA.CHI.INV(probabilidad;grados_de_libertad) Probabilidad es una probabilidad asociada a la distribución chi cuadrado. Grados_de_libertad es el número de grados de libertad. ¾ Ejemplo 7 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS Datos Descripción 0,05 P(X>k) = 0,05 10 Grados de libertad Fórmula Descripción (Resultado) =PRUEBA.CHI.INV(A2;A3) Nos devuelve el valor k=18,30703 cumpliendo P(x>k) = 0,05 6. Caso práctico 6.1. Cálculo de probabilidades en una v.a. Normal : 6.1.1. Crea una hoja de cálculo (HOJA1) que calcule, para una v.a. Normal de media µ y desviación típica σ, los siguientes valores: a. La función de densidad f(x) . b. La función de distribución F(x) = P(X ≤ x). c. P( X>k) = 1 - P( X < k) d. P(a < X < b) = P(X<b) – P( x <a) e. el valor de k, sabiendo que P(X<k) = p (conocido). Utilizando la HOJA1 calcula las siguientes probabilidades: a. En una N(5;1), f (5) = _____ ; F(6)=______; P(X>4,32):_____ b. En una N(0;1), P(X < 0,2)=________; P(-0,6< X < 0,6) =______ c. En una N(-1;2,7) , P (−1,2 ≤ X ≤ 0,5) = _______; P(X > -2)= ______ d. En una N(5;0,8) , el valor de k cumpliendo P(x < k)=0,45 6.1.2.Crea otra hoja de cálculo (HOJA2) que contenga los valores de la función de densidad y de distribución en el intervalo [ µ -3 σ , µ +3 σ ] de la distribución normal de media µ y desviación típica σ . Utilizando los datos de la HOJA2 haz la representación gráfica de ambas funciones. 6.2. Resolución de problemas usando la Normal: Crea una hoja de cálculo (HOJA3) mediante la cual puedas resolver el siguiente problema: La altura de los jóvenes de determinada población sigue una distribución normal de media 1.76 y desviación típica 0,13. Calcular el porcentaje de población que tendrá una altura mayor que 2 metros, cuántos entre 1,70 y 1,80 y cuántos con altura menor que 1,60. Si de 1000 individuos medidos sólo 921 están entre 1,50 y 2,00 metros, ¿qué podemos pensar? 8 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 2 VARIABLES ALEATORIAS CONTINUAS 6.3. Cálculo de probabilidades en una v.a. Chi-cuadrado : 6.3.1. Crea una hoja de cálculo (HOJA4) que calcule, para una v.a chi-cuadrado con n grados de libertad, los siguientes valores: a) P( X>k) = 1 - P( X < k) b) La función de distribución F(x) = P(X ≤ x). c) P(a < X < b) = P(X<b) – P( x <a) d) el valor de k, sabiendo que P(X>k) = p (conocido). Utilizando la HOJA4 calcula las siguientes probabilidades: a) En un ℵ 212 , P(X<14,8) = _____ ; P(X > 10) b) En una ℵ 210, P(|X-8| < 5)=________; P(0,6< X < 6) =______ c) En una ℵ 220 , el percentil 92 , P(X<K ) = 0,92 9