Distribución de Probabilidad Normal Daniel Paredes Moreno Estadı́stica I Departamento de Estadı́stica-FACES-ULA 22 de Diciembre de 2013 Daniel Paredes Moreno Estadı́stica I Introducción La distribución normal es quizás la distribución de probabilidad para variables aleatorias continuas mas estudiada en la teorı́a estadı́stica debido a su gran aplicabilidad en fenómenos de toda naturaleza. Llamada también distribución gaussiana en honor al trabajo que el matemático alemán del siglo XVIII Karl Gauss realizó con ella, fue propuesta inicialmente por Abraham de Moivre en 1738. Hoy en dı́a, la distribución normal, tiene aplicación prácticamente en todas las áreas donde la estadı́stica opera, y en una infinidad de métodos que esta emplea. Existe un sin número de variables aleatorias que pueden ser explicadas como un modelo de distribución normal por lo que su estudio es casi obligatorio para cualquier curso de estadı́stica básica. Daniel Paredes Moreno Estadı́stica I Introducción Algunos ejemplos incluyen: Ingresos mensuales de los empleados de una planta, que ganan en promedio 17000 Bs. con desviación estándar de 1000 Bs. Peso de los paquetes de arroz producidos por cierta marca, los cuales tienen un peso promedio de 900 gr. con desviación estándar de 1 gr. Contaminación del aire en una comunidad medida en particulas por millón, con un promedio de 2500 y una desviación estándar de 750 particulas por millón. Ingreso per cápita de un paı́s en desarrollo, con un ingreso promedio de 1400 $ con desviación estándar de 300 $. Número de delitos violentos por año en una ciudad. Con un promedio de 8000 y una desviación estándar de 900. Daniel Paredes Moreno Estadı́stica I Función de Densidad de Probabilidad Normal Función de Densidad de Probabilidad Normal Sea X una v.a. continua. Diremos que X sigue una Distribución Normal con parámetros µ y σ 2 si y solo si su función de densidad de probabilidad viene dada por: −(x−µ)2 2σ 2 e f (x) = √ 2πσ 2 ∀x ∈ (−∞, ∞) En este caso diremos que X ∼ normal µ, σ 2 donde µ ∈ (−∞, ∞) y σ > 0. Daniel Paredes Moreno Estadı́stica I Caracterı́sticas de la Distribución Normal Gráfica de la distribución normal. También llamada curva de Gauss o campana de Gauss, la forma de la gráfica de esta distribución es la siguiente: Daniel Paredes Moreno Estadı́stica I Caracterı́sticas de la Distribución Normal Parámetros de la Distribución Normal. Valor Esperado y Varianza de una Variable Aleatoria con Distribución Normal Sea X ∼ Normal µ, σ 2 entonces se sigue que: E [X ] = µ µ ∈ (−∞, ∞) V [X ] = σ 2 σ > 0 DE [X ] = σ σ > 0 Daniel Paredes Moreno Estadı́stica I Caracterı́sticas de la Distribución Normal Parámetros de la Distribución Normal. Los valores de µ y σ 2 representan caracterı́sticas especı́ficas para la distribución normal. Supongamos que X ∼ Normal(µ, σ 2 = 1). Veamos el efecto que tiene µ sobre la curva normal. Observe que µ es tanto la media como la mediana y la moda de la distribución. Daniel Paredes Moreno Estadı́stica I Caracterı́sticas de la Distribución Normal Parámetros de la Distribución Normal. Supongamos que X ∼ Normal(µ = 0, σ 2 ). Veamos el efecto que tiene σ sobre la curva normal. Daniel Paredes Moreno Estadı́stica I Caracterı́sticas de la Distribución Normal Regla Empı́rica. Supongamos que X ∼ Normal(µ, σ 2 ). Entonces se sigue que los valores de la variable estan distribuidos aproximadamente de la siguiente manera en función de µ y σ Daniel Paredes Moreno Estadı́stica I Ejemplo Consideremos una variable aleatoria X :Ingreso mensual de los empleados de una planta. Decir que esta variable aleatoria sigue una distribución normal, significa en la práctica que su verdadera distribución de frecuencias puede ser aproximada por la curva de la distribución normal con media µ y desviación estándar σ Daniel Paredes Moreno Estadı́stica I Ejemplo Consideremos que X :Ingreso mensual de los empleados de una planta sigue una distribución normal con media µ = 17000 Bs y desviación estándar de σ = 1000 Bs. Esto lo escribimos como X ∼ Normal (µ = 17000, σ = 1000). Supongamos que queremos calcular las siguientes probabilidades: 1 P (17000 < X < 18000) 2 P (X > 16800) 3 P (X < 19000) Daniel Paredes Moreno Estadı́stica I Ejemplo P (17000 < X < 18000) Por la regla empı́rica vista antes podemos calcular esta probabilidad como: Daniel Paredes Moreno Estadı́stica I Distribución Normal Estándar y Proceso de Estandarización Distribución Normal Estandar Sea X una v.a. tal que X ∼ Normal (µ, σ). La nueva variable aleatoria Z definida como: Z= (X − µ) σ se conoce como Variable Aleatoria Estandarizada. La variable Z también tiene distribución normal, de modo que: Z ∼ Normal (µ = 0, σ = 1) La distribución Normal (µ = 0, σ = 1) se conoce como Distribución Normal Estándar. Daniel Paredes Moreno Estadı́stica I Distribución Normal Estándar Gráfico de la Distribución normal estándar. Daniel Paredes Moreno Estadı́stica I Función de Distribución de Probabilidad Acumulada Normal Sea Z ∼ Normal (µ = 0, σ = 1) entonces: La F.D.P.A. normal estándar viene dada por: FZ (z) = P (Z ≤ z) = φ (z) Daniel Paredes Moreno Estadı́stica I Ejemplo Consideremos que X :Ingreso mensual de los empleados de una planta, donde X ∼ Normal (µ = 17000, σ = 1000). Si hacemos (X − 17000) (X − µ) = Z= σ 1000 De esta manera Z ∼ Normal (µ = 0, σ = 1) . (16800−17000) P (X > 16800) = P (X −17000) > = 1000 1000 P (Z > −0,2) = 1 − P (Z ≤ −0,2) = 1 − φ (−0,2) Daniel Paredes Moreno Estadı́stica I (16800−17000) > = P (X > 16800) = P (X −17000) 1000 1000 P (Z > −0,2) = 1 − P (Z ≤ −0,2) = 1 − φ (−0,2) Daniel Paredes Moreno Estadı́stica I Ejemplo Consideremos que X :Ingreso mensual de los empleados de una planta, donde X ∼ Normal (µ = 17000, σ = 1000). Si hacemos (X − 17000) (X − µ) = Z= σ 1000 De esta manera Z ∼ Normal (µ = 0, σ = 1) . P (X < 19000) = P (X −17000) < 1000 P (Z < 2) = P (Z < 2) = φ (2) Daniel Paredes Moreno (19000−17000) 1000 Estadı́stica I = < P (X < 19000) = P (X −17000) 1000 P (Z < 2) = P (Z < 2) = φ (2) Daniel Paredes Moreno (19000−17000) 1000 Estadı́stica I =