Tema 4: Probabilidad y Teoría de Muestras Estadística. 4o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 1 / 12 Índice 1 Introducción 2 Espacio de probabilidad 3 Variables aleatorias. Independencia 4 Parámetros asociados a una variable aleatoria 5 Principales distribuciones de probabilidad 6 Muestra Aleatoria Simple de una variable aleatoria 7 Distribuciones muestrales Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 2 / 12 1. Introducción Si a partir de los datos obtenidos de los individuos de la muestra, pretendemos sacar conclusiones generales que afecten al total de la población, debemos recurrir al uso de la Inferencia Estadística. Las conclusiones que extraigamos con el uso de la Inferencia Estadística se soportan en una teoría matemática que nos proporcionan modelos adecuados para los fenómenos aleatorios: la Teoría de la Probabilidad. En este tema introduciremos los conceptos e ideas fundamentales de dicha Teoría, que nos serán necesarios para desarrollar el resto de capítulos, dedicados a la Inferencia Estadística. No es el objeto de esta asignatura la dimensión puramente matemática de la Teoría de la Probabilidad, sino más bien su vertiente más aplicada. Por ello, intentando alejarnos lo menos posible del rigor matemático, trataremos que los conceptos aquí expuestos no requieran del alumno más esfuerzo del necesario para desarrollar e interpretar correctamente un análisis inferencial de un conjunto de datos. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 3 / 12 2. Espacio de probabilidad Definición El espacio de resultados, Ω, es el conjunto de todos los posibles resultados de un experimento aleatorio. Este conjunto es el objeto matemático que, de alguna manera, representa a la población en el experimento estadístico que tratamos de modelizar. Se trata de una representación teórica, no de la población en sí. Sucesos Llamaremos suceso a cualquier subconjunto de Ω. Un suceso A ocurre si el resultado del experimento es uno de los elementos de A. Suceso complementario de A (Ā): ocurre cuando el resultado del experimento no es un elemento de A. Suceso unión de A y B (A ∪ B): ocurre cuando ó bien sucede A ó bien sucede B. Suceso intersección de A y B (A ∩ B): ocurre cuando A y B suceden simultáneamente. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 4 / 12 2. Espacio de probabilidad Probabilidad Una probabilidad es una aplicación que a cada suceso A de Ω le asigna un número, P(A), con 0 ≤ P(A) ≤ 1, y que verifica además los siguientes axiomas: P(Ω) = 1. Si A1 , A2 son sucesos con intersección vacía (que no ocurren simultáneamente) entonces P(A1 ∪ A2 ) = P(A1 ) + P(A2 ). De estos axiomas se deducen otras propiedades como por ejemplo P(Ā) = 1 − P(A) ó P(∅) = 0 Intuitivamente, la probabilidad es una medida para cuantificar cómo de verosímil es un suceso en un experimento aleatorio. Si P(A) = 0, el suceso A no va a ocurrir. Si P(A) = 1, el suceso A va a ocurrir con toda seguridad. Conforme mayor sea el número P(A) más verosímil es el suceso A. El conjunto Ω junto con la probabilidad P forman un Espacio de Probabilidad. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 5 / 12 2. Espacio de probabilidad Ejemplo 1 Se lanzan dos dados, uno rojo y otro azul. El espacio de resultados Ω estará constituido por los 36 posibles resultados del experimento, es decir: Ω = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), . . . , (6, 6)} En el caso de que ambos dados sean cubos perfectos, los 36 sucesos elementales son equiprobables, es decir, cada uno presenta una probabilidad igual a 1/36. En este caso, como siempre que se suponga simetría en el fenómeno bajo estudio, las probabilidades podrán ser calculadas de la forma: P(A) = No de sucesos elementales favorables a A No total de sucesos elementales Así P(rojo = 4) = 1 1 3 1 , P(azul < 3) = , P(rojo + azul = 10) = = 6 3 36 12 Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 6 / 12 2. Espacio de probabilidad Probabilidad condicional A veces, el hecho de que ocurra un suceso, B, influye en la probabilidad de los otros sucesos. A la probabilidad de un suceso A cuando sabemos que ha ocurrido otro suceso B se le denomina probabilidad de A condicionada a B y se calcula: P(A|B) = probabilidad de que A y B ocurran simultáneamente P(A ∩ B) = P(B) probabilidad de que ocurra B Cuando el suceso B no influye en la probabilidad del suceso A, P(A|B) = P(A) y se dice que A y B son independientes. P(A ∩ B) = P(A) · P(B) Ejemplo 1 (continuación) P((2, 6)) = P( rojo = 2) · P( azul = 6) Por tanto los sucesos “rojo = 2” y “azul = 6” son independientes. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 7 / 12 3. Variables aleatorias. Independencia Variable aleatoria Una variable aleatoria, X, es una aplicación que a cada elemento de Ω le asocia un número real (cuantitativa) o alguna de las modalidades de cierto carácter (cualitativa). Intuitivamente, una variable aleatoria es la representación teórica de la variable que estamos estudiando en el experimento estadístico. De hecho no haremos diferencia entre la variable definida en la población y la definida en Ω. Nos centraremos en las variables cuantitativas, que como ya sabemos pueden ser discretas o continuas. Distribución de probabilidad Son los valores que la probabilidad P asigna a los sucesos de Ω relacionados con la variable X. Conociendo la distribución de probabilidad de X podemos calcular la probabilidad de que X tome el valor 2 ( P(X = 2) ). la probabilidad de que X tome un valor entre 0.5 y 3.4 ( P(0.5 ≤ X ≤ 3.4) ). Intuitivamente, la distribución de probabilidad es un modelo teórico que ajustamos a la variable de nuestro experimento estadístico y que nos facilita el proceso de extraer conclusiones. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 8 / 12 3. Variables aleatorias. Independencia Variables aleatorias discretas Si x1 , x2 , . . . son sus posibles valores, su distribución de probabilidad queda determinada por las probabilidades P(X = xi ) i = 1, 2, . . . Variables aleatorias continuas Su distribución de probabilidad queda determinada por una función de densidad f (x) ≥ 0. Las probabilidades relacionadas con X son las áreas que quedan por debajo de la curva que representa a f (x) y por tanto se calculan mediante integrales definidas: Z a P(X ≤ a) = Z f (x)dx , P(a ≤ X ≤ b) = −∞ b f (x)dx , P(X = a) = 0 a Independencia de variables aleatorias Dos variables aleatorias se dicen independientes si el valor que toma una de ellas no influye en la distribución de probabilidad de la otra. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 9 / 12 4. Parámetros asociados a una variable aleatoria Media poblacional (µ) Es el centro de gravedad de la distribución de probabilidad de X: n X Si X discreta: µ = x1 P(X = x1 ) + · · · + xn P(X = xn ) = xi P(X = xi ) i=1 ∞ Z Si X continua: µ = xf (x)dx −∞ Varianza poblacional (σ 2 ) y desviación típica poblacional (σ) Miden la dispersión de la distribución de probabilidad de X en torno a µ: n X Si X discreta: σ 2 = (xi − µ)2 P(X = xi ) i=1 2 Z ∞ Si X continua: σ = (x − µ)2 f (x)dx −∞ 2 Mientras √ que las unidades de σ son las de la variable X elevadas al cuadrado, σ = σ 2 tiene las mismas unidades que la variable X. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 10 / 12 4. Parámetros asociados a una variable aleatoria Cuantiles (xα ) Nos interesarán especialmente en variables aleatorias continuas. Dado un número α tal que 0 < α < 1, se define el cuantil por la derecha de la variable aleatoria X como el valor, xα , que deja que deja a la derecha una probabilidad de α, es decir, que verifica que P(X ≥ xα ) = α La letra x se sustituirá en cada caso por el símbolo que caracterice a la distribución de probabilidad de X. El cuantil de orden 0.5 es la mediana de la distribución de probabilidad de X. Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 11 / 12 Licenciatura en Ciencias Ambientales (4o Curso) Tema 4: Probabilidad y Teoría de Muestras Curso 2008-2009 12 / 12