Tema 4: Probabilidad y Teoría de Muestras

Anuncio
Tema 4: Probabilidad y Teoría de Muestras
Estadística. 4o Curso.
Licenciatura en Ciencias Ambientales
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
1 / 12
Índice
1
Introducción
2
Espacio de probabilidad
3
Variables aleatorias. Independencia
4
Parámetros asociados a una variable aleatoria
5
Principales distribuciones de probabilidad
6
Muestra Aleatoria Simple de una variable aleatoria
7
Distribuciones muestrales
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
2 / 12
1. Introducción
Si a partir de los datos obtenidos de los individuos de la muestra, pretendemos sacar
conclusiones generales que afecten al total de la población, debemos recurrir al uso de
la Inferencia Estadística.
Las conclusiones que extraigamos con el uso de la Inferencia Estadística se soportan
en una teoría matemática que nos proporcionan modelos adecuados para los
fenómenos aleatorios: la Teoría de la Probabilidad.
En este tema introduciremos los conceptos e ideas fundamentales de dicha Teoría, que
nos serán necesarios para desarrollar el resto de capítulos, dedicados a la Inferencia
Estadística.
No es el objeto de esta asignatura la dimensión puramente matemática de la Teoría de
la Probabilidad, sino más bien su vertiente más aplicada. Por ello, intentando
alejarnos lo menos posible del rigor matemático, trataremos que los conceptos aquí
expuestos no requieran del alumno más esfuerzo del necesario para desarrollar e
interpretar correctamente un análisis inferencial de un conjunto de datos.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
3 / 12
2. Espacio de probabilidad
Definición
El espacio de resultados, Ω, es el conjunto de todos los posibles resultados de un
experimento aleatorio. Este conjunto es el objeto matemático que, de alguna manera,
representa a la población en el experimento estadístico que tratamos de modelizar. Se
trata de una representación teórica, no de la población en sí.
Sucesos
Llamaremos suceso a cualquier subconjunto de Ω. Un suceso A ocurre si el resultado
del experimento es uno de los elementos de A.
Suceso complementario de A (Ā): ocurre cuando el resultado del experimento no
es un elemento de A.
Suceso unión de A y B (A ∪ B): ocurre cuando ó bien sucede A ó bien sucede B.
Suceso intersección de A y B (A ∩ B): ocurre cuando A y B suceden
simultáneamente.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
4 / 12
2. Espacio de probabilidad
Probabilidad
Una probabilidad es una aplicación que a cada suceso A de Ω le asigna un número,
P(A), con 0 ≤ P(A) ≤ 1, y que verifica además los siguientes axiomas:
P(Ω) = 1.
Si A1 , A2 son sucesos con intersección vacía (que no ocurren simultáneamente)
entonces P(A1 ∪ A2 ) = P(A1 ) + P(A2 ).
De estos axiomas se deducen otras propiedades como por ejemplo
P(Ā) = 1 − P(A)
ó
P(∅) = 0
Intuitivamente, la probabilidad es una medida para cuantificar cómo de verosímil es
un suceso en un experimento aleatorio. Si P(A) = 0, el suceso A no va a ocurrir. Si
P(A) = 1, el suceso A va a ocurrir con toda seguridad. Conforme mayor sea el
número P(A) más verosímil es el suceso A.
El conjunto Ω junto con la probabilidad P forman un Espacio de Probabilidad.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
5 / 12
2. Espacio de probabilidad
Ejemplo 1
Se lanzan dos dados, uno rojo y otro azul. El espacio de resultados Ω estará
constituido por los 36 posibles resultados del experimento, es decir:
Ω = {(1, 1), (1, 2), . . . , (1, 6), (2, 1), . . . , (6, 6)}
En el caso de que ambos dados sean cubos perfectos, los 36 sucesos elementales son
equiprobables, es decir, cada uno presenta una probabilidad igual a 1/36.
En este caso, como siempre que se suponga simetría en el fenómeno bajo estudio, las
probabilidades podrán ser calculadas de la forma:
P(A) =
No de sucesos elementales favorables a A
No total de sucesos elementales
Así
P(rojo = 4) =
1
1
3
1
, P(azul < 3) = , P(rojo + azul = 10) =
=
6
3
36
12
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
6 / 12
2. Espacio de probabilidad
Probabilidad condicional
A veces, el hecho de que ocurra un suceso, B, influye en la probabilidad de los otros
sucesos. A la probabilidad de un suceso A cuando sabemos que ha ocurrido otro
suceso B se le denomina probabilidad de A condicionada a B y se calcula:
P(A|B) =
probabilidad de que A y B ocurran simultáneamente
P(A ∩ B)
=
P(B)
probabilidad de que ocurra B
Cuando el suceso B no influye en la probabilidad del suceso A, P(A|B) = P(A) y se
dice que A y B son independientes.
P(A ∩ B) = P(A) · P(B)
Ejemplo 1 (continuación)
P((2, 6)) = P( rojo = 2) · P( azul = 6)
Por tanto los sucesos “rojo = 2” y “azul = 6” son independientes.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
7 / 12
3. Variables aleatorias. Independencia
Variable aleatoria
Una variable aleatoria, X, es una aplicación que a cada elemento de Ω le asocia un
número real (cuantitativa) o alguna de las modalidades de cierto carácter (cualitativa).
Intuitivamente, una variable aleatoria es la representación teórica de la variable que
estamos estudiando en el experimento estadístico. De hecho no haremos diferencia
entre la variable definida en la población y la definida en Ω. Nos centraremos en las
variables cuantitativas, que como ya sabemos pueden ser discretas o continuas.
Distribución de probabilidad
Son los valores que la probabilidad P asigna a los sucesos de Ω relacionados con la
variable X. Conociendo la distribución de probabilidad de X podemos calcular
la probabilidad de que X tome el valor 2 ( P(X = 2) ).
la probabilidad de que X tome un valor entre 0.5 y 3.4 ( P(0.5 ≤ X ≤ 3.4) ).
Intuitivamente, la distribución de probabilidad es un modelo teórico que ajustamos a
la variable de nuestro experimento estadístico y que nos facilita el proceso de extraer
conclusiones.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
8 / 12
3. Variables aleatorias. Independencia
Variables aleatorias discretas
Si x1 , x2 , . . . son sus posibles valores, su distribución de probabilidad queda
determinada por las probabilidades
P(X = xi ) i = 1, 2, . . .
Variables aleatorias continuas
Su distribución de probabilidad queda determinada por una función de densidad
f (x) ≥ 0. Las probabilidades relacionadas con X son las áreas que quedan por debajo
de la curva que representa a f (x) y por tanto se calculan mediante integrales definidas:
Z
a
P(X ≤ a) =
Z
f (x)dx
,
P(a ≤ X ≤ b) =
−∞
b
f (x)dx
,
P(X = a) = 0
a
Independencia de variables aleatorias
Dos variables aleatorias se dicen independientes si el valor que toma una de ellas no
influye en la distribución de probabilidad de la otra.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
9 / 12
4. Parámetros asociados a una variable aleatoria
Media poblacional (µ)
Es el centro de gravedad de la distribución de probabilidad de X:
n
X
Si X discreta: µ = x1 P(X = x1 ) + · · · + xn P(X = xn ) =
xi P(X = xi )
i=1
∞
Z
Si X continua: µ =
xf (x)dx
−∞
Varianza poblacional (σ 2 ) y desviación típica poblacional (σ)
Miden la dispersión de la distribución de probabilidad de X en torno a µ:
n
X
Si X discreta: σ 2 =
(xi − µ)2 P(X = xi )
i=1
2
Z
∞
Si X continua: σ =
(x − µ)2 f (x)dx
−∞
2
Mientras
√ que las unidades de σ son las de la variable X elevadas al cuadrado,
σ = σ 2 tiene las mismas unidades que la variable X.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
10 / 12
4. Parámetros asociados a una variable aleatoria
Cuantiles (xα )
Nos interesarán especialmente en variables aleatorias continuas. Dado un número α
tal que 0 < α < 1, se define el cuantil por la derecha de la variable aleatoria X como
el valor, xα , que deja que deja a la derecha una probabilidad de α, es decir, que
verifica que
P(X ≥ xα ) = α
La letra x se sustituirá en cada caso por el símbolo que caracterice a la distribución de
probabilidad de X.
El cuantil de orden 0.5 es la mediana de la distribución de probabilidad de X.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
11 / 12
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 4: Probabilidad y Teoría de Muestras
Curso 2008-2009
12 / 12
Descargar