Subido por Harold Marrero

BLOQUE I ESTADISTICA DESCRIPTIVA E INTRO

Anuncio
BLOQUE I: ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA
PROBABILIDAD
TEMA 1. ESTADÍSTICA DESCRIPTIVA
1. Generalidades
Estadística: Conjunto de teorías y técnicas para la recopilación, el análisis, la
interpretación y la presentación de conjuntos de datos
Etapas en un estudio estadístico:
 Recogida de datos, incluyendo el diseño de cómo se ha de
realizar dicha recogida
 Ordenación y representación de los datos obtenidos
 Descripción de las características más importantes
 Análisis estadístico formal de dichos datos, que permitirá
extraer conclusiones así como tomar decisiones
Estadística Descriptiva: Parte de la Estadística que tiene por objeto el estudio
de conjuntos numerosos de datos con el fin de dar una descripción numérica,
ordenación y simplificación de la información recogida en los datos
Población: conjunto de individuos o elementos sobre el que recaen las
observaciones y objeto de nuestro estudio
Muestra: subconjunto representativo de toda la población. Se suele considerar
una muestra de la población porque no siempre es posible estudiar
exhaustivamente la población por motivos de tiempo, coste excesivo u otro tipo
de dificultad
Carácter: propiedad que deseamos observar sobre los elementos de la
población
Modalidad: cada uno de los estados diferentes que puede presentar un carácter.
Las modalidades de un carácter deben ser exhaustivas e incompatibles. Cada
elemento debe pertenecer a una y solamente a una modalidad
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
1
P
…
M1
Mk
M2
P  M1  M 2   M k
M i  M j  ,i  j
Atendiendo a sus modalidades, los caracteres se pueden clasificar en
 Caracteres cualitativos: sus modalidades no están sujetas a medida
 Caracteres cuantitativos: sus distintas modalidades son medibles
Los caracteres cualitativos se denominan también atributos
Los caracteres cuantitativos se denominan también variables estadísticas y se
dividen en
 Variables estadísticas discretas: número finito o infinito numerable
de modalidades
 Variables estadísticas continuas: número de modalidades no
numerable
A veces la distinción entre variables estadísticas discretas y continuas es
arbitraria. Variables discretas con un gran número de valores se pueden
aproximar por continuas y, a su vez, variables continuas pueden tratarse como
discretas debido, por ejemplo, a la imprecisión de los instrumentos de medida.
Ejemplos. Para los habitantes de un cierto municipio se pueden estudiar los
siguientes caracteres: sexo, estado civil, profesión, número de hermanos, edad,
estatura, nivel de estudios,...
En este curso nos centraremos en el estudio de variables estadísticas.
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
2
Distribución de frecuencias
Población: P
Número de individuos observados: n
Carácter: C
Modalidades: M1,M2,...,Mk
Frecuencia absoluta de la modalidad Mi, ni: número de individuos observados
que presentan dicha modalidad
Y se cumple que
n1+...+nk=n
Frecuencia relativa de la modalidad Mi, fi: proporción de individuos
observados que presentan dicha modalidad, se obtiene como
fi 
ni
n
Y se verifica que
f1+...+fk=1
Se definen las frecuencias absolutas acumuladas y las frecuencias relativas
acumuladas, respectivamente, como
Ni=n1+...+ni
Fi=f1+...+fi
Distribución de frecuencias: conjunto de modalidades que presenta un carácter
junto con sus frecuencias (relativas o absolutas)
Distribución de frecuencias absolutas: {(Mi,ni): i=1,..., k)}
Distribución de frecuencias relativas: {(Mi,fi): i=1,..., k)}
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
3
2. Tabla de frecuencias
A continuación veremos cómo representar los datos en tablas estadísticas de
manera que se resuma la información observada
Variables estadísticas discretas  X: x1, x2,..., xk, donde x1 <x2<...<xk
Los datos se representan en una tabla como sigue
Valor
xi
Frecuencias
absolutas
ni
Ni
n1
N1
n2
N2
.
.
.
.
.
.
nk
Nk=n
n
x1
x2
.
.
.
xk
Frecuencias
relativas
fi
Fi
f1
F1
f2
F2
.
.
.
.
.
.
fk
Fk=1
1
Ejemplo. Número de piezas defectuosas producidas diariamente en una fábrica
(variable estadística discreta)
Valor
xi
0
1
2
3
4
5
6
Frecuencias
absolutas
ni
Ni
40
40
66
26
80
14
86
6
89
3
89
0
90
1
90
Frecuencias
relativas
fi
Fi
0.444
0.444
0.733
0.289
0.889
0.156
0.956
0.067
0.989
0.033
0.989
0.000
1
0.011
1
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
4
Variables estadísticas continuas  X: [e0,e1], (e1,e2],..., (ek-1,ek], con e0<...<ek
(ei-1,ei]: clase i-ésima
ei-1, ei: extremo inferior y extremo superior respectivamente de la
clase i-ésima
ai= ei - ei-1: amplitud de la clase i-ésima
xi=( ei-1 + ei)/2: marca de la clase i-ésima
hi=ni/ai: densidad de frecuencia para la clase i-ésima (número de
observaciones por unidad de intervalo)
Los datos se representan en una tabla como sigue
Intervalo
(ei-1,ei]
[e0,e1]
(e1,e2]
.
.
.
(ek-1,ek]
Frecuencias
absolutas
ni
Ni
n1
N1
n2
N2
.
.
.
.
.
.
nk
Nk=n
n
Frecuencias
relativas
fi
Fi
f1
F1
f2
F2
.
.
.
.
.
.
fk
Fk=1
1
Ejemplo. Tiempo de vida en horas de unas determinadas componentes de una
máquina (variable estadística continua)
Intervalo Marcas
(ei-1,ei]
de clase
xi
10
[0,20]
60
(20,100]
125
(100,150]
200
(150,250]
325
(250,400]
Frecuencias
absolutas
ni
Ni
7
7
22
15
44
22
63
19
70
7
70
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
Frecuencias
relativas
fi
Fi
0.1
0.1
0.214 0.314
0.314 0.628
0.271 0.899
1
0.1
1
5
3. Representación gráfica
 Las representaciones gráficas tiene por objeto proporcionar una síntesis
visual de la distribución de frecuencias
 Todas las representaciones gráficas se basan en el principio de hacer
proporcional las frecuencias a alguna magnitud de la figura representada,
generalmente el área encerrada
 Atendiendo al tipo de variable estadística en estudio se utilizan diferentes
tipos de representación
Variables estadísticas
discretas
Variables estadísticas
Variables estadísticas
continuas
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
 Diagrama de barras
 Polígono de
frecuencias
 Curva acumulativa o
de distribución
 Histograma
 Polígono de
frecuencias
 Curva acumulativa o
de distribución
6
Variables estadísticas discretas
 Diagrama de barras: En un sistema de ejes cartesianos se representa el
conjunto de puntos {(xi,ni): i=1,...,k} ó {(xi,fi): i=1,...,k}, y posteriormente se
unen con el eje de abscisas mediante segmentos verticales
n5
n2
n1
n3
n4
x1
x2
x3
x4
x5
 Polígono de frecuencias: Se construye uniendo con segmentos los extremos
superiores de los segmentos verticales en el diagrama de barras
n5
n2
n1
n3
n4
x1
x2
x3
x4
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
x5
7
 Curva acumulativa o de distribución: Consiste en la representación gráfica
de la función de distribución definida de la siguiente forma:
F(x)=proporción de individuos con valor de la variable menor o igual a x
0
F1

F2
F(x)  
...
Fk  1

1
si
si
si
...
si
si
x  x1
x1  x  x2
x 2  x  x3
...
xk  1  x  xk
x  xk
Propiedades:
 Se mantiene constante entre cada par de valores de la variable
 Función no decreciente en toda la recta real
 Función continua en todo punto de la recta real que no sea un valor de la
variable
 Función continua a la derecha en los valores de la variable

lim F(x)  0
x  -
lim F(x)  1
x  
F5=1
F4
F3
F2
F1
x1
x2
x3
x4
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
x5
8
Variables estadísticas continuas
 Histograma: Se representan sobre el eje de abscisas los extremos de los
intervalos de clase de la variable y sobre cada uno de ellos se construye un
rectángulo cuya área sea proporcional a su frecuencia absoluta (con el mismo
factor de proporcionalidad para todas las clases); por tanto, su altura será
igual a su densidad de frecuencia hi
h2
h3
h4
h1
h5
e0 e1
e2
e3
e4
e5
 Polígono de frecuencias: Se construye uniendo con segmentos los puntos
medios de los lados superiores de los rectángulos que forman el histograma
h2
h3
h4
h1
h5
e0
e1
e2
e3
e4
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
e5
9
 Curva acumulativa o de distribución: Consiste en la representación gráfica
de la función de distribución definida de la siguiente forma:
F(x)=proporción de individuos con valor de la variable menor o igual a x
En este caso, se conoce la función de distribución para los extremos de los
intervalos (ei-1,ei]
0
F1

F2
F(x)  
 ...
Fk

1
 1
si
x  e0
si
x  e1
si
...
x  e2
...
si
x  ek
si
x  ek
 1
Como no se conocen los valores de F(x) supondremos que esta función
aumenta de forma lineal entre los extremos de los intervalos
Propiedades:
 Función no decreciente en toda la recta real
 Función continua en todo punto de la recta real

lim F(x)  0
x  -
lim F(x)  1
x  
F5=1
F4
F3
F2
F1
e0 e1
e2
e3
e4
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
e5
10
4. Síntesis numérica de una variable estadística unidimensional
Nos centraremos a partir de ahora en el estudio de variables estadísticas
A continuación definimos cantidades numéricas, denominadas características o
medidas, que representan o sintetizan determinados aspectos de la distribución
de la variable estadística. En particular, nos centraremos en las siguientes
medidas:
 Medidas de posición o localización: describen cómo se comportan
globalmente los datos observados y localizan la distribución de
frecuencias
 Medidas de dispersión: miden la desviación o variabilidad de las
observaciones entre sí o en relación con un valor de referencia,
generalmente con respecto a una medida de posición central
informando sobre la representatividad de dicha medida
 Medidas de forma: resumen características relativas a la forma de la
distribución. Cuantifican aspectos sobre la posible simetría de la
distribución (medidas de asimetría) y sobre la concentración de las
observaciones más centrales con respecto a una distribución de
referencia (medidas de curtosis o apuntamiento)
 Medidas de posición
 Medidas de posición central
Media aritmética: Suma de los datos observados ponderados por sus
frecuencias relativas
k
x   x i fi 
i 1
1 k
 x i ni
n i 1
Moda: Valor de la variable que se presenta con mayor frecuencia
Para variables estadísticas discretas el cálculo de la moda es inmediato.
No tiene por qué ser única
Para variables estadísticas continuas se define el intervalo modal como el
intervalo que presenta mayor densidad de frecuencia.
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
11
h2
h3
h4
h1
h5
e0 e1
e2
Intervalo modal
e3
e4
e5
Mediana: La mediana como medida de tendencia central es el valor que
divide al conjunto de todas las observaciones (supuestas ordenadas en
orden creciente o decreciente) en dos subconjuntos con el mismo número
de observaciones cada uno, de manera que uno está formado por todas las
observaciones menores o iguales que la mediana y el otro por las mayores
Se define como el valor de la variable estadística, Me, tal que la ordenada
en la función de distribución vale 0.5, es decir, la solución de la ecuación
F(Me)=0.5
Cálculo de la mediana:
Se ordenan los datos de menor a mayor
1. Si n es impar, se considera como mediana el valor que ocupa la
posición central
2. Si n es par, se considera como mediana el punto medio de los valores
que ocupan las dos posiciones centrales
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
12
 Medidas de posición no central
Cuantiles. Se define el cuantil de orden  (0<<1) como el valor de la
variable x tal que su ordenada en la función de distribución vale , es
decir, la solución de la ecuación
F(x)=
Casos particulares de cuantiles para valores concretos de :
Cuartiles: Q1, Q2 y Q3, para =0.25, 0.5 y 0.75, respectivamente
F(Q1)=0.25, F(Q2)=0.5 y F(Q3)=0.75
Deciles: D1, D2, ..., D9, para =0.1, 0.2 ,..., y 0.9, respectivamente
F(D1)=0.1, F(D2)=0.2,..., y F(D9)=0.9
Percentiles: P1, P2, ..., P99, para =0.01, 0.02 , ..., y 0.99, respectivamente
F(P1)=0.01, F(P2)=0.02,..., y F(P99)=0.99
Cálculo del cuantil de orden :
El cuantil de orden  es el valor que deja por debajo n· observaciones
Para su cálculo, se ordenan los datos de menor a mayor
1. Si n· no es un número entero, se considera como cuantil de orden 
el valor que ocupa la posición [n·]+1, donde [n·] denota la parte
entera de n·
2. Si n· es un número entero, se considera como cuantil de orden  el
punto medio de los valores que ocupan las posiciones [n·] y [n·]+1
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
13
 Medidas de dispersión
 Medidas de dispersión absoluta. Miden la dispersión o variabilidad en
las mismas unidades que la variable en estudio. No sirven para comparar
la variabilidad o dispersión de distribuciones distintas
Rango: Amplitud del intervalo donde se encuentran distribuidas todas las
observaciones
R = Max xi – Min xi
Rango intercuartílico: Amplitud del intervalo donde se encuentran
distribuidas el 50% de las observaciones centrales
RI = Q3 - Q1
Desviación absoluta media respecto a un valor ‘a’: Media aritmética de
las desviaciones en valor absoluto entre los valores observados y ‘a’
k
Da   | xi  a | fi 
i 1
1
n
k
 |x a| n
i
i
i 1
Desviación cuadrática media respecto a un valor ‘a’: Media aritmética
de los cuadrados de las desviaciones entre los valores observados y ‘a’
k
Qa   ( xi  a) 2 fi 
i 1
1
n
k
 ( x  a)
i
2
ni
i 1
Caso particular: desviación cuadrática media respecto a la media
aritmética, denominada varianza (denotada por 2 o por Var X)
k
Var X   ( xi  x) 2 fi 
i 1
1
n
k
 (x x)
i
2
ni
i 1
A la raíz cuadrada positiva de la varianza se le denomina desviación
típica (denotada por )
Nota: La varianza se puede descomponer como la media de los
cuadrados de los valores menos el cuadrado de la media.
k
Var X   ( xi  x) 2 fi 
i 1
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
k
x
i
2
fi  x 2
i 1
14
 Medidas de dispersión relativa. Son medidas adimensionales que
permiten comparar la variabilidad de distintas distribuciones y la
representatividad de sus promedios
Coeficiente de variación de Pearson: Cociente entre la desviación típica
y la media aritmética
Cv 
σ
x
Interpretación: mide la representatividad de la media como medida que
resume toda la información de la variable al comparar distintas
distribuciones de frecuencias. Cuanto menor sea el valor de dicho
coeficiente mayor representatividad de la media, más agrupados están los
valores observados en torno a su valor medio
 Medidas de forma
 Medidas de asimetría: Miden el grado de asimetría de la distribución de
frecuencias
Una distribución de frecuencias es simétrica si su correspondiente
representación gráfica (diagrama de barras o histograma, según sea la
variable discreta o continua, respectivamente) es simétrica respecto a un
eje vertical
Distribución asimétrica a la derecha o asimétrica positiva si las
observaciones están desplazadas hacia la derecha
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
15
Distribución asimétrica a la izquierda o asimétrica negativa si las
observaciones están desplazadas hacia la izquierda
Sesgo a la izquierda
Sesgo a la derecha
Coeficientes de asimetría de Pearson:
aP 
3 (x - Me)
σ
a'P 
x - Mo
σ
Coeficiente de asimetría de Fisher:
g1 
m3
σ3
k
m3   ( xi  x) 3 fi
i 1
Interpretación del signo de los coeficientes:
Signo positivo  Asimetría a la derecha o positiva
Signo negativo  Asimetría a la izquierda o negativa
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
16
 Medidas de curtosis o apuntamiento: Se aplican a distribuciones
unimodales y simétricas o levemente asimétricas para estudiar la mayor o
menor concentración de los valores en torno a la media y cómo se
comportan las colas, comparándose con la distribución de probabilidad
normal o curva de Gauss
Coeficiente de curtosis de Fisher:
g2 
m4
3
σ4
k
m 4   ( xi  x) 4 fi
i 1
Coeficiente nulo  Igual de apuntada que la distribución normal
Interpretación del signo del coeficiente:
Signo positivo  Más apuntada que la distribución normal
Signo negativo  Menos apuntada que la distribución normal
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
17
Diagrama de caja-bigotes (Box-Whisker) Representación gráfica de una
distribución en la que intervienen las siguientes medidas: mediana (Me), primer
y tercer cuartil (Q1 y Q3), mínimo y máximo (min y max)
 Sobre una escala se dibuja un rectángulo que se extiende desde el primer
cuartil hasta el tercer cuartil
 Se divide el rectángulo en la posición que ocupa la mediana
 Se obtienen aquellos valores que distan del rectángulo más de 1.5 veces el
recorrido intercuartílico (RI=Q3-Q1), denominados valores anómalos o
atípicos, es decir, aquellos valores que están fuera del intervalo
(Q1 - 1.5 · RI, Q3 + 1.5 · RI)
 Se traza un segmento desde el primer cuartil hasta el menor valor observado
que no sea anómalo y otro segmento desde el tercer cuartil hasta el mayor
valor observado que no sea anómalo
 Los valores anómalos se añaden a la representación como puntos aislados
Ejemplo. Representar con un diagrama de caja-bigotes (Box-Whisker) los
siguientes datos:
15, 15, 17, 18, 19, 19, 19, 20, 20, 20, 23, 24, 25, 30, 32, 32, 38, 41, 61, 63, 64, 67, 80, 99, 132, 137, 140
n=27
Me=30
Q1=19
RI = Q3 - Q1 = 64 - 19 = 45
Q1 - 1.5 RI = 19 - 67.5 = - 48.5
Q3=64
1.5 RI=67.5
Q3 + 1.5 RI = 64 + 67.5 = 131.5
Valores anómalos: 132, 137, 140
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
18
TEMA 2. FUNDAMENTOS DE LA PROBABILIDAD
1. Espacio muestral
Experimento aleatorio: un experimento se dice aleatorio si no se puede
predecir el resultado del mismo antes de realizarlo, aunque sean conocidas las
condiciones iniciales de realización
Ejemplos. Lanzamiento de un dado, elección al azar de un número real dentro
del intervalo [0,1], lanzamiento de una moneda hasta que aparezcan dos caras,...
Teoría de la probabilidad: se ocupa de describir y estudiar los fenómenos
aleatorios proporcionando métodos de análisis para su tratamiento
Espacio muestral: conjunto de todos los posibles resultados asociados a un
experimento aleatorio, se denota por E
Atendiendo al número de posibles resultados del experimento, los espacios
muestrales se pueden clasificar en
 Espacios muestrales finitos
 Espacios muestrales infinitos numerables
 Espacios muestrales infinitos no numerables
Ejemplo. Construir el espacio muestral asociado a los siguientes experimentos
aleatorios:
a) Lanzamiento de un dado compuesto por 6 lados
E={1, 2, 3, 4, 5, 6}
b) Lanzamiento de una moneda hasta obtener una cara
E={C, +C, ++C, +++C, ...}
c) La elección al azar de un número real perteneciente al intervalo [0,1]
E=[0,1]
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
19
Suceso: conjunto formado por resultados del experimento aleatorio
Sucesos elementales: cada uno de los resultados posibles del experimento
aleatorio que no se pueden descomponer en otros más simples que puedan
obtenerse al realizar el experimento aleatorio
Suceso seguro: suceso que siempre ocurre. Está formado por todos los sucesos
elementales
Suceso imposible: suceso que no ocurre nunca, denotado por 
Operaciones con sucesos:
Sean A y B, sucesos asociados a un experimento aleatorio
Unión de sucesos, AUB: suceso formado por todos los posibles resultados de A
y de B, sin repetir los resultados comunes
Intersección de sucesos, A∩B: suceso formado por todos los resultados
comunes de A y de B
Propiedades:
Conmutativa
AUB = BUA
A∩B = B∩A
Asociativa
AU(BUC) = (AUB)UC
A∩(B∩C) = (A∩B)∩C
Distributiva
AU(B∩C) = (AUB)∩(AUC)
A∩(BUC) = (A∩B)U(A∩C)
Existencia de elemento neutro
AUØ = A
A∩E = A
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
20
Complementario de un suceso A con respecto al espacio muestral E, Ā:
suceso que contiene todos los resultados de E que no se encuentran en A,
verificándose que
AUĀ = E
A∩Ā = Ø
Leyes de Morgan:
A B  A  B
A B  A  B
Diferencia de dos sucesos, A-B: suceso formado por los resultados de A que no
están en B y se obtiene como
AB AB
Sucesos incompatibles: A y B son sucesos incompatibles si no tienen
resultados en común, es decir,
A∩B = Ø
Ejemplo. Sean A, B y C tres sucesos cualesquiera. Expresar formalmente los
siguientes sucesos:
a)
b)
c)
d)
e)
Ocurren A y B, pero no ocurre C
Ocurren al menos dos
Ocurre solamente uno de los tres
Ocurre al menos uno de los tres
No ocurre ninguno de los tres
Solución
a) A  B  C
b) (A  B)  (A  C)  (B  C)
c) (A  B  C)  (A  B  C)  (A  B  C)
d) A  B  C
e) A  B  C
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
21
-álgebra de sucesos: Sea un experimento aleatorio y su espacio muestral
asociado E. Una -álgebra de sucesos es una clase A formada por subconjuntos
de E que verifica las propiedades
1. E  A
2. Si Ai  A, i=1, 2, ... 

 A A
i
i 1
3. Si A  A  A  A
A (E, A) se le denomina espacio probabilizable
2. Concepto de probabilidad. Definición axiomática
La probabilidad de un suceso es una medida del grado de incertidumbre
asociado a dicho suceso
Regla de Laplace. Si el conjunto de sucesos elementales es finito y todos los
sucesos elementales son equiprobables (todos los sucesos elementales tienen la
misma probabilidad de ocurrir), entonces la probabilidad de un suceso A se
calcula como
P(A) 
k casos favorables

n
casos posibles
donde k es el número de sucesos elementales que favorecen la ocurrencia de A y
n es el número total de sucesos elementales
Ejemplo. Una urna contiene 3 bolas blancas, 2 negras y 6 rojas.
a) ¿Cuál es la probabilidad de que una bola extraída al azar sea roja?
b) ¿Y que no sea negra?
Solución
a) P(R) 
6
 0.5454
11
b) P(N) 
9
 0.8181
11
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
22
Definición axiomática: Sea (E, A) un espacio probabilizable, se dice que una
aplicación
P: (E, A)  
A  A  P(A)  
es una función de probabilidad si verifica los siguientes axiomas (axiomas de
Kolmogorov):
Axioma 1. P(E) = 1
Axioma 2. P(A)  0, AA
Axioma 3. Ai  A, i=1,2,..., tales que Ai∩Aj=, para ij, entonces

 
P  A i    P(A i )
 i 1  i 1
A la terna (E, A, P(·)) se le denomina espacio de probabilidad y al número
P(A), para cada suceso A, probabilidad del suceso A
Consecuencias de los axiomas
1. La probabilidad asociada al suceso imposible es nula, P() = 0
2. Sean A1,..., AnA tales que Ai∩ Aj=, para ij, entonces
 n
 n
P  A i    P(A i )
 i 1  i 1
3. P(Ā) = 1 – P(A), AA
4. P(B) = P(Ā∩B) + P(A∩B), A, B A
5. Sean A, B A tales que A  B, entonces
P(A) ≤ P(B)
6. Sean A, B A, entonces
P(AUB) = P(A) + P(B) – P(A∩B)
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
23
7. Sean A, B, C A, entonces
P(AUBUC) =P(A)+ P(B)+P(C) –P(A∩B)–P(A∩C) –P(B∩C) + P(A∩B∩C)
8. Sean A, B A, entonces
P(AUB) ≤ P(A) + P(B)
Ejemplo. Sean A, B y C tres sucesos de un espacio probabilístico (E, A, P(·))
tales que P(A)=0.2, P(B)=0.4, P(C)=0.3, P(A∩B)=0.1 y (AUB) ∩C=. Calcular
las probabilidades de los siguientes sucesos:
a)
b)
c)
d)
e)
f)
g)
h)
Sólo ocurre A
Los tres sucesos ocurren
Ocurren A y B, pero no C
Por lo menos dos ocurren
Ocurren dos y no más
No ocurren más de dos
Ocurre por lo menos uno
No ocurre ninguno
Solución
Como (AUB) ∩C=  (A∩C)U(B∩C)=  (A∩C)= y (B∩C)=,
entonces
P(A∩C)=0 y
P(B∩C)=0
a)
P(A  B  C )  P(A  ( B  C))  P(A)  P(A  (B  C))  P(A)  P((A  B)  (A  C))
 P(A)  P(A  B)  P(A  C)  P(A  B  C)  0.2  0.1  0.1
b) P(A∩B∩C)=P()=0
c) P(A  B  C)  P(A  B)  P(A  B  C)  0.1  0  0.1
d)
P((A  B)  (A  C)  (B  C))  P(A  B)  0.1
e)
P((A  B  C )  (A  B  C)  (A  B  C))  P(A  B  C)  P(A  B  C)
 P(A  B  C)  P(A  B) - P(A  B  C)  0.1 - 0  0.1
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
24
f) P( A  B  C)  1  P(A  B  C)  1  0  1
g) P(A  B  C)  P(A)  P(B)  P(C) - P(A  B) - P(A  C) - P(B  C)  P(A  B  C)
 0.2  0.4  0.3 - 0.1  0.8
h) P(A  B  C)  P( A  B  C)  1  P(A  B  C)  1  0.8  0.2
3. Probabilidad condicionada. Independencia de sucesos
En ciertas ocasiones es necesario encontrar la probabilidad de sucesos bajo la
condición de que un cierto suceso B, con P(B) > 0, ha ocurrido
Ejemplo. Consideremos el experimento aleatorio de lanzar dos monedas. El
espacio muestral asociado a dicho experimento vendrá dado por
E={CC, C+, +C, ++}
Y sean los sucesos
A: obtener dos cruces
B: obtener al menos una cruz
Entonces P(A) = 1/4 y P(B)=3/4. Si se sabe que B ha ocurrido entonces el
espacio muestral queda reducido a
EB={C+, +C, ++}
En este caso, P(A|B)=1/3
Se define la probabilidad condicionada de un suceso A al suceso B como
P(A | B) 
P(A  B)
, P(B) > 0
P(B)
que es la probabilidad de que ocurra el suceso A supuesto que el suceso B ha
ocurrido. Se puede comprobar que la aplicación
P(·|B): (E, A)  
A  A  P(A|B)  
cumple los axiomas de la probabilidad y es, por tanto, una función de
probabilidad. Con lo cual, (E, A, P(·|B)) es un espacio de probabilidad
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
25
Todas las propiedades de una función de probabilidad se cumplen, en particular,
para P(·|B). Por ejemplo, para sucesos cualesquiera A y C, se verificará
 0 ≤ P(A|B) ≤ 1
 P(Ā|B) = 1 – P(A|B)
 P(AUC|B) = P(A|B) + P(C|B) – P(A∩C|B)
Ejemplo. En el ejemplo anterior, utilizando la definición de de probabilidad
condicionada, la probabilidad P(A|B) se calcula como
1
P(A  B) 4 1
P(A | B) 
 
3 3
P(B)
4
que coincide con el valor obtenido previamente
Regla del producto.
1. Sean A y B sucesos cualesquiera, con P(A) > 0 y P(B) > 0, entonces se
verifica
P(A∩ B) = P(A|B) P(B)
P(A∩ B) = P(B|A) P(A)
2. Sean A , B y C sucesos cualesquiera, con P(C) > 0, P(B∩C) > 0, entonces se
verifica
P(A∩ B∩C) = P(A|B∩C) P(B|C) P(C)
Independencia de dos sucesos. Sean A y B sucesos cualesquiera, se dice que A
y B son independientes si se verifica que
P(A|B) = P(A)
O, equivalentemente,
P(B|A)=P(B)
O sea, la ocurrencia del suceso B no tiene ningún efecto en la ocurrencia del
suceso A y la ocurrencia del suceso A no tiene influencia sobre la ocurrencia del
suceso B
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
26
Consecuencias:
 A y B son independientes  P(A∩ B) = P(A) P(B)
 Si A y B son independientes, entonces
a) A y B son independientes
b) A y B son independientes
c) A y B son independientes
Independencia de n sucesos. Sean A1, A2, …, An , sucesos cualesquiera, se
dice que A1, A2, …, An son mutuamente independientes si para cualquier
subconjunto de sucesos Ai1, Ai2, …, Aik se cumple que
P (Ai1∩ Ai2 ∩ …∩ Aik ) = P(Ai1) P(Ai2) · · · P(Aik)
Ejemplo. En una batalla naval, tres destructores localizan simultáneamente a un
submarino. Sean P(A), P(B) y P(C), respectivamente, las probabilidades de que
el primer, el segundo y el tercer destructor hundan al submarino.
Se pide determinar la probabilidad de que el submarino sea hundido, sabiendo
que P(A)=0.6, P(B)=0.3 y P(C)=0.2.
Solución. Supongamos que el hecho de hundir el submarino cada uno de los
destructores es independiente si le impacta o no el proyectil lanzado por los
otros destructores. Entonces,
P(sea hundido) = 1- P(no sea hundido) = 1 - P(ninguno de los tres impacta)
= 1  P(A  B  C )  1 - P(A)  P(B)  P( C )  1 - 0.4  0.7  0.8  0.776
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
27
4. Teorema de la Probabilidad Total. Teorema de Bayes
Se dice que los sucesos A1,..., AnA forman una partición del espacio muestral
si son sucesos incompatibles y exhaustivos, i.e.,
Ai∩ Aj=, para ij,
n
y
A
i
E
i 1
Teorema de la Probabilidad Total
Sean A1,..., AnA, sucesos que forman una partición del espacio muestral
y sea BA un suceso cualquiera. Supongamos que se conocen las
probabilidades P(Ai) y P(B|Ai), para i=1,...,n, entonces
n
P(B)   P(B | A i )P(A i )
i 1
-DemostraciónUtilizando que A1,..., An forman una partición del espacio muestral se puede
expresar B como una unión finita de sucesos incompatibles dos a dos, esto es,
B = B ∩ E = B ∩ (A1U … U An) = (B ∩ A1) U … U (B ∩ An)
donde (B ∩ Ai ) ∩ (B ∩ Aj ) =, para ij , con lo cual
P (B) = P(B ∩ A1) + … + P(B ∩ An)
Usando ahora que P(B ∩ Ai ) = P(B | Ai ) P(Ai) se tiene el resultado deseado ■
Teorema de Bayes
Sean A1,..., AnA, sucesos que forman una partición del espacio muestral
y sea BA un suceso cualquiera. Supongamos que se conocen las
probabilidades P(Ai) y P(B|Ai), para i=1,...,n, entonces
P(A i | B) 
P(B | A i )P(A i )
n
 P(B | A )P(A )
j1
j
,
para i=1,...,n
j
-DemostraciónPor la definición de probabilidad condicionada y utilizando la regla del producto
P(A i | B) 
P(B  A i ) P(B | A i )P(A i )

P(B)
P(B)
para i=1,…, n. Y aplicando el Teorema de la Probabilidad Total se obtiene el
resultado deseado ■
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
28
Ejemplo. En un proceso de tratamiento de cierto mineral se utilizan tres técnicas
A, B y C. El 50% del total se trata con la técnica A, mientras que B y C son
utilizadas en un 25% del total cada una. Las probabilidades de cometer algún
fallo en su aplicación para las técnicas A, B y C son 0.15, 0.10 y 0.05,
respectivamente. Determinar la probabilidad de que el proceso no se realice de
forma correcta.
Solución
Sean los sucesos
A: la técnica A se utiliza en el proceso de tratamiento
B: la técnica B se utiliza en el proceso de tratamiento
C: la técnica C se utiliza en el proceso de tratamiento
y el suceso F: cometer algún en la aplicación
Con la información que se proporciona se sabe que
P(A)=0.50 P(F|A)=0.15
P(B)=0.25 P(F|B)=0.10
P(C)=0.25 P(F|C)=0.05
y que los sucesos A, B y C forman una partición
Se pide la probabilidad P(F), que se calcula utilizando el Teorema de la
Probabilidad Total
P(F) = P(F|A)P(A) + P(F|B)P(B) + P(F|C)P(C)
= 0.15·0.50 + 0.10·0.25 + 0.05·0.25 = 0.1125
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
29
Ejemplo. Supóngase que en un centro médico, de todos los fumadores de
quienes se sospecha que tenían cáncer de pulmón, el 90% lo tenía, mientras que
únicamente el 5% de los no fumadores lo padecía. Si la proporción de
fumadores es de 0.45. Se pide:
a) ¿Cuál es la probabilidad de un paciente, seleccionado al azar padezca
cáncer de pulmón?
b) ¿Cuál es la probabilidad de un paciente con cáncer pulmonar,
seleccionado al azar, sea fumador?
Solución
Sean los sucesos
F: ser fumador
F : ser no fumador
C: padecer cáncer de pulmón
C : no padecer cáncer de pulmón
Por los datos que se proporcionan se sabe que
P(F)=0.45
P(C|F)=0.90
P(F)  1 - 0.45  0.55
P(C | F)  0.05
a) Aplicando directamente el Teorema de la Probabilidad Total se tiene que
P(C)  P(C | F)P(F)  P(C | F)P(F)  0.90  0.45  0.05  0.55  0.4325
b) Aplicando ahora el Teorema de Bayes se tiene que
P(F | C) 
P(F  C)
P(C | F)P(F)
0.90  0.45


 0.9364
P(C)
P(C | F)P(F)  P(C | F)P(F) 0.90  0.45  0.05  0.55
Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016.
30
Descargar