INTRODUCCIÓN A LAS VARIABLES ALEATORIAS

Anuncio
INTRODUCCIÓN A LAS VARIABLES ALEATORIAS
En el lenguaje de la probabilidad y la estadística, el total que lanzamos con un par de dados es una variable
aleatoria, el tamaño de la familia de una pareja escogida aleatoriamente y su ingreso de un foco incandescente
escogido aleatoriamente para inspección.
Puesto que asociar un numero con cada punto(elemento) de un espacio muestral es simplemente otra forma de
decir que estamos definiendo una función sobre los puntos de un espacio muestral.
DEFINICIONES
Si s es un espacio muestral con una medida de probabilidad y x es una función de valor real definida sobre los
elementos de s, entonces x se llama una variable aleatoria.
Una variable x es una variable aleatoria si los valores que toma corresponden a los distintos resultados
posibles de un experimento, y por ello el hecho de que tome un valor particular es un evento aleatorio.
Por ejemplo:
Considere el muestreo de 20 consumidores a los que se les preguntaba su preferencia por el envase A o B. El
numero de consumidores que prefiera el envase A puede considerarse como una variable aleatoria y que
puede tomar cualquiera de los valores 0,1, 2....20. cada uno de estos valores corresponden a un resultado
posible del experimento consiste en la extracción de la muestra de 20 consumidores y el consiguiente registro
del numero de ellos prefiere el envase A.
El variable X es una variable aleatoria ya que el valor que tomara al llevar a cabo el experimento no puede
predecirse con certeza; esto es, el hecho de que tome un valor determinado.
En los ejemplos que se han dado nos hemos limitado nuestro análisis a espacios muestrales discretos, y por
tanto variables aleatorias discretas, a saber, variables aleatorias cuyo intervalo es finito o infinito numerable.
CLASIFICACION DE LAS VARIABLES ALEATORIAS
Las variables aleatorias se clasifican en dos tipos: discretas o continuas.
DEFINICIÓN
Una variable aleatoria discreta es aquella que toma. a lo mas una cantidad numerable de valores distintos.
El hecho de que la cantidad de valores que pueden tomar una variable aleatoria sea numerable quiere decir
que estos valores se pueden asociar a los enteros 1.2.3.4 en otras palabras. que se pueden enumerar. El numero
de valores distintos que la variable aleatoria discreta y que puede tomar. puede ser entonces finito o infinito
(ya que el proceso de numeración puede no terminar nunca).
El numero de errores y que un mecánico comete en una línea de ensamblado es una variable aleatoria discreta
ya que solo puede cometer un error finito de ellos. 0,1,2,3.......N, en donde N es el numero de operaciones
hechas en línea. El numero de años (y) que deben transcurrir para que determinada compañía logre sus
acciones valgan 1 billón de dólares podrían ser infinito. Aun así y es una variable aleatoria discreta. En este
ultimo ejemplo. la cantidad la cantidad de valores que puede tomar y es conceptual mente infinita. Otros
ejemplos de variables aleatorias discretas son los sig:
1
1.− El numero de automóviles vendidos en un mes.
2.− El numero de accidentes ocurridos en una determinada semana en una planta de manufactura, también
determinada
3.− El numero de clientes esperando servicio en la caja de un supermercado.
4.− El numero de tubos electrónicos de televisión producidos en una hora determinada.
Una variable aleatoria continua se define como:
DEFINICIÓN
Una variable aleatoria continua es aquella que puede tomar cualquier valor de entre todos los contenidos en un
intervalo de la recta.
Como ejemplo. suponga que se mide la distancia entre un abastecimiento y un posible consumidor y se
representa esta por una variable aleatoria y. Si se usa un instrumento de medición exacto. cada posible valor
de y podría. al menos desde el punto de vista teórico. considerarse como un punto en un intervalo de la recta.
Otros ejemplos de la variable aleatoria continua son los sig:
• El tiempo necesario para completar el ensamblaje de un articulo en una planta.
• La cantidad de petróleo bombeado cada hora en un pozo.
• La cantidad en miligramos de monóxido de carbono contenido en un metro cúbico de aire.
• La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día.
Es importante la diferencia que se hace entre las variables aleatorias discretas y continuas ya que se requieren
modelos pro balísticos distintos para cada uno de ellas. Las probabilidades asociadas a cada valor posible de
una variable discreta suman 1. yeso no es posible para las continuas. En las dos secciones que siguen. se
consideran por separado las distribuciones de probabilidad para las variables aleatorias discretas y continuas.
CLASIFICACION DE LAS VARIABLES ALEATORIAS
1.− ¿Cuál es la definición de variables aleatorias y continuas?
R: Aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo de la recta.
2.−¿Qué es la variable aleatoria discreta?
R: Aquella que toma, a lo mas una cantidad numerable de valores distintos.
3.−¿Qué se entiende por el hecho de que la cantidad de valores que puede la variable aleatoria sea numerable?
R: Que estos valores se pueden asociar a los enteros 1,2,3,4,..., en otras palabras, que se pueden enumerar.
4.− ¿Qué números de valores distintos pueden tomar la variable aleatoria discreta y?
R: Pueden ser finito o infinito C y a que el proceso de numeración puede no terminar nunca.
5. ¿Cuál es la diferencia entre variables aleatorias continuas y aleatorias discretas?
R: En que las continuas toma cualquier valor de entre todos los contenidos en un intervalo y la discreta es la
2
que toma una cantidad numerable de valores distintos.
DISTRIBUCIÓN DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA DISCRETA
Una distribución de probabilidad para una variable aleatoria discreta es un listado mutuamente
excluyente de todos los resultados numéricos posibles para esa variable aleatoria tal que una probabilidad
especifica de ocurrencia se asocia con cada resultado.
Valor esperado de una variable aleatoria discreta: es un promedio ponderado de todos los resultados
posibles, donde las ponderaciones son las probabilidades asociadas con cada uno de los resultados.
PONDERACION: Atención, cuidado con que se hace o dice una cosa. Exageración. Acción de pasar una
cosa. compensación o equilibrio entre dos pesos.
La media de una distribución de probabilidad es el valor esperado de su variable aleatoria.
La varianza de una variable aleatoria discreta se define como el promedio ponderado de los cuadros de las
diferencias entre cada resultado posible y su media.
Esta medida se puede obtener multiplicando el cuadrado de cada diferencia posible. por su probabilidad
correspondiente y luego sumando los productos obtenidos.
DESVIACIÓN ESTANDAR DE UNA VARIABLE ALEATORIA DISCRETA
Se dice que un modelo es la representación en miniatura de algunos fenómenos relevantes. En particular, un
modelo matemático es una expresión matemática que representa algún fenómeno relevante. Para variables
aleatorias discretas, esta expresión matemática se conoce como función de distribución de probabilidad.
NOTA:
Xi: i−esimo resultado de X, la variable aleatoria discreta de interés.
P(Xi): probabilidad de ocurrencia del i−esimo resultado de X.
Hipotecas de Casa
P
Aprobadas por semana
0
0.10
1
0.10
2
0.20
3
3
0.30
4
0.15
5
0.10
6
2.05
Distribución de probabilidad de hipotecas
De casas aprobadas por semana
(0)(.10)+(1)(.10)+(2)(20)+(3)(.30)+(4)(.15)+(5)(.10)+(6)(0.5)
M=2.8
Varianza
(0−2.8)2 (0.10) + (1−2.8)2 (.10) + (2−2.8)2(.20) + (3−2.8)2(.30) + (4−2.8)2(.15) + (5−2.8)2(.10) +
(6−2.8)2(.05)
=
CUESTIONARIO
1.− ¿Qué es la distribución de probabilidad para una variable aleatoria discreta?
R: es un listado mutuamente excluyente de todos los resultados numéricos posibles para esa variable aleatoria
tal que una probabilidad especifica de ocurrencia se asocia con cada resultado.
2.− Es el promedio ponderado de todos los resultados posibles, donde las ponderaciones son las
probabilidades asociadas de los resultados: Valor esperado de una variable aleatoria discreta.
3.− ¿Cómo se define la varianza de una variable aleatoria discreta?
R: como el promedio ponderado de los cuadros de las diferencias entre cada resultado posible y su media
4.− ¿Cómo se obtiene la varianza de una variable aleatoria discreta?
R: multiplicando el cuadrado de cada diferencia posible, por su probabilidad correspondiente y luego
sumando los productos obtenidos.
5.− ¿Qué es el modelo matemático?
R: Es una expresión matemáticas que representa algún fenómeno relevante
6.− ¿Con que otro nombre se le conoce al modelo matemático?
R: Como función de distribución de probabilidad
4
ESPERANZA MATEMÁTICA
Originalmente el concepto de esperanza matemática surgió en relación con los juegos de azar y en su forma
mas simple es el producto de la cantidad que un jugador puede ganar y la probabilidad de que ganara. Por
ejemplo: si tenemos uno de 10,000 boletos de una rifa cuyo premio principal es un viaje que vale 4,800
nuestra esperanza matemática es 4,800. 1/ 10,000= $0.48 por boleto. Si también hay un segundo premio de
$1.200 y u tercer premio con valor de $400, podemos argumentar que en conjunto los 10,000 boletos pagan
$4,800+ $1,200, + $400= $6,400 o en promedio $6,400/ 10,000= $0.64 por boleto. Veamos esto e forma
diferente podemos argumentar que si la rifa se repite muchas veces perderíamos 99.97 porciento de las veces
(o una probabilidad de 0.9997) y ganaríamos cada uno de los premios 0.01 porciento de las veces (o con
probabilidad de 0.0001) en promedio ganaríamos así 0(0.9997) + 4,800(0.0001) + 1,200(0.0001) +
400(0.0001)= $0.64, que es la suma de os productos obtenidos al multiplicar cada cantidad por la probabilidad
correspondiente.
EL VALOR ESPERADO DE VARIABLE ALEATORIA
En la ilustración de la sección anterior la cantidad que ganamos fue una variable aleatoria fue la suma de los
productos obtenidos al multiplicar cada valor de la variable aleatoria de la probabilidad correspondiente. Nos
referimos a la esperanza matemática de una variable aleatoria simplemente como su valor esperado, y
entendemos la definición al caso continuo al reemplazar la operación e la suma por la integración, así
tenemos.
DEFINICIÓN
si x e una variable aleatoria discreta y f(x) es el valor de su distribución de probabilidad en x, el valor
esperado de x es :
De manera correspondiente si x es una variable aleatoria continua y f(x) es el valor de su densidad de
probabilidad en x, el valor esperado e x es:
En esta definición se supone, por supuesto, que la suma o la integral existe; de otra manera la esperanza
matemática esta indefinida.
CUESTIONARIO
1.− ¿En relación a que surgió el concepto esperanza matemática?
R: Surgió en relación con los juegos de azar
2.− ¿Qué es esperanza matemática?
R: Es el producto de cantidad que un jugador puede ganar y la probabilidad de que gane.
3.− ¿Con que otro nombre se le conoce a la esperanza matemática?
R: Valor esperado
4.− ¿Cómo nos referimos a la esperanza matemática aleatoria?
5
R: Como su valor esperado y entendemos la de definición al caso continuo al remplazar la operación en la
suma por la integración, asi tenemos.
5.− ¿De acuerdo a la definición que se encuentra en el rectángulo la esperanza matemática esta definida o
indefinida?
R: Si x es una variable aleatoria discreta y f(x) es el valor de su distribución de probabilidad en x, el valor
esperado de x es:
E(x)= x.F(x)
DISTRIBUCION DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS
Una variable aleatoria continua es aquella que puede asumir el numero infinitamente grande de valores
correspondientes a los puntos sobre un intervalo en una línea recta. (Son el resultado de un proceso de medir).
Las probabilidades asociadas con una variable aleatoria continua se dan como áreas bajo la distribución de
probabilidad f(y).No es posible asignar probabilidades a los puntos muéstrales asociados con una variable
aleatoria continua, requiere un modelo poblacional completamente distinto. Cuando el numero de
observaciones se vuelve muy grande y los intervalos muy pequeños, las frecuencias relativas se presentarían
para todos los propósitos como una curva sin saltos.
Las frecuencias relativas asociadas con una clase particular de la población, es la de fracción de observaciones
de la población que caen en este intervalo Y, también es la probabilidad de seleccionar una observación de
clase. Por ejemplo si el área total debajo de un histograma de frecuencia relativa se ajustase de modo que sea
igual a uno, entonces las áreas bajo la curva de frecuencias correspondería a probabilidades.
Supongamos que la variable aleatoria Y pueda tomar valores sobre una línea recta, distribuiremos una unidad
de probabilidad a lo largo de la línea, de la misma forma en que una persona podría distribuir un puñado de
arena, donde cada observación de la población correspondería a un grano de arena.
La probabilidad, granos de arena u observaciones se amontonaran en ciertos lugares y el resultado será una
distribución de probabilidad, el espesor o densidad de probabilidad, que varían y se puede representar por una
ecuación matemáticamente llamada de probabilidad (o la de la función de densidad de probabilidad) de la
variable aleatoria y la función de densidad f(y).
La función de densidad f(y) se define de modo que el área total bajo la curva sea igual a uno, por lo tanto, que
el área sobre un intervalo dado sea igual a la probabilidad de que Y caiga en aquel intervalo.
Así, la probabilidad de que A < Y < B (A sea menor que Y, sea menor que B) es igual que el área sombreada
bajo la función de densidad entre los puntos A y B.
6
¿Cómo escogemos el modelo, esto es, la distribución de probabilidad f(y) apropiada para una situación física
dada? Y después ¿ como podemos calcular el área bajo la curva que corresponde a un intervalo dado? La
primera pregunta es la mas difícil por que su respuesta depende del tipo de observación implicada, lo que es
importante observar, es que se requirió sentido coman al asignar las probabilidades a los puntos muéstrales
que aunque inexacta, las probabilidades eran suficientemente precisas para procesos prácticos. Una vez que el
modelo f(y) ha sido escogido, podemos calcular las áreas bajo la curva usando el calculo integral, podríamos
conseguir una aproximación del área por promedio de una inspección visual.
CUESTIONARIO
1.− ¿Qué es una variable aleatoria continua?
R: es aquella que puede asumir el numero infinitamente grande de valores correspondiente a los puntos sobre
un intervalo en una línea recta.
2.− ¿cómo se dan las probabilidades asociadas con una variable aleatoria continua?
R: Se dan como áreas bajo la distribución de probabilidad f(y)
3.− ¿Es posible asignar probabilidades a los puntos muéstrales asociados con una variable aleatoria continua?
R: No es posible ya que requiere un modelo poblacional completamente distinto
4.− ¿Cómo se puede representar el espesor o densidad de probabilidad que varia con Y?
R: Por una ecuación matemáticamente llamada de probabilidad (o la de la función de densidad de
probabilidad) de la variable aleatoria y la función de densidad f(y).
7
5.− Menciona un ejemplo de variable aleatoria continua
R:
DISTRIBUCIÓN POISSON
DATOS HISTÓRICOS:
La distribución de Poisson se llama así en honor a Simeón Dennis Poisson (1781 − 1840), francés que
desarrollo esta distribución basándose en estudios efectuados en la ultima parte de su vida.
DEFINICIÓN:
La distribución de poisson desempeña un papel muy importante por derecho propio como modelo
probabilistico apropiado para un gran numero de fenómenos aleatorios.
Distribución De Poisson.
Características:
En este tipo de experimento los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc, etc,:
− de defectos de una tela por m2
− de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc, etc.
− de bacterias por cm2 de cultivo
− de llamadas telefónicas a un conmutador por hora, minuto, etc, etc.
− de llegadas de embarcaciones a un puerto por dia, mes, etc, etc.
Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la formula a
utilizar seria:
donde:
=probabilidad de que ocurra x éxitos, cuando el numero promedio de ocurrencia de ellos es
= media o promedio de éxitos por unidad de tiempo, área o producto
= 2.718
= variable que nos denota el numero de éxitos que se desea que ocurra
hay que hacer notar que en esta distribución el numero de éxitos que ocurren por unidad de tiempo, área o
producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así
como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado.
8
Ejemplo:
Si un banco recibe en promedio 6 cheques sin fondos por día, cuales son las posibilidades de que reciban 4
cheques sin fondo en un día dada.
a) x= variable que nos define el numero de cheques sin fondo que llegan al banco en un día cualquiera.
(landa) = 6 cheques sin fondo x día
= 2.718
Solución:
CUESTIONARIO
1.− ¿Qué es la distribución Poisson?
R: es el modelo probabilistico apropiado para un gran numero de fenómenos aleatorios
2.− ¿En honor a quien se debe la distribución Poisson?
R: A Simeon Dennis Poisson(1781 − 1840)
3.− en este tipo de experimentos los éxitos buscados son expresados por.
R: Unidad de área, tiempo, pieza, etc.
4.− Menciona un experimento en el que pueda ser usado la distribución poisson
R: num. de llegadas de embarcaciones a un puerto por día, mes, etc.
5. Cual es la función para determinar la probabilidad de que ocurra x éxitos por unidad e tempo, área o
producto?
R:
DISTRIBUCIÓN NORMAL
O CAMPANA DE GAUSS
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667 − 1754).
Posteriormente, Carl Friedrich Gauss (1777 − 1855) elaboro desarrollos mas profundos y formulo la ecuación
de la curva; de ahí que también se le conozca, mas comúnmente, como la Campana de Gauss.
La distribución normal es la distribución de probabilidad que con mas frecuencia aparece en estadística y
teoría de probabilidades.
9
Lo Importancia de lo distribución normal se debe principalmente o que hoy muchos variables asociados o
fenómenos naturales que siguen el modelo de lo normal:
• Caracteres morfológicos de individuos (personas, animales, plantas,...) de uno especie, ejemplo.
tallos, pesos, envergaduras, diámetros, perímetros.
• Caracteres fisiológicos, por ejemplo: efecto de uno mismo dosis de un medicamento, o de uno mismo
cantidad de abono.
• Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos,
puntuaciones de examen.
• Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio.
• Valores estadísticos muéstrales, por ejemplo: lo media.
Lo distribución normal quedo definido por dos parámetros, su medio y su desviación estándar y lo
representamos así:
10
Ejemplo: supongamos que se sabe que el peso de los sujetos de una determinada población sigue una
distribución aproximadamente normal, con una media de 80 kg y una desviación estándar de 10 kg.
¿Podremos saber cual es la probabilidad de que una persona, elegida al azar, tenga un peso superior a 100 kg?
11
como el área total bajo la curva es igual a 1, se puede deducir que:
Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de eso población tenga un
peso mayor de 100 Kg , es de 1−0.9772=0.0228, es decir, aproximadamente de un 2.3%
Ejemplo: La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5 ,
distribuye según una distribución normal en un lote de 10.000 lámparas. ¿Cuántas lámparas superán75 meses?
t =75−68/5=1.4 P(X>75)=(t>1.4)=1−p (t<1.4)=1−0.9192=0.0808
10.000 0.808= 808 lamparas superan los 75 meses
Ejemplo: Una empresa instala en una ciudad 20.000 bombillas para su iluminación. La duración de una
distribución normal con media de 302 días y desviación típica de 40 días. Calcular.
A) ¿Cuántas bombillas Se fundirán antes de 365 días?
B) ¿ cuantas duraran mas de 400 días?
A) t = 365 − 302 /40 = 1.575 P (X < 365) = P (t <1.575) = 0.9418
20.000 0.9418 = 18.836 bombillas se fundirán antes de 365 días.
B) t = 400 − 302 / 40 = 2.45 P ( X > 400 ) = P ( t > 2.45 ) = 1 − P ,( t < 2.45 ) =1 − 0.9929 = 0.0071
20.000 0.0071 = 142 bombillas duraran mas de 400 días
DISTRIBUCIÓN NORMAL
1.−¿ Que es la distribución normal?
R= Es la distribución de probabilidad que con mas frecuencia aparece en estadística y
teoría de probabilidades, esto se debe a su forma de campana.
2.−¿Con que otro nombre se le conoce a la distribución normal?
R= Campana de Gauss.
12
3.−¿Cual es la importancia de la distribución normal? R= Se debe principalmente a que hay muchas variables
naturales que asociadas a fenómenos siguen el modelo de la normal:
Caracteres morfológicos
Caracteres fisiológicos,
Caracteres sociológicos,
Caracteres psicológicos,
Valores estadísticos.
4.−¿Cuales son sus parámetros?
R= Su media () y su desviación estándar ()
5.−¿Cuales son las características de la distribución normal?
R=
* Tiene forma de campana.
* La curva tiene un solo pico.
* La media se encuentra en el centro de la curva normal, la mediana y la moda también se encuentran en el
centro por lo tanto poseen el mismo valor.
* Se extiende de manera indefinida hacia los extremos (izquierdo y derecho) y nunca toca el eje horizontal.
DISTRIBUCIÓN F
Llamada así en honor s Sir Fonald A. Fisher, uno de los fundadores de la estadística moderna. Esta
distribución de probabilidad se usa como estadística prueba en varias situaciones.
Originalmente, se estudió como la distribución de muestreo de la razón de dos variables aleatorias
independientes como distribuciones ji cuadrada, cada una dividida por sus grados de libertad respectivos.
Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Es útil para
determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata
de comparar simultáneamente varias medidas poblacionales.
La comparación simultánea de varias medidas poblacionales se conoce como Análisis de Varianza (ANOVA).
En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.
CARACTERÍSTICAS
• Es una distribución continua
• No puede ser negativa
• A medida que aumentan los valores, la curva se aproxima al eje X, pero nunca la toca.
La distribución F esta relacionada con el cociente de varianzas pues la distribución F también se le conoce
13
como la distribución de la razón de varianzas.
PRUEBA DE LA HIPÓTESIS F: Cálculo e interpretación de la estadística F.
Si sustituimos con la abreviatura estadística, el numerador y denominador de este cociente, la ecuación se
convierte.
VARIANZA DENTRO
X
15
18
19
22
11
85
X
22
27
18
21
17
105
X
18
24
19
16
22
15
114
X−M
−2
1
2
5
6
X−M
1
6
−3
0
−4
X−M
−1
5
0
−3
3
−4
(X − M)2
4
1
4
25
36
70
(X − M)2
1
36
9
0
16
62
(X − M)2
1
25
0
9
9
16
60
Varianza de muestra
.
VARIANZA ENTRE
h
14
5
5
6
17
21
19
19
19
19
−2
2
0
4
4
0
20
20
0
t=57 T=40
Num. De grados de libertad en el numerador de cociente f. =(Num. Muestral−1)
(3−1) = 2
Num. De grados de libertad en el denominador del cociente f =
Num. De cifras de cada una de las tablas
El denominador y el numerador deben ser aproximadamente iguales si la hipótesis nula es verdadera.
DISTRIBUCIÓN F
GRADOS DE LIBERTAD
Se determina un grado de libertad cuando calculamos la varianza entre columna, y el numero de grado de
libertad para el numerador del coeficiente F siempre es una unidad menor que el numero de muestras. La regla
es:
Numero de grado de libertad =(numero de muestras −1)
En el numerador de coeficiente F
Y podemos calcular el numero degrado de libertad en el denominador del coeficiente F, utilizando la
ecuación:
15
Numero de grado de libertad en =
El denominador de coeficiente F
Análisis de varianza (ANOV A) técnica estadística utilizada para probar la equidad de 3 o mas medidas de
muestra y, de este modo, hacer inferencias sobre si las muestras provienen de poblaciones que tienen la misma
medida.
Distribución F familia de distribuciones diferenciadas por dos parámetros (grados de libertad del
denominador, grados de libertad del denominador), utilizada principalmente para probar hipótesis con
respecto a varianza.
CUESTIONARIO
1.− ¿Por qué se llama distribución F?
R: en honor a Sir Fonald A. Fisher
2.− ¿Como se estudio originalmente la distribución F?
R. como la distribución de muestreo de la razón de dos variables aleatorias independientes
16
3.− ¿Para que se emplea la distribución F?
R: para probar si dos muestras provienen de poblaciones que poseen varianzas iguales
4.− ¿Cómo se le conoce a la distribución F?
R: La distribución de la razon de varianza
5.− ¿a que se le conoce como análisis de varianzas?
R: A la comparación simultanea de varias medidas poblacionales
LA DISTRIBUCIÓN T DE STUDENT
La distribución T de student es una distribución continua que se define por la siguiente expresión:
X: media
T: cantidad
S: desviación estándar muestral
La distribución T de student puede tomar valores negativos, pero, en general, solo interesa su magnitud y no si
signo.
Es una distribución simétrica y con mayor dispersión que la distribución normal. No obstante, cuando "n" es
igual o mayor que 100, la distribución "1" es igual a la normal.
Fue descubierta por w.s. gosset y publicada en 1908 seudónimo de student se refería ala cantidad estudiada
como t y cantidad a sido conocida desde ese entonces como t de student
Sirve para conocer la desviación están dar de la población y el tamaño de muestra es relativamente pequeño.
La prueba t de student es muy utilizada en la práctica, sin embargo a menudo su aplicación se hace sin
excesivo cuidado, no comprobando las asunciones que requiere. En este artículo se ha puesto de manifiesto
que la falta de normalidad o la falta de homogeneidad en las varianzas invalida la prueba t de student
Características
• Al igual que la distribución z, es una distribución continuas.
• La distribución t tienes una medida de cero, es simétrica respecto ala medida y se extiende de menos y
mas.
• Tiene forma campanada y simétrica.
• No hay una distribución t, si no una familia de distribuciones
• La distribución t es mas ancha y mas plana en el centro que la
• Distribución normal estándar como resultado de ellos tienes
Formula:
17
Ejemplo: Se generan 6 diamantes mediante el nuevo proceso y resultan estos de 0.46, 0.61, 0.52, 0.48, 0.57 y
0.54 kilates el costo de proceo indica que el peso promedio es mayor de 0.5 kilates.
CUESTIONARIO
1.− ¿Qué es distribución T de student?
R: Es una distribución continua que se define por la siguiente expresión:
X=media
T=cantidad
S=desviación estandar muestral
2.− ¿Quién fundo la distribución T de student?
R:W. S. Gosset en 1908
3.− ¿Para que sirve la distribución T de student?
R: Para conocer la desviación estándar de la población y el tamaño de muestra es relativamente pequeño.
4.− ¿Cuáles son las características de la distribución T de student?
R:
18
• Al igual que la distribución Z, es una distribución continua
• La distribución t tiene una medida de cero, es simétrica respecto a la medida y se extiende de menos y
mas.
• Tiene forma campanada y simétrica
• No hay una distribución T, si no una familia de distribución
• La distribución T es mas ancha y mas plana en el centro que la distribución normal estándar como
resultado de ellos.
5.− ¿Cuál es la formula de la distribución de student?
R:
DISTRIBUCIÓN JI_CUADRADA
La distribución ji_cuadrada nos permite probar, si dos o mas proporciones de población pueden ser
consideradas iguales.
Si clasificamos a una población en diferentes categorías con respecto a dos atributos (edad, y desempeño en el
trabajo), podemos utilizar una prueba ji_cuadrada, para comprobar si los dos atributos son rndependientes
entre si. la distribución Ji cuadrada, se denota por la letra griega X(Ji), elevada al cuadrado: X2.
A medida que aumentan los grados de libertad la curva se va haciendo más simétrica y su cola derecha se va
extendiendo.
Características de la distribución
• Todos los valores de x2 son positivos.
• Es una curva sesgada hacia la derecha.
• La media de la distribución son sus grados de libertad
PRECAUC1NES QUE SE DEBEN TOMAR CUANDO SE USE UNA PRUEBA JI_CUADRADA
Para utilizar una prueba de hipótesis ji_cuadrada, debemos tener un tamaño de muestra lo suficientemente
grande para garantizar la similitud entre la distribución teórica correcta y nuestra distribución de muestreo de
x2, estadística ji_cuadrada. Cuando las frecuencias esperadas son muy pequeñas el valor de x2 estará
sobrestimado y se tendrá como resultado demasiados rechazos de la hipótesis nula, para evitar incurrir en
inferencias incorrectas de la prueba de hipótesis ji_cuadrada. Siga la regla general que dice que una frecuencia
esperada de menos de cinco en una celda de una tabla de contingencia es demasiado pequeña para utilizarse.
Si el valor de ji_cuadrada hubiera sido cero, hubiésemos tenido que ser cuidadosos al preguntar si
absolutamente no existen diferencias entre las frecuencias observadas y las esperadas. Si tenemos fuertes
creencias de que debería existir alguna diferencia tendríamos que examinar tanto la forma en que recabamos
datos o la manera como iniciamos las mediciones o ambas cosas para tener la certeza de que las diferencias
existentes no fueron minimizadas o pasadas por alto al recolectar los datos de muestra.
PROPIEDADES DE LAS DISTRIBUCIONES JI_CUADRADAS
l.−Los valores de x2 son mayores o iguales que O
2.−La forma de una distribución x2 depende del g I =n−l. En consecuencia hay un numero infinito de
19
distribuciones x2.
3.−EI área bajo una curva ji_cuadrada y sobre el eje horizontal es 1.
4.−Las distribuciones x2 no son simétricas, tienen colas estrechas que se extienden a la derecha; están
sesgadas a la derecha.
5.−cuando n>2 la media de una distribución x2 es n−l y la varianza es 2(n−l). 6.−EI valor modal de una
distribución x2 se da en el valor (n−3).
(TABLA DE CONTINGENCIA: Compara la cuenta de respuestas categóricas entre dos grupos
independientes para desplegar la frecuencia de éxitos y fracasos en cada grupo).
GRAFICA DISTRIBUCION JI CUADRADA PARA V= 2, 5, Y 10 GRADOS DE LIBERTAD
Distribución Ji cuadrada para v=2,5 y 10.
La estadística de Ji cuadrada se calcula de la manera siguiente:
Esta formula establece que ji_cuadrada, o x2, es la suma que obtendremos si:
1.− Restamos Fe de Fo para cada una de las celdas de la tabla
20
2.−Elevamos al cuadrado cada una de las diferencias
3.− Dividimos cada diferencia al cuadrado entre Fe, y
4.−Sumamos los resultados
CUESTIONARIO DE DISTRIBUCIÓN JI_CUADRADA
1.− ¿Qué nos permite probar la distribución ji_cuadrada?
R: Si dos o mas proporciones de población pueden ser consideradas iguales
2.− ¿Menciona las características de la distribución ji_cuadrada:
R: 1.− Todos los valores de
son positivos
2.− Es una curva sesgada hacia la derecha
3.− La media de la distribución son sus grados de libertad.
3.− Menciona dos propiedades de la distribución ji_cuadrada:
R: Los valores de
son mayores o iguales que 0
El area bajo una curva Ji_ cuadrada y cobre el eje horizontal es 1.
4.− Para que nos sirve la tabla de contingencia en la distribución ji_cuadrada?
R: Para comparar la cuenta de respuestas categóricas entre dos grupos independientes para desplegar la
frecuencia de éxitos y fracasos en cada grupo.
5.− Escribe la formula de la distribución ji_cuadrada y el significado de sus elementos:
R:
Ejemplo: Suponga que en 4 regiones de la Republica Mexicana, la compañía mundial de cuidado de la salud,
muestra actitudes de los empleados de sus hospitales con respecto al examen de desempeño en el trabajo. Alos
trabajadores se les da a escoger entre el método actual( 2 exámenes al año) y un nuevo método propuesto
(exámenes cada trimestre).
Se trabajara con la siguiente tabla de contingencia:
21
PN Proporción de empleados en el noreste que prefieren el presente plan.
PS Proporción de empleados en el sudeste que prefiere el actual método.
PC Proporción de empleados en la región centro que prefiere el actual método.
PW Proporción de empleados que en la región de la costa del occidente prefieren el método actual
Ho:PN=PS=PC=PW Hipótesis nula
Hi:PN,PS,PC,PW Hipótesis alternativa
TABLA 1
Si la hipótesis nula es verdadera podemos combinar los datos de los trabajadores que prefieren el método
actual.
.6643 estima la proporción de población esperada que prefiere el método presente de evaluación entonces
0.3357 (=1_0.6643) es la estimación de la proporción esperada de la población que prefiere el método
propuesto.
TABLA 2 Proporción de empleados muestreados en cada una de las regiones que se espera prefieran los dos
métodos.
Numero total
muestrado
Proporción
estimada que
prefiérale método
actual
Numero que se
espera prefiera el
método actual
Noreste
Sureste
Central
Costa Occidental
100
120
90
110
x.6643
x.6643
x.6643
x.6643
66.43
79.72
59.79
73.03
TABLA 3 Comparación de frecuencias observadas y esperadas de trabajadores muestrados.
Frecuencia
observada(real)
Frecuencia
esperada(teórica)
Frecuencia
observada(real)
Frecuencia
esperada(teórica)
So los conjuntos de frecuencias observadas y esperadas son casi iguales, podemos razonar de manera intuitiva
22
que aceptaremos de manera intuitiva que aceptaremos la hipótesis nula. Si existe una diferencia grande entre
estas frecuencias podemos intuitivamente rechazar la hipótesis nula y llegar a la conclusión de que existen
diferencias significativas en las proporciones de empleados de las cuatro regiones que prefieren el nuevo
metodo. Las frecuencias observadas y esperadas se les da uso en la estadística ji_cuadrada, se calcula:
TABLA 4 Calculo de la estadística
(ji_cuadrada)
Fo
Fe
PASO 1
PASO 2
Fe−Fe
(Fo−Fe)
PASO 3
La respuesta obtenida de 2.764 es el valor de ji_cuadrada n nuestro problema de comparación. Si el valor
fuera muy grande indicaría una diferencia sustantiva entre nuestros valores.
Para utilizar la prueba ji_cuadrada debemos calcular el numero de grados de libertad en la tabla de
contingencia mediante la aplicación de la ecuación.
Numero de grados de libertad=(numero de renglones−1)(numero de columnas −1)
=(3−1) (4−1)
=(1)(3)
=3 grados de libertad
si la compañía desea probar la hipótesis nula a un nivel de significancía de 0.10, se localiza el valor de la
estadística ji_cuadrada con 3 grados de libertad.
Grados de libertad
1
2
3
4
5
0.20
1.042
3.219
4.642
5.989
7.289
0.10
2.705
4.605
6.251
7.779
9.236
0.05
3.841
5.991
7.815
9.488
11.070
0.25
5.024
7.378
9.348
11.143
12.833
0.01
6.635
9.210
11.345
13.277
15.086
El valor es de ______________ podemos interpretar que con tres grados de libertad la región que se allá a la
derecha del valor ji_cuadrada, 6.251 contiene 0.10 del área bajo la curva. En consecuencia la región de
aceptación de la hipótesis nula, va del extremo izquierdo de la curva al valor jia_cuadrada de 6.251. el valor
de la muestra 2.764 que calculamos cae dentro de la región de aceptación. Aceptamos la hipótesis nula de que
no existe diferencia entre las actitudes con respecto a la evaluación del trabajo en las 4 regiones geográficas.
0
6
23
1
2
3
4
5
0.1
0.2
0.3
P(x)
x
F=
Varianza dentro de columnas
Varianza entre columnas
F=
Primera estimación de la varianza de la población basada en la varianza entre las medias de las muestras
Segunda estimación de la varianza de la población basada en las varianzas dentro de las muestras
2.7
Desviacion
24
Descargar