UNIVERSIDAD MARIANO GALVEZ DE GUATEMALA

Anuncio
UNIVERSIDAD MARIANO GALVEZ DE GUATEMALA
CARRERA:
CURSO:
LICENCIADO.
CICLO:
CONTADURÍA PUBLICA Y AUDITORIA
INVESTIGACION DE OPERACIONES
ORLANDO MONZON
QUINTO CICLO.
TEMA: Distribución de T Student
HECTOR F. XEP COROXON
3215-07-18684
Introducción
El siguiente trabajo trata sobre la distribución de T student, el cual es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño. Surge, en la mayoría de los estudios
estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser
estimada a partir de los datos de una muestra.
DISTRIBUCIÓN T DE STUDENT
En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que
surge del problema de estimar la media de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la
diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una
población y ésta debe ser estimada a partir de los datos de una muestra.
La Distribución T de Student
En la generalidad de los casos, no disponemos de la desviación standard de la población, sino de
una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos
calcular Z.
La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (18761937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín .
Debido a que en la destilería, su puesto de trabajo no era inicialmente de estadístico y su
dedicación debía estar exclusivamente encaminada a mejorar los costes de producción, publicó
sus hallazgos anónimamente firmando sus artículos con el nombre de "Student".
En estos casos calculamos el estadístico T:
con
Donde S es la desviación standard muestral, calculada con n-1 grados de libertad.
Nótese que utilizamos S, la Desviación Standard de una Muestra, en lugar de μ, la Desviación
Standard de la Población.
El estadístico T tiene una distribución que se denomina distribución T de Student, que está
tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calculó la desviación
standard. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación
standard de la población, porque en realidad la tabla de T contiene las distribuciones de
probabilidades para distintos grados de libertad.
La distribución T es mas ancha que la distribución normal tipificada Para un número de grados de
libertad pequeño. Cuando los grados de libertad tienden a infinito, la distribución T tiende a
coincidir con la distribución normal standard. Es decir, en la medida que aumentemos el número
de observaciones de la muestra, la desviación standard calculada estará mas próxima a la
desviación standard de la población y entonces la distribución T correspondiente se acerca a la
distribución normal standard. El uso de la distribución T presupone que la población con que
estamos trabajando tiene una distribución normal.
Distribución de Promedios Muestrales
Para comprender que significa distribución de promedios muestrales, vamos a suponer que
realizamos un experimento con bombos como los usados en la lotería. Colocamos un número muy
grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este
bombo representa la población de observaciones X, y tiene media m y varianza s2. Supongamos
que a continuación hacemos los siguiente:
1) Tomamos una muestra de n=10 bolas blancas.
2) Calculamos la media y la anotamos en una bola azul.
3) Colocamos la bola azul en un segundo bombo de color azul.
4) Devolvemos las bolas blancas a su bombo y le damos vueltas.
5) Repetimos toda la operación muchas veces hasta que el bombo azul esté lleno de bolas azules.
Entonces, los números del bombo azul forman una población de promedios muestrales. Esta es
una población derivada de la anterior, y tiene la misma media o promedio que la distribución
original, pero su varianza es un enésimo de la varianza de la distribución original:
En el caso del bombo azul, si denominamos
a la varianza y μm a la media, tenemos:
La distribución de medias muestrales está situada en el mismo lugar (alrededor de la misma
media) que la distribución original, pero es mucho mas estrecha, porque su varianza es la décima
parte de la varianza original. La distribución original de observaciones representada por el bombo
blanco se denomina comúnmente distribución madre o base. Al construir la población de
promedios muestrales, realizábamos extracciones de 10 bolas blancas después de dar vueltas al
bombo. Es decir, que estábamos realizando un muestreo aleatorio de la población madre, porque
cada una de las bolas blancas tenía la misma posibilidad de ser elegida para integrar la muestra.
Aunque la población original no sea de distribución normal, si el muestreo es aleatorio, la
población de promedios muestrales se aproximará a la normalidad, es decir, será casi de
distribución normal. Este efecto se debe a un teorema de estadística matemática denominado
Teorema Central del Límite. En resumen, si se cumple la hipótesis de muestreo aleatorio, tenemos:
En general, en los problemas que se presentan habitualmente, existe una población de
observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual
intentamos conocer todo lo que sea posible acerca de la población de la cual fue extraída. El
promedio de la muestra de n elementos pertenece a la distribución de promedios muestrales de la
población original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos
promedios muestrales que se distribuyen alrededor de m con desviación standard.
Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribución de promedios
con desviación standard más pequeña, por lo cual, el promedio de la muestra estará mas cerca del
promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es una
estimación del promedio del universo.
Caracterización
La distribución t de Student es la distribución de probabilidad del cociente
Donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución ji-cuadrado con grados de libertad
Z y V son independientes
Si μ es una constante no nula, el cociente
es una variable aleatoria que sigue la
distribución t de Student no central con parámetro de no-centralidad .
Aparición y especificaciones de la distribución t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con
media μ y varianza σ2. Sea
la media muestral. Entonces
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset
estudió un cociente relacionado,
donde
es la varianza muestral y demostró que la función de densidad de T es
donde es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.
El parámetro representa el número de grados de libertad. La distribución depende de , pero no
de o , lo cual es muy importante en la práctica.
Intervalos de confianza derivados de la distribución t de Student
El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en
estimar la desviación típica de los datos S y calcular el error estándar de la media
, siendo
entonces el intervalo de confianza para la media =
.
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de
muestras de dos distribuciones normales se distribuye también normalmente, la distribución t
puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
para efectos prácticos el valor esperado y la varianza son:
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3
CONCLUSIONES
Del trabajo presentado anteriormente puedo decir que La distribución t de Student es la
distribución de probabilidad del cociente donde Z tiene una distribución normal de media nula y
varianza 1 V tiene una distribución chi-cuadrado con ν grados de libertad Z y V son
independientes.
El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en
estimar la desviación típica de los datos S y calcular el error estándar de la media= S/(raíz cuadrada
de n), siendo entonces el intervalo de confianza para la media = x media +- t (alfa/2) multiplicado
por (S/(raíz cuadradada de n)).
Documentos relacionados
Descargar