EL CONTRASTE DE HIPOTESIS: Esquemas y ejemplos

Anuncio
EL CONTRASTE DE HIPOTESIS: Esquemas y ejemplos
Una vez expuesta la lógica de un Contraste de Hipótesis y tras haber
definido los términos y conceptos involucrados, hay que decir que esa lógica
general se concreta en una enorme cantidad de técnicas particulares. Cada
técnica ha sido desarrollada para ser empleada en un escenario específico, es
decir, a las hipótesis referidas a un determinado parámetro, con unos
determinados supuestos distribucionales y en unas circunstancias concretas. En
la asignatura Análisis de Datos en Psicología II se expondrá una variedad de
estas técnicas, elegidas por ser algunas de las más empleadas en Psicología. En
este tema vamos a exponer tres de las más sencillas, para que el estudiante se
vaya familiarizando con ellas y para que pueda ir aplicándolas en los contextos
en los que sean pertinentes. En este documento se ofrece un esquema general
de los pasos que se deben dar en un Contraste de Hipótesis y luego se exponen
tres técnicas concretas, como ilustración de su aplicación. Las dos primeras se
refieren al Contraste de Hipótesis sobre la media poblacional (µ), mientras que la
tercera se refiere al Contraste de Hipótesis sobre la independencia lineal entre
dos variables (ρ=0). El estudiante debe prepararse para ir rellenando una tabla
como la que aparece al final, en la que deberá ir incluyendo cada técnica
estudiada.
Pasos en el Contraste de Hipótesis
Lo expuesto en el documento anterior nos permite especificar el esquema
de los pasos que se deben dar en un Contraste de Hipótesis de la siguiente
forma:
1) Establecer las Hipótesis, indicando la Hipótesis Nula (H0) y la Hipótesis
Alterativa (H1).
2) Especificar los Supuestos que se van a asumir, incluyendo supuestos
distribucionales, de muestreo, de información conocida, etc.
3) Elegir un Estadístico de Contraste apropiado, especificando su distribución
cuando se asume como verdadera la H0 establecida en el paso 1 y los
supuestos indicados en el paso 2.
4) Establecer una Regla de Decisión, bilateral o unilateral, basada en el nivel
de significación (α) específico que se adopte.
5) Calcular, según la fórmula indicada, el valor del estadístico de contraste y el
nivel crítico.
6) Adoptar la Decisión y establecer la conclusión.
Contraste de hipótesis sobre la media, conocida σ
Para contrastar hipótesis sobre el valor de una media vamos a distinguir
dos casos: aquellos en los que se conoce la varianza poblacional y aquellos en
los que no se conoce. Aunque el primer caso es muy infrecuente en la práctica,
por razones didácticas se suele exponer en primer lugar. El procedimiento
consiste, como ya hemos dicho en aplicar el esquema habitual con los siguientes
pasos:
1) Hipótesis. Si se trata de un contraste bilateral, éstas serán de la forma,
H0: µ = µ0
H1: µ ≠ µ0
2) Supuestos.
- La población se distribuye N(µ,σ) o la muestra es suficientemente
grande como para asumir la normalidad basándonos en el
Teorema Central del Límite.
- La media muestral se ha obtenido sobre una m.a.s.
- Conocemos σ.
3) Estadístico de Contraste y su distribución bajo H0 verdadera.
z=
X − μ0
→ N(0, 1)
σ
n
4) Regla de Decisión, basada en el nivel de significación (α) adoptado.
Rechazar si z ≥ 1-α/2z ó z ≤ α/2z
No rechazar si α/2z < z < 1-α/2z
5) Cálculo del Estadístico de Contraste (y eventualmente el Nivel Crítico).
6) Adoptar la Decisión y Concluir.
Ejemplo. Supongamos que queremos contrastar la hipótesis de que la media
poblacional en una determinada variable, X, es igual a 100, sabiendo que la
varianza poblacional es igual a 64 y que X es normal. Para ello extraemos una
m.a.s. de 25 observaciones y calculamos su media aritmética en X, que resulta
ser igual a 105; establecemos un nivel de significación (α) de 0,05.
1) Hipótesis.
H0: µ = 100
H1: µ ≠ 100
(Adviértase que en el problema no se especifica nada
sobre la dirección de la diferencia entre 100 y la media
poblacional real, en caso de ser falsa H0, por lo que se
realiza un contraste bilateral)
2) Supuestos.
- La población se distribuye N(µ, 8)
- Se trata de una m.a.s.
- Conocemos σ
3) Estadístico de Contraste. En las condiciones indicadas,
z=
X − μ0
→ N(0, 1)
σ
n
4) Regla de decisión.
Rechazar si z ≥ 1,96 ó z ≤ -1,96
No rechazar si -1,96 < z < 1,96
5) Cálculo.
z=
X − μ0 105 − 100
=
= 3,125
σ
8
n
25
6) Decisión y Conclusión.
Como 3,125 > 1,96 rechazamos H0.
Concluimos que la evidencia aconseja rechazar, según la regla de
decisión adoptada, la hipótesis de que la media poblacional sea igual
a 100.
Un último comentario sobre esta técnica de contraste. Entre los supuestos
se ha incluido la normalidad de la distribución en la población de la variable
implicada. Por lo que ya hemos estudiado, sabemos que aunque esto no fuera
verdad la distribución muestral de la media se aproxima a la normal a medida
que se incrementa el tamaño de la muestra empleada (Teorema Central del
Límite). Es raro que sepamos con certeza la forma de una distribución y en
cambio no conozcamos su media. Es más frecuente que desconozcamos ambos.
Esta es la razón por la que se suele recomendar, para aplicar este contraste, que
la muestra sobre la que se calcula la media sea de al menos n=30. De esta
forma se podrá aplicar esta técnica sin preocuparnos por la distribución de la
variable de partida.
Contraste de hipótesis sobre la media, desconocida σ
Con mucha frecuencia nos encontraremos en una situación como la
anterior pero con la diferencia de que no conoceremos la varianza poblacional,
σ2. Es decir, queremos contrastar si la media poblacional es un cierto valor y
podemos asumir la normalidad de la población (o se trata de una muestra
grande) y que la media se ha obtenido en una m.a.s. Si la única diferencia con el
escenario anterior es que no conocemos la varianza poblacional (algo bastante
razonable, dado que será raro que no conozcamos µ y en cambio conozcamos σ)
entonces podemos recurrir a un estadístico similar al anterior, pero en el que en
lugar de aparecer σ en el denominador aparece su estimador S (la desviación
típica de la muestra). La única consecuencia de cambiar σ por S es que el
Estadístico de Contraste ya no se distribuye N(0,1), sino según la distribución t
de student, siendo los grados de libertad el tamaño de la muestra menos 1 (tn-1),
T=
X − μ0
→ tn-1
S
n
(Si lo que aparece en el denominador es el estimador sesgado de la desviación
típica, entonces en la raíz aparece (n-1). Es decir, representando por Sn y Sn-1 a
los estimadores sesgado e insesgado, respectivamente, las fórmulas serían,
T=
X − μ0
Sn
n -1
T=
y
X − μ0
Sn
n -1
aunque en ambos casos la distribución es la misma: tn-1. El
similar al del caso anterior, será el siguiente,
esquema,
muy
1) Hipótesis.
H0: µ = µ0
H1: µ ≠ µ0
2) Supuestos.
- La población se distribuye N(µ,σ) o la muestra es suficientemente
grande como para asumir la normalidad basándonos en el TLC.
- La media muestral se ha obtenido sobre una m.a.s.
- Desconocemos σ.
3) Estadístico de Contraste.
T=
X − μ0
o
S n-1
n
T=
X − μ0
Sn
n -1
4) Regla de Decisión.
Rechazar si T ≥ 1-α/2tn-1 ó T ≤ α/2tn-1
→
tn-1
No rechazar si
α/2tn-1
< T < 1-α/2tn-1
5) Cálculo.
6) Decisión y Conclusión.
Ejemplo. Supongamos que queremos contrastar la hipótesis de que la media
poblacional en una determinada variable, X, que se distribuye normalmente, es
igual a 80. Extraemos una m.a.s. de 81 observaciones y en ella obtenemos que
su media es 75,8 y su varianza ( S n2-1 ) es igual a 236; establecemos un nivel de
significación (α) de 0,01.
1) Hipótesis.
H0: µ = 80
H1: µ ≠ 80
2) Supuestos.
- La población se distribuye N(µ, σ)
- Se trata de una m.a.s.
- Desconocemos σ.
3) Estadístico de Contraste.
T=
X − μ0
→ t80
S
n
4) Regla de decisión, con el nivel de significación adoptado (α=0,01),
Rechazar si T ≥ 2,639 ó T ≤ -2,639
No rechazar si -2,639 < T < 2,639
5) Cálculo.
T=
X − μ0
75,8 − 80
=
= -2,461
S n-1
15,36
81
n
6) Decisión y Conclusión.
Como el valor obtenido (-2,461) está entre ± 2,639 Mantenemos
H0.
La evidencia aconseja no rechazar, según la regla de decisión
adoptada, la hipótesis de que la media poblacional sea igual a 80; la
evidencia observada es compatible con ella.
Contraste de hipótesis sobre la correlación de Pearson
El caso que exponemos aquí es única y exclusivamente aquel en el que
queremos contrastar si la correlación de Pearson poblacional es 0. Los contrastes
sobre cualquier otro valor exigen otros elementos que se expondrán en la
asignatura de Análisis de Datos en Psicología II. No obstante, el contraste del
valor 0 es, con mucho, el más interesante y el que con mayor frecuencia se
emplea.
Se trata de contrastar la independencia lineal entre dos variables; es decir,
si la correlación poblacional (ρ) es igual a 0. Para ello necesitamos especificar un
escenario en el que podamos definir un Estadístico de Contraste con una
distribución conocida con la que establecer la regla de decisión. El escenario
buscado es el que se resume en el siguiente esquema, en el que se llega a un
Estadístico de Contraste que bajo hipótesis nula verdadera se distribuye t de
student con n-2 grados de libertad (tn-2).
1) Hipótesis.
H0: ρ = 0
H1: ρ ≠ 0
2) Supuestos.
- Las dos variables a las que se refiere la correlación son normales
(en realidad los supuestos distribucionales son más complejos,
pues se debe asumir la homocedasticidad condicional; esto se
explicará en Análisis II).
- La correlación muestral, rXY, se ha obtenido sobre una m.a.s. de
pares de valores de X e Y.
3) Estadístico de Contraste.
T=
rXY n - 2
2
1 − rXY
4) Regla de Decisión.
Rechazar si T ≥ 1-α/2tn-2 ó T ≤ α/2tn-2
No rechazar si α/2tn-2 < T < 1-α/2tn-2
5) Cálculo.
6) Decisión y Conclusión.
→ tn-2
Ejemplo. Supongamos que queremos contrastar si a nivel poblacional las
variables X e Y son linealmente independientes. Extraemos una m.a.s. de 62
observaciones y en ella obtenemos una correlación de 0,28. Por estudios
anteriores sabemos que podemos asumir que se trata de variables normales;
establecemos un nivel de significación (α) de 0,05.
1) Hipótesis.
H0: ρ = 0
H1: ρ ≠ 0
2) Supuestos.
- Ambas variables se distribuye Normalmente en la población.
- Se trata de una m.a.s.
3) Estadístico de Contraste.
T=
rXY n - 2
2
1 − rXY
→ t60
4) Regla de Decisión.
Rechazar si T ≥ 2,000 ó T ≤ -2,000
No rechazar si -2,000 < T < 2,000
5) Cálculo.
T=
rXY n - 2
2
1 − rXY
=
0,28 62 - 2
1 − 0,28 2
= 2,259
6) Decisión y Conclusión.
Como 2,259 no está entre ± 2,000, Rechazamos H0.
La evidencia aconseja rechazar, según la regla de decisión
adoptada, la hipótesis de que en la población estas variables sean
linealmente independientes; la evidencia observada no es
compatible con ella.
CONTRASTES CON UNA MUESTRA
Parámetro
Media
Supuestos y condiciones
- Normalidad o no normalidad con
muestra grande
- Conocida σ
- m.a.s.
- Normalidad o no normalidad con
muestra grande
- Desconocida σ
- m.a.s.
Estadístico y
Distribución
z=
X − μ0
→ N(0,1)
σ
n
T=
T=
Correlación
- Normalidad y homocedasticidad
- Hipótesis de independencia lineal,
ρ=0
- m.a.s.
- Normalidad y homocedasticidad
- Hipótesis sobre otros valores de ρ
- m.a.s.
T=
X − μ0
→ tn-1
S n-1
n
X − μ0
→ tn-1
Sn
n -1
rXY n - 2
2
1 − rXY
?
?
Proporción
?
?
Varianza
?
→ tn-2
CONTRASTES CON DOS MUESTRAS
Parámetro
Diferencia
de medias
Igualdad
de
varianzas
Otros
Supuestos y condiciones
Estadístico y
Distribución
Descargar