FÓRMULAS MathType - Ruben Jose Rodriguez

Anuncio
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Formulario de Estadística
Descriptiva e Inferencial
1
Autor: Prof. Rubén José Rodríguez
6 de marzo de 2006
MEDIDAS DE TENDENCIA CENTRAL y POSICIÓN
n
X 
X
j 1
j
n
n
X
X
j 1
j
*f
n
n
X
 pm * f
j 1
n
f *x'

X Z
*i
n
Fórmulas editadas con MathType 4.0 Editor de ecuaciones, 1999. Copie y pegue en los
Reports Estadísticos.
1
-1-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
X (Total o Ponderada)=
Md  lirMd
N1 * X1  N2 * X 2  ...  Nn * X n
N1  N2  ...  Nn
n
 fali
2
*i
f Md
d1
Mo  lirMo 
*i
d1  d 2
1
P25  lir  4
3
P75  lir  4
* n  fali
f P25
*i
* n  fali
f P75
*i
-2-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
MEDIDAS DE FORMA DE LA DISTRIBUCIÓN
ASIMETRÍA
Medida de la asimetría de una distribución. La distribución normal es simétrica por lo que
tiene un valor de asimetría 0 [As = 0]. Una distribución que tenga una asimetría positiva significativa tiene una cola derecha larga. Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda larga. Un valor de asimetría mayor que 1, en valor absoluto,
indica generalmente una distribución que difiere de manera significativa de la distribución normal.
Un valor de Asimetría < 0 [As < 0] indicará una Asimetría negativa (con una cola a la izquierda de la Media aritmética).
Un valor de Asimetría > 0 [As < 0] señalará una Asimetría positiva (con una cola a la derecha de la Media aritmética).
Los resultados pueden ser los siguientes:
g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribución asimétrica positiva). La mayor parte de los sujetos tienen puntuaciones ba-
jas.
g1 < 0 (distribución asimétrica negativa).
La mayor parte de los sujetos tienen pun-tuaciones
altas.
CURTOSIS
Medida del grado en que las observaciones están agrupadas en torno al punto central. Para una
distribución normal (mesocúrtica) el valor del estadístico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran más y presentan colas más largas que las de una
distribución normal (platicúrtica). Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas más cortas (leptocúrtica).
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable
Los resultados pueden ser los siguientes:
g 2 = 0 (distribución mesocúrtica). La distribución es normal.
g2 > 0(distribución leptocúrtica ). Muchos sujetos en torno a las puntaciones centrales.
g2 < 0 (distribución platicúrtica). Los sujetos están distribuidos a lo largo de todos los
valores de la variable.
.
-3-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
MEDIDAS DE VARIABILIDAD
At  Rango  Recorrido  las  lai  1
las = límite aparente superior
lai = límite aparente inferior
At  lsr  lir
 X
N
 
2
X
j 1
j
 X 
2
N
 2 X  P *Q
 X j  X 
n
s2 X 
j 1
n 1
  X j  X 
N
X 
2
2
j 1
N
-4-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
 X
n
j 1
sX 
j
X
2
n 1
sX  p * q
 X
n
j 1
sX 
X * f
2
j
n
n
sX  i *

j 1
 n

2
f *x'   f *x'

  j 1


n
n




2
n
DX 
 X X
j 1
n
DQ  C3  C1
C3  C1
Q
2
-5-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
DISTRIBUCIÓN BINOMIAL
X  n* p
sX  n * p * q
ES  Error Standard de la Media p    X 
p*q
n
 n
n!


 r  r !*  n  r !
 n, r   Cn, r  
 n  r n r
 p  q    * p * q
r n  r 
 n
P  r     * p r * q nr
r 
n
zp 
0
p  (n * p)
n* p*q
-6-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
CURVA NORMAL de GAUSS
y
z
z
1
 * 2
*e
1  X  
 *

2   
2
X 

X X
s
X   z * s  X
s
X X
z
zp 
p  (n * p)
n* p*q
X  1s  68, 26%
X  2s  95, 44%
X  3s  99,72%
P   (bilateral )  P .01  A  .4950  2,54z
P   (bilateral )  P .05  A  .4750  1,96z
P   (bilateral )  P .10  A  .4495  1,64z
P   (unilateral )  P .01  A  .4900  2,32z
-7-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
P   (unilateral )  P .05  A  .4495  1,64z
P   (unilateral )  P .10  A  .3962  1,26z
-8-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
CHI CUADRADO
n
x
2
( P ; gl )

j 1
f
ij 
Fij 
2
Fij
( fo  fe)2
 
fe
i 1
n
x
2
( P ; gl )
P  Valor de probabilidad que se observa en la relación entre el
gl =
f ij = f 0
Fij =f e
Predictor y la VD que se presentará si el Predictor y la VD
fueran estadísticamente independientes.
Grados de libertad: (I-1)*(J-1), es decir, (columnas-1)*(filas-1)
Frecuencia condicional o frecuencia empírica, valor que asume
el Predictor y el Criterio en la celda ij.
Frecuencia esperada o teórica bajo la hipótesis de independencia.
N

N * (a * d  b * c)  
2

x2 
(a  b) *(c  d ) *(a  c) *(b  d )
2
d
cd

 Independencia
bd
n
P(A)=PA/B  Independencia
Corrección por continuidad de Yates
-9-
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Chi Cuadrado-Prueba Exacta de Fisher
Si X 2 calculado > X 2 tabla  H 0 H1
Si 300,337 > 7,87944  H 0 H1
X 2 teorico  X 21;0,05  7,87944
Pα  0, 05
X 2 calculado  Chi  square value  300,337
Rechazo H 0
Aceptacion H 0
P-value= 0,000
Zona de Riesgo
(RESID) R ij  (Oij  Eij )
[Residuos No tipificados]
(SRESID) SR ij  (Oij  Eij ) / Eij
[Residuos tipificados]
(SRESID) AR ij  SRij / Vij
[Residuos tipificados corregidos]
Vij  1  (Oi. / n) 1  (O. j / n) 
[Residuos tipificados corregidos]
- 10 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
TEORÍA DE LAS MUESTRAS
ERRORES STÁNDARES DE DISTRIBUCIONES MUESTRALES
X
X 
n
sX
n
X 
sX  ES X 
sX
N n
*
n 1
n
 p  ES p 
p*q
n
 X  ES X 
p*q  N  n 
*

n  n 1 
 X  X  ES X  X  ES D 
1
2
1
2
 12
n1

 22
 12
n2
 22
 X  X  ES X  X  ES D 

n1  1 n2  1
 p  p  ES p  p  ES D 
p1 * q1 p2 * q2

n1
n2
1
1
2
2
1
1
2
2
 p  p  ES p  p  ES D 
1
2
1
2
p1 * q1 p2 * q2

n1  1 n2  1
- 11 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
INFERENCIA DE MEDIAS Y PROPORCIONES
X  X  z *
X  X  z *
X
n
sX
n
sX
N n
X  X  t *
*
n 1
n
P  p  z*
P  pt*
p*q
n
p*q  N  n 
*

n  n 1 
P1  P2  p1  p2  z *
p1 * q1 p2 * q2

n1
n2
P1  P2  p1  p2  t *
p1 * q1 p2 * q2

n1  1 n2  1
- 12 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
TAMAÑO DE LA MUESTRA
n (universo infinito) 
n (universo finito) 
z2 * p * q
P  
2

4* p * q
e2
[n
4* p * q * N
e *( N  1)  (4* p * q)
2
 100.000]
[n <100.000]
CÁLCULO DEL ERROR DE MUESTREO Y DEL ERROR DE ESTIMACIÓN
UNIVERSO INFINITO (  100.000)
ERROR DE MUESTREO
X 
p*q
n
UNIVERSO FINITO (<100.000)
ERROR DE MUESTREO
X 
p*q  N  n 
*

n  N 1 
ERROR DE ESTIMACIÓN PARA PROPORCIONES PARA UNA
MUESTRA INFINITA [z * Error de Muestreo]
e%  z *
p*q
n
ERROR DE ESTIMACIÓN PARA PROPORCIONES PARA UNA
MUESTRA FINITA [z * Error de Muestreo]
p*q N  n
e%  z *
*
n
N 1
- 13 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
EJEMPLO DE APLICACIÓN
p*q
n
p  q  50%
N  310.000
n  275
 X  3, 02%
X 
E  z * X
E  2 * 3, 02
E  6, 04%
X 
p*q  N  n 
*

n
 N 1 
E  z * X
E  1, 96 * 5, 25%
E  10, 29%
p  q  50%
N  10.000
n  90
P ( )  5% (nivel de significación)
z = 1,96
 X  Error de muestreo
E= Error de estimación (intérvalo de confianza=P(1- )=95%)
- 14 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
TEORÍA DE LA DECISIÓN ESTADÍSTICA
HIPÓTESIS ESTADÍSTICAS
Proposición lógica que estable una relación entre estadísticos o parámetros indicando o no el
sentido o diferencias de dicha relación. La formulación de hipótesis direccionales o no direccionales, o hipótesis simétricas o asimétricas, implica considerar que la prueba estadística es unilateral (hipótesis asimétricas) o bilateral (hipótesis simétricas). (Ver fórmulas de Curva Normal
de Gauss para niveles de significación: PALFA bilaterales y unilaterales).
a) Pueden no indicar el sentido de la relación o diferencias entre estadísticos y/o parámetros:
H1 : X 1  X 2
H 2 : X1  X 2  0
H3 : X1   X
H 4 : X1   X  0
b) Indicando el sentido de la relación o diferencia entre estadísticos y/o parámetros:
H1 : X 1  X 2
H 2 : X1  X 2  0
H3 : X1   X
H 4 : X1   X  0
HIPÓTESIS NULA Y ALTERNATIVA
H0  phombres y sobrevivieron  pmujeres y sobrevivieron  d %  0
H1  phombres y sobrevivieron  pmujeres y sobrevivieron  d %  0
- 15 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
TEST DE HIPÓTESIS ESTADÍSTICAS
PRUEBA ESTADÍSTICA PARAMÉTRICAS
CONTRASTE DE MEDIAS Y PROPORCIONES
Hipótesis estadísticas:
1. Diferencia entre media muestral y media parámetro2
H0  X1  X  D  0
1.1. Prueba t (de Student-Fisher) para una muestra. Muestras grandes
(n> 30)
t X1   X
X


1
  X   D DX1 X

SX
X
n
1.2. Prueba t para una muestra. Muestras chicas (n
t X1   X 2
2
X


1

30)
  X    D DX1 X

SX
X
n 1
En SPSS: Analizar > Comparar medias > Prueba T para una muestra.
- 16 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Hipótesis estadísticas:
2. Diferencia entre proporción muestral y proporción parámetro
H0  p1  P  D  0
2.1. Prueba t para una muestra. Muestras grandes (n> 30)
t pP
p  P   PD


pq
n

D pP
X
2.2. Prueba t para una muestra. Muestras chicas (n
t pP
p  P   PD


pq
n 1


30)
D pP
X
- 17 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Hipótesis estadística
3. Diferencia entre dos medias muestrales independientes3
H0  X1  X 2  D  0
3.1. Prueba t para muestras independientes. Muestras grandes (n > 30)
t X1  X 2
X


1
 X 2   D
S1 S 2

n1 n2

DX X
1
2
D
3.2. Prueba t para muestras independientes. Muestras chicas (n
t X1  X 2
3
X


1
 X 2   D
S1
S2

n1  1 n2  1

DX X
1

30)
2
D
En SPSS: Analizar > Comparar medias > Prueba T para una muestras independientes.
- 18 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Hipótesis estadística:
4. Diferencia entre dos proporciones muestrales independientes
H0  p1  p2  D  0
4.1. Prueba t para muestras independientes. Muestras grandes (n > 30)
t p p 
1
2
( p1  p2 )  PD
d%

p1  q1 p2  q2  D

n1
n2
4.2. Prueba t para muestras independientes. Muestras chicas (n
t p p 
1
2

30)
( p1  p2 )  PD
d%

p1  q1 p2  q2  D

n1  1 n2  1
- 19 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE
Covx , y
1 n
 *  ( X j  X ) *(Y j  Y ) 
n j 1
n
rx , y 
 ( X
j
j 1
 X ) *(Y j  Y ) 
n * x * y
n
 ( X
j 1
rx , y 
 X ) *(Y j  Y ) 
n
n
rx , y
j
n
2
(
X

X
)
 j
j 1
n
2
(
Y

Y
)
 i
*
j 1
n
1 n
  zx * z y
n j 1
- 20 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Y Y
X X
 rx , y *
sy
sx
Y  Y  rx , y *
sy
sx
*( X  X )
Yx  rx , y *
sy
X y  rx , y
sx
*(Y  Y )  X
sy
sx
bYx  rx , y *
*( X  X )  Y
sy
sx
sx
bXy  rx , y *
sy
ESest   Yx  s y * 1  r 2
ESest   X y  sx * 1  r 2
- 21 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
σYx =σ( est ) =ES( est ) =sY * 1- r 2
σYx =σ( est ) =ES( est ) =sY * k
- 22 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
1  r2  k2
r2  1 k 2
k  1 r2
EP  100*(1  k )
- 23 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
ANALISIS DE REGRESIÓN LINEAL SIMPLE
Y  a  b* X
z y  a   yx * z x
z y j  b0  1 * z x j
z x  a   xy * z y
z x j  b0  1 * z y j
- 24 -
FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Y = Yc  e
Y = Yc  z  s yx
X  = X c  z  sx y
Yc e  Y  Yc e
- 25 -
Descargar