FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Formulario de Estadística Descriptiva e Inferencial 1 Autor: Prof. Rubén José Rodríguez 6 de marzo de 2006 MEDIDAS DE TENDENCIA CENTRAL y POSICIÓN n X X j 1 j n n X X j 1 j *f n n X pm * f j 1 n f *x' X Z *i n Fórmulas editadas con MathType 4.0 Editor de ecuaciones, 1999. Copie y pegue en los Reports Estadísticos. 1 -1- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL X (Total o Ponderada)= Md lirMd N1 * X1 N2 * X 2 ... Nn * X n N1 N2 ... Nn n fali 2 *i f Md d1 Mo lirMo *i d1 d 2 1 P25 lir 4 3 P75 lir 4 * n fali f P25 *i * n fali f P75 *i -2- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL MEDIDAS DE FORMA DE LA DISTRIBUCIÓN ASIMETRÍA Medida de la asimetría de una distribución. La distribución normal es simétrica por lo que tiene un valor de asimetría 0 [As = 0]. Una distribución que tenga una asimetría positiva significativa tiene una cola derecha larga. Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda larga. Un valor de asimetría mayor que 1, en valor absoluto, indica generalmente una distribución que difiere de manera significativa de la distribución normal. Un valor de Asimetría < 0 [As < 0] indicará una Asimetría negativa (con una cola a la izquierda de la Media aritmética). Un valor de Asimetría > 0 [As < 0] señalará una Asimetría positiva (con una cola a la derecha de la Media aritmética). Los resultados pueden ser los siguientes: g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) g1 > 0 (distribución asimétrica positiva). La mayor parte de los sujetos tienen puntuaciones ba- jas. g1 < 0 (distribución asimétrica negativa). La mayor parte de los sujetos tienen pun-tuaciones altas. CURTOSIS Medida del grado en que las observaciones están agrupadas en torno al punto central. Para una distribución normal (mesocúrtica) el valor del estadístico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran más y presentan colas más largas que las de una distribución normal (platicúrtica). Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas más cortas (leptocúrtica). El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable Los resultados pueden ser los siguientes: g 2 = 0 (distribución mesocúrtica). La distribución es normal. g2 > 0(distribución leptocúrtica ). Muchos sujetos en torno a las puntaciones centrales. g2 < 0 (distribución platicúrtica). Los sujetos están distribuidos a lo largo de todos los valores de la variable. . -3- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL MEDIDAS DE VARIABILIDAD At Rango Recorrido las lai 1 las = límite aparente superior lai = límite aparente inferior At lsr lir X N 2 X j 1 j X 2 N 2 X P *Q X j X n s2 X j 1 n 1 X j X N X 2 2 j 1 N -4- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL X n j 1 sX j X 2 n 1 sX p * q X n j 1 sX X * f 2 j n n sX i * j 1 n 2 f *x' f *x' j 1 n n 2 n DX X X j 1 n DQ C3 C1 C3 C1 Q 2 -5- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL DISTRIBUCIÓN BINOMIAL X n* p sX n * p * q ES Error Standard de la Media p X p*q n n n! r r !* n r ! n, r Cn, r n r n r p q * p * q r n r n P r * p r * q nr r n zp 0 p (n * p) n* p*q -6- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL CURVA NORMAL de GAUSS y z z 1 * 2 *e 1 X * 2 2 X X X s X z * s X s X X z zp p (n * p) n* p*q X 1s 68, 26% X 2s 95, 44% X 3s 99,72% P (bilateral ) P .01 A .4950 2,54z P (bilateral ) P .05 A .4750 1,96z P (bilateral ) P .10 A .4495 1,64z P (unilateral ) P .01 A .4900 2,32z -7- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL P (unilateral ) P .05 A .4495 1,64z P (unilateral ) P .10 A .3962 1,26z -8- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL CHI CUADRADO n x 2 ( P ; gl ) j 1 f ij Fij 2 Fij ( fo fe)2 fe i 1 n x 2 ( P ; gl ) P Valor de probabilidad que se observa en la relación entre el gl = f ij = f 0 Fij =f e Predictor y la VD que se presentará si el Predictor y la VD fueran estadísticamente independientes. Grados de libertad: (I-1)*(J-1), es decir, (columnas-1)*(filas-1) Frecuencia condicional o frecuencia empírica, valor que asume el Predictor y el Criterio en la celda ij. Frecuencia esperada o teórica bajo la hipótesis de independencia. N N * (a * d b * c) 2 x2 (a b) *(c d ) *(a c) *(b d ) 2 d cd Independencia bd n P(A)=PA/B Independencia Corrección por continuidad de Yates -9- FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Chi Cuadrado-Prueba Exacta de Fisher Si X 2 calculado > X 2 tabla H 0 H1 Si 300,337 > 7,87944 H 0 H1 X 2 teorico X 21;0,05 7,87944 Pα 0, 05 X 2 calculado Chi square value 300,337 Rechazo H 0 Aceptacion H 0 P-value= 0,000 Zona de Riesgo (RESID) R ij (Oij Eij ) [Residuos No tipificados] (SRESID) SR ij (Oij Eij ) / Eij [Residuos tipificados] (SRESID) AR ij SRij / Vij [Residuos tipificados corregidos] Vij 1 (Oi. / n) 1 (O. j / n) [Residuos tipificados corregidos] - 10 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL TEORÍA DE LAS MUESTRAS ERRORES STÁNDARES DE DISTRIBUCIONES MUESTRALES X X n sX n X sX ES X sX N n * n 1 n p ES p p*q n X ES X p*q N n * n n 1 X X ES X X ES D 1 2 1 2 12 n1 22 12 n2 22 X X ES X X ES D n1 1 n2 1 p p ES p p ES D p1 * q1 p2 * q2 n1 n2 1 1 2 2 1 1 2 2 p p ES p p ES D 1 2 1 2 p1 * q1 p2 * q2 n1 1 n2 1 - 11 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL INFERENCIA DE MEDIAS Y PROPORCIONES X X z * X X z * X n sX n sX N n X X t * * n 1 n P p z* P pt* p*q n p*q N n * n n 1 P1 P2 p1 p2 z * p1 * q1 p2 * q2 n1 n2 P1 P2 p1 p2 t * p1 * q1 p2 * q2 n1 1 n2 1 - 12 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL TAMAÑO DE LA MUESTRA n (universo infinito) n (universo finito) z2 * p * q P 2 4* p * q e2 [n 4* p * q * N e *( N 1) (4* p * q) 2 100.000] [n <100.000] CÁLCULO DEL ERROR DE MUESTREO Y DEL ERROR DE ESTIMACIÓN UNIVERSO INFINITO ( 100.000) ERROR DE MUESTREO X p*q n UNIVERSO FINITO (<100.000) ERROR DE MUESTREO X p*q N n * n N 1 ERROR DE ESTIMACIÓN PARA PROPORCIONES PARA UNA MUESTRA INFINITA [z * Error de Muestreo] e% z * p*q n ERROR DE ESTIMACIÓN PARA PROPORCIONES PARA UNA MUESTRA FINITA [z * Error de Muestreo] p*q N n e% z * * n N 1 - 13 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL EJEMPLO DE APLICACIÓN p*q n p q 50% N 310.000 n 275 X 3, 02% X E z * X E 2 * 3, 02 E 6, 04% X p*q N n * n N 1 E z * X E 1, 96 * 5, 25% E 10, 29% p q 50% N 10.000 n 90 P ( ) 5% (nivel de significación) z = 1,96 X Error de muestreo E= Error de estimación (intérvalo de confianza=P(1- )=95%) - 14 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL TEORÍA DE LA DECISIÓN ESTADÍSTICA HIPÓTESIS ESTADÍSTICAS Proposición lógica que estable una relación entre estadísticos o parámetros indicando o no el sentido o diferencias de dicha relación. La formulación de hipótesis direccionales o no direccionales, o hipótesis simétricas o asimétricas, implica considerar que la prueba estadística es unilateral (hipótesis asimétricas) o bilateral (hipótesis simétricas). (Ver fórmulas de Curva Normal de Gauss para niveles de significación: PALFA bilaterales y unilaterales). a) Pueden no indicar el sentido de la relación o diferencias entre estadísticos y/o parámetros: H1 : X 1 X 2 H 2 : X1 X 2 0 H3 : X1 X H 4 : X1 X 0 b) Indicando el sentido de la relación o diferencia entre estadísticos y/o parámetros: H1 : X 1 X 2 H 2 : X1 X 2 0 H3 : X1 X H 4 : X1 X 0 HIPÓTESIS NULA Y ALTERNATIVA H0 phombres y sobrevivieron pmujeres y sobrevivieron d % 0 H1 phombres y sobrevivieron pmujeres y sobrevivieron d % 0 - 15 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL TEST DE HIPÓTESIS ESTADÍSTICAS PRUEBA ESTADÍSTICA PARAMÉTRICAS CONTRASTE DE MEDIAS Y PROPORCIONES Hipótesis estadísticas: 1. Diferencia entre media muestral y media parámetro2 H0 X1 X D 0 1.1. Prueba t (de Student-Fisher) para una muestra. Muestras grandes (n> 30) t X1 X X 1 X D DX1 X SX X n 1.2. Prueba t para una muestra. Muestras chicas (n t X1 X 2 2 X 1 30) X D DX1 X SX X n 1 En SPSS: Analizar > Comparar medias > Prueba T para una muestra. - 16 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Hipótesis estadísticas: 2. Diferencia entre proporción muestral y proporción parámetro H0 p1 P D 0 2.1. Prueba t para una muestra. Muestras grandes (n> 30) t pP p P PD pq n D pP X 2.2. Prueba t para una muestra. Muestras chicas (n t pP p P PD pq n 1 30) D pP X - 17 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Hipótesis estadística 3. Diferencia entre dos medias muestrales independientes3 H0 X1 X 2 D 0 3.1. Prueba t para muestras independientes. Muestras grandes (n > 30) t X1 X 2 X 1 X 2 D S1 S 2 n1 n2 DX X 1 2 D 3.2. Prueba t para muestras independientes. Muestras chicas (n t X1 X 2 3 X 1 X 2 D S1 S2 n1 1 n2 1 DX X 1 30) 2 D En SPSS: Analizar > Comparar medias > Prueba T para una muestras independientes. - 18 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Hipótesis estadística: 4. Diferencia entre dos proporciones muestrales independientes H0 p1 p2 D 0 4.1. Prueba t para muestras independientes. Muestras grandes (n > 30) t p p 1 2 ( p1 p2 ) PD d% p1 q1 p2 q2 D n1 n2 4.2. Prueba t para muestras independientes. Muestras chicas (n t p p 1 2 30) ( p1 p2 ) PD d% p1 q1 p2 q2 D n1 1 n2 1 - 19 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE Covx , y 1 n * ( X j X ) *(Y j Y ) n j 1 n rx , y ( X j j 1 X ) *(Y j Y ) n * x * y n ( X j 1 rx , y X ) *(Y j Y ) n n rx , y j n 2 ( X X ) j j 1 n 2 ( Y Y ) i * j 1 n 1 n zx * z y n j 1 - 20 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Y Y X X rx , y * sy sx Y Y rx , y * sy sx *( X X ) Yx rx , y * sy X y rx , y sx *(Y Y ) X sy sx bYx rx , y * *( X X ) Y sy sx sx bXy rx , y * sy ESest Yx s y * 1 r 2 ESest X y sx * 1 r 2 - 21 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL σYx =σ( est ) =ES( est ) =sY * 1- r 2 σYx =σ( est ) =ES( est ) =sY * k - 22 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL 1 r2 k2 r2 1 k 2 k 1 r2 EP 100*(1 k ) - 23 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL ANALISIS DE REGRESIÓN LINEAL SIMPLE Y a b* X z y a yx * z x z y j b0 1 * z x j z x a xy * z y z x j b0 1 * z y j - 24 - FORMULARIO DE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL Y = Yc e Y = Yc z s yx X = X c z sx y Yc e Y Yc e - 25 -