6. Taller 1 - mcuantitativos2011B

Anuncio
Taller 2. Análisis previo de los datos
El segundo taller sobre análisis previos de datos, usted debe comprender el
siguiente archivo.
a.
Hatco.sav
Por favor, determine:
 Determinar la información presentada. Listar lo que significa cada
una de las variables. Leer el archivo hatco_documentation.pdf
 Determine el tipo de escala de cada una de las variables
 Determine el posible uso de la información recolectada
 Explicar la validez y confianza de los datos presentados
 Evaluar los supuestos de normalidad, linealidad, ξ~N(0,σ2), varianza
constante
 Análisis gráfica de forma de distribución: histograma con curva
normal, diagrama de tallos y hojas
 Análisis de relación entre variables: gráfico de dispersión por
variables, r y gráfico de cajas y bigotes.
 Escriba una páginas explicando esta base de datos
Análisis previo de los datos
1. Leer el texto del la base de datos HATCO
2. Cargar la base de datos HATCO en SPSS
3. Análisis de la forma de la distribución.
Histograma de frecuencia con curva normal
Diagrama de tallos y hojas
ANALISIS DE LAS DIFERENCIAS ENTRE GRUPOS
ANALISIS DE LA DIFERENCIA ENTRE GRUPOS
ESTANDARIZAR VARIABLES CUANTITATIVAS Y COMPARAr EL FRÁFICO DE CAJA VIGOTES
Z(i)=(x(i)-media)/var
DATOS AUSENTES
Método de la media
Método de la moda en el rango
Dato típico en la población
Imputación mediante la regresión
Eliminación de la observación
Eliminación de la variable
DETECCION DE CASOS ATIPICOS
DISTANCIA DE MAHALANOBIS POR CASOS Y VARIABLES DECISION CASO ATIPICO
VALORACION DE LOS SUPUESTOS FRENTE A LOS MODELO
NORMALIDAD
Gráficos P-P
gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad
gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad
P-P...,P-P...,P-P...
gráficos de probabilidad P-P,gráficos de probabilidad P-P,gráficos de probabilidad P-P
gráficos de probabilidad normal,gráficos de probabilidad normal,gráficos de probabilidad
normal
gráficos de probabilidad normal,gráficos de probabilidad normal,gráficos de probabilidad
normal
P-P...,P-P...,P-P...
gráficos,gráficos,gráficos
gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad
Representa las proporciones acumuladas de una variable respecto a las proporciones
acumuladas de cualquiera de las integrantes en una serie de distribuciones de
contraste. Los gráficos de probabilidad se suelen utilizar para determinar si la
distribución de una variable coincide con otra distribución especificada. Si la variable
seleccionada coincide, los puntos se agruparán en torno a una línea recta.
Entre las distribuciones de contraste disponibles se incluyen Beta, Chi-Cuadrado,
Exponencial, Gamma, Semi-Normal, Laplace, Logística, Lognormal, Normal, Pareto, t de
Student, Weibull y Uniforme. Según la distribución seleccionada, podrá especificar los
grados de libertad y otros parámetros.


Se obtendrán gráficos de probabilidad para los valores transformados. Entre las
opciones de transformación se incluyen Transformación log natural, Tipificar los
valores, Diferenciar y Diferenciar ciclo.
Puede especificar los métodos para calcular las distribuciones esperadas y para
deshacer los "empates" o las múltiples observaciones con el mismo valor.
Asimetría. Medida de la asimetría de una distribución. La distribución normal es
simétrica y tiene un valor de asimetría igual a 0. Una distribución que tenga una
asimetría positiva significativa tiene una cola derecha larga. Una distribución que
tenga una asimetría negativa significativa tiene una cola izquierda larga. Como regla
aproximada, un valor de la asimetría mayor que el doble de su error típico se asume
que indica una desviación de la simetría.
Curtosis. Medida del grado en que las observaciones están agrupadas en torno al
punto central. Para una distribución normal, el valor del estadístico de curtosis es 0.
Una curtosis positiva indica que las observaciones se concentran más y presentan
colas más largas que las de una distribución normal. Una curtosis negativa indica
que las observaciones se agrupan menos y presentan colas más cortas.
HOMOCEDASTICIDAD
MATRIZ DE VIRIANZA COVARIANZA
LINEALIDAD
El segundo taller sobre análisis previos de datos, usted debe leer los
siguientes archivos
b. Colombia.xls
c.
Colombiaagrupaso.xls
Por favor, determine:
 Validez y confianza de los datos
 Homogeneidad de los datos
 Proponga un método de organización de los datos
 Crear un archivo en SPSS “colombia”
 Aplique los procesos anteriormente enunciados en el presente taller
 Escriba tres páginas explicando esta base de datos
Descargar