Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Análisis de Datos II Análisis Discriminante Richard Amaguaña Planteamiento del problema Supuestos del modelo Estimación Outline Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Motivación Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Outline Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Motivación Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Motivación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Discriminante = Discriminar o clasificar. Ejemplos: Modelo Planteamiento del problema Supuestos del modelo (1) Clasificar si una persona caerá en mora o no, (2) Clasificar si una persona pasará a estar desempleada (3) Admitir o no a un estudiante a la universidad (4) Determinar si un banco pondrá en riesgo el sístema Estimación Motivación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Discriminante = Discriminar o clasificar. Ejemplos: Modelo Planteamiento del problema Supuestos del modelo (1) Clasificar si una persona caerá en mora o no, (2) Clasificar si una persona pasará a estar desempleada (3) Admitir o no a un estudiante a la universidad (4) Determinar si un banco pondrá en riesgo el sístema I Objetivo: Identificar el grupo al cual un objeto pertenece Estimación Motivación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Outline Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Motivación Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Es una herramienta de clasificación supervisada. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Es una herramienta de clasificación supervisada. I Permite clasificar un objeto en una categoria previamente definida. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Es una herramienta de clasificación supervisada. I Permite clasificar un objeto en una categoria previamente definida. I Planteamiento estadístico: Se dispone de un conjunto amplio de elementos que pueden venir de dos o más poblaciones distintas. En cada elemento se ha observado una variable aleatoria p-dimensional x, cuya distribución se conoce en las poblaciones consideradas. Se desea clasificar un nuevo elemneto, con valores de las variables conocidas, en una de las poblaciones. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) I Objetivo: Establecer la relación entre una variable cualitativa y variables cuantitativas Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) I Objetivo: Establecer la relación entre una variable cualitativa y variables cuantitativas I Análisis discriminante de dos grupos : variable dependiente consta de dos grupos Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) I Objetivo: Establecer la relación entre una variable cualitativa y variables cuantitativas I Análisis discriminante de dos grupos : variable dependiente consta de dos grupos I Análisis discriminante múltiple: variable dependiente consta de tres o más grupos. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) I Objetivo: Establecer la relación entre una variable cualitativa y variables cuantitativas I Análisis discriminante de dos grupos : variable dependiente consta de dos grupos I Análisis discriminante múltiple: variable dependiente consta de tres o más grupos. I Otra herramienta adicional al análisis discriminante es la Regresión Logística. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Algunas ideas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Problema: Variable dependiente es categórica(≥ 2) I Objetivo: Establecer la relación entre una variable cualitativa y variables cuantitativas I Análisis discriminante de dos grupos : variable dependiente consta de dos grupos I Análisis discriminante múltiple: variable dependiente consta de tres o más grupos. I Otra herramienta adicional al análisis discriminante es la Regresión Logística. I La regresión logística la restringiremos a la forma básica de dos grupos. Modelo Planteamiento del problema Supuestos del modelo Estimación Qué es el análisis discriminante? Richard Amaguaña Métodos de Dependencia Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Richard Amaguaña Compradores frente a No compradores Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Richard Amaguaña Compradores frente a No compradores - Análisis Gráfico Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Richard Amaguaña Compradores frente a No compradores - Funciones Discriminantes Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Richard Amaguaña Compradores frente a No compradores - Precisión Funciones Discriminantes Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Múltiple Richard Amaguaña Cambio de Proveedor Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Múltiple Richard Amaguaña Cambio de Proveedor - Análisis gráfico Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Ejemplo de Análisis Discrimiante Múltiple Richard Amaguaña Cambio de Proveedor - Análisis gráfico bidimensional Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Outline Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Motivación Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Existen varios enfoques posibles para solucionar el problema de discriminación. Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Existen varios enfoques posibles para solucionar el problema de discriminación. I Se utilizará el enfoque clásico debido a fisher que se basa en la normalidad multivariante de las variables consideradas. Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Existen varios enfoques posibles para solucionar el problema de discriminación. I Se utilizará el enfoque clásico debido a fisher que se basa en la normalidad multivariante de las variables consideradas. I Si las variables no son normales se pueden transformar. Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Existen varios enfoques posibles para solucionar el problema de discriminación. I Se utilizará el enfoque clásico debido a fisher que se basa en la normalidad multivariante de las variables consideradas. I Si las variables no son normales se pueden transformar. I Todas las variables usadas para clasificar son continuas. Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Existen varios enfoques posibles para solucionar el problema de discriminación. I Se utilizará el enfoque clásico debido a fisher que se basa en la normalidad multivariante de las variables consideradas. I Si las variables no son normales se pueden transformar. I Todas las variables usadas para clasificar son continuas. I Cuando existen variables continuas y discretas para clasificar se utilizan otras técnicas. Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I I Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I I I Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I I I I Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación I Problema: Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación I Problema: I Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo I Problema: Clasificar x0 en P1 o P2 . Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo I Problema: Clasificar x0 en P1 o P2 . I Recordar: Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo I Problema: Clasificar x0 en P1 o P2 . I Recordar: I Observamos X0 y calculamos con el teorema de bayes las probabilidades a posteriori. Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo I Problema: Clasificar x0 en P1 o P2 . I Recordar: I Observamos X0 y calculamos con el teorema de bayes las probabilidades a posteriori. I Conclusión: Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Error de clasificación Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Costos de clasificación Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Cuantificar los Costos de clasificación Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Normalidad Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Supuesto: fi ∼ N , i = 1, 2 Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Normalidad: Solución Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Planteamiento del problema Richard Amaguaña Normalidad: Solución Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) I No multicolinealidad. Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) I No multicolinealidad. I La relación debe ser lineal. Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) I No multicolinealidad. I La relación debe ser lineal. I Analizar los datos atípicos (Preferible eliminarlos). Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) I No multicolinealidad. I La relación debe ser lineal. I Analizar los datos atípicos (Preferible eliminarlos). I Tamanõ de la muestra = 5-20 datos por cada variable independiente. Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? I Normalidad multivariante de las variables independientes(fi ∼ N, i = 1, 2). I Matrices de varianzas y covarianzas iguales (aunque desconocidas) I No multicolinealidad. I La relación debe ser lineal. I Analizar los datos atípicos (Preferible eliminarlos). I Tamanõ de la muestra = 5-20 datos por cada variable independiente. I Tamanõ de la muestra: No debe haber diferencia grande entre los grupos Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo Estimación Supuestos del modelo Richard Amaguaña Pruebas estadśiticas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Normalidad: Kolmogorov - Smirnov, Shapiro-wilk Estimación Supuestos del modelo Richard Amaguaña Pruebas estadśiticas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Normalidad: Kolmogorov - Smirnov, Shapiro-wilk I Matrices de covarianzas iguales: Box test Estimación Supuestos del modelo Richard Amaguaña Pruebas estadśiticas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Normalidad: Kolmogorov - Smirnov, Shapiro-wilk I Matrices de covarianzas iguales: Box test I No multicolinealidad: Correlation test Estimación Supuestos del modelo Richard Amaguaña Pruebas estadśiticas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Normalidad: Kolmogorov - Smirnov, Shapiro-wilk I Matrices de covarianzas iguales: Box test I No multicolinealidad: Correlation test I Igualdad de medias: ANOVA test Estimación Supuestos del modelo Richard Amaguaña Pruebas estadśiticas Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I Normalidad: Kolmogorov - Smirnov, Shapiro-wilk I Matrices de covarianzas iguales: Box test I No multicolinealidad: Correlation test I Igualdad de medias: ANOVA test I Estimación: etapas/simultaneo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes Modelo Planteamiento del problema Supuestos del modelo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes I Método por etapas: Incluir una a una las variables independientes. Modelo Planteamiento del problema Supuestos del modelo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes I Método por etapas: Incluir una a una las variables independientes. I Significancia estadística(enfoque simultaneo): Traza Hotelling, criterio de pillai Modelo Planteamiento del problema Supuestos del modelo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes I Método por etapas: Incluir una a una las variables independientes. I Significancia estadística(enfoque simultaneo): Traza Hotelling, criterio de pillai I Significancia estadística (enfoque por etapas): D2 de Mahalanobis y V de Rao Modelo Planteamiento del problema Supuestos del modelo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes I Método por etapas: Incluir una a una las variables independientes. I Significancia estadística(enfoque simultaneo): Traza Hotelling, criterio de pillai I Significancia estadística (enfoque por etapas): D2 de Mahalanobis y V de Rao I Evaluar si la discriminación global es significativa Modelo Planteamiento del problema Supuestos del modelo Estimación Estimación Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I Método simultaneo: Considerar todas las variables independientes I Método por etapas: Incluir una a una las variables independientes. I Significancia estadística(enfoque simultaneo): Traza Hotelling, criterio de pillai I Significancia estadística (enfoque por etapas): D2 de Mahalanobis y V de Rao I Evaluar si la discriminación global es significativa I Evaluar cada función discriminante Modelo Planteamiento del problema Supuestos del modelo Estimación Valoración Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I 1 paso : calcular función Z discriminante Estimación Valoración Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I 1 paso : calcular función Z discriminante I 2 paso: calcular la puntuación Z para cada observación Estimación Valoración Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I 1 paso : calcular función Z discriminante I 2 paso: calcular la puntuación Z para cada observación I 3 paso : evaluar diferencias de grupo Estimación Valoración Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo Modelo Planteamiento del problema Supuestos del modelo I 1 paso : calcular función Z discriminante I 2 paso: calcular la puntuación Z para cada observación I 3 paso : evaluar diferencias de grupo I 4 paso: valorar precisión de la predicción Estimación Cálculo de las puntuaciones Richard Amaguaña Motivación Introducción al análisis discriminante Qué es el análisis discriminante? Idea con un ejemplo I La puntuación Z se puede calcular como: Modelo Planteamiento del problema Supuestos del modelo Estimación