minería de datos - Professional Hunters

Anuncio
MINERÍA DE DATOS
¿Por qué son importantes las Bases de Datos?
Los diferentes mercados y tipos de organizaciones se ha requerido un
mayor estudio referentes al descubrimiento de conocimiento y gracias a la
integración de tecnologías como Minería de Datos con Inteligencia de
Negocios es posible ofrecer de manera automatizada e inteligente
información de suma importancia para ejecutar acciones para la solución
de problemas organizacionales.
La Minería de Datos es un proceso que permite obtener conocimiento a
partir de los datos almacenados, mediante un proceso no trivial de
extracción de información implícita, previamente desconocida y
potencialmente útil. Descubrir conocimiento implica buscar patrones de
comportamiento aún no conocidos en los datos. El conocimiento se puede
manifestar como: patrones, reglas de conocimiento, asociaciones, grupos,
restricciones, tendencias, etc. Los dominios de aplicación prácticamente
abarcan cualquier campo y tipo de empresas (comercialización,
producción, finanzas, energía, gobierno, tecnología, etc.)
2
Objetivos del curso
 Conocer de manera general las técnicas y enfoques de Minería de
Datos
 Exploración y uso de fuentes de datos para análisis y toma de
decisiones
 Comprender el proceso de la Minería de Datos para extraer
conocimiento desde base de datos y la aplicación de estas técnicas a la
solución de problemas de reconocimiento de patrones, clasificación y
pronóstico.
3
Desarrollo del curso
Durante el desarrollo del curso el instructor explicará cada uno de los
temas, proporcionará ejemplos de aplicación en diversos campos y
reforzará los conocimientos mediante ejercicios desarrollados en clase.
4
Instructor
Act. Sonia Yoselin Ovando Retiz
Actuario titulada por la Facultad de Ciencias de la UNAM enfocada a las áreas de
Estadística, reaseguro y pensiones.
En lo laboral:
Ha impartido cátedra en la UNAM para el departamento de Matemáticas en materias
como: Cálculo Diferencial, Geometría Analística, Estadística, Almacenes de datos y
Minería de datos.
Trabaja en HSBC como asesor de Análisis de Crédito, realizando las siguientes
funciones:
 Desarrollo de estrategias de aseguramiento de la cartera de tarjetas de crédito
basadas en el análisis estadístico, la minería de datos y mediciones de rentabilidad.
 Desarrollo de estrategias de gestión de cuentas para la cartera de tarjeta de
crédito: las transferencias de saldo, cheques de conveniencia, de gestión de la línea
de crédito, autorizaciones, etc.
 Desarrollo y automatización de seguimiento mensual para el seguimiento de las
estrategias de originación y de suscripción
 Proporcionar datos para el análisis ad hoc sobre la cartera de tarjeta de crédito.
Trabaja y conoce a un excelente nivel C++, Visual Basic, R, SAS
5
Temario
1.
Introducción a minería de datos
¿Qué es minería de datos?
¿Porqué minería de datos?
CRISP-SEMMA
2. Datos de procesamiento
¿Porqué procesar los datos?
Limpieza de datos
Manejo de datos missing
Identificación de errores de clasificación
Métodos graficos y outliers
Trasnformación de datos
Métodos numéricos y outliers
6
…Temario
3. Análisis exploratorio de datos
Pruebas de hipótesis vs Análisis exploratorio de datos
Conocimiento de los datos
Correlación de variables
Variables categóricas
Relaciones multivariadas
Selección de subconjuntos de datos
Binning
4. Estimaciones y pronósticos
Descubrimiento de conocimiento en los datps
Estimación y pronóstico
Métodos univariados
Inferencia estadística
7
…Temario
Intervalos de confianza
Peligros de la exploración
Regresión multiple
Verificación de los supuesto del modelo
5. Algoritmo k-nearest neighbor
Métodos supervisados vs no supervisados
Metodología para modelos supervisados
Sesgo-varianza
Clasificación
k-nearest neighbor
Función distancia
Otras funciones
Cuantificación de relevancias
8
…Temario
Algoritmo k-nearest neighbor para estimación y pronóstico
Elegir k
6. Árboles de decisión
Árboles de decisión y regresión
Algoritmo C4.5
Reglas de decisión
Algoritmo CART vs C5.0
7. Redes neuronales
Codificación de entradas y salidas
Redes neuronales para estimacaión y pronóstico
Ejemplos simples
Función sigmoid
9
…Temario
Retropropagación
Método gradient descent
Reglas de retropropagación
Ejemplos de retropropagación
Criterio de terminación
Tasa de aprendizaje
Análisis de sensibilidad
Aplicación
8. Clustering
Clustering
Método jerárquico
K-means
Ejemplo
10
…Temario
9. Reglas de asociación
Affinity analysis and market basket analysis
Soporte, confianza, frecuencias y propiedades a priori
Generación de frecuencias
Generación de reglas de asociación
Datos categoricos
Método de inducción de reglas generalizadas
Cuando no usar reglas de asociación
Reglas de asociación y aprendizaje supervisado o no
supervisado
Patrones locales vs modelos globales
10. Técnicas de evaluación
Modelos de evaluación para descripción
Modelos de evaluación para estimación y pronóstico
Modelos de evaluación para clasificación
11
…Temario
Tasa de error, falsos positivos y falsos negativos
Misclassification
Análisis de decisión costo/beneficio
Lift and gains charts
Validación de modelos
Conclusiones
12
Dinámica
El curso se realizará en un ambiente práctico, de manera que es
importante que los participantes puedan llevar una laptop.
13
Información general del curso
 Duración:
40 horas
 Lugar:
Tlaxcala No. 67 1er. Piso, Col. Roma Sur, Del. Cuauhtémoc
C.P. 06760 México, D.F. (están justo en la esquina de Tlaxcala y
Medellín)
 Horario:
11:00 a 15:00 horas
 Inicio
Sábado 25 de octubre de 2014
 Fin
Sábado 24 de enero de 2015
14
Ubicación
Tlaxcala 67 101,
Col. Roma Sur,
Del. Cuauhtémoc,
C.P. 06760
15
Inversión
 Empresas y facturación (cualquier forma de pago)
 $ 4,999 + IVA
 Efectivo
 $ 3,999
Aparta tu lugar con $1,000 y liquídalo antes de que comience el curso
Cupo limitado
16
Garantía
Asiste a la primera sesión y si
no es de tu agrado, te
devolvemos el importe de tu
apartado
 Si decides tomar el curso completo, puedes pagar el importe total en la
primera sesión o pactar un esquema de pago que vaya acorde a tus
posibilidades .
 Limitado a disposición de lugares.
17
Inscripciones e Informes
1.
2.
3.
4.
Solicitar por correo electrónico o vía telefónica las formas de pago.
Enviar el comprobante de pago vía correo electrónico a la dirección de
correo [email protected] indicando el nombre completo,
teléfono y datos fiscales anexando su RFC (en caso de requerir factura)
Una vez enviados los datos anteriores se confirmara la inscripción y
depósito vía correo electrónico.
El reembolso solo se realizará 15 días antes de iniciar el curso y únicamente
se devolverá el 70% de la inversión realizada hasta ese momento.
Informes:
[email protected]
[email protected]
Tels. 5171-6286, 4329-0443, 4331-9873
18
Descargar