Aprendizaje Automático (Machine 2. Learning) DATA MINING Lesly Zerna @leslysandra TEMARIO ◎ Introducción ◎ Fundamentos Data Mining ◎ El proceso de la extracción del conocimiento ◎ Ejercicios ◎ Tarea 2 OBJETIVOS ◎ Conceptos fundamentales de Data Mining 3 BIBLIOGRAFIA ◎ Joel Grus, Data Science from Scratch, 2nd Edition https://learning.oreilly.com/library/view/data-science-from/97 81492041122/ ◎ Ian Witten, Eibe Frank, Mark Hall, Christopher Pal, Data Mining, 4th Edition http://shop.oreilly.com/product/9780128042915.do 4 BIBLIOGRAFIA ◎ Robert Layton, Learning Data Mining with Python http://shop.oreilly.com/product/9781784396053.do ◎ ** Lin, T.Y., Ohsuga, S., Liau, C.-J., Hu, X., Tsumoto, S. (Eds.), Foundations of Data Mining and Knowledge Discovery https://www.springer.com/gp/book/9783540262572 5 CONCEPTOS PREVIOS ◎ Data Intuition ◎ Data Knowledge ◎ Data Driven 6 “ Los datos son el oro del SIGLO XXI 7 Fundamentos de Data Mining ◎ Manejo de grandes cantidades de datos ◎ Encontrar patrones, clasificaciones, … ◎ En los negocios: ○ Masiva cantidad de datos ○ Hardware → poder computacional ○ Algoritmos de Machine Learning 9 10 Arquitectura Data Mining 11 Ventajas Data Mining ◎ Detección de fraudes ◎ Diferentes métodos para DM → menor $ ◎ Aplicable a diferentes áreas 13 Desventajas Data Mining ◎ Seguridad ◎ Software costoso + herramientas extras ◎ Exactitud de datos? 14 Otras dificultades en Data Mining ◎ Manejo de valores faltantes, nulos, inconsistentes ◎ Eficiencia de algoritmos ◎ Variedad mínima en el dataset ◎ Complejidad de la data ◎ Selección de los datos a usar/explorar 16 Skills Data Mining ◎ Programación ◎ Frameworks Big Data ◎ Bases de datos (relacionales & no relacionales) ◎ Estadística 17 Skills Data Mining ◎ Estructura de datos ◎ Algoritmos ◎ Técnicas de Machine Learning ◎ Comunicación (visualización) 18 Skills Data Mining Datos → … → Conocimiento 19 Skills Data Mining Datos → … → Conocimiento example! 20 The knowledge Discovery Process ◎ Conocer los datos y establecer una meta ◎ Poner los datos en el ambiente apropiado para la exploración ◎ Verificaciones: objetivo, herramientas, procesos de integración 21 The knowledge Discovery Process ◎ Limpieza de datos ◎ Desarrollar hipótesis y un modelo ◎ Data mining → proceso principal ○ Revelar patrones ○ Encontrar nuevo conocimiento o validar hipótesis planteada 22 The knowledge Discovery Process ◎ Pruebas y verificaciones ◎ Interpretación y usos (visualizaciones) 23 Ejercicio 24 Tarea ◎ Houses price dataset ← limpieza de datos + regresión lineal + resultados 25 26