Subido por Kendra rivera

clase2

Anuncio
Aprendizaje
Automático
(Machine 2.
Learning)
DATA MINING
Lesly Zerna
@leslysandra
TEMARIO
◎ Introducción
◎ Fundamentos Data Mining
◎ El proceso de la extracción del
conocimiento
◎ Ejercicios
◎ Tarea
2
OBJETIVOS
◎ Conceptos fundamentales de Data
Mining
3
BIBLIOGRAFIA
◎ Joel Grus, Data Science from Scratch, 2nd
Edition
https://learning.oreilly.com/library/view/data-science-from/97
81492041122/
◎ Ian Witten, Eibe Frank, Mark Hall, Christopher Pal,
Data Mining, 4th Edition
http://shop.oreilly.com/product/9780128042915.do
4
BIBLIOGRAFIA
◎ Robert Layton, Learning Data Mining with Python
http://shop.oreilly.com/product/9781784396053.do
◎ ** Lin, T.Y., Ohsuga, S., Liau, C.-J., Hu, X., Tsumoto, S.
(Eds.), Foundations of Data Mining and Knowledge
Discovery
https://www.springer.com/gp/book/9783540262572
5
CONCEPTOS PREVIOS
◎ Data Intuition
◎ Data Knowledge
◎ Data Driven
6
“
Los datos son el oro del SIGLO XXI
7
Fundamentos de Data Mining
◎ Manejo de grandes cantidades de datos
◎ Encontrar patrones, clasificaciones, …
◎ En los negocios:
○ Masiva cantidad de datos
○ Hardware → poder computacional
○ Algoritmos de Machine Learning
9
10
Arquitectura Data Mining
11
Ventajas Data Mining
◎ Detección de fraudes
◎ Diferentes métodos para DM → menor $
◎ Aplicable a diferentes áreas
13
Desventajas Data Mining
◎ Seguridad
◎ Software costoso + herramientas extras
◎ Exactitud de datos?
14
Otras dificultades en Data Mining
◎ Manejo de valores faltantes, nulos,
inconsistentes
◎ Eficiencia de algoritmos
◎ Variedad mínima en el dataset
◎ Complejidad de la data
◎ Selección de los datos a usar/explorar
16
Skills Data Mining
◎ Programación
◎ Frameworks Big Data
◎ Bases de datos (relacionales & no
relacionales)
◎ Estadística
17
Skills Data Mining
◎ Estructura de datos
◎ Algoritmos
◎ Técnicas de Machine Learning
◎ Comunicación (visualización)
18
Skills Data Mining
Datos →
…
→ Conocimiento
19
Skills Data Mining
Datos →
…
→ Conocimiento
example!
20
The knowledge Discovery Process
◎ Conocer los datos y establecer una meta
◎ Poner los datos en el ambiente apropiado
para la exploración
◎ Verificaciones: objetivo, herramientas,
procesos de integración
21
The knowledge Discovery Process
◎ Limpieza de datos
◎ Desarrollar hipótesis y un modelo
◎ Data mining → proceso principal
○ Revelar patrones
○ Encontrar nuevo conocimiento o
validar hipótesis planteada
22
The knowledge Discovery Process
◎ Pruebas y verificaciones
◎ Interpretación y usos (visualizaciones)
23
Ejercicio
24
Tarea
◎ Houses price dataset ← limpieza de datos +
regresión lineal + resultados
25
26
Descargar