+
Extracción de Información
Algunas aplicaciones prácticas
Javi Fernández
+
n Javi
Fernández
n  Doctorando
· Aplicaciones de la informática
n  PAS · Universidad de Alicante
n  Correo · [email protected]
+
Índice
n Introducción
n Minería
de opiniones
n Recuperación
n Conclusiones
de información
+
Introducción
Extracción de información
+
Introducción
n Extracción
n  Extracción
de información
automática de información
estructurada o semiestructurada a partir de
una colección de documentos.
+
Introducción
n Extracción
de información
+
Introducción
n Extracción
de información
+
Introducción
n Usos
n  Reconocimiento
de entidades nombradas
n  Personas
n  Organizaciones
n  Lugares
n  …
+
Introducción
n Usos
n  Extracción
elementos estructurales
n  Título
n  Subtítulo
n  Contenido
n  Foco
n  …
+
Introducción
n Usos
n  Resolución
de la correferencia
n  Extracción de terminología
n  Extracción de relaciones
+
Introducción
n Relación
con otras áreas
n  Recuperación
de información
n  Textual
n  Geográfica
n  …
n  Minería
de opiniones
n  Búsqueda de respuestas
n  …
+ Recuperación de
información
Problemática y ejemplo
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
n Elementos
n  Título
n  URL
n  Texto
n  Enlaces
n  …
n “Sencillo”
a extraer
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
n Elementos
a extraer
n  Secciones
n  Títulos
de secciones
n  Frases relacionadas
n  Partes relevantes
n  …
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
+
Recuperación de información
n Elementos
a extraer
n  Información
irrelevante y spam
n  Para eliminar
+
Recuperación de información
+
Recuperación de información
n ¿Cómo?
+
Recuperación de información
n ¿Cómo?
n  Opción
1: sistema especializado.
n  Alta eficacia y rendimiento.
n  Opción 2: sistema genérico.
n  Alta adaptabilidad.
+
Recuperación de información
n ¿Cómo?
n  Ejemplo:
n  Árbol
de etiquetas
+
Recuperación de información
n Menús
n  Página
1
body
h1
Título A
div
table
div
a
div
Publicidad A
Enlace A
Datos A
+
Recuperación de información
n Menús
n  Página
2
body
h1
Título B
div
table
div
a
div
Publicidad A
Enlace A
Datos B
+
Recuperación de información
n Menús
n  Página
2
body
h1
Título B
div
table
div
a
div
Publicidad A
Enlace A
Datos B
+
Recuperación de información
n Menús
n  Página
2
body
h1
Título B
div
table
div
a
div
Publicidad A
Enlace A
Datos B
+
Recuperación de información
n Publicidad
n  Página
1
body
h1
Título A
div
table
div
a
div
Publicidad A
Enlace A
Datos A
+
Recuperación de información
n Publicidad
n  Página
1
body
h1
Título A
div
table
div
a
div
Publicidad C
Enlace A
Datos A
+
Recuperación de información
n Publicidad
n  Página
1
body
h1
Título A
div
table
div
a
div
Publicidad C
Enlace A
Datos A
+
Recuperación de información
n Publicidad
n  Página
1
body
h1
Título A
div
table
div
a
div
Publicidad C
Enlace A
Datos A
+
Minería de opiniones
Problemática y ejemplos
+
Minería de opiniones
+
Minería de opiniones
+
Minería de opiniones
+
Minería de opiniones
n ¿Cómo?
+
Minería de opiniones
n ¿Cómo?
n  Ejemplo
1:
n  Aprendizaje automático
+
Minería de opiniones
+
Minería de opiniones
FRASES
+
Minería de opiniones
POLARIDAD
+
Minería de opiniones
+
Minería de opiniones
n ¿Cómo?
n  Ejemplo
2:
n  Lista de adjetivos inicial
n  Minipar
+
Minería de opiniones
+
Minería de opiniones
+
Minería de opiniones
n Ejemplo
n  Lista
de adjetivos inicial
n  bueno (positivo)
n  malo (negativo)
+
Minería de opiniones
n Ejemplo
n  La
pantalla de este móvil es buena.
n  El teclado es un poco malo.
+
Minería de opiniones
n Ejemplo
n  La
pantalla de este móvil es buena.
n  El teclado es un poco malo.
+
Minería de opiniones
n Ejemplo
n  La
pantalla de este móvil es buena.
n  El teclado es un poco malo.
+
Minería de opiniones
n Ejemplo
n  La
pantalla de este móvil es buena.
n  El teclado es un poco malo.
n  Añadimos
puntuaciones y nombres:
n  pantalla +1
n  teclado -1
+
Minería de opiniones
n Ejemplo
n  La
pantalla es espléndida.
n  El teclado es terrible.
+
Minería de opiniones
n Ejemplo
n  La
pantalla es espléndida.
n  El teclado es terrible.
+
Minería de opiniones
n Ejemplo
n  La
pantalla es espléndida.
n  El teclado es terrible.
+
Minería de opiniones
n Ejemplo
n  La
pantalla es espléndida.
n  El teclado es terrible.
n  Añadimos
nuevos adjetivos a la lista:
n  espléndida: positivo
n  terrible: negativo
+
Minería de opiniones
n Ejemplo
n  Resultado:
n  Características
encontradas:
n  Pantalla
n  Teclado
n  Nuevos
adjetivos encontrados:
n  espléndido (positivo)
n  terrible (negativo)
+
Minería de opiniones
n Ejemplo
n  Resultado:
n  La
pantalla tiene opiniones positivas
n  El teclado tiene opiniones negativas
+
Conclusiones
¿Qué recordar de todo esto?
+
Conclusiones
n Extracción
de información
n  Extracción
automática de información
estructurada o semiestructurada a partir de
una colección de documentos.
n  Puede
ser:
n  Tarea principal.
n  Soporte para otras tareas.
n  Necesaria en recuperación de información y minería
de opiniones.
+
Extracción de Información
Algunas aplicaciones prácticas
Javi Fernández
Descargar

Extracción de información - Algunas aplicaciones prácticas