Demostrador textmess2.0-Alicante-2010-01-31

Anuncio
Demostrador tecnológico
Proyecto TextMess 2.0
Grupo de Procesamiento del Lenguaje Natural
Universidad de Alicante
Introducción

La importancia de las opiniones
◦ Variedad de productos existentes

Dispersión de la información
◦ Cantidad de opiniones sobre cada producto

Difícil elección por parte de los
compradores
Objetivo


Crear un sistema de búsqueda y valoración
de opiniones sobre productos tecnológicos
Módulos intercambiables, parametrizable
◦ Integración con el Metasistema InTiMe

Características
◦ Búsqueda de un producto
◦ Valoración de las características de cada
producto
◦ Valoración general de un producto
◦ Acceso a las opiniones y a las fuentes de esas
opiniones
Metodología
INTERNET
Recuperación
documentos
dominio
Detección tipos
productos
Documentos
Selección
características
Detección
productos
Extracción
opiniones
Corpus
etiquetado
Entrenamiento
Productos
Opiniones
Clasificación
opiniones
Modelos
Metodología

Entrenamiento del modelo
◦ Corpus etiquetado (EmotiBlog)
◦ Aprendizaje automático

Recuperación de documentos de sitios
web completos sobre el dominio
seleccionado
◦ Páginas con información sobre las
características de productos de ese dominio
◦ Páginas con opiniones de productos de ese
dominio
Metodología

Detección de productos y tipos de
productos:
◦ A partir de elementos conocidos en páginas
web
◦ Detección de productos
 Creación de base de datos de productos
◦ Detección de tipos de productos
 Obtención de características comunes
Metodología

Extracción de características para cada
tipo de producto
◦ Extracción de términos de los documentos
◦ Combinación de
 Freeling
 Métodos de selección de características estadísticos
◦ Filtrado manual de características
◦ Ontología
Metodología

Filtrado y clasificación de frases
◦ División de los documentos recuperados en
frases
◦ Filtrado de frases
 Hablan sobre las características extraídas
 Hablan sobre el producto en general
◦ Clasificación de frases según polaridad e
intensidad
◦ Cálculo de puntuación para cada producto
Ejemplos
this is not a bad phone.. been using it for a few weeks.. starting i was very
disappointed with this phone cos it is v slow and lag when i ugrade from 2.1
to 2.2 and sometimes it hang or went black screen and must wait for
very long.. but yesterday i...
the best phone ever mabe.... no i phone can come near it
Galaxy S with Android 2.2.1 is far better than IPhone4. On only one days
use you did not even try rooting it and install any lagfix, and you did not upgrade
to the official 2.2.1 update. Most apps install less than 20 mb on the internal
memory, the...
Metodología

Búsqueda de opiniones
◦ Búsqueda de un producto
◦ Valoración de las características de cada
producto
◦ Valoración general de un producto
◦ Acceso a las opiniones y a las fuentes de esas
opiniones
Ejemplo

Búsqueda de productos
Ejemplo

Valoración de productos
Muchas gracias por su atención
¿Alguna pregunta?
13
Descargar