Identificación de rasgos de personalidad a través del Análisis

Anuncio
Imp
Identificación de rasgos de personalidad
a través del Análisis Automatizado de Textos
Este p
122 c
diseñ
impre
Janet Viridiana Hernández García | Dr. Esaú Villatoro Tello – MC Gabriela Ramírez de la Rosa | UAM Cuajimalpa
Introducción
Hoy en día, el Internet representa una fuente de
información donde es posible obtener grandes
cantidades de textos escritos en lenguaje natural.
Esto ha motivado muchas investigaciones, en
diversas áreas
del conocimiento.
Es necesario construir herramientas que permitan analizar
y hacer conclusiones a partir de grandes cantidades de
información.
Justificación
El estudio de la personalidad y el lenguaje tiene variadas
aplicaciones en TI, por ejemplo:
§  Marketing personalizado y anuncio de productos
Objetivos Específicos
a)  Implementar formas tradicionales de representación de
textos, por ejemplo, bolsa de palabras, que permita realizar
la clasificación de los diferentes rasgos de personalidad.
b)  Implementar una forma de representación que capture el
contexto, estilo y léxico empleado en los documentos.
c)  Evaluar el desempeño de la representación desarrollada en
problemas de clasificación no temática.
d)  Construcción de un sistema Web que sea capaz de predecir
el o los rasgos de personalidad dado un conjunto de textos
de entrada.
Existen metodos de Clasificación de Textos que se emplean
comumente, como son:
•  Vector de términos
•  Modelo de n-gramas
Los modelos tradicionales de representación enfrentan grandes
retos:
MultiEvolución
Escasez
Ruido
lenguaje
del lenguaje
wi
wi
Misma representación en
bigramas, aunque su significado
es totalmente diferente
Estado del Arte
Los estudios que se revisaron se relacionan con
clasificación automática de la personalidad, APC.
detectaron tres tipos de enfoques que emplean
trabajos para sus investigaciones, los cuales son:
Grafos de N-Gramas
ki
ki
Wiki
la
Se
los
Kiwi
Para resolver esto se propone el uso de grafos de n-gramas de
caracteres. Los cuales representan documentos individuales y
categorias enteras como grafos.
Grafos de rasgos
§  Reputación de marcas / personajes públicos.
Extroversión
§  Diseño de interfaces de usuario
Texto
§  Sistemas de recomendación
§  Tecnologías de asistencia
Basados en el análisis de
texto
Grafo de n-gramas de
c a r a c t e r e s d e l
documento
Cálculo de
similitud
Amabilidad
(0.2,0.8,1.0,...,0.4,0.2,0.5, …,0.3,0.5,0.6,..)
Vector de características
Objetivo General
Basados en
comportamiento
Aplicar una representación basada en grafos, que sea capaz de
capturar carácterísticas léxicas, estilísticas y de contexto para hacer
una asociación efectiva del texto de un usuario a uno de los rasgos
de personalidad del Big Five.
Análisis Multi-Modal
Neuroticismo
Sistema Web
Pers
Los m
este p
Espec
posici
clic en
tabla,
Smart
mul/m
Para a
texto,
de la Si nec
posici
texto de lo posici
Powe
con e
¿Dese
en lug
proble
image
haga la ima
Descargar