Imp Identificación de rasgos de personalidad a través del Análisis Automatizado de Textos Este p 122 c diseñ impre Janet Viridiana Hernández García | Dr. Esaú Villatoro Tello – MC Gabriela Ramírez de la Rosa | UAM Cuajimalpa Introducción Hoy en día, el Internet representa una fuente de información donde es posible obtener grandes cantidades de textos escritos en lenguaje natural. Esto ha motivado muchas investigaciones, en diversas áreas del conocimiento. Es necesario construir herramientas que permitan analizar y hacer conclusiones a partir de grandes cantidades de información. Justificación El estudio de la personalidad y el lenguaje tiene variadas aplicaciones en TI, por ejemplo: § Marketing personalizado y anuncio de productos Objetivos Específicos a) Implementar formas tradicionales de representación de textos, por ejemplo, bolsa de palabras, que permita realizar la clasificación de los diferentes rasgos de personalidad. b) Implementar una forma de representación que capture el contexto, estilo y léxico empleado en los documentos. c) Evaluar el desempeño de la representación desarrollada en problemas de clasificación no temática. d) Construcción de un sistema Web que sea capaz de predecir el o los rasgos de personalidad dado un conjunto de textos de entrada. Existen metodos de Clasificación de Textos que se emplean comumente, como son: • Vector de términos • Modelo de n-gramas Los modelos tradicionales de representación enfrentan grandes retos: MultiEvolución Escasez Ruido lenguaje del lenguaje wi wi Misma representación en bigramas, aunque su significado es totalmente diferente Estado del Arte Los estudios que se revisaron se relacionan con clasificación automática de la personalidad, APC. detectaron tres tipos de enfoques que emplean trabajos para sus investigaciones, los cuales son: Grafos de N-Gramas ki ki Wiki la Se los Kiwi Para resolver esto se propone el uso de grafos de n-gramas de caracteres. Los cuales representan documentos individuales y categorias enteras como grafos. Grafos de rasgos § Reputación de marcas / personajes públicos. Extroversión § Diseño de interfaces de usuario Texto § Sistemas de recomendación § Tecnologías de asistencia Basados en el análisis de texto Grafo de n-gramas de c a r a c t e r e s d e l documento Cálculo de similitud Amabilidad (0.2,0.8,1.0,...,0.4,0.2,0.5, …,0.3,0.5,0.6,..) Vector de características Objetivo General Basados en comportamiento Aplicar una representación basada en grafos, que sea capaz de capturar carácterísticas léxicas, estilísticas y de contexto para hacer una asociación efectiva del texto de un usuario a uno de los rasgos de personalidad del Big Five. Análisis Multi-Modal Neuroticismo Sistema Web Pers Los m este p Espec posici clic en tabla, Smart mul/m Para a texto, de la Si nec posici texto de lo posici Powe con e ¿Dese en lug proble image haga la ima