UNIVERSIDAD TECNICA DE ORURO FACULTAD NACIONAL DE INGENIERIA CARRERA: INGENIERIA INFORMÁTICA TITULO: “ADRIANA” - ANALIZADOR LINGÜISTA COMPUTACIONAL PARA PRIMARIA INFERIOR Autor: Ing. Ximena Mariel ZeballosVasquez Fecha de defensa: 4 de Junio de 2010 Fecha de defensa de la tesis: 14 de Mayo de 2010 Descriptores: Lingüista, léxico, sintáctico, semántico, calificación Tutor de Tesis: Ing. Miguel Reynolds Nro.Páginas: 368 págs. RESUMEN El Procesamiento del Lenguaje Natural, en el área de la inteligencia artificial; en su rama “Lingüística computacional”, trata del estudio del lenguaje en sus diferentes niveles y procesos (fonética, morfología, sintaxis, semántica, pragmática, etc.) desde una perspectiva tecnológica. El analizador lingüístico utiliza herramientas de esta rama. Se realiza este sistema porque la organización SaveTheChildren no cuenta en la evaluación, con un proceso automatizado que obtenga resultados de redacciones de textos de estudiantes, “preguntas abiertas” y solo cuenta con sistemas de evaluación de preguntas cerradas. El sistema evita preocuparse por resultados sin preguntas abiertas y tener una mayor certeza sobre los resultados más completos y exactos. SaveTheChildren – Oruro, por el departamento de educación desarrolla evaluaciones. El proceso de evaluación toma dos caminos: evaluación de preguntas cerradas y abiertas. La parte de automatización de preguntas cerradas ya está resuelta, no en tanto las preguntas abiertas aún no se han resuelto. El principal objeto de estudio es el texto producido por el estudiante. Lo que se quiere resolver en el proyecto es la automatización de preguntas abiertas, para completar el proceso de evaluación. El objetivo general es: Desarrollar un “Analizador Lingüista computacional” de análisis morfológico, sintáctico, disléxico y de corrección de pruebas de lenguaje de primer y segundo ciclo, para obtener un proceso de evaluación completa e imparcial. Los objetivos específicos son: a) Diseñar la construcción del modelo del intérprete para identificar roles, usuarios, etc. b) Diseñar el modelo del intérprete, para facilitar la implementación del analizador léxico y sintáctico. c) Construir un analizador léxico y disléxico, para analizar morfológicamente el texto. d) Construir un interpretador de textos en su fase analizador sintáctico, para hacer un estudio gramatical de la unión de palabras y formación de sentencias. e) Realizar un análisis de resultados para poder observar el comportamiento del sistema después de la implementación. Las metodologías utilizadas en el proyecto son: Objetivos Diseñar la construcción del modelo Diseñar el modelo del intérprete. Construir un analizador léxico y disléxico. Construir un interpretador de textos en su fase analizador sintáctico. Realizar un análisis de resultados. Herramientas o métodos de solución “PROCESO UNIFICADO”, UML con Rational Rose Metodología de desarrollo de compiladores. C++ Builder, SQL SERVER– Procedimientos almacenados Teoría de compiladores, -Revisor para gramáticas libres de contexto (Gold ParserBuilder), -C++ Builder, SQL SERVER Ingeniería de Software, - Pruebas de hipótesis Estadísticas. La hipótesis del proyecto es: El sistema tiene la capacidad de completar el proceso de calificaciones de manera imparcial y evitando la divergencia al emitir resultados. La prueba de hipótesis es respondida mediante la prueba para igualdad de dos varianzas que se determina que la muestra revisada por los expertos presenta una mayor dispersión respecto a su medida de tendencia central respecto al sistema desarrollado. Conclusiones: La incorporación del sistema ADRIANA, responde a las necesidades de la institución mediante la construcción del analizador léxico (5 autómatas creados), sintáctico (46 reglas sintácticas creadas), semántico (algoritmos de fragmentación creadas) y asignando la nota del texto construido (Creados 30 parámetros de calificación de análisis léxico y sintáctico) por el estudiante y completa el proceso de evaluaciones de preguntas abiertas a las ya existentes automatizaciones de preguntas cerradas. Recomendaciones: El País, solo cuenta con una institución dedicada a la lingüística ubicada en la ciudad de La Paz. El fomento al estudio del procesamiento del lenguaje sería un referente importante en la investigación y superación del país.