Inteligencia artificial Proceso de Lenguaje Natural ¿Qué es el Lenguaje? Q ¿Qué es el Lenguaje Natural? Q Procesamiento del lenguaje Natural (PLN) Q Aplicaciones PLN Q Niveles del Lenguaje Q Arquitectura de un sistema de PLN Inteligencia Artificial Q Introducción Inteligencia Artificial La inteligencia humana abarca muchas habilidades, incluyendo la habilidad para percibir y analizar escenas visuales y la habilidad para entender o generar lenguajes. Lenguaje: Sistema estructurado. de signos complejo, ¿Qué es el Lenguaje? Inteligencia Artificial Un lenguaje es un conjunto de oraciones, que usualmente es infinito y se forma con combinaciones de palabras. Es necesario que esas combinaciones sean correctas (con respecto a sintaxis) y tengan sentido (con respecto a la semántica). Un lenguaje es la función que expresa pensamientos y comunicaciones entre la gente. Esta función es llevada a cabo por medio de señales y vocales (voz) y posiblemente por signos escritos (escritura). Inteligencia Artificial Un lenguaje se considera un conjunto de símbolos que al combinarse permiten la costrucción de mensajes. Un mensaje se forma por la combinación de unidades lingüísticas de menor tamaño (morfemas, palabras, frases, sentencias, párrafos). Comunicación es el intercambio de mensajes a través de la emisión y percepción de ellos. ¿Qué es el Lenguaje? La lingüística estudia cómo se combinan las unidades del lenguaje para formar otras mayores (modelado por una gramática). Inteligencia Artificial La lingüística estudia los procesos de construcción de mensajes para la adecuada comprensión. La lingüística computacional adelanta el proceso de análisis y síntesis para la comprensión de un texto de forma eficiente por medio del computador. Morfología. Sintaxis. Semántica Morfología Estudia la estructura y formación de las palabras. Inteligencia Artificial Las unidades constitutivas de las palabras son los morfemas (mínimas unidades lingüísticas con significado). Se distinguen: Morfemas libres. Morfemas ligados. Morfología Según la estructura morfológica se distinguen tres clases de lenguajes: Aislativos. Están compuestos sólo por morfemas libres. Las palabras son invariantes. Inteligencia Artificial Aglutinativos. Las palabras se forman por concatenación de morfemas invariantes. Flexivos. Las palabras se forman por la unión de morfemas que se alteran para expresar tiempo, número, persona. Sintaxis Inteligencia Artificial Se encarga de estudiar las relaciones entre las palabras en el contexto de la oración. Inteligencia Artificial Sintaxis Semántica Q Q Inteligencia Artificial Q Estudia el significado de los elementos lingüísticos. En semántica computacional se suele asumir que el significado de una sentencia es equivalente a sus condiciones de verdad. La descripción semántica de un lenguaje consiste en establecer un mecanismo que determine las condiciones de verdad para cada sentencia. Semántica Inteligencia Artificial Las condiciones de verdad de una sentencia determinan la validez de las inferencias realizadas. Las herramientas básicas para el desarrollo de teorías semánticas proceden de la lógica y de las reglas de inferencia que se construyan, igualmente de la representación del conocimiento (información). Generalidades del lenguaje Inteligencia Artificial Lenguaje natural (Chino, danés, inglés, español) son aquellos que los seres humanos utilizan para comunicarse entre sí. Lenguaje formal (LISP, PROLOG, C++, JAVA, lógica matemática, lógica de primer orden,...), es lo utilizado para estructurar leyes, procesos o teorías. Inteligencia Artificial ¿Qué es el Lenguaje Natural? Los lenguajes naturales se caracterizan por las siguientes propiedades: Desarrollados por enriquecimiento progresivo antes de cualquier intento de formación de una teoría. Su carácter expresivo se debe a la riqueza del componente semántico (polisemántica). Existe dificultad o imposibilidad de una formalización completa. Inteligencia Artificial Procesamiento computacional del Lenguaje Natural (PLN) Una meta fundamental de la Inteligencia artificial (IA), es la manipulación del lenguaje natural utilizando herramientas de computación (programas). Los lenguajes formales (programación) juegan un papel importante, ya que facilitarían el enlace necesario entre los lenguajes naturales y su manipulación por una máquina. Lenguajes de programación Un lenguaje de programación se basa en dos elementos muy importantes: Sintaxis: que se refiere a la utilización correcta de cada una de las sentencias de cierto lenguaje de programación. Inteligencia Artificial Semántica: se encarga de que cada sentencia utilizada del lenguaje en el programa tenga un significado correcto. Inteligencia Artificial Procesamiento computacional del Lenguaje Natural (PLN) PLN es utilizar el lenguaje natural para comunicarnos con el computador. Este comprendería las sentencias enunciadas. El uso de lenguajes naturales facilita el desarrollo de programas que realicen tareas de comunicación. Y construir modelos que ayuden a comprender los mecanismos humanos relacionados con el lenguaje. Utilizar lenguaje natural (LN) en la comunicación hombre-maquina es una ventaja y un obstáculo con respecto a otros medios de comunicación. Estructura de frase Q Q Inteligencia Artificial Q Q Los mensajes se componen de frases, las cuales se agrupan en diversas categorias. Frase nominal (ej: el rey, el agente de la esquina) FN Frase verbal (ej: esta muerto) M => FN FV Pasos de una comunicación Inteligencia Artificial Intención Generación Síntesis Percepción Análisis (interpretación sintactica, interpretación semántica). Desambiguación. Incorporación. HABLANTE Intención: Sabe (H, ¬EstáVivo (rick, S3) Generación: “El rick está muerto” Síntesis: [elrickestamuerto] OYENTE Inteligencia Artificial Percepción “El rick está muerto” Desambiguación ¬EstáVivo(rick, S3) Análisis (gramatical) O FN FV artículo sustantivo verbo adjetivo El rick está muerto Incorporación: DECIR (BC) ¬EstáVivo(rick, S3) Aplicaciones del PLN Traducción automática Q Recuperación de la información Q Extracción de Información y Resúmenes Q Resolución cooperativa de problemas. Q Tutores inteligentes. Q Reconocimiento de Voz Inteligencia Artificial Q Niveles del Lenguaje Nivel Fonológico: trata de cómo las palabras se relacionan con los sonidos que representan. Inteligencia Artificial Nivel Morfológico: trata de cómo las palabras se construyen a partir de unas unidades de significado mas pequeñas llamadas morfemas, por ejemplo: Rápida + Mente == Rápidamente Inteligencia Artificial Niveles del Lenguaje Nivel Semántico: trata del significado de las palabras y de cómo los significados se unen para dar significado a una oración, también se refiere al significado independiente del contexto, es decir de la oración aislada. Nivel Pragmático: trata de cómo las oraciones se usan en distintas situaciones y de cómo el uso afecta al significado de las oraciones. Se suele reconocer un subnivel recursivo: discursivo, que trata de cómo el significado de una oración se ve afectado por las oraciones inmediatamente anteriores. Arquitectura de un sistema PLN Son los procesos con los que el computador interpreta y analiza las sentencias dadas. Inteligencia Artificial El usuario le expresa al computador que es lo que desea hacer. El computador analiza las oraciones recibidas, en el sentido morfológico y sintáctico, es decir, si las frases contienen palabras compuestas por morfemas y si la estructura de las oraciones es correcta. Luego analiza semánticamente, es decir, saber cual es el significado de cada oración, y determinar el valor de verdad. Enseguida pasa a realizar el análisis pragmático de la oración, es decir, se miran todas juntas, tomando en cuenta la situación de cada una. Inteligencia Artificial Así sabrá el computador que es lo que debe hacer, es decir, ya tiene la expresión final. Una vez obtenida la expresión final, pasa a su ejecución para obtener un resultado y proporcionárselo al usuario. Análisis y comprensión del lenguaje Q Q Inteligencia Artificial Q Q Muchas aplicaciones comercializadas utilizan gramáticas “comentadas” —cuentan con gran cantidad de reglas para describir diferentes tipos de frases. Cada regla se halla comentada por características o expresiones en un lenguaje de programación. Este tipo de gramáticas alcanzan tamaños que dificultan su mantenimiento y reutilización. Se obtienen sistemas eficaces para determinadas aplicaciones, pero lentos, lo que los hace inaplicables a entornos interactivos o con gran volumen de trabajo. Análisis y comprensión del lenguaje ! ! Inteligencia Artificial ! ! En la investigación actual: Se emplean gramáticas muy simples, tales como autómatas de estado finito, que proporcionan un procesamiento muy eficiente. Algunas aproximaciones prescinden incluso de la gramática y usan métodos estadísticos para identificar patrones lingüísticos. Por otro lado, se han desarrollado diversos formalismos de gran sofisticación y potencia para facilitar la ingeniería de la gramática. Inteligencia Artificial