Inteligencia artificial distribuida Tema: Estructura de los agentes Programa = algoritmo + datos Objeto= atributos + métodos Agente= arquitectura + programa Donde la arquitectura puede ser una computadora sencilla, o hardware especial para la ejecución de ciertas tareas, como el procesamiento de imágenes de una cámara, o el filtrado de señales de entrada de audio. Puede incluirse también un software que ofrezca cierto grado de aislamiento entre la computadora y el programa agente, lo que permitiría la programación aun nivel superior. Pone al alcance del programa las percepciones obtenidas mediante los sensores, lo ejecuta y alimenta al efector con las acciones elegidas por el programa conformes éstas se van generando. En cuanto al programa, se refiere a la función que permita implantar el mapeo del agente para pasar de percepciones a acciones y que se ejecutará en algún tipo de dispositivo de cómputo. Tema: Entorno de trabajo Antes de diseñar un agente hay que centrarse en el entorno de trabajo – que son esencialmente los problemas para los que los agentes son las soluciones-, debe de especificarse de la forma más completa posible. Especificaciones del entorno El entorno de trabajo está conformado por cuatro elementos: -Medida de rendimiento (METAS) – Cualidades deseables del agente – medidas de rendimiento, objetivos, metas - Incluyen criterios que determinan el éxito en el comportamiento del agente. Como regla general, es mejor diseñar medidas de utilidad de acuerdo con lo que se quiere para el entorno, más que de acuerdo con cómo se cree que el agente debe comportarse, por ejemplo en el agente aspiradora, su meta principal o medida de rendimiento es: mantener siempre el “Suelo limpio”. (R) -Entorno sobre el cual actuará o se moverá el agente (E) -Actuadores – Herramientas o elementos para efectuar el trabajo, acciones a realizar (A) -Sensores – Como percibe el ambiente el agente, con qué lo percibe (S) A estos cuatro elementos se les engloba con el acrónimo REAS (Rendimiento, Entorno, Actuadores, Sensores) (libro: Stuart Russel y Pete Norving. Inteligencia Artificial un enfoque moderno. Ed. Prentice-Hall) o PAAM (Percepción, Acción, Meta, Ambiente). REAS= Rendimiento Entorno Actuadores Sensores PAMA=Percepción Acción Meta Ambiente Ejemplos de descripción REAS (O PAMA) de algunos agentes 1 Tipo agente Rendimiento (Metas) Paciente saludable, reducción al mínimo de los costos y de las demandas. Entorno (Ambiente) Paciente, hospital, personal Sistema para el análisis de imágenes satelitales Clasificación correcta de la imagen. Robot clasificador (seleccionador) de partes Poner las partes en el bote que les corresponda. Porcentaje de piezas clasificadas. Controlador de un refinería Maximizar la seguridad, pureza y rendimiento (producción). Imágenes enviadas desde un satélite en órbita, conexión con el satélite en órbita. Banda transportadoras sobre la que se encuentran las partes, las partes, y los botes sobre en los que se depositarán las partes clasificadas. Refinería, operadores Tutor interactivo de inglés Que el estudiante obtenga la máxima calificación en una prueba. Grupo de estudiantes, agencia examinadora. Conductor de taxi Viaje seguro, rápido, sin infracciones, cómodo, obtención máxima de Caminos, tráfico, peatones, cliente, semáforos. Sistema de diagnóstico médico Actuadores (Acciones) Preguntas, pruebas, tratamientos, diagnósticos, casos. Impresora, monitor Visualizar e imprimir una clasificación de escena. Sensores (Percepciones) Sintoma, evidencias y respuestas del paciente. Teclado para emitir dicha información. Pixel de intensidad y colores diversos (matriz de bits) Recoger partes y clasificarlas poniéndolas en botes. Brazos y manos articulados. Pixel de intensidad variable (mapa de bits). Cámara, sensor angular. Abrir y cerrar válvulas, ajustar la temperatura. Válvulas, bombas, calentadores, monitores. Ejercicios en línea, impresos, de audio, visualizar correcciones y sugerencias. Bocinas, monitor, impresora. Manipulación del volante, acelerar, frenar, hablar con el pasajero. Acelerador, Lectura de temperatura y presión. Sensores químicos. Palabras escritas a través del teclado, y emisión de voz. Teclado, micrófono. Cámaras, velocímetro, sistema satelital global de ubicación, sonar, 2 ganancias. freno, bocina, visualizador (pantalla) micrófono, sensores de motor, teclado, tacómetro, visualizador de la aceleración. Propiedades de los entornos de trabajo El rango de los entornos de trabajo en los que se utilizan técnicas de IA es muy grande. Sin embargo, se pueden identificar un pequeño número de dimensiones en las que categorizar estos entornos. Estas dimensiones determinan, hasta cierto punto, el diseño más adecuado para el agente y la utilización de cada una de las familias principales de técnicas en la implementación del agente. Tipos de entorno de trabajo: Totalmente observable (accesible) vs parcialmente observable (inaccesible) Se dice que un entorno de trabajo es totalmente observable si los sensores detectan todos los aspectos que son relevantes en la toma de decisiones y en las medidas de rendimiento, además de proporcionarle al agente acceso al estado completo del medio en cada momento. Este entorno es el más conveniente, ya que el agente no necesita mantener ningún estado interno para saber qué sucede en el exterior. Por otro lado el entorno puede ser parcialmente observable debido al ruido y a la existencia de sensores poco exactos o porque los sensores no reciben información de parte del sistema. Deterministas vs estocásticos (no determinístico) Si el siguiente estado del medio está totalmente determinado por el estado actual y la acción ejecutada por el agente, entonces el entorno es determinista; de otra forma es estocástico. En principio, un agente no se tiene que preocupar de la incertidumbre en un medio totalmente observable y determinista. Sin embargo, si el medio es parcialmente observable entonces puede parecer estocástico. Esto es particularmente cierto si se trata de un medio complejo, haciendo difícil el mantener constancia de todos los aspectos observables. Si el medio es determinista, excepto para las acciones de otros agentes, decimos que el medio es estratégico. Episódico vs secuencial (no episódico) En un entorno de trabajo episódico, la experiencia del agente se divide en episodios atómicos. Cada episodio consiste en la percepción del agente y la realización de una única acción posterior. Es muy importante saber que el siguiente episodio no depende de las acciones que se realizaron anteriormente (episodios previos) y es que en los medios episódicos la elección de la acción en cada episodio depende sólo del episodio en sí mismo. Muchas tareas de clasificación son episódicas. En entornos secuenciales, la decisión presente puede afectar a decisiones futuras. Los medios episódicos son más simples que los secuenciales porque el agente no necesita pensar con tiempo. Estático vs dinámico Si el entorno puede cambiar cuando el agente está deliberando, entonces se dice que el entorno es dinámico para el agente; de otra forma se dice que es estático. Los medios estáticos son más fáciles de tratar ya que el agente no necesita estar pendiente del mundo mientras está tomando una decisión 3 sobre una acción, ni necesita preocuparse sobre el tiempo transcurrido. Los medios dinámicos, por el contrario, preguntan continuamente al agente qué quiere hacer, si no ha decidido aún, entonces se entiende que ha tomado la decisión de no hacer nada. Si el entorno no cambia con el paso del tiempo, pero el rendimiento del agente cambia, entonces se dice que el medio es semidinámico. Discreto vs continuo Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se dice que el ambiente es discreto. El ajedrez es discreto porque existe una cantidad fija de posibles jugadas en cada ronda. La conducción de un taxi es continua: la velocidad y la ubicación del taxi y de los demás vehículos se extiende a través de un rango de valores continuos. La distinción entre discreto y continuo se puede aplicar al estado del medio, a la forma en la que se maneja el tiempo y a las percepciones y acciones del agente. Agente individual vs multiagente La distinción entre el entorno de una agente individual y el de un sistema multiagente puede parecer suficientemente simple. Sin embargo hay algunas diferencias sutiles. Primero, se ha descrito que una entidad puede percibirse como un agente, pero no se ha explicado qué entidades se deben considerar agentes. ¿Tiene el agente A (por ejemplo el agente taxista) que tratar con un objeto B (otro vehiculo) como un agente, o puede tratarse meramente como un objeto con un comportamiento estocástico, como las olas de la playa o las hojas que mueve el viento?. La distinción clave está en identificar si el comportamiento de B está mejor descrito por la maximización de una medida de rendimiento cuyo valor depende del comportamiento de A. Por ejemplo, en el ajedrez, la entidad oponente B intenta maximizar su medida de rendimiento, la cual, según las reglas, minimiza la medida de rendimiento del agente A. Por tanto, el ajedrez es un entorno multiagente competitivo. Por otro lado, en el medio definido por el taxista circulando, el evitar colisiones maximiza la medida de rendimiento de todos los agentes, así pues es un entorno multiagente parcialmente cooperativo. Los problemas en el diseño de agentes que aparecen en entornos multiagente son a menudo bastante diferentes de los que aparecen en entornos con un único agente; por ejemplo, la comunicación a menudo emerge como un comportamiento racional en entornos multiagente; en algunos entornos competitivos parcialmente observables el comportamiento estocástico es racional ya que evita las dificultades de la predicción. El caso más complejo es el parcialmente observable, estocástico, secuencial, dinámico, continuo y multiagente. En este sentido, y valorando las definiciones teóricas que entrañan el cuerpo y forma de nuestro entorno como dominio del problema y desencadenante de una solución a través de agentes, la estructura del metro de la cd. de México se considera un medio parcialmente observable, puesto que el agente conocerá los aspectos relevantes en la toma de decisiones de los nodos contiguos a éste, ligados por las correspondencias existentes entre estaciones/líneas, estocástico, ya que no se puede predecir que un tren pueda averiarse o si la infraestructura necesita de una rehabilitación o mantenimiento por urgencia sin previo aviso, secuencial, puesto que la decisión de avanzar por una estación creando una ruta puede afectar a decisiones futuras, estático, puesto que aunque el entorno puede cambiar cuando el agente está deliberando (inesperadamente se averían una o varias estaciones), se tomarán como ciertos y no modificables los datos a priori cargados de la base de datos (estructura de almacenamiento de datos remoto actualizada en todo momento con la situación global del entorno de la Red) sobre las disponibilidades o no de las estructuras que conforman el metro – líneas y estaciones – en el inicio del cálculo, y discreto, porque, dado cualquier instante 4 de tiempo t, consideraremos que los trenes se encuentran siempre ubicados en una estación a u otra b (0 o 1), y no desplazándose entre medias del tramo de línea que las conectan. Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se dice que el ambiente es discreto. Ejemplos de entornos de trabajo y sus características Entorno de trabajo Crucigrama Ajedrez con reloj Póker Observable Determinista Episódico Estático Discreto Agente Totalmente Totalmente Determinista Secuencial Estático Estratégico Secuencial Semi Discreto Discreto Individual Multi Discreto Multi Parcialmente Estratégico Secuencial Estático Referencias http://aima.cs.berkeley.edu http://poiritem.wordpress.com/2009/11/16/6-4-2-agentes-inteligentes-y-la-naturaleza-de-su-entorno/ Stuart Russel y Pete Norving. Inteligencia Artificial un enfoque moderno. Ed. Prentice-Hall 5