Inteligencia artificial distribuida

Anuncio
Inteligencia artificial distribuida
Tema:
Estructura de los agentes
Programa = algoritmo + datos
Objeto= atributos + métodos
Agente= arquitectura + programa
Donde la arquitectura puede ser una computadora sencilla, o hardware especial para la ejecución de
ciertas tareas, como el procesamiento de imágenes de una cámara, o el filtrado de señales de entrada
de audio. Puede incluirse también un software que ofrezca cierto grado de aislamiento entre la
computadora y el programa agente, lo que permitiría la programación aun nivel superior. Pone al
alcance del programa las percepciones obtenidas mediante los sensores, lo ejecuta y alimenta al
efector con las acciones elegidas por el programa conformes éstas se van generando.
En cuanto al programa, se refiere a la función que permita implantar el mapeo del agente para pasar
de percepciones a acciones y que se ejecutará en algún tipo de dispositivo de cómputo.
Tema:
Entorno de trabajo
Antes de diseñar un agente hay que centrarse en el entorno de trabajo – que son esencialmente los
problemas para los que los agentes son las soluciones-, debe de especificarse de la forma más
completa posible.
Especificaciones del entorno
El entorno de trabajo está conformado por cuatro elementos:
-Medida de rendimiento (METAS) – Cualidades deseables del agente – medidas de rendimiento,
objetivos, metas - Incluyen criterios que determinan el éxito en el comportamiento del agente.
Como regla general, es mejor diseñar medidas de utilidad de acuerdo con lo que se quiere para el
entorno, más que de acuerdo con cómo se cree que el agente debe comportarse, por ejemplo en el
agente aspiradora, su meta principal o medida de rendimiento es: mantener siempre el “Suelo
limpio”. (R)
-Entorno sobre el cual actuará o se moverá el agente (E)
-Actuadores – Herramientas o elementos para efectuar el trabajo, acciones a realizar (A)
-Sensores – Como percibe el ambiente el agente, con qué lo percibe (S)
A estos cuatro elementos se les engloba con el acrónimo REAS (Rendimiento, Entorno, Actuadores,
Sensores) (libro: Stuart Russel y Pete Norving. Inteligencia Artificial un enfoque moderno. Ed.
Prentice-Hall) o PAAM (Percepción, Acción, Meta, Ambiente).
REAS= Rendimiento Entorno Actuadores Sensores
PAMA=Percepción Acción Meta Ambiente
Ejemplos de descripción REAS (O PAMA) de algunos agentes
1
Tipo agente
Rendimiento
(Metas)
Paciente
saludable,
reducción al
mínimo de los
costos y de las
demandas.
Entorno
(Ambiente)
Paciente,
hospital,
personal
Sistema para el
análisis de
imágenes
satelitales
Clasificación
correcta de la
imagen.
Robot
clasificador
(seleccionador)
de partes
Poner las
partes en el
bote que les
corresponda.
Porcentaje de
piezas
clasificadas.
Controlador de
un refinería
Maximizar la
seguridad,
pureza y
rendimiento
(producción).
Imágenes
enviadas desde
un satélite en
órbita,
conexión con
el satélite en
órbita.
Banda
transportadoras
sobre la que se
encuentran las
partes, las
partes, y los
botes sobre en
los que se
depositarán las
partes
clasificadas.
Refinería,
operadores
Tutor
interactivo de
inglés
Que el
estudiante
obtenga la
máxima
calificación en
una prueba.
Grupo de
estudiantes,
agencia
examinadora.
Conductor de
taxi
Viaje seguro,
rápido, sin
infracciones,
cómodo,
obtención
máxima de
Caminos,
tráfico,
peatones,
cliente,
semáforos.
Sistema de
diagnóstico
médico
Actuadores
(Acciones)
Preguntas,
pruebas,
tratamientos,
diagnósticos,
casos.
Impresora,
monitor
Visualizar e
imprimir una
clasificación de
escena.
Sensores
(Percepciones)
Sintoma,
evidencias y
respuestas del
paciente.
Teclado para
emitir dicha
información.
Pixel de
intensidad y
colores
diversos
(matriz de bits)
Recoger partes
y clasificarlas
poniéndolas en
botes.
Brazos y
manos
articulados.
Pixel de
intensidad
variable (mapa
de bits).
Cámara, sensor
angular.
Abrir y cerrar
válvulas,
ajustar la
temperatura.
Válvulas,
bombas,
calentadores,
monitores.
Ejercicios en
línea,
impresos, de
audio,
visualizar
correcciones y
sugerencias.
Bocinas,
monitor,
impresora.
Manipulación
del volante,
acelerar, frenar,
hablar con el
pasajero.
Acelerador,
Lectura de
temperatura y
presión.
Sensores
químicos.
Palabras
escritas a
través del
teclado, y
emisión de
voz.
Teclado,
micrófono.
Cámaras,
velocímetro,
sistema
satelital global
de ubicación,
sonar,
2
ganancias.
freno, bocina,
visualizador
(pantalla)
micrófono,
sensores de
motor, teclado,
tacómetro,
visualizador de
la aceleración.
Propiedades de los entornos de trabajo
El rango de los entornos de trabajo en los que se utilizan técnicas de IA es muy grande. Sin
embargo, se pueden identificar un pequeño número de dimensiones en las que categorizar estos
entornos. Estas dimensiones determinan, hasta cierto punto, el diseño más adecuado para el agente
y la utilización de cada una de las familias principales de técnicas en la implementación del agente.
Tipos de entorno de trabajo:
Totalmente observable (accesible) vs parcialmente observable (inaccesible)
Se dice que un entorno de trabajo es totalmente observable si los sensores detectan todos los
aspectos que son relevantes en la toma de decisiones y en las medidas de rendimiento, además de
proporcionarle al agente acceso al estado completo del medio en cada momento. Este entorno es el
más conveniente, ya que el agente no necesita mantener ningún estado interno para saber qué
sucede en el exterior. Por otro lado el entorno puede ser parcialmente observable debido al ruido y a
la existencia de sensores poco exactos o porque los sensores no reciben información de parte del
sistema.
Deterministas vs estocásticos (no determinístico)
Si el siguiente estado del medio está totalmente determinado por el estado actual y la acción
ejecutada por el agente, entonces el entorno es determinista; de otra forma es estocástico. En
principio, un agente no se tiene que preocupar de la incertidumbre en un medio totalmente
observable y determinista. Sin embargo, si el medio es parcialmente observable entonces puede
parecer estocástico. Esto es particularmente cierto si se trata de un medio complejo, haciendo difícil
el mantener constancia de todos los aspectos observables. Si el medio es determinista, excepto para
las acciones de otros agentes, decimos que el medio es estratégico.
Episódico vs secuencial (no episódico)
En un entorno de trabajo episódico, la experiencia del agente se divide en episodios atómicos. Cada
episodio consiste en la percepción del agente y la realización de una única acción posterior. Es muy
importante saber que el siguiente episodio no depende de las acciones que se realizaron
anteriormente (episodios previos) y es que en los medios episódicos la elección de la acción en cada
episodio depende sólo del episodio en sí mismo. Muchas tareas de clasificación son episódicas. En
entornos secuenciales, la decisión presente puede afectar a decisiones futuras. Los medios
episódicos son más simples que los secuenciales porque el agente no necesita pensar con tiempo.
Estático vs dinámico
Si el entorno puede cambiar cuando el agente está deliberando, entonces se dice que el entorno es
dinámico para el agente; de otra forma se dice que es estático. Los medios estáticos son más fáciles
de tratar ya que el agente no necesita estar pendiente del mundo mientras está tomando una decisión
3
sobre una acción, ni necesita preocuparse sobre el tiempo transcurrido. Los medios dinámicos, por
el contrario, preguntan continuamente al agente qué quiere hacer, si no ha decidido aún, entonces se
entiende que ha tomado la decisión de no hacer nada. Si el entorno no cambia con el paso del
tiempo, pero el rendimiento del agente cambia, entonces se dice que el medio es semidinámico.
Discreto vs continuo
Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se
dice que el ambiente es discreto. El ajedrez es discreto porque existe una cantidad fija de posibles
jugadas en cada ronda. La conducción de un taxi es continua: la velocidad y la ubicación del taxi y
de los demás vehículos se extiende a través de un rango de valores continuos.
La distinción entre discreto y continuo se puede aplicar al estado del medio, a la forma en la que se
maneja el tiempo y a las percepciones y acciones del agente.
Agente individual vs multiagente
La distinción entre el entorno de una agente individual y el de un sistema multiagente puede parecer
suficientemente simple. Sin embargo hay algunas diferencias sutiles. Primero, se ha descrito que
una entidad puede percibirse como un agente, pero no se ha explicado qué entidades se deben
considerar agentes. ¿Tiene el agente A (por ejemplo el agente taxista) que tratar con un objeto B
(otro vehiculo) como un agente, o puede tratarse meramente como un objeto con un
comportamiento estocástico, como las olas de la playa o las hojas que mueve el viento?. La
distinción clave está en identificar si el comportamiento de B está mejor descrito por la
maximización de una medida de rendimiento cuyo valor depende del comportamiento de A. Por
ejemplo, en el ajedrez, la entidad oponente B intenta maximizar su medida de rendimiento, la cual,
según las reglas, minimiza la medida de rendimiento del agente A. Por tanto, el ajedrez es un
entorno multiagente competitivo. Por otro lado, en el medio definido por el taxista circulando, el
evitar colisiones maximiza la medida de rendimiento de todos los agentes, así pues es un entorno
multiagente parcialmente cooperativo. Los problemas en el diseño de agentes que aparecen en
entornos multiagente son a menudo bastante diferentes de los que aparecen en entornos con un
único agente; por ejemplo, la comunicación a menudo emerge como un comportamiento racional en
entornos multiagente; en algunos entornos competitivos parcialmente observables el
comportamiento estocástico es racional ya que evita las dificultades de la predicción.
El caso más complejo es el parcialmente observable, estocástico, secuencial, dinámico, continuo y
multiagente.
En este sentido, y valorando las definiciones teóricas que entrañan el cuerpo y forma de nuestro
entorno como dominio del problema y desencadenante de una solución a través de agentes, la
estructura del metro de la cd. de México se considera un medio parcialmente observable, puesto
que el agente conocerá los aspectos relevantes en la toma de decisiones de los nodos contiguos a
éste, ligados por las correspondencias existentes entre estaciones/líneas, estocástico, ya que no se
puede predecir que un tren pueda averiarse o si la infraestructura necesita de una rehabilitación o
mantenimiento por urgencia sin previo aviso, secuencial, puesto que la decisión de avanzar por una
estación creando una ruta puede afectar a decisiones futuras, estático, puesto que aunque el entorno
puede cambiar cuando el agente está deliberando (inesperadamente se averían una o varias
estaciones), se tomarán como ciertos y no modificables los datos a priori cargados de la base de
datos (estructura de almacenamiento de datos remoto actualizada en todo momento con la situación
global del entorno de la Red) sobre las disponibilidades o no de las estructuras que conforman el
metro – líneas y estaciones – en el inicio del cálculo, y discreto, porque, dado cualquier instante
4
de tiempo t, consideraremos que los trenes se encuentran siempre ubicados en una estación a u otra
b (0 o 1), y no desplazándose entre medias del tramo de línea que las conectan.
Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se
dice que el ambiente es discreto.
Ejemplos de entornos de trabajo y sus características
Entorno de
trabajo
Crucigrama
Ajedrez
con reloj
Póker
Observable
Determinista Episódico
Estático
Discreto
Agente
Totalmente
Totalmente
Determinista Secuencial Estático
Estratégico
Secuencial Semi
Discreto
Discreto
Individual
Multi
Discreto
Multi
Parcialmente Estratégico
Secuencial Estático
Referencias
http://aima.cs.berkeley.edu
http://poiritem.wordpress.com/2009/11/16/6-4-2-agentes-inteligentes-y-la-naturaleza-de-su-entorno/
Stuart Russel y Pete Norving. Inteligencia Artificial un enfoque moderno. Ed. Prentice-Hall
5
Descargar