coord-survey2 - Grupo de Inteligencia Artificial

advertisement
Universidad de Málaga
Proyecto DAMMAD, Diseño y Aplicación de Modelos Multiagente para
Ayuda a la Decisión, TIC2000-1370-C04-02
Informe Técnico: MODELOS DE COORDINACIÓN
INTELIGENCIA ARTIFICIAL DISTRIBUIDA
PARA
Junio, 2001. Universidad de Málaga
Indice
1 Introducción
2 Mecanismos de Cooperación: Interacciones Multi-Agente Cooperativas
2.1 Características
2.2 Técnicas de Coordinación
2.2.1 Estructuras Organizacionales
2.2.2 Planificación Multi-Agente
2.2.2.1 Planificación Multi-agente en Entornos Estáticos
2.2.2.2 Planificación Multi-Agente en Entornos Dinámicos
2.2.2.3 Planificación en Equipo
2.2.3 Redes de Contratos
2.2.4 Cooperación Funcionalmente Exacta
3 Mecanismos de Negociación: Interacciones Multi-Agente Autointeresadas
3.1 Características
3.2 Técnicas de Coordinación
3.2.1 Mecanismos de Mercado
3.2.2 Teoría del Regateo
3.2.2.1 Teoría del Regateo Axiomática
3.2.2.2 Teoría del Regateo Estratégica
3.2.3 Formación de Coaliciones
3.2.3.1 Generación de la Estructura de Coaliciones
3.2.3.2 Resolución del Problema de Optimización de cada Coalición
3.2.3.3 División de Pagos
3.2.4 Votación
3.2.5 Subastas
3.2.5.1 Tipos de Subastas
3.2.5.2 Protocolos de Subastas
3.2.5.3 Eficiencia de la Asignación Resultante
3.2.6 Asignación de Tareas entre Dos Agentes
4 Selección en Tiempo de Ejecución de los Mecanismos de Coordinación
5 Soporte Operacional para los Mecanismos de Coordinación
5.1 Agentes Intermediarios
5.2 Lenguajes de Comunicación de Agentes
6 Referencias
1
2
4
4
4
6
8
9
9
11
12
14
14
14
15
17
18
18
21
23
24
24
24
26
29
29
29
31
32
34
37
37
38
39
Universidad de Málaga
1 Introducción
La coordinación es tal vez uno de los problemas clave en Inteligencia Artificial
Distribuida (IAD). Se denomina así al proceso por el cual un agente razona acerca de
sus acciones locales y las acciones (anticipadas) de los otros, en un intento de asegurar
una comunicación que permita a los agentes llevar a cabo sus acciones y
comportamientos de forma coherente. Una coordinación efectiva es esencial si
diferentes agentes autónomos quieren alcanzar sus objetivos dentro de un Sistema
Multi-Agente (SMA). Dicha coordinación requiere gestionar las diferentes formas de
dependencia que se producen cuando los agentes tienen: 1) objetivos inter-enlazados, 2)
comparten un entorno común, ó 3) hay recursos compartidos [Bourne et al, 2000].
Lógicamente, y con el fin de alcanzar dicha coordinación se han desarrollado hasta la
fecha una gran diversidad de mecanismos. Quizás antes de pasar a enumerarlos, sería
interesante analizar las teorías y principios que guían esta actividad, y que nos van a
permitir obtener una mejor comprensión de los mismos, así como una visión de
conjunto. En la literatura de los SMA podemos encontrar diferentes análisis que
modelan el problema de la coordinación de formas distintas. A continuación mostramos
los tres enfoques que nos han parecido más interesantes, y han sido más ampliamente
aceptados en esta comunidad.
Compromisos y Convenciones [Jennings, 96]. Jennings modela las comunidades de
agentes usando un formalismo de búsqueda de objetivos distribuida, y argumenta que
los compromisos (promesa de acometer un curso de acción específica) y las
convenciones (medios de gestionar los compromisos en circunstancias cambiantes) son
las bases de la coordinación en todos los sistemas de IAD. De alguna manera los
compromisos proporcionan la estructura necesaria para las interacciones predecibles, las
convenciones proporcionan la flexibilidad necesaria para operar en entornos dinámicos,
y las convenciones sociales proporcionan un grado de soporte mutuo entre ambas (los
agentes necesitan convenciones sociales que especifiquen cómo comportarse con
respecto a los otros miembros de la comunidad cuando se alteran sus compromisos).
Según este análisis la mayoría de los mecanismos de coordinación pueden ser
reformulados en términos de compromisos y convenciones. Jennings [Jennings, 96]
clasifica dichos mecanismos en tres grupos: 1) estructuras organizacionales o reglas
(convenciones) a largo plazo que prescriben cómo se han de comportar los agentes en
una sociedad [Shoham, 92], 2) intercambio de información a un meta-nivel o
convenciones a medio plazo que permiten asegurar la coordinación sobre un rango de
actividades en un horizonte temporal de medio plazo, tales como la Planificación
Global Parcial [Durfee et al., 91], y 3) protocolos de un intento o convenciones a corto
plazo, que coordinan las actividades entre agentes en un corto horizonte temporal con el
objetivo de acometer una tarea específica.
Coordinación Práctica [Durffe, 99]. En segundo lugar, Durfee considera la
coordinación como el proceso por el cual un agente tiene en cuenta las posibles acciones
de los restantes agentes. De este modo el resultado de las acciones de un agente
dependería del conocimiento que éste tuviera acerca de las posible acciones de los otros
agentes. Para anticipar las acciones de los restantes agentes del sistema éste necesitaría
2
Universidad de Málaga
modelos anidados de cómo ellos ven la situación [Gmytrasiewicz et al., 95], de cómo
piensan ellos que los otros ven su situación, de cómo ellos piensan que los otros piensan
que los otros ven la situación, y así sucesivamente. Por este motivo considerar “todo” el
conocimiento que un agente podría necesitar para anticipar las acciones de los restantes,
puede ser computacionalmente intratable en la mayoría de las aplicaciones. Hacer este
conocimiento tratable consiste en limitar el número de modelos anidados sobre los que
razonar, y decrementar el número de combinaciones de acciones que un agente debe
considerar. O lo que es lo mismo hacer la coordinación “práctica” consiste en encontrar
formas de no usar parte de todo el conocimiento que un agente podría tener, y mantener
ciertos grados de “ignorancia” acerca de la situación multi-agente. De acuerdo con esta
propuesta Durfee [Durfee, 99] analiza una gran cantidad de mecanismos de
coordinación, desde el punto de vista de las distintas formas que los diseñadores han
encontrado para ignorar, simplificar o diseñar implícitamente modelos de agentes que
permitan una coordinación “práctica”.
Cooperación versus Negociación [Huhns et al., 99]. Finalmente, y en tercer lugar,
Huhns y Stephens definen la coordinación como una propiedad de un sistema de
agentes que llevan a cabo alguna actividad en un entorno compartido. Para coordinarse
con éxito cada agente debe mantener un modelo de los otros agentes, desarrollar un
modelo de las interacciones futuras, y mantener una coherencia global del sistema sin
un control global explícito. Para ello los agentes deben ser capaces de determinar los
objetivos que comparten con los restantes agentes, determinar tareas comunes, evitar
conflictos innecesarios y aunar conocimiento.
Huhns y Stephens dividen los mecanismos de coordinación entre agentes en dos grupos:
cooperación y negociación. La cooperación es la coordinación entre agentes no
antagonistas, y la negociación es la coordinación entre agentes auto-interesados o
simplemente competitivos. Lógicamente es la comunicación la que posibilita a los
agentes coordinar sus acciones y comportamiento, y obtener como resultado sistemas
más coherentes. Los protocolos de interacción gobiernan el intercambio o la
comunicación de una serie de mensajes entre agentes (una conversación). En aquellos
casos en los que los agentes son auto-interesados o tienen objetivos conflictivos negociación- el principal objetivo de los protocolos es maximizar los pagos o utilidades
de los agentes. En aquellos casos en los que los agentes tienen similares objetivos o
problemas comunes –cooperación-, como en la Resolución de Problemas Distribuida
(RPD), el objetivo de los protocolos es mantener un comportamiento de los agentes
globalmente coherente sin violar su autonomía, e.d. sin un control global explícito.
Cualquiera de los anteriores análisis nos parece igualmente válido para describir de una
forma detallada los modelos de coordinación más conocidos. Sin embargo, hemos
seleccionado la tercera aproximación por ser quizás la más común y conocida. A
continuación pasamos a enumerar algunos de los mecanismos de coordinación más
relevantes de acuerdo con la división anterior de los mismos en: Mecanismos de
Cooperación -interacciones multi-agente cooperativas-, y Mecanismo de Negociación interacciones multi-agente auto-interesadas-.
3
Universidad de Málaga
-Mecanismos de Cooperación
 Estructuras Organizacionales
 Planificación Multi-agente (Centralizada y Distribuida)
 Redes de Contratos
 Cooperación Funcionalmente exacta
-Mecanismos de Negociación
 Formación de Coaliciones
 Mecanismos de Mercado
 Teoría del Regateo
 Votación
 Subastas
 Asignación de Tareas entre dos Agentes
En el punto 2 del resumen daremos una descripción detallada de los mecanismos de
cooperación y en el punto 3 de los mecanismos de negociación, así como de los trabajos
más representativos de dichos modelos.
Todos los mecanismos anteriores tienen diferentes propiedades y características que los
hacen adecuados a diferentes tipos de tareas y entornos. En todos ellos la elección del
modelo de coordinación es algo que el diseñador impone al sistema en tiempo de
diseño. Aunque esto puede ser suficiente para entornos estables y predecibles, puede ser
inapropiado para contextos dinámicos y abiertos. Investigaciones recientes [Bourne et
al., 2000] apuntan que en tales entornos puede ser útil que los agentes tengan una
variedad de mecanismos de coordinación, y que seleccionen en tiempo de ejecución
aquel que les parezca más apropiado para la tarea o el problema actual. En estas
situaciones el objetivo sería desarrollar agentes que puedan razonar acerca del proceso
de coordinación, y puedan seleccionar mecanismos que sean adecuados a la actual
situación. En el punto 4 del resumen analizamos en profundidad esta reciente propuesta.
Finalmente, hemos de tener en cuenta que en entornos abiertos y dinámicos formados
por agentes heterogéneos, como Internet, es necesario tener en cuenta aspectos
adicionales que permitan a los agentes interoperar, y así incrementar su capacidad de
resolución de problemas mediante una coordinación efectiva. En éste tipo de entornos
aquellos agentes heterogéneos que deseen coordinarse entre ellos han de enfrentarse a
dos inconvenientes: primero, cada uno de ellos debe ser capaz de localizar a los otros
(en entornos abiertos los agentes pueden aparecer y desparecer de forma impredecible),
y segundo, deben ser capaces de interoperar. Una propuesta de solución al problema son
los Agentes Intermediarios (Middle Agents) [Decker et al., 97]. De esta forma cuando
un nuevo agente llega al sistema “anuncia” sus capacidades a un agente intermediario.
De este modo un agente que busque a otro que posea una capacidad particular puede
cuestionar a dicho agente intermediario. En el punto 5 del resumen explicamos esta
propuesta, y enumeramos las características y tipos de agentes intermediarios. En el
punto 6 del resumen, y para terminar, mostramos las referencias incluidas en el
documento.
4
Universidad de Málaga
2 Mecanismos de Cooperación: Interacciones Multi-Agente Cooperativas
2.1. Características
Los mecanismos de cooperación estudian cómo un grupo de agentes inteligentes
(especialistas, expertos, fuentes de conocimiento o resolvedores de problemas son
términos equivalentes) pueden compartir sus recursos y coordinar sus actividades de
forma que la “capacidad” del grupo sea mayor que la suma de las “capacidades” de los
agentes individuales (capacidad en el sentido de inteligencia). Los mecanismos de
coordinación cooperativos asumen que los agentes tienen objetivos comunes y por tanto
“cooperan”. Términos como RPD (Resolución de Problemas Distribuida), o
antiguamente RPDC (Resolución de Problemas Distribuida Cooperativa) han sido
utilizados para denominar este tipo de sistemas. A continuación enumeramos las
características que los agentes pertenecientes a un sistema deberían mostrar [Durfee et
al., 94], para que dicho sistema sea incluido dentro de la categoría anterior:



Benevolencia: el término benevolencia significa que los agentes quieren
ayudarse los uno a los otros siempre que esto sea posible. Todo ello sin pagos o
cualquier otro tipo de incentivo o compensación.
Objetivos comunes: una motivación para la benevolencia se debe al hecho de
que los agentes están seguros de que persiguen un objetivo común. En este caso
todos los agentes intentan maximizar la misma función de utilidad global.
Agentes homogéneos: entendemos por agentes homogéneos aquellos que no
persiguen objetivos conflictivos, y que además no usan diferentes mecanismos
de representación del conocimiento o de comunicación.
El principal problema que afrontan los mecanismos de cooperación es cómo coordinar
las actividades de resolución de problemas de los agentes con el objetivo de llevar a
cabo la tarea/s del sistema, teniendo en cuenta que la cantidad de información que puede
ser intercambiada entre los agentes está limitada. Cuestiones como qué agentes deben
llevar a cabo qué tarea, qué resultados parciales se deberían intercambiar o qué
comunicaciones se deberían establecer son puntos importantes a resolver
2.2 Técnicas de Coordinación
Una estrategia básica compartida por muchos protocolos de cooperación consiste en
descomponer y a continuación distribuir tareas, con el objetivo de reducir la
complejidad de la tarea global. El sistema debe decidir entre descomposiciones
alternativas, si las hay, así como considerar los recursos y capacidades de los agentes de
modo que se eviten conflictos entre éstos. La distribución de tareas puede hacerse de
acuerdo con los siguientes criterios [Durfee et al., 87]:
1. Evitar sobrecarga de recursos críticos
2. Asignar tareas a agentes con capacidades que se corresponden con las mismas
3. Encargar a un agente con mayor grado de conocimiento global la asignación de
tareas a otros agentes
4. Asignar responsabilidades solapadas a distintos agentes para alcanzar coherencia
5
Universidad de Málaga
5. Asignar tareas altamente interdependientes a agentes con proximidad semántica
o espacial. Esto minimizará los costes de comunicación y sincronización.
6. Reasignar tareas, si es necesario, para completar tareas urgentes.
Los siguientes mecanismos de interacción o protocolos cooperativos son comúnmente
usados para distribuir tareas entre agentes cooperativos:




Estructuras Organizacionales: los agentes tienen responsabilidades fijas para
tareas particulares
Planificación Multi-agente: los agentes de planificación tienen la
responsabilidad de asignar tareas
Redes de Contratos: ciclos de anuncios, ofertas, y adjudicaciones
Cooperación Funcionalmente Exacta: los agentes interactuan a través del
intercambio asíncrono de resultados parciales
A continuación analizamos las principales características de los mecanismos anteriores,
así como los trabajos más representativos de los mismos.
2.2.1 Estructuras Organizacionales
Una estructura organizacional define roles, responsabilidades, y preferencias para los
agentes dentro de una sociedad cooperativa, así cómo las relaciones de control y
comunicación entre ellos [Singh, 90] [Werner, 89] [Gasser, 92]. Desde un punto de vista
global, la estructura organizacional asocia a cada agente los tipos de tareas que éste
puede hacer, así como cierta prioridad sobre algunos de estos tipos de tareas que se
consideren más importantes en relación con su rol organizacional. Esta priorización
permite a la estructura solapar responsabilidades, lo que incrementará las oportunidades
de éxito a pesar del fallo de alguno de los agentes.
Las relaciones de control son las responsables de diseñar la autoridad relativa de los
agentes, y de dar forma a los diferentes tipos de interacción social que pueden ocurrir
entre éstos. Estas relaciones de control pueden ser básicamente de dos tipos:

Jerárquicas: La autoridad para la toma de decisiones y el control se concentra
en un único resolvedor de problemas en cada nivel de la jerarquía. La
interacción se lleva a cabo a través de comunicación vertical de agentes
superiores a subordinados y viceversa. Los agentes superiores ejercitan el
control sobre los recursos y la toma de decisiones.

Planas (comunidad de expertos): Cada uno de los resolvedores de problemas es
un especialista en un área en particular (sistemas de pizarra) [Lander et al., 93]
[Werkman, 92]. Los agentes interactúan mediante reglas de orden y
comportamiento [Lander et al., 91], y se coordinan a través del ajuste mutuo de
sus soluciones de modo que se pueda alcanzar una coherencia global (los
agentes pueden relajar sus restricciones). Por ejemplo, los agentes involucrados
en una búsqueda negociada [Lander et al., 93] tienen a su disposición una
variedad de operadores (iniciar-solución, extender-solución, criticar-solución y
relajar-requisitos-solución) para progresar en la resolución distribuida de
6
Universidad de Málaga
problemas. Normalmente se utilizan medidas heurísticas dependientes del
dominio de aplicación que permiten decidir cuál de estos operadores aplicar y
dónde.
Estas relaciones especificadas a través de las estructuras organizacionales ayudan al
proceso de coordinación indicando qué acciones acometerá cada agente, y
proporcionando un medio de dividir el espacio de búsqueda.
En [Corkill et al., 83] encontramos una estructura organizacional que da a cada agente
una visión de alto nivel de cómo el grupo resuelve problemas. Por otro lado Shoham y
Tennenholtz [Shoham et al., 92] proponen una forma organizacional más detallada que
ellos denominan “ley social”. Con esta aproximación la sociedad adopta un conjunto de
leyes que especifican cómo los agentes deberían comportarse. Cada programador o
diseñador está comprometido a obedecer estas leyes cuando construye su propio agente.
De esta manera el proceso de diseño se simplifica puesto que puede ser asumido que los
restantes agentes se adherirán a la ley especifica.
Otra aplicación dentro de esta línea es la monitorización de vehículos distribuida
[Pattison et al., 87]. Ésta simula una comunidad de agentes organizada espacialmente
que lleva a cabo una interpretación distribuida para trazar el movimiento de los
vehículos. Cada agente decide qué áreas del espacio de búsqueda explorar basándose en
su visión local actual y en su conocimiento organizacional de su papel en la comunidad.
En este contexto la coordinación consiste en dos actividades concurrentes: la
construcción y mantenimiento de la estructura organizacional de toda la comunidad, y la
continua elaboración de esta estructura usando para ello el conocimiento local y las
capacidades de control de cada agente. La organización se especifica como un conjunto
de áreas de interés y como un conjunto de clasificaciones de prioridad. La primera
indica qué, cuándo y a quién se debe enviar la información, y la última indica cómo
evaluar la importancia de procesar diferentes tipos de objetivos.
Otra perspectiva en IAD define la estructura organizacional en términos de teoría de la
organización. En esta visión una organización se define como un conjunto de agentes
con compromisos mutuos, compromisos globales y creencias mutuas [Bond et al., 88].
Una organización consiste en un grupo de agentes, un conjunto de actividades llevadas a
cabo por los agentes, un conjunto de conexiones entre los agentes, y un conjunto de
objetivos o criterios de evaluación a través de los cuales las actividades combinadas de
los agentes son evaluadas.
Entre los beneficios de este mecanismo de coordinación cabe destacar que la
incorporación de los agentes dentro de una organización permite una simplificación de
sus decisiones (éstos tienen menos opciones y saben que también los restantes agentes
tienen menos opciones), y por tanto así sus actividades de coordinación dinámica
pueden ser mejor dirigidas. Entre los inconvenientes de diseñar una estructura
organizacional está el de determinar cómo descomponer las tareas en roles separados,
así como tener un alto grado de fiabilidad, bajo coste, y unas prestaciones efectivas.
7
Universidad de Málaga
2.2.2 Planificación Multi-Agente
La planificación multi-agente es un mecanismo de coordinación en el que los agentes
construyen secuencias de acciones o planes, los cuales especifican todas sus acciones
futuras e interacciones con respecto a un objetivo particular. Cuando estos planes se
ejecutan correctamente y en orden, llevan al sistema a un estado u objetivo deseado.
Con esta aproximación los agentes saben de antemano qué acciones llevarán a cabo, qué
acciones llevarán a cabo los restantes agentes, y qué interacciones se producirán.
Lógicamente, esta técnica de coordinación tiene un horizonte temporal corto, debido a
que los planes requieren una especificación de comportamiento completa, y pueden
producirse en el entorno eventos inesperados que eviten la ejecución con éxito de los
planes, siendo por tanto necesaria una replanificación.
La planificación clásica asumía que era un único agente el que llevaba a cabo la
planificación siendo este la única fuente de cambio en su entorno, y por tanto
descartando otras acciones inesperadas y concurrentes en el mismo. El ejemplo más
conocido en este sentido es la aproximación STRIPS para el mundo de bloques. Sin
embargo, y debido a la posible aparición de eventos en el entorno que vayan más allá
del control de los agentes se desarrollaron extensiones a la planificación clásica. Las
posibles contingencias fueron consideradas de forma explícita en los planes, la
ejecución de los planes fue controlada, y los planes revisados teniendo en cuenta la
posible aparición de eventos relevantes [Russel et al., 95].
Sin embargo, la situación de la planificación multi-agente ocupa un lugar intermedio
con respecto a las dos aproximaciones anteriores. Aunque un entorno multi-agente esta
constantemente cambiando, los cambios son debidos a acciones llevadas a cabo por
otros agentes, y estas no son necesariamente impredecibles e incontrolables.
Generalmente estas acciones están encaminadas hacia la consecución de los objetivos
de los agentes, y por tanto el agente de planificación puede predecirlas, e incluso influir
en la forma en la que éstas ocurren.
La planificación multi-agente o distribuida se enfrenta al problema de cómo un agente
debería formular un curso de acción que tuviera en cuenta las acciones deseadas e
indeseadas que los restantes agentes podrían llevar a cabo concurrentemente:1) de cómo
un agente debería averiguar qué cursos de acción llevarán los restantes agentes, 2) de
cómo un agente debería modelar cómo sus acciones son anticipadas por los otros, 3) de
cómo un agente puede influenciar a los otros cambiando sus modelos de acciones, y 4)
de cómo un agente debería comprometerse con los modelos de él mismo.
Las primeras aproximaciones a la planificación distribuida operan en entornos estables,
y por este motivo primero generan planes detallados y completos para todos los agentes
y luego actúan o ejecutan dichos planes. Sin embargo aplicaciones más recientes de la
planificación multi-agente se usan también para entornos dinámicos. Como
consecuencia de esto los planes se construyen (y reconstruyen) basándose en el modelo
parcial actual del agente acerca del entorno y acerca de los otros agentes, y este modelo
se revisa continuamente durante el curso de acción de dicho agente. Esto significa que, a
diferencia de la primera aproximación, la planificación debe ser intercalada con la
ejecución del plan.
8
Universidad de Málaga
2.2.2.1 Planificación Multi-agente en Entornos Estáticos
Una aproximación en esta línea consiste en usar técnicas de planificación no-lineales
estándares para generar secuencias de acciones admisibles parcialmente ordenadas (Ej.
NOAH [Sacerdoti, 77]), y a continuación enviar secuencias no ordenadas de acciones a
diferentes agentes. Los agentes las pueden ejecutar en paralelo sin necesidad de más
coordinación, ya que todas las interacciones posibles han sido previamente eliminadas.
Sin embargo, esta aproximación tiene la desventaja de que el paralelismo depende
únicamente de los objetivos y acciones, y no de los agentes disponibles.
Una aproximación alternativa consistiría en descomponer el objetivo común global en
sub-objetivos que puedan ser asignados a agentes individuales. Sin embargo, estos subobjetivos podrían interactuar, lo que significa que dichos agentes no podrían planificar
de forma independiente, sino que deberían reconocer interacciones entre sub-objetivos y
modificar sus planes con el fin de evitarlas. En esta línea encontramos dos
aproximaciones, una que se denomina planificación multi-agente centralizada, y otra
planificación multi-agente distribuida.
En la aproximación centralizada un agente es el responsable del reconocimiento y
reparación de las interacciones entre planes. Este agente o coordinador puede ser
definido estáticamente [Georgeff, 83] o dinámicamente [Cammarata et al., 83]. Los
restantes agentes envían sus planes separados al coordinador, éste examina los planes
con el objetivo de descubrir regiones críticas en las que interacciones entre los planes de
los agentes podrían conducir a fallos, y los modifica de la forma más adecuada. Por
ejemplo, en el trabajo de Georgeff se insertan mensajes de sincronización en los planes.
Sin embargo, en la aproximación de Cammarata et al. los agentes envían al coordinador
información acerca de sus acciones. A continuación el coordinador construye un plan
que especifica todas las acciones de los agentes, incluyendo las acciones que ellos o
algún otro agente deberían adoptar para evitar colisiones.
En contraste con la anterior, en la aproximación distribuida el reconocimiento de
interacciones y la reparación de planes se hace de forma distribuida, es decir el plan es
desarrollado por varios agentes. Esto significa que no hay agentes individuales con una
visión completa de las actividades de la comunidad, y por tanto detectar y resolver
interacciones indeseables puede ser más difícil. En su sistema NOAH distribuido
[Corkill, 79] Corkill desarrolla versiones distribuidas de NOAH. Como antes, los subobjetivos son asignados a diferentes agentes, y cada agente construye un plan para su
sub-objetivo. Sin embargo, cada agente también tiene en cuenta el hecho de que los
otros agentes están llevando a cabo concurrentemente sus planes. De esta forma, a
medida que los planes se construyen localmente, los efectos de estos planes se propagan
de modo que determinadas restricciones de orden sobre los pasos del plan, que prevean
interacciones, puedan ser identificadas y resueltas (usando mensajes de sincronización).
2.2.2.2 Planificación Multi-Agente en Entornos Dinámicos
La Planificación Global Parcial (Partial Global Planning, PGP) [Durfee et al., 91]
supone que en cualquier momento pueden ocurrir eventos inesperados, y por este
motivo intercala la planificación y la ejecución en cada uno de los agentes. Este
9
Universidad de Málaga
mecanismo de planificación no supone ninguna distribución particular de subproblemas, expertos u otros recursos, sino que en su lugar permite a los agentes
coordinarse dinámicamente a través de ellos mismos. La PGP es un mecanismo de
intercambio de información a un meta-nivel, en el que los agentes construyen y
comparten planes locales como un medio de identificar mejoras potenciales en la
coordinación.
Los Planes Globales Parciales (PGPs) son intercambiados por los agentes con el
objetivo de construir representaciones de las actividades de los restantes agentes
(agentes conocidos). Éstos planes indican qué objetivos se persiguen y en qué orden, así
como qué resultados se alcanzarán y en cuánto tiempo por parte de sus agentes
propietarios. De esta manera, cada uno de los miembros individuales de la comunidad
usa un modelo de ellos mismos y una representación de los agentes conocidos, con el
fin de identificar cuando los agentes tienen PGPs cuyos objetivos forman parte de un
objetivo “global” de la comunidad. En caso de que dichas actividades complementarias
sean detectadas, los PGPs relacionados se combinan en un único PGP mayor que
proporciona una visión más completa de las actividades de la comunidad. A
continuación los agentes pueden ajustar apropiadamente su propia planificación local,
de forma que los objetivos de planificación comunes sean cumplidos.
Las investigaciones más recientes en planificación multi-agente se han enfocado sobre
el particionamiento del espacio de planificación en regiones localizadas, de modo que la
planificación dentro de cada región pueda ser llevada a cabo casi independientemente
de la planificación en otras regiones [Pope et al., 92]. La localización de la planificación
posibilita una reducción substancial de la complejidad (computación y comunicación),
aunque requiere un conocimiento ingenieril para identificar problemas de planificación
casi independientes.
Una forma posible de llevar a cabo esta localización de la planificación consiste en
identificar determinadas relaciones de coordinación de interés [Decker et al., 92] [von
Martial, 92]. Decker mejora algunas de las limitaciones del PGP creando un marco de
trabajo genérico basado en PGP (Generic Partial Global Planning, GPGP) llamado
TAEMS. La aportación de Decker y sus colegas es doble: por un lado desarrollan un
lenguaje de modelado general (TAEMS), cuya principal característica reside en la
posibilidad de representar dependencias (relaciones de coordinación), y por otro lado
desarrollan un marco de trabajo de planificación multi-agente distribuido que genera y
adapta planes de agentes con respecto a las dependencias que son detectadas en una
descripción del dominio en TAEMS. Las relaciones de dependencia que se identifican
son por ejemplo: habilitación (un agente lleva a cabo una tarea cuyos resultados
permitirán a otro agente llevar a cabo sus tareas), facilitación (la ejecución de la tarea de
un agente podría ayudar a otro agente a llevar a cabo su tarea mejor o más rápidamente),
etc. Estas dependencias son modeladas con TAEMS, y GPGP detecta y responde
apropiadamente a las relaciones de coordinación en estos modelos.
El trabajo de Von Martial [von Martial, 92] se concentra en lo que él llama relaciones
de favor: desarrollo de mecanismos que permiten identificar oportunidades para que los
agentes se ayuden los unos a los otros en la consecución de sus objetivos, así como a
modificar sus planes de forma adecuada. Von Martial presenta un marco de trabajo para
10
Universidad de Málaga
la coordinación de agentes basado en relaciones de planes multi-agente. Los agentes
tienen planes individuales que existen a priori (el plan de cada agente describe las
acciones que este ha de llevar a cabo en un futuro). Sin embargo, es posible encontrar
interdependencias entre acciones de distintos planes. Este hecho se refleja en las
relaciones de planes multi-agente. Un agente de planificación especial, llamado
coordinador, detecta estas relaciones y modifica convenientemente los planes de los
agentes. Por tanto, los planes son coordinados si todas las relaciones de planes son
resueltas.
Von Martial presenta una taxonomía de relaciones de planes multi-agente. Ésta
contempla principalmente dos clases de relaciones: relaciones negativas, que
generalmente impiden a los planes individuales la formación de un plan multi-agente
globalmente consistente; y relaciones positivas, que se desprenden de una sinergia
potencial entre planes, de forma que el uso de estas relaciones producirá un plan global
más eficiente. Al mismo tiempo Von Martial identifica tres clases de acciones para
manejar estas relaciones de planes: acciones de resolución de conflictos temporales,
acciones de resolución de conflictos de recursos, y acciones de modificaciones de
planes.
2.2.2.3 Planificación en Equipo
Otra línea de investigación dentro de la planificación multi-agente cooperativa se ha
dirigido hacía el modelado explícito del trabajo en equipo. Esto puede ser especialmente
útil en entornos dinámicos donde los miembros de un equipo pueden fallar, o por el
contrario se les pueden presentar nuevas oportunidades. En estos casos, es necesario que
los equipos gestionen sus prestaciones y las reorganicen basándose en su nueva
situación actual.
El marco de trabajo de las intenciones conjuntas [Levesque et al., 90] se enfoca sobre la
caracterización del estado mental de un equipo, denominado intención conjunta. Un
equipo propone conjuntamente una acción de equipo si los miembros de dicho equipo
están conjuntamente comprometidos a completar dicha acción, mientras mutuamente
creen que están acometiendo la ejecución de la misma. Para que todos los miembros de
un equipo formen parte de un compromiso conjunto, todos deben tener creencias y
compromisos mutuos adecuados. Esto se lleva a cabo a través de un intercambio de
actos de habla de petición y confirmación [Cohen et al., 91].
El Modelo de Plan Compartido [Gras et al., 96] está basado sobre una actitud mental
diferente: tener la intención de que se haga una acción. En este caso el concepto se
define a través de un conjunto de axiomas que guían a un miembro del equipo a llevar a
cabo una acción, o bien a iniciar una comunicación que permita a los restantes
miembros del equipo llevar a cabo tareas asignadas. Tambe [Tambe, 97] presenta un
modelo de trabajo en equipo denominado STEAM (Shell para TEAMwork), que está
basado sobre mejoras de la arquitectura SOAR [Newell, 90]. STEAM usa una
aproximación híbrida que combina intenciones conjuntas con planes compartidos
parciales.
11
Universidad de Málaga
2.2.3 Redes de Contratos
El protocolo de la red de contratos [Smith, 80] es un protocolo de interacción para
resolución de problemas distribuida cooperativa entre agentes. Este protocolo posibilita
la asignación dinámica de tareas, permite a los agentes hacer ofertas sobre múltiples
tareas al mismo tiempo, y proporciona un balanceo natural de la carga (los agentes
ocupados no están obligados a ofertar).
El protocolo de la red de contratos proporciona una solución al llamado problema de
conexión: encontrar el agente apropiado para llevar a cabo una tarea (Figura 1). El
agente que ha de llevar a cabo una tarea se denomina manager. Los agentes que podrían
ser capaces de resolver las tareas se llaman contratantes potenciales. Las funciones del
manager son las siguientes:
 Anunciar una tarea que ha de ser llevada a cabo.
 Recibir y evaluar ofertas desde los contratantes potenciales.
 Adjudicar un contrato a un contratante adecuado.
 Recibir y sintetizar resultados
Por otro lado, las funciones del contratante son las siguientes:
 Recibir anuncios de tareas
 Evaluar su capacidad para responder
 Responder (declinar, ofertar)
 Llevar a cabo la tarea si su oferta es aceptada
 Comunicar sus resultados
Los roles de los agentes no se especifican de antemano. Cualquier agente puede actuar
como manager haciendo anuncios de tareas, y cualquier agente puede actuar como un
contratante respondiendo a dichos anuncios. Esta flexibilidad es la que permite la
descomposición de tareas, ya que un contratante puede actuar como manager para una
tarea específica solicitando la ayuda de otros agentes para resolver parte de esta tarea.
Las conexiones manager-contratante resultantes forman una jerarquía de control para la
distribución de tareas y la síntesis de resultados.
Las tareas pueden también ser dirigidas a uno o más contratantes potenciales quienes
deben cumplir un criterio de elegibilidad. Cada contratante potencial evalúa los
anuncios de tareas que todavía no han expirado para determinar si éstas son adecuadas
para enviar una oferta. El contratante a continuación elige la tarea más atractiva (basada
en algún criterio) y envía una oferta al manager correspondiente. El manager recibe y
evalúa ofertas para cada anuncio de tarea. Cualquier oferta puede ser aceptada antes de
que finalice el tiempo de expiración del anuncio de tarea. El manager notifica al
contratante la aceptación de oferta a través de un mensaje.
Sin embargo, las limitaciones del protocolo son las siguientes:
12
Universidad de Málaga
Un manager anuncia la existencia de tareas a través de una
multidifusión (posiblemente selectiva)
Los agentes evalúan el anuncio, y algunos de ellos emiten
ofertas
El manager concede un contrato al agente más apropiado
El manager y el agente contratado se comunican de forma
privada tantas veces como sea necesario
Figura 1. Pasos básicos en el protocolo de la Red de Contratos





El manager no tiene la obligación de informar a los restantes contratantes
potenciales que una adjudicación ya ha sido hecha, y por tanto sus ofertas han
sido rehusadas.
Una tarea puede ser adjudicada a un contratante con menor capacitación, si otro
contratante mejor cualificado está ocupado durante el tiempo de adjudicación.
Tareas importantes pueden quedar sin adjudicación, debido a que los agentes
contratantes adecuados estén ocupados con otras tareas de menor importancia.
Una vez que una oferta es adjudica, el contratante no puede rehusarla.
El protocolo necesita una comunicación intensiva.
13
Universidad de Málaga
Algunas extensiones al protocolo de la red de contratos [Sandholm et al., 95] permiten
anular adjudicaciones ya asignadas a contratantes, mediante la introducción de
penalizaciones. Por otro lado Sycara [Sycara, 97] utiliza la teoría de la tasación de
opción financiera para obtener esquemas de contratación flexibles en entornos inciertos.
2.2.4 Cooperación Funcionalmente Exacta
La cooperación funcionalmente exacta (Functionally Accurate Model, FA/C) [Lesser et
al., 81] es un mecanismo de coordinación que ha sido usado en resolución de problemas
distribuidos, para la ejecución de tareas en las que los agentes únicamente descubren
cómo sus sub-problemas están interrelacionados a través de la formulación tentativa y el
intercambio iterativo. En un modelo FA/C los agentes no necesitan tener localmente
toda la información necesaria para resolver sus sub-problemas, sino que han de
interactuar a través del intercambio asíncrono de resultados parciales.
Para que este método funcione correctamente los agentes participantes han de tratar los
resultados parciales que han formulado y los que han recibido como tentativos, y así
tener en consideración y contrastar varias hipótesis parciales competitivas. Las
arquitecturas de pizarra han sido a menudo empleadas para dar soporte a esta necesidad.
El intercambio de soluciones parciales tentativas puede mejorar las prestaciones del
sistema en su completitud, precisión y seguridad. Cuando un agente usa un resultado de
otro para refinar sus propias soluciones, la precisión se incrementa. Y cuando un agente
combina medidas de seguridad de dos soluciones parciales (corroborando o
compitiendo), la seguridad que éste tiene en la solución cambia.
En cuanto a los inconvenientes de esta técnica, este mecanismo de coordinación puede
incurrir en una sobrecarga de comunicación y computación. Por ejemplo, si los agentes
comparten demasiados resultados se puede producir un fenómeno llamado distracción:
todos los agentes pueden intentar resolver la misma parte del problema. Por esta razón,
limitar la comunicación puede ser una buena idea, así como dar a los agentes algún
grado de escepticismo a la hora de asimilar y reaccionar frente a la información de los
otros.
3 Mecanismos de Negociación: Interacciones Multi-Agente Autointeresadas
3.1 Características
Los mecanismos de Negociación modelan la cooperación entre agentes auto-interesados
o competitivos. Estos mecanismos permiten una convergencia hacia decisiones
conjuntas a través de la coordinación y la resolución de conflictos y mediante una
comunicación explícita [Müller, 96]. En [Jennings et al., 98] se enumeran las principales
características de los mecanismos de negociación. Estas son:
a) La presencia de alguna forma de conflicto que deba ser resuelto de una forma
descentralizada
b) Agentes auto-interesados
c) Racionalidad limitada
d) Información incompleta
14
Universidad de Málaga
Los mecanismos de negociación se aplican a colecciones de agentes autónomos,
posiblemente preexistentes, que han de alcanzar una decisión conjunta para resolver un
determinado problema. El término Sistema Multi-Agente (SMA) es en la actualidad el
más utilizado para denominar este tipo de sistemas. Un SMA también se puede definir
como una red débilmente acoplada de resolvedores de problemas que trabajan juntos
con el objetivo de resolver problemas que van más allá de las capacidades individuales
o el conocimiento de cada uno de ellos. Estos resolvedores son autónomos y pueden ser
heterogéneos. Las principales características de los SMA son las siguientes:




No-benevolencia: se supone un comportamiento racional individual de los
agentes, que intentan maximizar su propia utilidad personal en lugar de la del
sistema (algunas veces otros comportamientos como el altruismo o la
responsabilidad social [Jennings et al., 97], que son un punto intermedio entre
benevolencia y racionalidad individual, son también considerados).
Objetivos Múltiples: se supone la existencia de múltiples objetivos al menos
parcialmente conflictivos. Esto viene generalmente reflejado en el hecho de que
los agentes tienen diferentes funciones locales de utilidad. Una consecuencia
importante de los objetivos múltiples es la existencia de dilemas sociales o de
conflictos reales, que no pueden ser resueltos mediante el intercambio de
información.
Autonomía: Los agentes son capaces de la creación de objetivos auto-motivados.
Un agente genera sus propios objetivos y decide si adoptará objetivos de los
otros. Esta última decisión será adoptada si el agente consigue algo a cambio.
Agentes Heterogéneos: la heterogeneidad puede aparecer de muy diferentes
formas. Esto término se puede referir a diferentes arquitecturas, ontologías o
representaciones del conocimiento, y lenguajes de comunicación.
3.2 Técnicas de Coordinación
El objetivo de los investigadores en este ámbito consiste en determinar bajo que
condiciones pueden emerger en el sistema propiedades globales interesantes que
desemboquen en comportamientos uniformes. Para ello se diseñan y analizan
mecanismos que sesgan el comportamiento racional de cada uno de los agentes, y así
generan un comportamiento global deseado. El diseñador del sistema desarrolla el
mecanismo de interacción o protocolo con la intención de satisfacer determinados
objetivos de diseño, así como de optimizar el comportamiento de los agentes en la toma
de decisiones con respecto al protocolo impuesto [Rosenschein et al., 94]. El objetivo es
diseñar mecanismos para agente auto-interesados, de forma que si los agentes adoptan
estos mecanismos el comportamiento global del sistema será aceptable (si cada agente
maximiza su utilidad local la sociedad entera mostrará un comportamiento deseable).
La mayoría de los mecanismos de coordinación o negociación en SMA están inspirados
en modelos tomados de la ciencias sociales y en modelos económicos [Sandholm, 96].
El sistema PERSUADER de Sycara [Sycara, 90] y el trabajo de Rosenschein y Zlotkin
[Rosenschein et al., 94] fueron los primeros trabajos sobre negociación entre agentes
autointeresados. PERSUADER [Sycara, 90] es un sistema que trabaja en el dominio de
la negociación laboral, y está inspirado en la negociación humana. Este sistema modela
15
Universidad de Málaga
el intercambio iterativo de propuestas y contrapropuestas, con el objetivo de que las
diferentes partes alcancen un acuerdo. Por otro lado, el trabajo de Rosenschein y Zlotkin
[Rosenschein et al., 94] está basado en teoría de juegos. En este caso los valores de
utilidad para resultados alternativos se representan en una matriz de pagos
(conocimiento común). Cada parte, basándose en la matriz de pagos, razona y
selecciona aquella alternativa que maximice su utilidad.
A continuación analizamos las principales características de los mecanismos de
negociación más usados en SMA, así como sus trabajos más representativos. Los
mecanismos seleccionados han sido los siguientes:
1)
2)
3)
4)
5)
6)
Mecanismos de Mercado
Teoría del Regateo
Formación de Coaliciones
Subastas
Votación
Asignación de tareas entre dos agentes
La elección de un mecanismo u otro dependerá de las características con las que el
diseñador quiera a su sistema. A continuación enumeramos algunos de los criterios que
nos permitirán evaluar los diferentes mecanismos de negociación [Sandholm, 99]:






Bienestar Social: es la suma de los pagos o utilidades de todos los agentes en
una solución dada. El bienestar social "mide" o "determina" el grado de
bienestar global de los agentes.
Eficiencia: Una solución x es pareto eficiente o pareto óptima si no hay otra
solución x´ en la que al menos un agente esté mejor en x´ que en x, y ningún
agente esté peor en x´ que en x. Las soluciones que maximizan el bienestar
social son un subconjunto de las pareto eficientes.
Racionalidad Individual: La participación de un agente en un mecanismo de
coordinación es racional individual, si el pago de dicho agente en la solución
negociada no es menor que el pago que éste recibiría si no participará en la
negociación. Lógicamente sólo son viables los mecanismos racionales
individuales.
Estabilidad: Ningún agente debería tener incentivos para desviarse de las
estrategias previamente acordadas. Por este motivo, los mecanismos deberían
motivar a los agentes para que éstos se comportaran de la manera deseada.
Eficiencia: Los mecanismos deberían ser diseñados de modo que la sobrecarga
computacional fuese la menor posible.
Distribución y eficiencia en las comunicaciones: Los mecanismos no deberían
necesitar un coordinador o tomador de decisiones central. Así se evitarían
cuellos de botella o puntos de fallo únicos. Además, sería deseable minimizar la
cantidad de comunicación necesaria para alcanzar una solución (claramente en
algunos casos ambos objetivos pueden estar en conflicto).
16
Universidad de Málaga
3.2.1 Mecanismos de Mercado
Este modelo de coordinación equipara un sistema multi-agente con un mercado virtual,
con el objetivo de que dicho sistema tenga algunas de las propiedades deseables de los
mercados reales. Los mecanismos de mercado se basan en un marco de trabajo de
mercados microeconómicos denominado Teoría de Equilibrio General [Varian, 92].
Esta proporciona un método distribuido para una asignación eficiente de bienes y
recursos entre los agentes basada en precios de mercado.
Para formular los problemas como una economía computacional, las actividades de
interés son generalmente clasificadas en términos de producción y consumo de bienes.
Consideremos por ejemplo el algoritmo WALRAS [Welman, 95], que es el núcleo de
un sistema de programación orientado al mercado. Aquí se implementa un mecanismo
de subasta distribuido para asignar recursos (bienes) entre múltiples agentes
(productores y consumidores). Los agentes pueden adquirir recursos en diferentes
mercados, que son gestionados por los subastadores, a un cierto precio. Inicialmente los
agentes envían ofertas (cantidad demandada de un bien en función de su precio
potencial) a cada mercado, con el objetivo del que el subastador calcule el precio de
limpieza (clearing price), e.d. el precio en el que la demanda de exceso agregado es
cero. A continuación los subastadores notifican el nuevo precio a los agentes que hacen
ofertas. Los consumidores adaptan sus funciones de demanda a los nuevos precios y
envían sus ofertas actualizadas a las subastas. El proceso finaliza cuando a la larga los
precios se mantienen: el mercado alcanza un equilibrio general, o lo que es lo mismo
hay un balance perfecto entre la oferta y la demanda. En esta situación los recursos son
vendidos a los agentes, de acuerdo con sus demandas, por el precio de equilibrio.
Se han de cumplir varias condiciones para asegurar que el proceso converge a un
equilibrio general. Un equilibrio general se alcanza si:
1) Cada productor maximiza sus beneficios dados los precios.
2) Cada consumidor maximiza sus preferencias dados los precios.
3) Limpieza de Mercado: para cada bien la producción iguala el consumo. Hay un
balance perfecto entre la demanda y la oferta.
Este equilibrio general siempre tiene algunas propiedades deseables: a) es pareto
eficiente, b) es estable frente a posibles coaliciones, cada equilibrio, sin productores
presentes, es estable en el sentido del núcleo (concepto solución de teoría de juegos para
la formación de coaliciones), c) existe, aunque en algunos dominios no se puede
garantizar la existencia de este equilibrio general, sin embargo si se pueden establecer
condiciones de suficiencia para su existencia, y d) unicidad del equilibrio, un equilibrio
general es único si la demanda para cada bien dentro de la sociedad no supone una
bajada en los precios de otros bienes.
La motivación operacional que subyace en estos mecanismos de mercado es que los
agentes pueden encontrar una solución conjunta eficiente, sin centralizar toda la
información o control. Existen diferentes algoritmos que se pueden usar para buscar un
equilibrio general, siendo unos centralizados y otros distribuidos. El algoritmo
descentralizado más común es el proceso de tatonnement. Este es un mecanismo
17
Universidad de Málaga
iterativo en el que se supone que las transferencias, producciones y consumos, se
producen únicamente cuando el proceso ha finalizado. En cada iteración el subastador
establece un vector de precios. A continuación, cada uno de los agentes ha de declarar
que cantidad de bienes de cada tipo desea comprar y vender a los precios actuales. Con
esta información el subastador actualiza el vector de precios para la siguiente iteración.
Bajo determinadas condiciones se garantiza que este proceso converge a un equilibrio
general.
Dentro de los sistemas multi-agente computacionales, Wellman ha usado su algoritmo
WALRAS en los siguientes dominios ejemplo: enrutado de flujo en una red [Wellman,
93], parámetros de diseño en un aeroplano [Wellman, 94], redes de información
distribuida [Mullen et al., 95]. WALRAS difiere en algunos aspectos del proceso de
tatonnement. Sin embargo, y bajo ciertas condiciones, se prueba que WALRAS también
converge a un equilibrio general [Cheng et al., 95].
Entre los inconvenientes de los sistemas basados en mecanismos de mercado hemos de
destacar que éstos únicamente discuten la complejidad de los algoritmos (WALRAS,
tatonnement), suponiendo conocidas las funciones de oferta y demanda de los agentes.
Sin embrago, generar para cada agente su función óptima de oferta y demanda dados los
precios actuales puede ser computacionalmente complejo (cada vez que cambien los
precios en cada iteración del algoritmo, cambiará el plan óptimo para cada agente).
3.2.2 Teoría del Regateo
En la teoría del Regateo los agentes pueden llegar a un acuerdo mutuamente
beneficioso, pero tienen un conflicto de intereses acerca de qué acuerdo seleccionar. En
esta teoría se distingue entre dos aproximaciones: la no cooperativo ó estratégica y la
cooperativa o axiomática. La aproximación no cooperativa está orientada al estudio de
la estrategia. La atención se centra en las acciones que cada jugador es capaz de adoptar,
de forma que se alcance algún tipo de equilibrio. Por el contrario en la aproximación
cooperativa se estudian los resultados esperados. En estos modelos nos centramos
directamente en el espacio de resultados posibles y no en la forma en la que se llega a
éstos. La aproximación cooperativa es una aproximación “micro” importa la descripción
de lo que ocurre, y la no cooperativa es una aproximación “macro” lo que interesa son
los resultados que los agentes pueden alcanzar.
3.2.2.1 Teoría del Regateo Axiomática
En esta sección tratamos con el llamado problema del regateo [Thomson, 97]. El marco
de trabajo es el siguiente: los agentes son capaces de llegar a soluciones de forma
conjunta (aproximación cooperativa), pero no están de acuerdo acerca de cuál
seleccionar. Además no es posible llegar a acuerdos que no sean ratificados por todos
los agentes (se desestima la formación de posibles coaliciones).
Supongamos que sea N={1,2,...,n} el conjunto de agentes. Un problema de regateo es
un par (S,d) donde: S  Rn es el conjunto factible o espacio de estrategias del juego. El
grupo de agentes N podrá conseguir cualquier punto de este conjunto si todos coinciden
en él; si por el contrario no llegan a un acuerdo conseguirán dS. Este último se
18
Universidad de Málaga
denomina punto de amenaza o de desacuerdo. El punto de desacuerdo es un vector
d=(d1,d2,...,dn) cuyas componentes son los pagos maximin1 o niveles de seguridad de un
juego no cooperativo. Además asumimos que S es un conjunto compacto y convexo y
que en S hay al menos un punto que domina estrictamente a d.
Raiffa
Nash
u2
a(S)
A
Kalai-Smorodinsky
2 0
x
2 1
x
x2
x1
S
Igualitaria
1 1
x
1 0
x
45º
d=0
B
u1
Figura 2. Soluciones al problema del Regateo
En la figura 2 los ejes representan los niveles de utilidad o pagos de los agentes. Existen
dos limitaciones a cualquier acuerdo razonable
 Racionalidad de Grupo: no parece razonable que el conjunto de agentes llegue a
conformarse con un acuerdo que no sea óptimo de pareto.
 Racionalidad Individual: Sería irracional que un agente estuviese de acuerdo con un
resultado conjunto que le proporcionara una utilidad inferior a la que podría
asegurarse mediante sus propios esfuerzos individuales.
La curva AB de la figura 2 satisface ambos criterios y se conoce como el núcleo. Este
núcleo puede estar constituido por muchos puntos, y sería interesante quedarnos con
una única solución.
Vamos a definir a continuación algunas de las soluciones univaluadas más conocidas
para el problema del regateo, para posteriormente mencionar algunas de las propiedades
de las mismas. Si denotamos por 0n al conjunto de problemas N-personales con
amenaza fija y d=0. Una Solución f es un método para elegir un punto posible del
espacio de estrategias del juego. Formalmente es una función f: 0n Rn, tal que
f(S,d)S para todo S0n. Cada componente de f(S,d)=(f1(S,d),....,fn(S,d)) muestra el
pago de cada jugador.
1
La estrategia maximin es otro concepto de equilibrio relacionado con el equilibrio de Nash. En concreto el equilibrio de Nash
proporciona a cada jugador un pago que es al menos tan bueno como el mayor valor que a cada jugador se le puede garantizar.
19
Universidad de Málaga
Solución de Nash. Esta solución introducida por Nash selecciona el punto en el cual el
producto de utilidades es maximizado. f(S,d) es el maximizador del producto ui sobre
S.
Solución de kalai-Smorodinsky. Esta solución establece utilidades desde el origen,
proporcionales a las utilidades máximas de los agentes. f(S,d) es el punto máximo de S
sobre el segmento que conecta el origen con a(S). Se define el punto ideal a(S) como:
ai(S)=max{xi|xS} para todo i.
Solución Igualitaria. f(S,d) es el punto máximo de S de coordenadas iguales.
Solución discreta de Raiffa. Esta solución está basada en un proceso de concesiones
balanceadas. El compromiso inicial es obtenido seleccionando el punto medio entre las
alternativas preferidas de los agentes. Generalmente este punto no es un óptimo de
pareto. El siguiente paso es seleccionar el punto medio entre las alternativas preferidas
de los agentes, entre aquellas alternativas que prefirieron en el compromiso previo. Este
procedimiento se repite hasta que se alcanza una solución pareto eficiente. f(S,d) es el
punto límite de la secuencia {zt} definida por: xi0=Di(S) para todo i (Di(S) es el punto x
máximo de S con xj=0 para todo ji); para todo tN, zt=(xi(t-1))/n, y xit es el punto
óptimo de pareto con xijt=xtj para todo ji.
Cada una de las soluciones anteriores vienen caracterizadas por un conjunto de axiomas
o propiedades de las mismas.
Solución de Nash.(Nash, 1950) [Nash, 50] Nash especificó algunos supuestos
razonables bajo los cuales la solución propuesta por él para este problema existe y es
única:
Racionalidad Individual:f(S,d)d para todo (S,d) 0n
Invarianza de Escala: Si  es una transformación afín y f(S) es una solución al
problema de regateo (S, d), entonces f(S)=f(S). Es decir, la solución no varia para
transformaciones de utilidad afines positivas; y dos escenarios de regateo que se
relacionen de esta forma son dos escenarios idénticos en términos de posibilidades
físicas que sólo se diferencian en un aspecto arbitrario de su representación de la
utilidad.
Simetría: S es invariante bajo todos los intercambios de agentes, fi(S,d)=fj(S,d) para todo
i,j. A priori el escenario de regateo no favorece a ninguno de los agentes intervinientes.
Independencia de Contracción. Para todo S y S´02, si S´S y f(S,d)S´ entonces
f(S´,d)=f(S,d). Si las oportunidades se contraen dejando la solución resultante factible,
ésta todavía debería ser seleccionada. Es decir, si tenemos dos problemas de regateo y el
espacio estratégico de uno de ellos está contenido en el otro, S´S, y la solución del
mayor está contenida en el más pequeño, este será el punto solución para ambos
problemas.
Optimalidad de pareto: Para todo S02, f(S,d)OP(S)={xS|x´S con x´x}, es
decir la solución f(S,d) no puede ser dominada por otro resultado factible.
Solución Kalai-Smorodinsky. (Kalai y Smorodinsky, 1975) Estos demostraron [Kalai et
al., 75] que dicha solución existe y es única bajo los supuestos siguientes: Optimalidad
de pareto, Simetría, Invarianza de escala y Monotonía individual.
20
Universidad de Málaga
Monotonía Individual: Para todo S, S´02, Si S´S y aj(S´)=aj(S) para todo ji,
entonces fi(S´,d)fi(S,d). De modo que si las oportunidades se expanden en la dirección
de un agente, este debe ganar. Este axioma indica cuando un cambio en el problema de
regateo debería favorecer a un jugador concreto.
Solución Igualitaria. (Kalai, 1977) [Kalai, 77] Esta solución satisface la optimalidad de
pareto, y la simetría, pero no la invarianza de escala. Esto se debe a que si las
oportunidades se expanden en una dirección que realmente favorece a un agente, esta
solución requiere que todos los agentes ganen o que la ventaja se reparta a partes iguales
entre todos.
Como podemos ver existen diferentes soluciones al problema del regateo y además el
número de soluciones no se agota aquí, Ej. Solución de área igual, Solución de Yu,
Solución Utilitaria.....[Thomson, 97]. La selección de una u otra dependerá del problema
que se esté intentando modelizar. Mientras en la solución de Nash se tiene en cuenta
cuando un cambio en el juego no debe afectar a la solución (independencia de
contracción), en la solución de Kalai-Smorodinsky se contempla cuando un cambio
debería favorecer a un agente en concreto (monotonía individual).
Ossowski [Ossowski, 97] utiliza la solución de Nash como vehículo para formalizar la
cooperación estructural entre agentes auto-interesados en un contexto social y
normativo. Para ello su sistema ha de asumir una serie de restricciones que permiten
evitar de alguna manera los inconvenientes computacionales de la teoría de regateo
(racionalidad perfecta entre otros). Estos son: agentes homogéneos, diseño centralizado
y acuerdos comprometidos.
3.2.2.2 Teoría del Regateo Estratégica
En la sección anterior se han mostrado un conjunto de soluciones posibles al proceso de
interacción entre agentes. Pero en todas estas aproximaciones nos hemos centrado en el
espacio de resultados posibles, sin tener en cuenta el proceso real de negociación.
Dichas soluciones vienen caracterizadas por el espacio de resultados posibles y el punto
de desacuerdo. Sin embargo, en un proceso de negociación en el que intervengan
agentes auto-interesados será necesario analizar cuales de las soluciones anteriores están
en equilibrio. Puesto que si el diseñador sabe que los restantes agentes están usando
estrategias en equilibrio, no se obtendrán mayores beneficios construyendo un agente
que use otra estrategia distinta. Por tanto, el objetivo sería encontrar un modelo de
negociación no cooperativo, caracterizar sus estrategias en equilibrio y relacionar las
soluciones resultantes con una o varias soluciones cooperativas, ya que estas últimas
son las que obtienen resultados más beneficiosos.
Desafortunadamente, en la teoría de juegos encontrar estrategias en equilibrio no es un
proceso mecánico [Kraus et al., 95]. Para determinar estas estrategias, generalmente,
cada agente debe hacer una estimación acerca de qué estrategias serán las que estarán en
equilibrio. Para ello cada agente ha de adivinar el conjunto de acciones que serán usadas
por los restantes agentes en cada paso de la negociación. Sin embargo, el número de
posibles ofertas que un agente podría proponer es muy elevado, así como el número de
posibles combinaciones de acciones con que los otros agentes le podrían responder
21
Universidad de Málaga
(todo ello suponiendo información completa, sin ella el problema es incluso
computacionalmente más complejo). Por todo ello calcular las estrategias en tiempo
real, puede ser un problema inviable [Sandholm, 99]. Una posible solución sería
identificar las estrategias en equilibrio antes de que se lleve a cabo el proceso de
negociación, y posteriormente incorporarlas en los agentes. A continuación vamos a
mostrar varios mecanismos de negociación cuyos resultados en equilibrio coinciden con
algunos de las soluciones clásicas cooperativas antes citadas.
Estrategía de Zeuthen. (Zeuthen, 1930) [Zeuthen, 30] Zeuthen fue un precursor de la
solución de Nash. Éste propuso un proceso de negociación bipersonal que produce un
resultado formalmente idéntico a la solución de Nash [Harsanyi, 56]. El proceso de
negociación consistía en que ambos jugadores simultáneamente debían hacer una
propuesta, y cada propuesta debía ser un punto de la frontera de posibilidades (óptimo
de pareto). Dependiendo de la relación existente entre ambas propuestas uno de los dos
jugadores se vería obligado a cambiar su propuesta por otra que hiciera la mínima
concesión suficiente.
Si u1 fuera la propuesta del jugador 1, u1=(u11, u12), y u2 la del jugador 2, u2=(u21,u22) y
d=0, se habrían de comparar los siguientes valores: (u11-u21)/u11 y (u22-u12)/u22 . Si el
primero es inferior al segundo el jugador 1 debe hacer la concesión mínima suficiente
para invertir la desigualdad. (u11-u21)/u11, calcula el coste que le supone al agente 1
hacer una concesión al agente 2. Aquel al que le suponga un coste menor habrá de hacer
la siguiente concesión. Es fácil ver que (u11-u21)/u11 < (u22-u12)/u22 es equivalente a
u11u12<u21u22. Por tanto, el jugador que tenga el producto de Nash menor será el que
hará la siguiente concesión. Este proceso termina en la solución de Nash. Esta estrategia
de negociación de hecho, ha sido usada como base para el desarrollo de mecanismos de
negociación en dominios concretos de IAD (dominios orientados a tareas, [Rosenschein
et al., 94]).
Modelo de Ofertas Alternantes de Rubinstein. (Rubinstein, 1982) [Rubinstein, 82] La
principal característica de este mecanismo es que tiene en cuenta el paso del tiempo
durante la negociación. El problema del que Rubinstein se ocupa es muy sencillo:
suponemos que hay un bien a repartir entre dos jugadores, jugador 1 (J1) y jugador 2
(J2). Si J1 obtiene s1[0,1], J2 obtiene s2=1-s1, pero ningún jugador recibirá nada si
ambos no llegan a un acuerdo. El proceso está modelizado como un proceso no
cooperativo. En el primer periodo J1 hace una oferta y J2 la acepta o la rechaza. Si J2 la
acepta el proceso de negociación finaliza, obteniendo J1 s1 y J2 1-s1. Si por el contrario
J2 rechaza la propuesta el juego continúa y será J2 quien haga la siguiente oferta a J1. El
proceso finalizará cuando un jugador acepte la oferta del otro. Para cada jugador el
valor del resultado obtenido se incrementará con la cantidad de bien recibido y
disminuirá con el paso del tiempo.
Rubinstein demostró [Rubinstein, 82] que el resultado final de una combinación de
estrategias en equilibrio perfecto es un par (s1*,1-s1*), donde s1* es el primer parámetro
del par (s1*,s2*) que satisface las dos ecuaciones siguientes, s2=d1(s1) y s1=d2(s2), donde:
d1(s1)=1 si, para todo s2[0,1, u1(1-s2,0)>u1(s1,1)=s2, si u1(1-s2,0)=u1(s1,1)
d2(s2)=1 si, para todo s1[0,1, u2(1-s1,0)>u2(s2,1)=s1, si u2(1-s1,0)=u2(s2,1)
22
Universidad de Málaga
ui(si,t) es la función de pagos del jugador i. Esta es continua y estrictamente creciente en
si, es decir el pago de un jugador es continuo con respecto a la cantidad de bien recibido,
y es estrictamente decreciente en t, e.d. el paso del tiempo es necesariamente costoso.
Además, la función está definida para si[0,1, e.d. el bien ha de poder valorarse y
t{0,1,2,...} y satisface que: a) cualquier cantidad de bien recibido es preferible a no
obtener nada, b) las funciones de pagos son estacionarias con respecto al tiempo, y c) la
compensación necesita por el retraso de tiempo en la recepción del bien se incrementa
con respecto a la cantidad del bien.
A la vista de los resultados parece como si la negociación tuviera que finalizar en el
primer periodo (t=0), esto es, cómo si fuera más beneficioso para un jugador ofertar en
primer lugar, y cómo si cuánto mayor fuera la cantidad de bien para un jugador en la
situación de equilibrio, menor fuera la pérdida al retrasar la recepción del bien en un
periodo. Este modelo también ha sido seleccionado como mecanismo de negociación en
problemas de asignación de tareas en entornos multi-agente, en los que era necesario
tener en consideración el paso del tiempo durante la negociación [Kraus et al., 95].
3.2.3 Formación de Coaliciones
En los mecanismos de negociación multi-agente hay situaciones en las que se pueden
formar coaliciones, que incluyan a algunos de los agentes mientras excluyan a otros.
Mediante éstas es posible que compartiendo sus recursos y coordinando sus acciones los
agentes sean capaces de incrementar sus beneficios. Los modelos teóricos de juegos
cooperativos, pueden ser usados como base para el diseño de mecanismos de
negociación que tengan en cuenta la formación de coaliciones en negociadores
automatizados [Sandholm et al., 97] [Zlotkin et al., 97] [Shehory et al., 99]. Es más, la
formación automatizada de coaliciones en sistemas multi-agente podría ahorrar tiempo
de trabajo a los negociadores humanos, debido a que los agentes computacionales
pueden ser mucho más efectivos en la formación de coaliciones beneficiosas que los
negociadores humanos.
La aproximación más general a este problema consistiría en establecer el protocolo de
formación de coaliciones como un juego en forma normal, y a continuación analizar el
equilibrio de Nash para ver cómo el juego debería ser jugado y cómo de eficientes
deberían ser los resultados. Sin embargo, el equilibrio de Nash es a menudo un
mecanismo demasiado débil, ya que subgrupos de agentes pueden desviarse de una
forma coordinada. Por este motivo, y en lugar de utilizar la aproximación estratégica
que usa el análisis de equilibrio, la formación de coaliciones se estudia de una forma
más abstracta utilizando los juegos en forma de función característica. En tales juegos el
valor de cada coalición K viene dado por una función característica v(K). La formación
de coaliciones en juegos en forma de función característica incluye tres actividades:



Generación de la estructura de coaliciones
Resolución del problema de optimización de cada coalición
división de pagos
A continuación explicamos de forma detallada cada una de las actividades anteriores.
23
Universidad de Málaga
3.2.3.1 Generación de la Estructura de Coaliciones
Esta actividad consiste en la formación de coaliciones por parte de los agentes de forma
que los agentes dentro de cada coalición coordinen sus actividades, pero éstos no se
coordinen entre coaliciones. Esto significa particionar el conjunto de agentes en
coaliciones disjuntas y exhaustivas. A esta partición se la denomina estructura de
coaliciones. Por ejemplo en un juego con tres agentes hay siete coaliciones posibles:
{1},{2}, {3},{1,2}, {1,3}, {2,3}, {1,2,3}, y cinco posibles estructuras de coaliciones:
{{1},{2},{3}},{{1,2},{3}},{{1,3}, {2}},{{2,3},{1}},{{1,2,3}}.
Tradicionalmente, la generación y optimización de la estructura de coaliciones no ha
sido una actividad que haya recibido demasiada atención dentro de la teoría de juegos.
El motivo es que ésta se ha centrado en dominios superaditivos en los que la coalición
global es siempre la más beneficiosa, y los costes de cooperación no crecen
significativamente con el número de agentes cooperantes. Sin embargo, en entornos
generales (superaditivos y no-superaditivos) la generación de una estructura de
coaliciones óptimas no es un problema trivial. En tales juegos algunos agentes pueden
conseguir mejores resultados coaligándose, mientras otros no. Por tanto, encontrar la
estructura de coaliciones que maximize el bienestar social es un problema
computacionalmente complejo. Sandholm [Sandholm et al., 99b] demuestra que
cualquier algoritmo general para formación de coaliciones que garantice una solución
dentro de un límite de la mejor en términos de maximización de utilidad, ha de buscar
en un número exponencial de soluciones posibles.
3.2.3.2 Resolución del Problema de Optimización de cada Coalición
Esta tarea consiste en reunir las tareas y los recursos de los agentes pertenecientes a la
coalición, y resolver este problema de forma conjunta. El objetivo de cada coalición es
maximizar su utilidad: el beneficio obtenido por llevar a cabo las tareas menos el coste
de su ejecución (recursos usados). Para ello cada coalición debería resolver su problema
de optimización, el cual definiría el valor de esa coalición. Sin embargo, en la práctica
en muchos dominios es demasiado complejo desde el punto de vista computacional, la
resolución de este problema. Por ello, en muchos casos sólo se puede encontrar una
solución aproximada. En estos casos los agentes auto-interesados habrán de llegar a un
compromiso entre la calidad de la solución y el coste de la computación asociada. En
[Sandholm et al., 97] se estudian en detalle estos asuntos y otros relacionados.
3.2.3.3 División de Pagos
Esta actividad consiste en dividir el valor coalicional de cada coalición de la estructura
de coaliciones entre los agentes que la componen de una forma justa y estable, de forma
que éstos estén motivados a permanecer en la actual estructura de coaliciones en lugar
de desviarse de ella y formar otra estructura de coaliciones diferente. A continuación
pasamos a discutir algunas de las soluciones más importantes que ofrece la teoría de
juegos [Friedman, 91] [Hart, 97] para la división de pagos.
24
Universidad de Málaga
Núcleo. (Gillies, 1953) [Von Neumann, 44] En los problemas de regateo para que un
vector de pagos o utilidades, xRn, pertenezca al núcleo, y sea, por tanto, una posible
solución al problema son necesarias dos condiciones: 1) racionalidad individual,
xiv({i}), el jugador i debe recibir un pago al menos tan grande como el que él pueda
conseguir por si mismo, 2) racionalidad de grupo, iN xi=v(N), cualquier vector
razonable debe dar a todos los jugadores una cantidad que iguale la que pueda ser
obtenida por una supercoalición formada por todos los jugadores. Una imputación es
cualquier vector de pagos que satisfaga ambas condiciones.
Pero en nuestro caso estas dos condiciones por si solas no bastan, ya que si una
coalición obtuviera por si misma un valor mayor que el que le proporciona el vector
solución se independizaría, y de esa forma no estaría garantizada la estabilidad de la
estructura de coaliciones propuesta como solución. Por tanto, es necesario que iK
xiv(K) para todo KN. Luego el núcleo C(N,v) se define como un subconjunto del
conjunto de imputaciones no dominadas. Dadas dos imputaciones x e y diremos que x
domina a y a través de K, yKxK, si y da más a los miembros de K de lo que lo hace x.
El inconveniente de esta solución es que pueden existir juegos para los cuales el núcleo
esté vacío y otros para los que esté formado por muchos puntos. Además, un problema
añadido es el de la complejidad computacional asociada a su cálculo. Puesto que el
número de estructuras de coalición es exponencial (2n-1), la resolución del sistema de
desigualdades necesario para el cálculo del mismo es un problema computacionalmente
complejo. Otra posibilidad consistiría en utilizar un esquema de transferencia iterativo
[Wu, 77]. Éste parte de cualquier división de pagos inicial e iterativamente cambia el
valor de la misma hasta que converge a una solución en el núcleo. Sin embargo, el
número de iteraciones de este esquema puede ser potencialmente infinito y por tanto de
nuevo computacionalmente complejo.
Valor de Shapley. (Shapley, 1953) [Shapley, 53] Esta solución establece que el pago
para cada jugador es la media ponderada de las contribuciones que éste hace a cada una
de las coaliciones a las que pertenece. Estas ponderaciones dependerán del número de
jugadores, n, y del número de miembros de cada coalición, |K|. Este valor lo
representaremos por (v)Rn, donde i(v) es el pago que el valor de Shapley asigna al
jugador i-ésimo:
i(v)=KN [v(K)-v(K\{i}((|K|-1)!-(n-|K|)!)/ n!
Como podemos observar, para cada una de las coaliciones K se calcula la contribución
marginal que hace el jugador i-ésimo a la coalición. Para ello se calcula la diferencia
entre el valor de la función característica para toda la coalición v(K), menos el valor de
la función característica para la coalición eliminando al jugador i, v(K\{i}). La
contribución se pondera calculando el número de coaliciones que contienen al jugador i
y tienen |K| miembros, ó lo que es lo mismo calculando la probabilidad de que el
jugador i se integre en la coalición K, que es la misma que la probabilidad de que
lleguen antes que él los |K|-1 jugadores y después n-|K|. Si todas las ordenaciones de
jugadores son equiprobables tenemos: ((|K|-1)!-(n-|K|)!)/ n!.
Shapley demostró [Shapley, 53] que las cuatro condiciones siguientes implican que (v)
está caracterizado por la formula anterior. Éstas son:
25
Universidad de Málaga




Racionalidad de grupo, iN i(v)=v(N)
Si v(K\{i})=v(K) para todas las coaliciones KN, entonces el valor de Shapley es
i(v)=0. Es decir, si el jugador i no añade ningún valor a la coalición K, el
jugador i recibe un beneficio 0 del valor de Shapley.
Si dos juegos son iguales excepto por el orden en que se relacionan sus
jugadores, entonces sus valores de Shapley serán también idénticos. Por tanto la
solución no depende de cómo estén enumerados los jugadores. Esta es la
condición de simetría.
Si se forma un nuevo juego mediante la suma de dos juegos, el valor de Shapley
del nuevo será la suma de los valores de Shapley de los dos juegos originales.
El valor de Shapley existe y es único para todo juego superaditivo en forma de función
característica que tenga un número finito de jugadores [Shapley, 53], y además es pareto
eficiente al igual que el núcleo. Sin embargo, a diferencia del núcleo, no garantiza que
todos los subgrupos de agentes estén mejor en la actual estructura de coaliciones que
fuera de ella y formando sus propias coaliciones. Otro problema con el valor de Shapley
es que la contribución marginal de cada agente ha de ser calculada sobre todos los
órdenes posibles de unión, y hay un número N! de ellos. Únicamente es posible
garantizar a cada agente un pago esperado igual a su valor de Shapley aleatorizando el
orden de llegada. Zotkin y Rosenschein [Zoltkin et al., 94] han propuesto un protocolo
no manipulable distribuido para encontrar un orden de unión aleatorio.
3.2.4 Votación
En los mecanismos de votación o mecanismos de elección social, todos los agentes
aportan unos datos de entrada al mecanismo y el resultado que el mecanismo elige,
basado en estos datos de entrada, es una solución para todos los agentes. En la mayoría
de los mecanismos este resultado es forzado, con lo que todos los agentes han de
cumplir la solución preescrita por éstos.
El objetivo tradicional de estos mecanismos consistía en derivar una regla de elección
social que clasificara los resultados sociales posibles, basándose en las clasificaciones
individuales de estos resultados [Sandholm, 99]. Supongamos que sea A el conjunto de
agentes y O el conjunto de resultados sociales posibles. Además, supongamos también
que cada agente i  A tiene una relación de preferencia i sobre O estrictamente
transitiva y asimétrica. Una regla de elección social toma como entrada las relaciones de
preferencia de cada uno de los agentes (1,...., |A|), y produce como salida las
preferencias sociales denotadas por la relación * . Una regla de elección social ha de
tener las siguientes propiedades:
1) Un orden de preferencia social * debería existir para todas entradas posibles.
Además, este orden debería ser asimétrico y transitivo sobre O para todas las
preferencias individuales.
2) El resultado debería ser pareto óptimo: si  i A, o i o´, entonces o * o´.
3) El esquema debería ser independiente de alternativas irrelevantes. Si  y ´ son
vectores de clasificaciones que satisfacen o i o´ si y sólo si o i´ o´ para todo i,
entonces la clasificación social de o y o´ es la misma en estas dos situaciones.
26
Universidad de Málaga
4) Ningún agente debería ser un dictador en el sentido que o i o´ implica o * o´,
para todas las preferencias de los restantes agentes.
35% de los agentes tienen la preferencia c  d  b  a
33% de los agentes tienen la preferencia a  c  d  b
32% de los agentes tienen la preferencia b  a  c  d
b
a
c
d
b
a
b
c
d
c
c
a
d
c
a
c
a
c
b
d
b
a
d
a
b
d
b
d
Figura 3. Dos agendas diferentes para un protocolo binario con 4 alternativas (a,b,c,d)
Desgraciadamente no es posible satisfacer todos estas propiedades. El teorema de
imposibilidad de Arrow [Arrow, 63] [Kreps, 90] establece que no hay ninguna regla de
elección social que satisfaga las cuatro propiedades anteriores. Por tanto, para diseñar
reglas de elección social algunas de las propiedades anteriores han de ser relajadas.
Por ejemplo, la tercera propiedad es normalmente relajada. En un protocolo binario (en
el que las alternativas son votadas por parejas, el ganador permanece para disputar las
siguientes alternativas mientras el perdedor es eliminado) la introducción de alternativas
irrelevantes a menudo modifica los resultados. Por ejemplo, en la figura 3 podemos ver
cómo distintos ordenes de emparejamiento conducen a diferentes resultados dadas las
mismas preferencias de los agentes. Incluso el resultado puede ser una de las
alternativas que son menos preferidas por los agentes (una solución pareto dominada)
Ej. la segunda alternativa de la figura en la que la opción d es la ganadora, aunque todos
los agentes prefieren c sobre d.
Otro protocolo ejemplo en el que la introducción de alternativas irrelevantes cambia el
resultado es el protocolo de Borda. Este protocolo se usa cuando el número de posibles
resultados es grande, y por tanto la utilización de un protocolo binario puede ser un
proceso muy lento. Este protocolo asigna |O| puntos a la alternativa más alta en la lista
de preferencias de cada agente, |O|-1 a la siguiente alternativa y así sucesivamente. Así,
os puntos de todos los votantes son sumados y aquella alternativa que tenga la
puntuación más alta será la elección social. En la figura 4 podemos apreciar que cuando
se elimina la alternativa con una clasificación más baja (alternativa irrelevante) se
producen resultados paradójicos, ya que la peor de las alternativas restantes se convierte
en la mejor y viceversa.
27
Universidad de Málaga
AGENTES
1
2
3
4
5
6
7
PREFERENCIAS
abcd
bcda
cdab
abcd
bcda
cdab
abcd
Figura 4. De acuerdo con la tabla el resultado del protocolo de Borda es el siguiente: c
gana con 20 puntos, b tiene 19, a tiene 18 y d pierde con 16. Si aplicamos el protocolo
de Borda eliminando al agente d (alternativa irrelevante) el resultado se invierte y el
ganador se vuelve perdedor. En este caso a gana con 15 puntos, b obtiene 14 y c pierde
con 16.
Por otro lado, anteriormente hemos asumido que al llevar a cabo un método de elección
social como los anteriores todas las relaciones de preferencia son conocidas. Sin
embargo, esto no es siempre cierto ya que en la mayoría de las ocasiones los agentes
han de revelar sus preferencias y en determinadas ocasiones éstos pueden obtener
beneficios no siendo sinceros a la hora de declararlas. El teorema de imposibilidad de
Gibbard-Satterthwaite establece que los protocolos no manipulables (aquellos en los
que los agentes no pueden mentir a la hora de revelar sus relaciones de preferencia) son
dictatoriales, e.d. hay algún agente i que consigue elegir su mejor resultad (o uno de
ellos) independientemente de lo que revelen los otros.
Aunque después de los dos resultados de imposibilidad anteriormente expuestos parezca
muy complicado el diseño de mecanismos de elección social, no siempre es así. En
determinadas situaciones las relaciones de preferencia de los agentes pueden pertenecer
a algún dominio restrictivo que invalide las condiciones de imposibilidad de ambos
teoremas. Siendo posible en estos casos diseñar mecanismos de elección social no
dictatoriales.
Por ejemplo, el mecanismo de Groves [Groves et al., 77] recauda un impuesto sobre los
votantes. Los agentes imponen un impuesto sobre aquellos agentes cuyos votos
modifican el resultado de la votación. El valor del impuesto de un agente es
exactamente igual a la cantidad en que su voto disminuye la utilidad de los restantes
agentes. Aquellos agentes cuyo voto no cambia el resultado no han de pagar impuesto.
Este mecanismo puede ser establecido de tal forma que la sinceridad a la hora de revelar
las preferencias de los agentes sea la estrategia dominante. Por este motivo, los agentes
no han de malgastar esfuerzo en especular acerca de las declaraciones de preferencias
de los restantes agentes. Además, la participación de un agente dentro del mecanismo es
siempre racional individual, puesto que éste únicamente puede incrementar su utilidad.
Sin embargo, este mecanismo no mantiene el balance del presupuesto, ya que recaudan
demasiados impuestos. Existen otros mecanismos en los que al revés que en el caso
anterior, los impuestos recaudados son negativos. Sin embargo, no hay ninguno en que
la recaudación sea igual a cero. Los esquemas en los que se recaudan demasiado poco
28
Universidad de Málaga
requieren que intervenga un benefactor externo, y aquellos que recaudan demasiado no
son óptimos de pareto debido a que la recaudación de impuestos extra ha de ser
eliminada. El mecanismo de Groves que minimiza el exceso de la recaudación de
impuestos se denomina Mecanismo de Impuestos de Clarke [Clarke, 71]. Normalmente,
el Mecanismo de Impuestos de Clarke se ha utilizado para resolver problemas aislados
de elección social. Ej. este mecanismo se ha usado en planificación multi-agente
[Ephrati et al., 91] [Ephrati, 94].
3.2.5 Subastas
La teoría de las Subastas analiza los protocolos y las estrategias de comportamiento de
los agentes en las subastas [Sandholm, 99]. Las subastas han tenido y tienen muchas
aplicaciones prácticas en el mundo de la informática [Waldspurger et al., 92] [MacKieMason et al., 93] [Huberman et al., 95], e incluso existen varias páginas web en las que
se compran y venden diferentes items usando subastas [Sandholm, 00]. A diferencia de
la votación, donde el resultado afecta a todos los agentes, en las subastas el resultado es
generalmente un trato entre dos agentes, el subastador y uno de los postores. Una
subasta consiste en un subastador y varios postores potenciales. Las subastas son
generalmente discutidas en situaciones en las que el subastador quiere vender un ítem y
conseguir el pago posible más alto, mientras los postores quieren adquirir el ítem al
precio más bajo posible.
3.2.5.1 Tipos de Subastas
En las subastas nos podemos encontrar con tres situaciones diferentes dependiendo de
cómo un agente determina el valor de un ítem (en este caso este valor es el equivalente
monetario de la utilidad): i) subastas de valor privado, el valor de un bien depende
únicamente de las propias preferencias del agente (Ej. la subasta de un pastel que el
ganador se comerá), ii) subastas de valor común, el valor de un bien para un agente
depende enteramente del valor que dicho bien tenga para los restantes agentes, iii).
subastas de valor correlacionado, el valor que el agente asignará al bien dependerá
parcialmente de sus propias preferencias y parcialmente de los valores de los otros (Ej.
si se subasta una tarea que ha de llevarse a cabo, el propio agente postor puede llevarla a
cabo el mismo, en cuyo caso las propias preferencias del agente son las que determinan
el coste de llevar a cabo la tarea, o por el contrario el agente puede contratar la
ejecución de la tarea en cuyo caso el coste depende únicamente de las valoraciones de
los restantes agentes).
3.2.5.2 Protocolos de Subastas

Subasta Inglesa, en esta subasta cada postor es libre de hacer su oferta. En el
momento en que ningún postor desea hacer nuevas ofertas la subasta finaliza, y
el postor con la oferta más alta hasta ese momento gana el bien al precio de
dicha oferta. La estrategia de un agente puede consistir en hacer una serie de
ofertas en función de su valor privado, de sus estimaciones acerca de las
valoraciones de los restantes, y de las ofertas pasadas de los otros. En las
subastas inglesas de valor privado, la estrategia dominante de un agente es
siempre ofertar una pequeña cantidad más que la oferta actual más alta, y parar
29
Universidad de Málaga
cuando se alcanza su precio de valor privado. En subastas de valor
correlacionado las reglas son a menudo variadas: el subastador puede
incrementar el precio en una proporción constante, o bien en la proporción que
éste considere apropiado.

Subasta Primer-Precio Oferta-Sellada, en esta subasta cada postor emite una
oferta sin conocer las ofertas de los otros. La oferta más alta gana el bien y paga
el precio total de su oferta. En este caso la estrategia de un agente es hacer su
oferta en función de su valor privado y de sus creencias acerca de las
valoraciones de los otros. En este tipo de subastas no hay estrategias dominantes
a la hora de hacer ofertas. Suponiendo conocimiento común y considerando las
distribuciones de probabilidad de los valores de los otros agentes, es posible
determinar estrategias en equilibrio de Nash para los agentes [Rasmusen, 89].

Subasta Danesa, en esta subasta el subastador baja continuamente el precio
hasta que una de las ofertas de los postores adquiere el bien al precio actual. Esta
subasta es estratégicamente equivalente a la subasta primer-precio oferta-sellada,
debido a que en ambos protocolos la oferta de un agente importa únicamente si
es la más alta, y ninguna información importante es revelada durante la subasta.

Subasta Vickrey (segundo-precio oferta-sellada), en esta subasta cada postor
hace una oferta sin conocer las ofertas de los otros. El postor que hace la oferta
más alta gana, pero al precio de la segunda oferta más alta [Vickrey, 61]
[Milgrom, 85]. En estas caso la estrategia de un agente consiste en hacer su
oferta en función de su valor privado y de sus creencias acerca de las
valoraciones de los otros. La estrategia dominante en subastas Vickrey de valor
privado es ofertar la valoración real del agente. Si un agente oferta una cantidad
mayor que la real, y el incremento es precisamente la diferencia entre ganar o
no, el agente terminará perdiendo si gana la subasta. Si el agente oferta menos,
la oportunidad de ganar es menor, pero el precio ganador no se ve afectado. Por
tanto, la estrategia dominante en las subastas Vickrey es hacer ofertas sinceras,
sin tener en cuenta las características de los restantes agentes. Esto tiene dos
efectos positivos: 1) los agentes revelan sus preferencias de forma sincera, lo
que permite conseguir decisiones globales más eficientes, y 2) los agentes no
necesitan malgastar esfuerzos en especular acerca de las valoraciones de los
otros agentes.
La subasta Vickrey ha sido ampliamente usada en sistemas multi-agente. Por
ejemplo, se ha usado para asignar recursos computacionales en sistemas operativos
[Waldspurger et al., 92], para asignar ancho de banda en redes de computador
[MacKie-Mason et al., 93], para controlar entornos de construcción computacionales
[Huberman et al., 95]. En [Sandholm, 96] se discuten algunas limitaciones a la
subasta Vickrey en sistemas muti-agente. Por último, las subastas todo-pago son
aquellas en las que todos los postores participantes tienen que pagar algo al
subastador. Estos esquemas han sido usados en algunos sistemas multi-agente
[Lenting et al., 94].
30
Universidad de Málaga
3.2.5.3 Eficiencia de la Asignación Resultante
Cuando se considera una oferta de forma aislada, cada uno de los cuatro protocolos de
subasta (inglesa, danesa, primer-precio oferta-sellada y vickrey) asignan el bien
subastado al postor que más lo valore. Se podría pensar que las subastas de primerprecio dan unos mayores ingresos esperados al subastador, ya que en las subastas de
segundo-precio el subastador sólo consigue el segundo mejor precio. Esto no es así, ya
que en las subastas de primer-precio los postores están motivados a mentir sesgando sus
ofertas a la baja, mientras que en las de segundo-precio éstos ofertan con sinceridad.
El teorema de equivalencia-ingresos [Vickrey, 61] [Milgrom, 85] [Rasmusen, 89]
establece que los cuatro protocolos producen los mismos ingresos esperados al
subastador en subastas de valor privado, donde los valores están distribuidos de forma
independiente. Sin embargo, aunque las cuatro son pareto eficientes en la asignación,
las únicas con estrategias dominantes (Inglesa y Vickrey) son más eficientes en el
sentido en que los agentes no necesitan malgastar esfuerzo en especular acerca de las
valoraciones de los otros postores. Sin embargo, en las subastas de valor correlacionado
las subastas vickrey e inglesa producen unos mayores ingresos al subastador que la
subasta primer-precio oferta-sellada o su equivalente, la subasta danesa.
Un problema que se puede plantear con las cuatro subastas anteriores es la posible
formación de coaliciones. Los postores podrían coordinar los precios de sus ofertas de
modo que las ofertas se establecieran artificialmente bajas. De esta forma los postores
conseguirían el bien a un precio más bajo al que normalmente lo obtendrían. De entre
las cuatro las subastas inglesa y vickrey son las que pueden provocar más acuerdos en la
formación de coaliciones. Por tanto, y con el objetivo de evitar la formación de
coaliciones, las subastas danesa o la subasta primer-precio oferta-sellada son las más
adecuadas.
La falta de sinceridad puede ser otro problema añadido en las subastas. Por ejemplo, en
la subasta vickrey el subastador puede subir artificialmente la segunda oferta más alta
como si fuera la más alta, a menos que un postor pueda verificar esto. De esta forma, el
postor con la oferta más alta tendrá que pagar más de lo que lo haría si el subastador
actuara de forma honesta. Para resolver esto los postores podrían usar firmas
electrónicas encriptadas, de forma que el subastador tendría que presentar la segunda
mejor oferta al postor ganador y no podría alterarla. Las tres subastas restantes no
presentan este problema debido a que el postor que ofrece el precio más alto consigue el
bien al precio de su oferta.
Finalmente, desde el punto de vista de la IAD es importante estudiar los aspectos
computacionales de las subastas. Dos aspectos son muy importantes desde el punto de
vista computacional: 1) la complejidad computacional que se produce cuando se
subastan items interrelacionados, y 2) las implicaciones en los costes computacionales
que suponen la obtención de información en protocolos o subastas de un único paso.
31
Universidad de Málaga
3.2.6 Asignación de Tareas entre Dos Agentes
Rosenschein y Zlotkin [Rosensechein et al., 94] han desarrollado un protocolo de
negociación para sistemas multi-agente computacionales basados en conceptos de
design mechanism de teoría de juegos. Esta aproximación está basada en la suposición
de que los agentes son económicamente racionales. El protocolo es específico para
grupos de dos agentes que deben tener un lenguaje de comunicación común, una
abstracción del problema común, y deben alcanzar una solución común. Los agentes
que siguen este protocolo hacen un trato, e.d. alcanzan un plan conjunto entre ellos que
debería satisfacer todos sus objetivos. Para cada agente la utilidad de un trato es el
beneficio que éste obtiene por la ejecución del trato menos el coste de su parte del
mismo. Cada agente quiere maximizar su propia utilidad. Este protocolo satisface los
criterios de racionalidad individual, estabilidad, simetría, eficiencia u optimalidad de
Pareto e independencia de alternativas irrelevantes.
Además, Rosenschein y Zoltkin [Rosenschein et al., 94] incluyen en su trabajo una
clasificación de los dominios. La clase de juegos más general es la de los dominios
orientados al valor (Worth Oriented Domains, WODs). En éstos los agentes tienen
diferentes preferencias numéricas para los diferentes estados del mundo, y todos ellos
tienen las mismas capacidades y costes para llevar el mundo de un estado a otro. Un
subconjunto de WODs son los dominios orientados a estados (State Oriented Domains,
SODs). En estos las funciones de valor de los agentes son binarias, e.d. los agentes
satisfacen un objetivo o no lo satisfacen, pero no se permite una satisfacción parcial de
los objetivos. Los dominios orientados a tareas (Task Oriented Domains, TODs) son un
subconjunto de los SODs. Aquí los agentes tienen que llevar a cabo una serie de tareas,
y cada agente tiene las capacidades necesarias o recursos para su ejecución. Sin
embargo, es posible que una distribución de las mismas entre los agentes les permita
obtener beneficios.
En términos formales un TOD es una tupla <T, A, c>, donde T es un conjunto de tareas,
A es el conjunto de agentes, y c(X) es una función monótona relativa al coste de
ejecución de las tareas X. La utilidad del trato d para el agente k es:
Uk(d) = c(Tk) – c(dk)
Un trato conflicto D se produce cuando los agentes no pueden llegar a un acuerdo y
alcanzar un trato. Un trato es racional individual si d>D. Un trato d es pareto óptimo si
no hay otro trato d´>d. El conjunto de todos los tratos que son racionales individuales y
pareto óptimos se denomina conjunto de negociación, NS (Negotiation Set). Existen
tres situaciones posibles:
1. Conflicto: si el NS está vacío.
2. Compromiso: los agentes prefieren estar solos, pero puesto que no lo están al
final coinciden en un trato negociado.
3. Cooperativo: todos los tratos en el NS son preferidos por ambos agentes, sobre el
hecho de alcanzar sus objetivos solos.
32
Universidad de Málaga
Si se produce la situación de conflicto los agentes no se beneficiarán negociando sino
que estarán mejor actuando solos. En los otros dos casos la negociación es la mejor
alternativa.
Puesto que los agentes tienen alguna autonomía en su ejecución, éstos pueden mentir o
engañar a los otros a la hora de revelar sus tareas. Rosenschein y Zoltkin [Rosenschein
et al., 94] también han investigado el desarrollo de protocolos en los que los efectos de
la no sinceridad a la hora de revelar las tareas pueden ser estudiados. Concretamente,
dentro de los dominios orientados a tareas se pueden incluir diferentes clases de
dominios considerando la revelación de tareas no sincera: i) TODs subaditivos, aquellos
en los que el coste de llevar a cabo juntos dos subconjuntos disjuntos de tareas, nunca
excede la suma de los costes de llevar a cabo los subconjuntos de forma separada, ii)
TODs cóncavos, son una subclase de los TODs subadtivos. Éstos son dominios en los
que el coste de sumar un conjunto de tareas arbitrario a las tareas originales de un
agente, nunca excede el coste de añadir ese conjunto arbitrario a un subconjunto de las
tareas originales, y iii) TODs modulares, son una subclase de los TODs cóncavos. Son
aquellos dominios en los que el coste de llevar a cabo cualesquiera dos subconjuntos
disjuntos de tareas juntos iguala la suma de los costes de llevarlas a cabo de forma
separada.
En este análisis se distinguen tres tipos de tratos alternativos:



Tratos Puros: a los agentes se les asigna de forma determinista conjuntos
disjuntos de tareas.
Tratos Mixtos: especifican una distribución de probabilidad sobre las particiones
anteriores.
Tratos Todo-o-Nada: son tratos mixtos donde las alternativas sólo incluyen
particiones donde un agente lleva a cabo las tareas de los restantes agentes.
Rosenschein y Zlotkin discuten tres formas de mentir en la revelación de tareas: 1) un
agente puede ocultar tareas no revelándolas, 2) un agente puede declarar tareas
fantasmas que no existen, y que no pueden ser generadas bajo demanada de otro agente,
3) un agente puede anunciar tareas señuelo que realmente no existen, pero que pueden
ser generadas bajo demanda. Las formas de mentir que son posibles en las diferentes
clases de dominio y con diferentes tipos de tratos se resumen en la figura 5. En general,
se puede observar que en los TODs más generales muchos tipos de mentiras pueden
llegar a ser beneficiosas.
TODG
TODG
TODG
TODS
TODS
TODS
TODC
TODC
TODC
TODM
TODM
TODM
Ocul
Fant
Señu
Ocul
Fant
Señu
Ocul
Fant
Señu
Ocul
Fant
Señu
Tratos
Puros
M
M
M
M
M
M
M
M
M
M
Tratos
Mixtos
M
M
M
M
M
Tratos
TodoNada
-
-
-
M
M
Figura 5. En esta tabla se reflejan los resultados de Rosenschein y Zlokin acerca de la
revelación de tareas no sincera.
33
Universidad de Málaga
TODG significa TOD Generales, TODS significa TOD Subaditivo, TODC significa
TOD Cóncavo y TODM significa TOD Modular. Ocul significa tareas ocultas, Fant
tareas fantasmas, Señu tareas señuelo, y M que una mentira de ese tipo específico es
beneficiosa en algunas instancias de problema dentro su clase de dominio
correspondiente y su tipo de trato. En general, el conjunto de negociación, conjunto de
tratos racionales individuales y pareto óptimos, en aquellos TODs que usen tratos TodoNada puede estar vacío.
4 Selección en Tiempo de Ejecución de los Mecanismos de Coordinación
En [Bourne et al., 2000] se argumenta que los agentes autónomos necesitan flexibilidad
a la hora de seleccionar, de una forma dinámica, el mecanismo que éstos quieran usar
para coordinar sus acciones durante la resolución cooperativa de un problema. Para ello
Bourne et al. han desarrollado un marco de trabajo formal que permite representar esta
forma de razonamiento, y así seleccionar en tiempo de ejecución el modelo de
coordinación que los agentes consideren adecuado.
1
2
3
4
5
1
A2
2
3
4
5
CT
A1
ST1
ST2
Figura 6. Ejemplo de un escenario del mundo de malla
Para la ilustración de esta idea sus autores han seleccionado el dominio del mundo de
malla. En éste un grupo de agentes autónomos (Ai) han de llevan a cabo sus tareas
específicas (STi) por las que recibirán un número determinado de unidades de beneficio
(Ri) (figura 6). Además, hay otro tipo de tareas que necesitan varios agentes para su
ejecución llamadas tareas cooperativas (CTs). Cada tarea tendrá un beneficio asociado
con ella, siendo las CTs más beneficiosas que las STs. Los agentes se pueden mover en
la malla un paso cada vez (por unidad de tiempo), y los movimientos son arriba, abajo,
izquierda y derecha, o bien pueden permanecer en su sitio. En cada unidad de tiempo
cada agente tiene un único objetivo, bien su ST o bien una CT. Cuando un agente llega a
una casilla de la malla que contiene su objetivo, el agente recibe su beneficio asociado.
A continuación, en el caso de ST aparece una nueva tarea específica en una posición
aleatoria de la malla, y que únicamente es visible por el agente apropiado. En el caso de
una CT también aparece una nueva tarea cooperativa en una posición aleatoria de la
malla, pero es únicamente visible por aquel agente que llegue a la casilla donde se
encuentra dicha CT.
Si un agente encuentra una CT en su camino a su objetivo actual (su ST), éste debe
decidir si iniciar o no un proceso de coordinación con los restantes agentes para llevar a
cabo la CT, y si es así habrá de seleccionar el Mecanismo de Coordinación (CM) que
usará. Dicho agente también puede decidir que coordinarse no es una opción viable, en
cuyo caso adoptará el CM nulo (e.d. el agente rechaza CT como su objetivo). Para la
34
Universidad de Málaga
selección del CM cada agente tiene un conjunto de CMs a su disposición, estando cada
uno de ellos caracterizado por dos atributos:
1. Coste de Establecimiento (en términos de unidades de tiempo): por ejemplo un
CM puede necesitar t unidades de tiempo para su establecimiento. Estas
unidades de tiempo son modeladas por el agente esperando ese número de
unidades de tiempo antes de solicitar ofertas de cooperación de los restantes
agentes.
2. Probabilidad de Éxito: por ejemplo tener una probabilidad p de éxito significa
que cuando los restantes agentes lleguen a la casilla en la que se encuentra la CT,
el beneficio será asignado con probabilidad p ó bien con probabilidad cero en
cualquier otro caso.
Si el agente decide adoptar la CT como su objetivo, este se convierte en el agente
encargado de la coordinación (AiC). AiC selecciona un CM y después de esperar el
tiempo reglamentario de establecimiento, difunde una petición a los restantes agentes
para que éstos participen en la coordinación. Los restantes agentes responden con
ofertas en las que se especifica la cantidad del beneficio que piden para participar en la
CT, y cuantas posiciones (o unidades de tiempo) están localizados fuera de la casilla en
al que se encuentra la CT. A continuación, se especifica el protocolo que siguen los
agentes en cada unidad de tiempo:
1) Cada agente llega a una casilla. Si su objetivo es alcanzado
recibe el beneficio correspondiente, y actualiza su objetivo.
2) Si el agente encuentra una CT en un cuadrado, éste se convierte
en AiC y decide que CM usar, CM = (t,p). Si t>0 éste debe
esperar t unidades de tiempo y a continuación difundir una
solicitud de coordinación.
3) Si un agente recibe una petición de coordinación, éste decide si
emitir una oferta. Si la decisión es afirmativa y la oferta
tiene éxito, este agente adopta CT como su nuevo objetivo (al
igual que lo hizo AiC). Si no llega ninguna oferta con éxito AiC
vuelve al paso 1).
4) Cada agente decide su próximo movimiento de acuerdo con su
objetivo actual, y todos los agentes hacen sus movimientos
simultáneamente.
Asumimos que todos los agentes en este escenario son esencialmente cooperativos
aunque interesados. Sin embargo, para modelar el hecho de que esto no tiene que ser
siempre así se introduce el concepto de “Deseo de Cooperación de un Agente” (WtC).
Este factor, w, representa la intención que un agente tiene de cooperar más que de
recoger únicamente su beneficio. Un agente neutral únicamente necesita recibir el
mismo beneficio de CT que de su ST (esto se corresponde con un factor WtC de w = 1).
Hay cuatro tipos de decisiones que los agentes han de tomar: 1) Su dirección de
movimiento en la malla, 2) Que CM adoptar, si lo desea, 3) Cuanto ofertar cuando
reciba una petición de coordinación, 4) Cómo determinar que oferta aceptar, si las hay.
1) Dirección de Movimiento. Cada agente decide moverse hacía su objetivo
seleccionando
la
dirección
(izquierda,
derecha,
arriba,
abajo)
35
Universidad de Málaga
probabilísticamente, de acuerdo al ratio de arriba/abajo a izquierda/derecha de
casillas fuera de su objetivo. Ejemplo: si un agente está localizado 4 casillas
arriba y 3 a la derecha de su objetivo, con probabilidad 4/7 se moverá hacía
arriba y con probabilidad 3/7 se moverá a la derecha.
2) CM a Usar. Para esto el agente debe determinar que ventaja obtendrá si decide
cooperar. Esto depende de los CM disponibles, del beneficio obtenido, así como
de varios factores del entorno que pueden afectar las demandas esperadas de los
agentes de coordinación potenciales. Para modelar las demandas esperadas de
los restantes agentes, el AiC asume que éstos están aleatoriamente distribuidos a
través de la malla, y que sus respectivas ST están similarmente distribuidas. Por
tanto, algunos agentes pueden estar cerca de la CT mientras otros pueden estar
lejos. Por este motivo para algunos agentes alcanzar la CT desde su ST les
supondrá una desviación significativa, mientras para otros coordinarse para
alcanzar la CT no les supondrá ninguna desviación ya que ésta se encuentra en
su ruta hacía su ST.
El AiC selecciona los posibles CMs en base a dos criterios: i) cuánto puede tardar en
llevar a cabo la tarea (incluyendo el tiempo de establecimiento y la distancia media a
la que cada agente se encuentra situada del cuadrado donde la CT esta situado), ii) el
beneficio que puede obtener después de deducir el beneficio esperado de los otros
agentes (basado sobre la cantidad de tiempo que ellos deben emplear desviándose de
su ruta y en la probabilidad de éxito del CM). Aunque estos criterios no son criterios
globalmente óptimos para decidir que CM usar, estos pueden tener sentido desde el
punto de vista de un agente auto-interesado.
3) Cuanto Ofertar. Cuando un agente recibe una petición para iniciar una
coordinación, éste debe emitir una oferta basada en la cantidad de beneficio que
pediría para compensar su desviación de la ruta que le lleva a su ST, así como
contemplar la posibilidad de que el CM seleccionado podría fallar. Además,
también comunican a AiC su distancia actual a la casilla en la que se encuentra
la CT
4) Que Oferta Aceptar. Una vez que AiC ha recibido ofertas de todos los agentes
selecciona aquella oferta que maximiza su beneficio, teniendo en cuenta toda la
información que ha recibido. En el caso de que no se reciba ninguna oferta con
beneficio positivo, AiC vuelve al paso 2 del protocolo e intenta coordinarse de
nuevo.
Este modelo de razonamiento ha sido evaluado de forma empírica, con el objetivo
de mostrar sus efectos sobre los agentes individuales y el sobre el sistema completo.
Un primer grupo de experimentos mostró que la elección del CM depende en gran
medida del posicionamiento de la CT. Si la distancia de la CT al centro de la malla
se incrementa, el tiempo esperado para que un agente alcance la CT también se
incrementa. Por este motivo para que dicho agente justifique su elección de la CT
sobre su ST, el AiC ha de asegurar que la cooperación tendrá éxito. Esta es la razón
por la que en estas posiciones se seleccionan CMs con mayor probabilidad de éxito.
Sin embargo, si la CT se posiciona más hacía el centro de la malla, el tiempo que
36
Universidad de Málaga
AiC ha de esperar por término medio para que llegue otro agente será mucho menor,
por eso puede permitirse una probabilidad de fallo mayor en el CM. Por tanto, en
estas situaciones el AiC selecciona el CM que minimicen el tiempo de
establecimiento.
Un segundo grupo de experimentos mostró que un factor clave a la hora de
determinar la cantidad de cooperación que se produce es el tamaño de la malla. A
medida que el tamaño de la malla se incrementaba la utilidad del sistema se
decrementaba (esto es debido a que los agentes en este caso tienen menor
oportunidad de cooperar en la CT). Por último, un tercer grupo de experimentos
estudió el efecto del factor WtC. Los resultados mostraron que a medida que se
incrementaba el factor w, se decrementaban el número de CTs que se iniciaban y
llevaban a cabo.
5 Soporte Operacional para los Mecanismos de Coordinación (agentes heterogéneos
y sistemas abiertos)
Los agentes pueden mejorar la coherencia del mecanismo de coordinación utilizado
para la resolución del problema planificando el tipo, el contenido, la cantidad y la
temporización de la comunicación que los agentes intercambian entre sí. Se ha
observado que la utilización de abstracción e información a un meta nivel es útil debido
a que ésta puede ayudar a decrementar la sobrecarga de comunicación.
Sin embargo, en entornos abiertos y dinámicos habitados por agentes heterogéneos
(como puede ocurrir con Internet), es necesario afrontar asuntos adicionales entre los
que destaca la interoperabilidad entre agentes. Lógicamente los agentes necesitan
interactuar los unos con los otros para cumplir los objetivos de sus diseñadores. En tales
entornos abiertos para que los agentes puedan coordinarse los unos con los otros, se han
de solucionar dos problemas importantes: 1) los agente han de ser capaces de localizarse
los unos con los otros (en un entorno abierto los agentes pueden aparecer y desaparecer
impredeciblemente), y 2) los agentes han de ser capaces de comunicarse e interoperar.
5.1 Agentes Intermediarios
Los agentes intermediarios [Kuokka et al, 96] han sido unas de las soluciones
propuestas al primer problema. Estos agentes permiten a un sistema operar de forma
robusta enfrentándose a apariciones y desapariciones de agentes, así como a
comunicaciones intermitentes. Cada agente que necesite coordinarse anuncia sus
capacidades a un agente intermediario. Éstos emparejan anuncios de peticiones con las
correspondientes capacidades también anunciadas. Se han identificado diferentes tipos
de agentes intermediarios [Chi Wong et al., 00], incluyendo agentes Matchmakers o
Páginas Amarillas (Figura 7), y agentes Brokers o Facilitadores (Figura 8). La
principal diferencia entre ambos tipos es que los agentes facilitadores hacen de
intermediarios en todas las transacciones, a diferencia de los agentes páginas amarillas
que únicamente ponen en contacto al agente que solicita una capacidad con el o los
agentes que la proporcionan, y a partir de ese momento ya no actúan de intermediarios.
37
Universidad de Málaga
Peticiones de Servicios
Matchmaker
Demandante
Descripción de Proveedores
Resultados
de la
Petición de
Servicios
Delegación
de Servicios
Anuncios de
Capacidades
Proveedor 1
Proveedor n
Figura 7. Matchmaker o Páginas Amarillas
Además de esta diferencia fundamental, se ha podido observar en determinados
experimentos [Decker et al., 97] que cada tipo de agente intermediario tiene ciertos
comportamientos característicos. Por ejemplo, mientras los agentes Broker son más
vulnerables a ciertos fallos, son también más capaces de hacer frente a trabajos más
rápidamente fluctuantes.
Delegación de Servicio
Broker
Demandante
Resultados de Servicio
Delegación
de
Servicios
Delegación
de Servicios
Proveedor 1
Anuncios de
Capacidades
Proveedor n
Figura 8. Facilitador o Broker
Además de esta diferencia fundamental, se ha podido observar en determinados
experimentos [Decker et al., 97] que cada tipo de agente intermediario tiene ciertos
comportamientos característicos. Por ejemplo, mientras los agentes “Broker” son más
vulnerables a ciertos fallos, son también más capaces de hacer frente a trabajos más
rápidamente fluctuantes.
5.2. Lenguajes de Comunicación de Agentes
Los lenguajes de comunicación entre agentes (ACLs) permiten a los agentes interactuar
mientras ocultan los detalles de sus trabajos internos, permitiendo de este modo a la
comunidad de agentes resolver problemas que los agentes individuales por si solos no
podrían. Un ACL proporciona a los agentes un medio de intercambiar información y
38
Universidad de Málaga
conocimiento, y aunque otros mecanismos se han utilizado para lograr estos objetivos
(Ej. llamada remota a procedimientos, RPC, ó invocación de métodos remotos, RMI), lo
que distingue a los ACLs de estos últimos es fundamentalmente su complejidad
semántica. Los ACLs sostienen proposiciones, reglas y acciones en lugar de simples
objetos con ninguna semántica asociada a ellos. Además un mensaje ACL describe un
estado deseado en un lenguaje declarativo, más que un procedimiento o un método.
A un nivel técnico, cuando se usa un ACL los agentes transportan mensajes sobre la red
usando un protocolo de bajo nivel (SMTP, TCP/IP, IIOP ó HTTP). Además, el ACL
define el tipo de mensajes (y sus significados) que los agentes pueden intercambiar.
Estos tipos de mensajes son concebidos como actos de habla los cuales se describen y
definen en términos de creencias, deseos, intenciones y modalidades similares. Este tipo
de descripción a nivel intencional permite describir un amplio rango de agentes BDI,
que tienen alguna representación implícita o explícita de las correspondientes
modalidades. Esta representación se construye por encima de un sustrato que describe el
modelo conceptual del conocimiento, objetivos y compromisos de un agente. Todo esto
es comúnmente conocido como teoría BDI.
Aunque el objetivo de un ACL es capturar las actitudes proposicionales sin preocuparse
de cómo se expresan estas proposiciones, estas proposiciones son importantes puesto
que indican acerca de están hablando los agentes Una propuesta de KSE (Knowledge
Sharing Effort) fue usar KIF (Knowledge Interchange Format) como un estándar para
describir elementos o items dentro de los sistemas computacionales tales como sistemas
expertos, bases de datos, agente inteligentes y demás. KSE diseña KIF para hacerlo útil
como un lenguaje intermedio o mediador en la traducción de otros lenguajes. KIF es un
lenguaje lógico. Éste es una versión prefija del cálculo de predicados de primer orden,
con extensiones para soportar meta-operadores y definiciones. El problema de la
ontología, es decir, el problema de cómo los agentes pueden compartir significados,
también ha sido abordado. Ontolingua [Farquhar et al., 96] ha sido la solución propuesta
por KSE. Éste es un lenguaje diseñado para describir ontologías, y proporciona además
una variedad de herramientas de apoyo que permiten desarrollar y mantener las
ontologías.
Ejemplos de ACL pueden ser KQML (Knowledge Query and Manipulation Language)
[Labrou et al., 97] y FIPA ACL (Foundations for Intelligent Physical Agents). La
semántica de KQML ha sido quizás el asunto más importante en el debate sobre ACLs.
Por otro lado, FIPA ACL es un lenguaje de desarrollado por la FIPA (www.fipa.org),
que ha sido la primera organización que ha encaminado sus esfuerzos al desarrollo de
estándares en el campo de los agentes. En [Labrou et al., 99] podemos encontrar una
interesante evaluación comparativa entre ambos, que va más allá del asunto de la
semántica y apunta a las limitaciones prácticas que comparten estos ACLs.
6 Referencias
[Arrow, 63] Arrow, K. “Social choice and individuals values”. New Haven, Cowles
Foundation, 2nd Edition, 1963.
[Bond et al., 88] Bond A.H. and Gasser, L. “Readings in Distributed Artificial
Intelligence”. San Francisco, Morgan Kaufmann, 1988.
39
Universidad de Málaga
[Bourne at al., 00] Bourne, R., Excelente-Toledo, C., and Jennings, N. “Run-Time
Selection of Coordination Mechanisms in Multi-Agent Systems”. In Proc. of the 14th
European Conference on Artificial Intelligence, ECAI-2000, pp. 348-362, 2000.
[Cammarata et al., 83] Cammarata, S., McArthur, D. and Steeb, R. “Startegies of
Cooperation in distributed Problem Solving”. In Proc. of the 8th International Joint
Conference on Artificial Intelligence, pp. 767-770, Germany, 1983.
[Cheng et al., 95] Cheng, J.Q. and Wellman, M.P. “The walras algorithm: A convergent
distributed implementation of general equilibrium outcomes”. Computational
Economics, 1997.
[Chi Wong et al., 00] Chi Wong, H. and Sycara, K. “ A Taxonomy of Middle-Agents
for the Internet”. In Proc. Of the 4th International Conference on Multiagent Systems
(ICMAS-00), 2000.
[Clarke, 71] Clarke, E.H. “Multipart pricing of public goods”. Public Choice (11),
pp.17-33, 1971.
[Cohen et al., 91] Cohen, P.R and Levesque, H. J. “Teamwork”. Nous, 25(4), pp. 487512, 1991.
[Corkill et al., 83] Corkill, D.D. and Lesser, V.R. “The Use of Metalevel Control for
Coordination in a Distributed Problem-Solving Network”. In Proc. of the 8th
International Joint Conference on Artificial Intelligence (IJCAI-83), pp.767-770, 1983.
[Corkill, 79] Corkill, D.D. “Hierarchical Planning in distributed environment. In Proc.
of the 6th International Joint Conference on Artificial Intelligence, pp. 168-175,
Cambridge, 1979.
[Decker at al., 92] Decker, K.R. and Lesser V.R. “The analysis of quantitative
coordination relationships”. In Proc. of 11th International Workshop on Dstributed
Artificial Intelligence, pp.59-76, Glen Arbor, 1992.
[Decker at al., 97] Decker, K., Sycara, K. and Williamson, M. “Middle-Agents for the
Internet”. In Proc. Of the 15th International Joint Conference on Artificial Intelligence,
(IJCAI-97), 1997.
[Decker et al., 96] Decker, K., Sycara, K. and Williamson, M. “Middle-agents for the
internet”. In Proc. of the fifteenth International Joint Conference on Artificial
Intelligence (IJCAI-97), Nagoya, Japan, 1997.
[Durfee et al. 87] Durfee, E.H. Lesser, V.R. and Corkill, D.D. “Coherent Cooperation
among Communicating Problem Solvers”. IEEE Transactions on Computers, C-36 (11),
pp. 1275-1291, 1987.
[Durfee et al., 94] Durfee, E. and Rosenschein, J. “Distributed Problem Solving and
Multi-Agent Systems: Comparisions and Exmaples”. In Proc. of the 13th International
DAI Workshop, pp. 94-104, 1994.
[Durfee, 91] Durfee, E.H. and Lesser, V.R. “Partial Global Planning: A coordination
framework for distributed hypothesis formation”. IEEE Transactions on Systems, Man
and Cybernetics, 21(5), pp. 1167-1183, 1991.
[Durfee, 99] Durfee, E.H. “Practically Coordinating”. AI Magazine, 20(1), pp. 99-116,
1999.
[Ephrati et al., 91] Ephrati, E. and Rosenschein, J.S. “The Clarke tax as a consensous
mechanism among automated agents”. In Proc. of the National Conference on Artificial
Intelligence, pp. 173-178, 1993.
[Ephrati, 94] Ephrati, E. “A non-manipulable meeting scheduling system”. In Proc. of
the 13th International Distributed Artificial Intelligence Workshop, 1994.
40
Universidad de Málaga
[Farquhar et al., 96] Farquhar, A., Fikes, R. and Rice, J. “The Ontolingua Server: A
Tool for Collaborative Ontology Construction”. Tech. Report KSL-96-26, Standford
Knowledge Systems Laboratory, 1996.
[Friedman, 91] Friedman, J. “Teoría de Juegos con Aplicaciones a la Economía”. Ed.
Alianza Universidad, 1991.
[Gasser, 92] Gasser, L. “ DAI approaches to Coordination”. N.M. Avouris and L.
Gasser, ed. Distributed Artificial Intelligence: Theory and Praxis. pp 31-51, Kluwer
Academic Publishers, Boston, 1992.
[Georgeff, 83] Georgeff, M.P. “Communication and action in multi-agent planning”. In
Proc. of the 3rd National Conference of Artificial Intelligence, pp. 125-129, Washington
D.C., 1983.
[Gmytrasiewicz et al, 95] Gmytrasiewicz, P.J. and Durfee, E.H. “A Rigorous
Operational Formalization of Recursive Modeling”. In Proc. of the first International
Conference on Multi-Agent Systems, pp. 125-132, San Franscisco, AAAI Press, 1995.
[Grosz et al, 96] Grosz, B. and Kraus, S. “Collaborative plans for complex group
actions”. Artificial Intelligence, 86 (2), pp.269-357, 1996.
[Groves et al., 77] Groves, T. and Ledyard, J. “Optimal allocation of public goods: a
solution to the `free-rider´ problem. Econometrica, 45, pp.783-809, 1977.
[Harsanyi, 56] Harsanyi, J. “Approaches to the Bargaining Problem Before and After
the Theory of Games”. Econometrica, 24, pp.144-156, 1956.
[Hart, 97] Hart, S. “Classical Cooperative Theory I: Core-Like Concepts”. Cooperation:
Game-Theoretic Approaches. NATO ASI Series, Hart, S. & Mas-Colell, A. Eds. F 155,
1997.
[Huberman et al., 95] Huberman, B. and Clearwater, S.H. “ A multi-agent system for
controlling building environments”. In Proc. of the First International Conference on
Multi-Agent Systems (ICMAS), pp. 171-176, 1995.
[Huhns et al., 99] Hunhns, M. N. and Stephens, L.M. “Multiagent Systems and
Societies of Agents”. G. Weiss ed. Multiagent Systems: A Modern Approach to
Distributed Artificial Intelligence. pp 79-120. The MIT Press, 1999.
[Jennings et al., 97] Jennings, N. and Campos, J. “Towards a Social Level
Characterisation of Socially Responsible Agents”. IEEE Proc. On Software
Engineering, 144(1), 1997.
[Jennings et al., 98] Jennings, N.R., Sycara, K., and Wooldridge, M. “ A Roadmap of
Agent Research and Development”. Autonumous Agents and Multi-Agent Systems, 1,
pp. 275-306, 1998.
[Jennings, 96] Jennings, N.R. “Coordination Techniques for Distributed Artificial
Intelligence”. In G.M.P. O`Hare and N.R. Jennings, ed., Foundations of Distributed
Artificial Intelligence, pp. 187-210. John Wiley and Sons Inc., New York, 1996.
[Kalai et al., 75] Kalai, E., Somorodinsky, M. “Other Solutions to Nash´s Bargaining
Problem”. Econometrica 43, pp. 513-518, 1975.
[Kalai, 77] Kalai, E. “Proportional Solutions to Bargaining Solutions: Interpersonal
Utility Comparations”. Econometrica 45, pp.1623-1630, 1977.
[Kraus et al., 95] Kraus, S., Wilkenfeld, J. and Zlotkin, G. “Multiagent Negociation
under time constraints”. Artificial Intelligence , 75, pp. 297-345, 1995.
[Kreps, 90] Kreps, D.M. “A Course in Microeconomic Theory”. Princenton University
Press, 1990.
41
Universidad de Málaga
[Kuokka et al., 96] Kukkoa, D.R. and Harada, L.P. “Issues and extensions for
information matchmaking protocols”. International Journal of Cooperative Information
Systems, 5(2-3), pp. 251-274, 1996.
[Labrou et al., 97] Labrou, Y. and Finin, T. “A Proposal for a New KQML
Specification”. Tech. Report TR-CS-97-03, Computer Science and Electrical
Engineering Dept., Univ. of Maryland, Baltimore County, 1997.
[Labrou et al., 99] Labrou, Y., Finin, T. and Peng, Y. “Agent Communication
Languages: The Current Landscape”. IEEE Intelligent Systems, March/April, 1999, pp.
45-52, 1999.
[Lander et al. 93] Lander, S.E. and Lesser, V.R. “Understanding the role of negotiation
in distributed search among heterogeneous agents”. In Proc. of the Thirteenth
International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 438-444, 1993.
[Lander et al., 91] Lander, S., Lesser, V.R., and Connell, M.E. “Conflict-Resolution
Strategies for Cooperating Expert Agents”. In CKBS-90, Proc. of the International
Working Conference on Cooperating Knowledge-Based Systems, ed. S.M. Deen, pp.
183-200, Springer-Verlag, 1991.
[Lenting et al., 94] Lenting, J. and Braspenning, P. “ An all-pay auction approach to
reallocation”. In Proc. of the 11th European Conference on Artificial Intelligence, pp.
259-263, 1994.
[Lesser et al., 81] Lesser, V.R. and Corkill, D.D. “Functionally accurate cooperative
distributed systems”. IEEE Transactions on System, Man and Cybernetics SMC-11(1),
pp.81-96, 1981.
[Levesque et al., 90] Levesque, H. J., Cohen, P.R., and Nunes, J. H. T. “On acting
together”. In Proc. of the 8th National Conference on Artificial Intelligence (AAAI-90),
Boston, pp.94-99, 1990.
[MacKie-Mason et al., 93] MacKie-Mason, J.K. and Varian, H.R. “Pricing the
Internet”. In Proc. of the Public Access to the Internet Conference. JFK School of
Government, 1993.
[Milgrom, 85] Milgrom, P.R. “ The economics of competitive bidding: a selective
survey”. In L. Hurwicz, D. Schmeidler, H. Sonnenschein, eds. Social goals and social
organizations: Essays in memory of Elisha Pazner, Chapter 9, pp. 261-292, Cambridge
University Press, 1985.
[Mullen et al., 95] Mullen, T. And Wellman, M.P. “A simple computational market for
network information services “. In Proc. of the first International Conference on MultiAgent Systems (ICMAS-95), pp. 283-289, San Francisco, 1995.
[Müller, 96] Müller, H. “Negotiation Principles”. In G.M.P. O`Hare and N.R. Jennings,
ed., Foundations of Distributed Artificial Intelligence, pp. 187-210. John Wiley and
Sons Inc., New York, 1996.
[Nash, 50] Nash, J.F. “The bargaining Problem”. Econometrica 28, pp.155-162, 1950.
[Newell, 90] Newell, A. “Unified Theories of Cognition”. Harvard University Press,
1990.
[Ossowski, 97] Ossowski, S. “Contribución al estudio functional de las sociedades
artificiales de agentes”. Tesis Doctoral, Universidad Politecnica de Madrid, 1997.
[Pattison et al., 87] Pattison, H.E.,Corkill, D.D. and Lesser, V.R. “Instantiating
descriptions of organizational structures”. M.N. Hunhns ed. Distributed Artificial
Intelligence, Morgan Kaufmann, London, 1987.
42
Universidad de Málaga
[Pope at al., 92] Pope, R.P., Conry, S.E. and Mayer, R.A. “Distributing the planning
process in a dynamic environment”. In Proc. of 11th International Workshop on
Distributed Artificial Intelligence, pp. 317-331, Glen Arbor, 1992.
[Rasmusen, 89] Rasmusen, E. “Games and Information”. Basil Blackwell, 1989.
[Rosenschein et al., 94] Rosenschein, J. S. and Zoltkin, G. “Rules of Encounter”. The
MIT Press, 1994.
[Rubinstein, 82] Rubinstein, A. “Perfect Equilibrium in a Bargaining Model”.
Econometrica, 50, pp. 97-109, 1982.
[Russel et al., 95] Russel, S. and Norving, P. “ Artificial Intelligence: A Modern
Approach”. Prentice-Hall, 1995.
[Sacerdoti, 77] Sacerdoti, E.D. “A Structure for Plans and Behaviour”. Elsevier,
Amsterdam, 1977.
[Sandholm et al., 95] Sandholm, T. and Lesser, V.R. “Issues in Automated Negotiation
and Electronic Commerce: Extending the Contract Net Protocol”. In Proc. of Second
International Conference on Multiagent Systems, AAAI Press, pp.328-335, 1995.
[Sandholm et al., 97] Sandholm, T., Lesser, V. “Coalitions among computationally
bounded agents”. Artificial Intelligence, 94 , pp. 99-137, 1997.
[Sandholm, 96] Sandholm, T.W. “Negotiation among Self-Interested Computationally
Limited Agents”. PhD thesis, University of Massachusetts, Amherst, 1996.
[Sandholm, 99] Sandholm, T. W. “Distributed Rational Decision Making”. Weiss, G.
ed. Multiagent Systems: A Modern Approach to Distributed Artificial Intelligence,
pp.201-258, The MIT Press, 1999.
[Sandholm, et al., 99b] Sandholm, T., Larson, K., Anderson, M., Shehory, O, and
Thome, F. “Coalition Structures with Worst Case Guarantees”. Artificial Intelligence,
111 (1-2), pp. 209-238, 1999.
[Sandholm, 00] Sandholm, T. “eMediator: A Next Generation Electronic Commerce
Server”. In Proc of Autonomous Agents, AGENTS-00, pp.341-348, 2000.
[Shapley, 53] Shapley, L.S. “A value for n-person games”. In Contributions to the
Theory of Games II (Annals of Mathematics Studies 28), Khun, H., Tucker, A. Eds.
Princenton University Press, 307-317, 1953.
[Shoham et al., 92] Shoham, Y. and Tennenholtz, M. “On the synthesis of useful social
laws for artificial agent societies. In Proc. Nat. Conf. Artificial Intelligence, 10th,
(AAAI-92) San José pp.276-281, 1992.
[Singh, 90] Singh, M.P. “ Group Intentions”. In Proc. of 10th Workshop Distributed
Artificial Intelligence, Bandera, TX, MCC Tech. Rep. ACT-AI-355-90.
[Smith, 80] Smith, R. G. “ The Contract Net Protocol: High Level Communication and
Control in Distributed Problem Solver”. IEEE Transactions on Computers, C-29 (12),
pp.1104-1113, 1980.
[Sycara, 90] Sycara, K.P. “Persuasive argumentation in negotiation”. Theory and
Decision, 28, pp. 203-242, 1990.
[Sycara, 97] Sycara, K. “Using Option Pricing to Value Commitment Flexibility in
Multiagent Systems”. Tech. Report, CMU-CS-TR-97-169, School of Computer
Science, Carnegie Mellon University, 1997.
[Tambe, 97] Tambe, M. “Recursive agent and agent group tracking in a real-time,
dynamic environment”. In Proc. of the first International Conference on Multi-Agent
Systems, San Francisco, pp.368-375, 1995.
43
Universidad de Málaga
[Thomson, 97] Thomson, W. ”Cooperative Theory of Bargaining I: Classical”.
Cooperation: Game-Theoretic Approaches. NATO ASI Series, Hart, S. & Mas-Colell,
A. Eds. F 155, 1997.
[Varian, 92] Varian H.R. “Microeconomic analysis”. New York: W.W. Norton, 1992.
[Vickrey, 61] Vickrey, W. “Counterspeculation, autions, and competitive sealed
tenders”. Journal of Finance, 16, pp. 8-37, 1961.
[Von Martial, 92] von Martial, F. “Coordination by negotiation based on a connection
of dialogue states with actions”. In Proc. of the 11th Workshop on Distributed Artificial
Intelligence, pp. 227-246, Glen Arbor, 1992.
[Von Neumann, 44] Von Neumann, J., Morgenstern, O. “Theory of Games and
Economic Behaviour”. Princenton University Press, 1944.
[Waldspurger et al., 92] Waldspurger, C.A., Hogg, T., Hunerman, B., Kephart, J. and
Stornetta, W.S. “Spawn: A distributed computational economy”. IEEE Transactions on
Software Engineering, 18 (2), pp. 103-117, 1992.
[Wellman, 93] Wellman, M.P. “A market-oriented programming environment and its
application to distributed multicommodity flow problems”. Journal of Artificial
Intelligence Research, 1, pp.1-23, 1993.
[Wellman, 94] Wellman, M.P. “A computational market model for distributed
configuration design”. In Proc. 12th National Conference on Artificial Intelligence
(AAAI-94), Seattle, pp. 401-407, 1994.
[Wellman, 95] Wellman, M.P. “Market-Oriented Programming: some early Lessons”.
In Clearwater, S. ed. “Market-based Control: A Paradigm for Distributed Resource
Allocation”, World Scientific, 1995.
[Werkman, 92] Werkman, K.J. “Multiple agent cooperative design evaluation using
negotaiation”. In Proc. of the second International Conference on Artificial Intelligence
in Design, Pittsburgh, 1992.
[Werner, 89] Werner, E. “Cooperating Agents: A unified theory of communication and
social structure”. L. Gasser and M.N. Huhns, ed. Distributed Artificial Intelligence, 2,
pp. 3-36, Morgan Kaufmann, London, 1989.
[Wu, 77] Wu, L.S. “A dynamic theory for the class of games with nonempty cores”.
SIAM Journal of Applied Mathematics, 32, pp. 328-338, 1977.
[Zeuthen, 30] Zeuthen, F. “Problems of Monopoly and Economic Warfare”. Routledge
& Kegan, P, 1930.
[Zoltkin et al., 94] Zoltkin, G., Rosenschein, J. “Coalition, Cryptography and Stability:
mechanisms for coalition formation in task oriented domain”. In Proc. of the National
Conference on Artificial Intelligence, pp. 432-437, Seattle, 1994.
44
Descargar