Chapitre 2 PDF

Agents et Systmes
Multi-agents
Adina Magda Florea

Professeur lUniversit Politehnica de Bucarest
adina@cs.pub.ro
URL du cours: http://turing.cs.pub.ro/auf2/

Architectures des agents
Plan
! La rationalit des agents

! Structure conceptuelle des agents
! Architectures des agents intelligents
o Architecture BDI
o Architecture ractive
o Architecture hybride
! Programmation oriente agents
2
Cours Agents et SMA A.M. Florea, UPB
1. La rationalit des agents
! Un agent rationnel est un agent qui agit d'une
manire lui permettant d'obtenir le plus de succs
possible dans la ralisation des tches qu'on lui a
assignes.
! Comment peut-on mesurer le succs d'un agent
"rationnel"?
! Une mesure de performance, si possible
objective, associe une certaine tche que l'agent
doit excuter.
3
2. Structure conceptuelle des
agents
! Un agent est situ dans un environnement.
E={e1, .., e, ..}
! Environnement
accessible ou inaccessible
dterministe ou non dterministe
statique ou dynamique
discret ou continu
4
Modlisation des agents
Composante
dcision Agent ractif
action Agent voir : E P
action : P A
Composante Composante env : E x A P(E)
perception excution
voir action
Environment
env
5
Plusieurs agents ractifs

env : E x A1 x An P(E)
inter : P I
Composante Agent rinter : I A
dcision Composante
action interaction Agent
inter / rinter
Composante Composante
perception excution Agent
voir action
Environment
env
6
Agents cognitifs
Agents avec tats
! action : S A
! suiv : S x P S
! inter : S x P I
! rinter : S x I A
! voir : E P
! env : E x A P(E)
7
Agents avec buts

but : E {0, 1}
Agents avec utilit

utilit : E R
Environnement non dterministe env : E x A P(E)

la probabilit estime par l'agent que le rsultat de l'excution
de l'action a dans ltat e sera ltat e
prob( ex( a, e ) = e' )

e' env( e, a)
= 1
8
! L'utilit attendue d'une action dans l'tat e du

point de vue de l'agent
U (a, e) = prob (ex ( a , e ) = e ' )*utilite (e ' )

e 'env ( e , a )
! Le principe de la plus grande utilit attendue -

utilit attendue maximale, en anglais Maximum
Expected Utility (MEU) - dit qu'un agent rationnel
devrait choisir l'action qui lui apporte la plus
grande utilit attendue.
9
Comment modliser ce probleme
! Agents ractifs
! Agents avec tats
! Agents avec buts
! Agents avec utilit
10
3. Architectures des agents
intelligents
3.1 Architecture BDI
Modle "Croyance-Dsir-Intention" de la rationalit d'un agent
intelligent
! Le B = Belief = Croyance
! Les croyances d'un agent sont les informations que l'agent possde sur
lenvironnement et sur d'autres agents qui existent dans le mme
environnement.
! Le D = Desire = Dsir
! Les dsirs d'un agent reprsentent les tats de lenvironnement, et
parfois de lui-mme, que l'agent aimerait voir raliss.
! Le I = Intention = Intention
! Les intentions d'un agent sont les dsirs que l'agent a dcids
d'accomplir ou les actions qu'il a dcid de faire pour accomplir ses
dsirs. 11
Architecture BDI
B=revc(B,p)
Croayances
Rvision des
croyances
Analyseur
opportunits
Procs de dcision
perceptions
I=options(D,I)
Intentions Dsirs
D=des(B,D,I)
Raisonnement
modalits
Filtre
I=filtre(B,D,I)
Intentions structures
LibP dans plans partiels
PE=plan(B,I)
Plans Execution actions
revc : B x P B est la fonction de rvision des croyances de
l'agent lorsqu'il reoit de nouvelles perceptions sur
lenvironnement, o P reprsente l'ensemble des perceptions de
l'agent; elle est ralise par la composante Rvision des
croyances ;
options : D x I I est la fonction qui reprsente le processus de
dcision de l'agent prenant en compte ses dsirs et ses intentions
courantes; cette fonction est ralise par la composante
Processus de dcision ;
des : B x D x I D est la fonction qui peut changer les dsirs
d'un agent si ses croyances ou intentions changent, pour
maintenir la consistance des dsirs de l'agent (on suppose dans
notre modle que l'agent a toujours des dsirs consistants) ; cette
fonction est galement ralise par la composante Processus de
dcision ;
filtre :B x D x I I est la fonction la plus importante
car elle dcide des intentions poursuivre; elle est
ralise par la composante Filtre.
plan : B x I PE est la fonction qui transforme les
plans partiels en plans excutables, PE tant
l'ensemble de ces plans ; elle peut utiliser, par
exemple, une bibliothque de plans, reprsente par le
module LibP dans la figure.
! Un plan est une squence d'actions excuter dans le

temps
Soient B0, D0 et I0 les croyances, dsirs et intentions initiales de
l'agent.
Algorithme de contrle d'agent BDI
1 B B0
2 D D0
3 I I0
4 rpter
4.1 obtenir nouvelles perceptions p
4.2 B revc(B, p)
4.3 I options(D, I)
4.4 D des(B, D ,I)
4.5 I filtre(B, D, I)
4.6 PE plan(B, I)
4.7 excuter(PE)
jusqu' ce que l'agent soit arrt
fin
Stratgie d'obligation
! Obligation aveugle.Un agent suivant cette stratgie va

maintenir ses intentions jusqu' ce qu'elles soient
ralises, plus prcisment jusqu' ce qu'il croie qu'elles
sont ralises.
! Obligation limite. Cette stratgie dit que l'agent va
maintenir ses intentions ou bien jusqu' ce quelles soient
ralises ou bien jusqu' ce quil croie quelles ne sont
plus ralisables.
! Obligation ouverte. Un agent ayant une stratgie
d'obligation ouverte maintient ses intentions tant que ces
intentions sont aussi ses dsirs; une fois que l'agent a
conclu que ses intentions ne sont plus ralisables, il ne
les considre plus parmi ses dsirs. 16
3.2 Architecture ractive
Architecture ractive de subsomption

Module Competence (2)
Exploration de
l'environnement
Node
Composante Node de
Entre d'inhibition Composante Sortie
perception supression excution
Deplacement dans
l'environnement

Eviter les obstacles
17
! Le fonctionnement de l'agent - rgles de comportement,
"behaviour rules" en anglais.
! Une rgle de comportement est semblable une rgle de
production et elle a deux parties: une condition c et une action a.
! L'ensemble de rgles de comportement
Comp = {(c, a) | cP, aA}
! Chaque module de comptence a associ un sous-ensemble des
rgles de comportement spcifiques ses comptences.
! Relation d'ordre ou relation inhibitrice totale sur l'ensemble
Comp, : Copm x Comp qui tablis la priorit des modules de
comptence.
! R - l'ensembles des rgles de comportement qui peuvent tre
excutes un certain moment
! Les rgles qui sont effectivement excuts sont
{(c, a)| (c', a') tel que (c', a') (c, a)}
3.3. Architecture hybride
! Systme InteRRaP ("Integration of Reactive

Behavior and Rational Planning" = Intgration du
comportement ractif et planification rationnelle).
! L'architecture InteRRaP est une architecture en

couches avec des couches verticales o les
donnes d'entre, notamment les perceptions,
passent d'une couche l'autre.
19
Sortie
Composante excution
Architecture hybride
Couche n
en couches verticales
Couche n-1

Couche 1
Composante perception
Entre
Couche
planification AR PE BC-Sociale
cooprative
Couche
Architecture planification BC-Planification
AR PE
InteRRaP locale
Couche BC-Monde
comportement AR PE
ractif
Perceptions Actions Communication
Environnement
Architecture TuringMachine
! Le systme TuringMachine.
! L'architecture du systme est une architecture en
couches horizontales, semblable l'organisation
de l'architecture de subsomption, o chaque
couche est responsable excuter des actions de
plus en plus complexes.
Couche n
Composante Composante
perception action
Couche 2
Couche 1
Architecture horizontale
22
4. Programmation oriente agents
POO POA
Unit de base objet agent
Paramtres dfinissant pas de contraintes croyances, dcisions, Programmation

l'tat de l'unit de base obligations, habilits
Oriente Objets
versus
Procs de calcul envoi des messages et envoi des messages et Programmation
mthodes pour la mthodes pour la
rponse rponse Oriente Agents
AGENT0
Types de messages pas de contraintes informer, demander,
offrir, promettre, Yoav Shoham
accepter, rejeter,
Contraintes sur les pas de contraintes consistance, vrit,

mthodes
23
D'autres diffrences entre POO et POA
! les agents sont autonomes alors que les objets ne le sont pas; un agent
va dcider par son propre procs de dcision s'il excute ou pas une
action requise;
! les agent ont leurs propres buts et ils agissent d'une manire pro-active
pour atteindre leurs buts (par exemple saisissent de opportunits) alors
que les objets ne le font pas;
! les agents sont capable d'un comportement social et ils peuvent
sengager dans des interactions complexes, par exemple coopration,
comptition, ngociation, avec d'autres agents; ce n'est pas le cas des
objets;
! un systme multi-agents est, normalement, un systme o les agent
correspondent des fils dexcution spars; chaque agent a son
propre fil dexcution alors que les objets, part les objets concurrents,
ne prsentent pas cette caractristique.
24

Chapitre 2 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chapitre 2 PDF

Uploaded by

Copyright:

Available Formats

Agents et Systmes

Adina Magda Florea

URL du cours: http://turing.cs.pub.ro/auf2/

! La rationalit des agents

Plusieurs agents ractifs

Agents avec buts

Agents avec utilit

Environnement non dterministe env : E x A P(E)

prob( ex( a, e ) = e' )

! L'utilit attendue d'une action dans l'tat e du

U (a, e) = prob (ex ( a , e ) = e ' )*utilite (e ' )

! Le principe de la plus grande utilit attendue -

! Un plan est une squence d'actions excuter dans le

! Obligation aveugle.Un agent suivant cette stratgie va

Architecture ractive de subsomption

Module Competence (0)

! Systme InteRRaP ("Integration of Reactive

! L'architecture InteRRaP est une architecture en

Perceptions Actions Communication

Unit de base objet agent

Paramtres dfinissant pas de contraintes croyances, dcisions, Programmation

Contraintes sur les pas de contraintes consistance, vrit,

You might also like