Professional Documents
Culture Documents
IFT-17587
Concepts avancs pour systmes intelligents
Luc Lamontagne
Types denvironnements
2
Quest-ce quun agent intelligent?
Agent intelligent:
tout ce qui peroit son environnement
laide de ses capteurs
et qui agit sur son environnement
laide de ses effecteurs.
percepts capteur
Environnement ?
agent
actions
effecteurs
3
Agents vs Objets
Agent
entit autonome interagissant avec son environnement
Objet
entit passive possdant un tat et sur lequel on peut effectuer
des oprations.
Un agent degr dabstraction plus lev quun objet.
Un agent peut tre constitu de plusieurs objets.
Un agent logiciel peut tre la fois client et serveur
Paradigme de programmation mettant en vidence
lautonomie
les interactions (par ex. la programmation oriente agent)
4
Exemple trs simple dagent
Un agent aspirateur
5
Tabulation de la fonction dagent
Percepts Action
6
Agent rationnel
Agent rationnel:
doitexcuter laction qui maximise sa mesure de
performance
en fonction de sa perception du monde et de ses
connaissances.
Mesure de performance
Externe
Fixe par le concepteur
Propre la tche
Critre de succs du comportement de lagent
7
Choix de la mesure de performance
8
Agent rationnel
Rationnel distinct de lomniscience
Tout savoir, connaissance infinie
Lagent peut accomplir ses actions pour :
Accomplir ses buts
Modifier sa perception de lenvironnement pour obtenir des
informations utiles
Agent autonome
Comportement dtermin par ses propres expriences
Capacit dadaptation et dapprentissage
Notion dagent
Un outil danalyse de systmes
non pas une caractrisation absolue qui divise le monde en
deux: agents et non-agents.
9
Environnement de la tche
La premire tape lors de la conception dun
agent est de spcifier lenvironnement de la
tche (task environment) qui contient les quatre
lments suivants (PEAS):
Mesure de la performance (Performance measure)
Environnement (Environment)
Effecteurs (Actuators)
Capteurs (Sensors)
10
Exemple
Conducteur de taxi automatique
Mesure de performance: scurit, vitesse, lgalit,
confort, profits, etc.
Environnement: routes, autres autos, pitons, clients,
etc.
Effecteurs: volant, acclrateur, frein, clignotant,
klaxon, etc.
Capteurs: camras, sonar, odomtre, indicateur de
vitesse, capteurs du moteur, etc.
11
Autre exemple
Systme de diagnostic mdical
Mesure de performance: patient en sant, viter les
poursuites, minimiser les cots
Environnement: patient, hpital, personnel
Effecteurs: lcran du systme
questions, tests, diagnostic, traitements, rfrences
Capteurs: clavier
saisie des symptmes, vidences, rponses du patient
12
Proprits de lenvironnement
Compltement observable vs partiellement observable
Dterministe vs stochastique
pisodique vs squentielle
Statique vs dynamique
Discret vs continu
13
Proprits de lenvironnement
Compltement observable vs partiellement observable:
Est-ce que les capteurs de lagent lui donne accs ltat
complet de lenvironnement tout moment ?
Dterministe vs stochastique:
Est-ce que le prochain tat de lenvironnement est
compltement dtermin par son tat courant et laction de
lagent ?
pisodique vs squentielle:
Un pisode est une squence perception-action.
Le prochain pisode ne dpend pas des actions effectues dans
les pisodes prcdents.
14
Proprits de lenvironnement
Statique vs dynamique:
Est-ce que lenvironnement change pendant que lagent
dlibre?
Discret vs continu :
La distinction entre discret et continu peut tre applique
ltat de lenvironnement
la faon dont le temps est gr
et aux perceptions et aux actions de lagent.
Un agent vs multi-agents :
Est-ce quil y a plus quun agent interagissant ensemble ?
15
Proprits de lenvironnement
Situation la plus difficile:
Partiellement observable
Stochastique
Squentielle
Dynamique
Continue
Multiagent
Exemple, conduite automatise dun taxi
16
Exemple
Environnement Observable Dterministe pisodique Statique Discret Agents
17
Fonctions et programmes dagent
Un agent est compltement spcifi par une fonction
dagent
Mise en correspondance des percepts et des actions
But : trouver un moyen dimplanter cette fonction de
manire concise
Problme des tables de fonction :
Immense
Prends un temps norme construire
Aucune autonomie
Mme avec apprentissage, ncessite un temps considrable
pour apprendre les lments du tableau
18
Structure dun agent
4 types de base en ordre de gnralit
grandissante:
Agent simple rflexe
Agent rflexe avec tat interne
Agent bas sur les buts
Agent bas sur lutilit
Tous ces types peuvent tre transforms en
agents apprenants.
19
Agent simple rflexe
Ce type dagent choisit ses actions en se
basant uniquement sur le percept courant,
en ignorant les percepts prcdents.
20
Agent simple rflexe
Agent Capteurs
Environnement
Comment le monde
est maintenant?
Effecteurs
21
Agent rflexe avec tat interne
Agent Capteurs
Environnement
tat Comment le monde
est maintenant?
Comment le monde volue?
Effecteurs
22
Agent bas sur les buts
Agent Capteurs
Environnement
tat Comment le monde
est maintenant?
Comment le monde volue?
Comment sera le monde
Quel est limpact de mes actions?
si je fais laction A?
Effecteurs
Goal-based agent
23
Agent bas sur lutilit
Les buts ne font la distinction que entre un
tat heureux ou pas heureux .
Fonction dutilit: tat valeur
Aide dans deux cas o les buts chouent:
Buts en conflits (ex: vitesse et scurit)
Lorsquil y a plusieurs buts
24
Agent bas sur lutilit
Agent Capteurs
Environnement
Comment le monde volue?
Comment sera le monde
Quel est limpact de mes actions?
si je fais laction A?
Effecteurs
25
Agent apprenant
Souvent, il est trs fastidieux o mme
impossible de dfinir le comportement de lagent
la conception.
Lapprentissage permet:
De simplifier la conception
lagent davoir plus de flexibilit
lagent dagir dans des environnements inconnus et
de devenir meilleur avec le temps.
26
Agent apprenant
Standards de performance
Capteurs
Critique
Environnement
Rtroaction
Changements
Module Module de
dapprentissage performance
Connaissances
Buts
dapprentissage
Gnrateur de
problmes
Agent Effecteurs
27
Agent taxi apprenant
Module de performance
Connaissances et procdures pour choisir les actions.
Critique
Observe lagent et donne des informations au module
dapprentissage.
Module dapprentissage
Modifie le module de performance.
Gnrateur de problmes
Identifie les possibilits damlioration et suggre des
exprimentations.
28
Conclusion
Un agent est un artefact (robot, logiciel) qui peroit et
agit sur un environnement
La mesure de performance value le succs du
comportement de lagent
Lenvironnement de tches varie selon diffrentes
dimensions.
Le programme dun agent est une implmentation de la
fonction dagent.
4 agents, aux fonctionnalits croissantes, bas sur les :
Rflexes, les modles, les buts et lutilit
Chacun peut tre amlior par lapprentissage.
29