Professional Documents
Culture Documents
I : INTRODUCTION
II : MODELISATION DE LA PLATE-FORME D'ESSAIS
II.1:Le pendule inversé
II.2:Modélisation
II.2.1.Choix du matériel de guidage
II.2.2.Modélisation de la motorisation
II.2.3.Mise en oeuvre du modèle de la plate-forme d'essai en boucle ouverte
II.2.4. Simulation du modèle de la plate-forme d'essais
III :SIMULATION DE LA PLATE-FORME D'ESSAIS
III.1:Principes de la commande floue
III.2:Les règles floues
III.3:Fuzzification
III.4:Inférence et défuzzification
III.5:Méthode d'optimisation du recuit simulé
III.6:Régulateur flou utilisé lors de la simulation de la plate-forme d'essais
III.7:Optimisation des gains du régulateur
III.8: Résultats obtenus lors de la simulation en boucle fermée
IV :REALISATION DE LA PLATE-FORME D'ESSAIS
IV.1:Fabrication de la plate-forme d'essais
IV.1.1 Rail de guidage
IV.1.2 Codeur absolu pour l'angle thêta
IV.1.3. Codeur incrémental pour la position X
IV.1.4.Carte d'acquisition de signaux
IV.2:Sécurité
IV.3:Conclusion
V :COMMANDE DU PENDULE-INVERSE
V.1:Commande du pendule autour de la position 0 radian
V.1.1. Représentation d'état discrète
V.1.2. Commande Linéaire Quadratique
V.1.3. Reconstructeur d'état
V.1.4.Obtention d'un modèle discret de la plate-forme
V.1.5.Commande utilisée pour le pendule inversé
V.2:Commande du pendule autour de la position Π radians
V.2.1. Régulateur flou à base de deux règles/Vidolov & Melin 92/
V.2.1.1.Principe
V.2.1.2.Commande utilisée pour le pendule inversé
V.2.2. Commande non-linéaire
V.2.2.1.Principe
V.2.2.2.Résultats
VI :CONCLUSION
VII :BIBLIOGRAPHIE et LIENS
I : INTRODUCTION
Devant les problèmes délicats de la modélisation et de la commande de systèmes complexes, les outils utilisés deviennent de plus
en plus pointus. L'un des axes de recherche au sein du laboratoire ( L.A.M.I.H )concerne la commande de systèmes
multivariables. Les premiers essais menés en simulation ont consisté à la mise au point de lois de commande basées sur des
optimisations non-linéaires (recuit simulé avec cycle de réchauffement, algorithmes génétiques, stratégie d'évolution).
Le but de ce projet est la mise en oeuvre d'une plate-forme d'essais permettant de tester des lois de commande. Le choix de cette
plate-forme s'est arrêté sur un système multivariable, non linéaire et instable: le pendule inversé. Ce dernier consiste en un chariot
mobile en translation supportant un pendule libre en rotation. Cette plate-forme doit permettre une rotation du pendule de 360° et
doit pouvoir être suffisamment flexible pour permettre une adaptation à d'autres systèmes basés sur un principe similaire: double
pendule inversé, contrôle d'un anti-balancement de charge,...
Dans cette optique, la première étape consiste à effectuer les choix technologiques et à modéliser l'ensemble de la plate-forme. Une
loi de commande basée sur la logique floue ayant été développée en simulation sur le pendule inversé /Vermeiren & al. 95/,des
rappels sur la commande floue sont ensuite fournis. Pour dimensionner la plate-forme, il a été nécessaire d'adapter la loi de
commande au modèle complet de la plate-forme, ce point fait l'objet de la deuxième étape.
La derniere partie traite des essais de commande de l'ensemble de la plate-forme. Dans un premier temps, pour de faibles
conditions initiales sur l'angle, une loi de commande basée sur la commande linéaire quadratique permet d'assurer la régulation du
pendule autour de 0 rad ainsi que la poursuite sur la position du chariot. Pour permettre la prise en compte de conditions initiales
quelconques sur l'angle, deux lois de commande sont présentées. La première est basée sur un régulateur flou, la seconde fait appel
à une loi de commande non-linéaire. Les différents résultats présentés et discutés montrent que l'association de la loi de commande
linéaire avec la loi de commande non linéaire présente la meilleure robustesse vis-à-vis des conditions initiales et des perturbations.
II : MODELISATION DE LA PLATE-FORME D'ESSAIS
Le choix de la plate-forme d'essais étant le pendule inversé, le système devra répondre à deux exigences préliminaires :
• permettre une rotation du bras de 360°, afin de prendre en compte toutes les conditions initiales possibles ;
• disposer d'une course de déplacement du chariot suffisante pour permettre au pendule de se relever à partir des
conditions initiales les plus défavorables.
L'objectif de cette partie est donc d'effectuer le choix du matériel nécessaire à la réalisation de la plate-forme d'essais. La première
étape passe par une modélisation de l'ensemble de la plate-forme : moteur, ensemble chariot-pendule, ...
Deux grandes familles de modèles sont présentées dans la littérature : /Foulard & al.87/, /Borne & al. 92/, /Landau 93/
• les modèles de connaissance utilisant les lois de la physique, des relations mathématiques, etc...;Ce sont des
modèles paramétriques (par exemple: fonction de transfert, équations différentielles, ...)
• les modèles de représentation: lorsque l'analyse interne du système n'est pas possible, il est alors considéré
comme une boîte noire.
Notre choix s'est porté sur le modèle de connaissance puisque tous les composants du système peuvent être représentés par des
équations différentielles.
II.1:LE PENDULE INVERSE
Le pendule inversé étudié ici est constitué d'un chariot mobile en translation sur un axe horizontal. Le pendule, tout en étant fixé
sur le chariot, est libre en rotation .
En exerçant une force horizontale F(t) sur le chariot, une translation de X mètres de celui-ci est obtenue ainsi qu'une rotation de θ
radians du pendule.
Le pendule inversé est un système instable en boucle ouverte, non linéaire et multivariable. La commande de ce système doit
réaliser :
• la régulation sur l'angle θ, en partant d'une condition initiale comprise dans l'intervalle [-Π, +Π] ;
• la régulation et la poursuite sur la position X, en partant d'une condition initiale comprise dans l'intervalle [-1m ,
+1m].
Le pendule de longueur 2*L et de masse m dont l'axe de suspension est lié au chariot de masse M, peut se déplacer sur un axe
horizontal. Initialement le système est au repos, les frottements situés au niveau de l'axe de rotation sont négligés, les frottements
dus au déplacement du chariot sont notés f.
La méthode utilisée pour déterminer le modèle est celle des équations du mouvement données par les équations de Lagrange
/Kandel & al.92/ :
Lagrangien du système : L =1/2.( m + M ) X ' ² +1/2 . m.L². Θ ' ² - L.m.X '.Θ ' .cos Θ - m.g.L.(1+ cosΘ)
Equations du mouvement :
La technique d'entraînement doit aussi pouvoir accepter de telles vitesses, sans engendrer de jeux mécaniques pouvant générer des
retards indésirables. Cette remarque écarte les vis à billes de précision et les pignons-crémaillère. Le choix s'est donc porté sur un
entraînement par pignons et courroie crantée.
Les exigences technologiques définies, deux solutions sont possibles. La première consiste à réaliser l'assemblage des différents
éléments, guidage, transmission, ...
La deuxième solution est de faire l'acquisition d'un rail complet de guidage et de transmission.
Le rail de guidage retenu est proposé par la société INA et permet de répondre aux exigences du cahier des charges. Les multiples
usinages nécessaires à la première solution sont ainsi évités et son coût est inférieur au coût global des différents composants de la
première solution.
II.2.2.Modélisation de la motorisation
La motorisation du chariot est assurée par un moteur couple à aimants permanents de marque PARVEX . Le modèle dynamique
peut se ramener à des équations différentielles linéaires à coefficients constants.
Les effets de saturation du circuit magnétique ne sont pas représentés, l'inductance de l'induit est considérée constante et l'ensemble
des couples de frottement sont regroupés dans l'expression fm.W(t). Le système d'équations différentielles représentant le moteur
est le suivant :
avec
C = couple (m.N)
i = intensité (A)
u = tension (V)
Ki = constante de flux (V/1000tr/mn)
R = résistance d'induit (ohms)
Li = inductance d'induit (mH)
Jm = inertie arbre moteur (Kg.m²)
fm = couple de frottement (m.N)
W = vitesse ( rads/s)
Le servoamplificateur pilotant le moteur, dont le schéma électronique a été fourni par PARVEX, peut s'assimiler à un régulateur de
typeProportionnel Intégral
Un écart Dref, obtenu en comparant l'entrée ref et le retour de la boucle de courant, alimente le servoamplificateur qui délivre alors
une tension U au moteur. Celui-ci fournit un couple C qui est transformé en force F par l'intermédiaire des poulies du rail de
guidage. Cette force appliquée au chariot permet la variation de l'angle Q et de la position X. Afin, de rendre homogène le modèle
global de la plate-forme d'essais, il est nécessaire d'adapter les modèles des différents éléments la composant :
- L'intensité impulsionnelle maximale du moteur (limitée par la puissance du servoamplificateur) est de 40 A, la tension de
consigne ref
issue de la carte d'acquisitions est limitée à +/- 10 V, un gain égal à 0.25 est donc inséré dans la boucle de courant.
- Le servoamplificateur délivre une tension maximale de 130 V, son modèle a donc été borné à cette valeur.
- Les modèles du moteur et du chariot-pendule pris séparément, donnent chacun une accélération propre:
Ces deux accélérations doivent être homogénéisées. Dans un premier temps, les frottements fm du moteur sont négligés.
L'inertie du moteur est ramenée sur le chariot-pendule en transformant l'inertie de rotation en inertie de translation. Il est donc
nécessaire de calculer la masse équivalente ramenée au chariot-pendule.
L'énergie cinétique en rotation est donnée par :
en posant : Wr = Wt il vient :
La constante de temps électromécanique du moteur en charge est donnée par :
De ce fait, seule l'équation différentielle concernant le chariot est conservée, et la vitesse de rotation du moteur W(t) (rad/s), est
écrite en fonction de la vitesse du chariot X ' (m/s).
L'équation :
devient alors :
et
poulies :
chariot-pendule :
pour la position
pour l'angle
Pour valider définitivement le choix du matériel et ainsi déterminer la course nécessaire pour le rail de guidage, une simulation du
comportement de l'ensemble du modèle en boucle fermée corrigée doit être réalisée. Ceci fait l'objet de la partie suivante.
III :SIMULATION DE LA PLATE-FORME D'ESSAIS
Des études en simulation menées au sein du laboratoire ont permis de dégager une loi de commande basée sur la logique floue
adaptée au problème du pendule inversé /Vermeiren & al. 95/. Cette loi de commande ne prend en compte que le modèle du
chariot-pendule sans saturation sur la commande. Pour permettre de finir le dimensionnement de la maquette, il a été décidé
d'adapter cette loi de commande au modèle complet proposé dans le chapitre précédent.Ce chapitre décrit, dans un premier temps,
les principes de la commande floue. Pour limiter les empirismes liés à la mise en oeuvre d'un régulateur flou, une solution peut
consister à utiliser une technique d'optimisation de certain de ces paramètres. Dans ce cadre, le deuxième paragraphe présente un
algorithme d'optimisation non-linéaire : le recuit simulé avec cycles de réchauffement /Bonnemoy & Hamma 91/.Ce dernier est
alors utilisé pour déterminer les gains d'adaptation d'échelle du régulateur flou. La dernière partie du chapitre présente alors le
régulateur flou optimisé et des résultats des simulations.
III.1:PRINCIPE DE LA COMMANDE FLOUE
Face à la complexité croissante des systèmes à commander, il devient de plus en plus ardu d'élaborer les modèles correspondant,
sous forme d'équations mathématiques.De ce fait, le calcul de la loi de commande qui répond de façon optimale à l'objectif du
système, devient lui aussi de plus en plus difficile.Une manière de pallier la recherche explicite du modèle d'un système est
l'utilisation de la commande floue. Celle-ci est basée sur la notion d'ensembles flous /Zadeh 65/ et sur la perception du système par
l'opérateur humain. Cette commande repose sur les deux concepts suivants :
○ décomposition de la plage de variation d'une variable en valeurs linguistiques.
Par exemple : POSITIVE, NULLE, NEGATIVE.
○ Elaboration de règles linguistiques pour décrire les relations Entrées/Sorties.
Par exemple : si e est NULLE et De est POSITIVE alors Du est NEGATIVE
où e représente l'erreur, De la variation de l'erreur et Du la variation de commande.
Habituellement un régulateur flou se décompose en trois parties : fuzzification, raisonnement flou et défuzzification /Guerra & al.
92/. La présentation adoptée ici sera aussi scindée en trois éléments : les règles floues, la fuzzification puis l'inférence et la
défuzzification regroupés ensemble.
III.2:LES REGLES FLOUE
Considérées comme le coeur du régulateur flou, les règles linguistiques décrivent les relations existantes entre les entrées de ce
régulateur et la commande du système. Dans le cas de systèmes complexes régulés par un opérateur humain, il est fait appel à une
extraction des connaissances de l'expert pour déterminer les règles. La difficulté réside alors principalement dans cette extraction.
On peut trouver des bases de règles variant d'une vingtaine à plusieurs centaines. Citons comme exemple le double pendule inversé
/Terano & al. 88/ où les règles ont été extraites à partir de l'observation de sujets régulant le double pendule inversé et sont au
nombre de 28.
Pour des essais en simulation, où un modèle du procédé est disponible le nombre de règles est en général assez faible, entre quatre
et une vingtaine.
La matrice des règles permet de visualiser l'ensemble des règles floues utilisées. Un exemple en est donné ci dessous .
Chaque case de la matrice des règles contient une règle floue. Par exemple, la case grisée contient la règle :
si De est NULLE et e est NEGATIVE alors Du est POSITIVE.
La partie suivante traite de la fuzzification qui permet d'obtenir les ensembles flous, à partir des variables d'entrées.
III.3:FUZZIFICATION
La fuzzification permet de transformer les variables réelles d'entrées du régulateur, en variables floues. L'univers du discours d'une
variable linguistique e est donné par l'intervalle [-eMAX, +eMAX] , qui représente sa plage de variation.
Dans le cas d'un univers du discours continu, les fonctions d'appartenance associées sont le plus couramment de forme
triangulaires et trapézoïdales mais peuvent aussi être la représentation de modèles mathématiques plus complexes.
L'exemple suivant présente un exemple de fuzzification. Pour une variable d'entrée e, un univers du discours continu, les fonctions
d'appartenance représentées par un triangle et deux trapèzes et les valeurs linguistiques : Positive, Zéro, Négative, l'ensemble flou
relatif à une valeur 0.5 de la variable d'entrée sera alors: ( 0 ; 0.5 ; 0.5).
Exemple de fuzzification pour un univers du discours continu.
Que l'univers du discours soit continu ou discret, les règles floues activées seront celles dont la valeur linguistique est différente de
zéro. Pour l'exemple précédent, avec l'ensemble flou (0 ; 0.5 ; 0.5), les règles linguistiques ayant pour prémisse soit "e est Zéro"
soit "e est Positive", seront activées.
La dernière partie du régulateur doit permettre de générer la commande envoyée au système, elle fait l'objet du paragraphe suivant.
III.4:INFERENCE ET DEFUZZIFICATION
Deux méthodes sont en général utilisées pour le raisonnement flou. L'une est basée sur l'inférence de règles floues (méthodes
classiques de Mamdani et Larsen), l'autre sur la logique floue (méthode de Sugeno). Seule cette dernière sera développée ici.
La méthode basée sur la logique floue permet d'obtenir directement la sortie défuzzifiée du régulateur, à partir des règles
linguistiques. Pour cela un poids wi est associé à chaque règle, sa valeur dépend de la logique adoptée pour les opérateurs ET et
OU contenus dans les prémisses des règles. La partie conclusion des règles est alors simplement un singleton.
Dans le cas d'une structure de type PI-flou, la variation de commande fournie par le régulateur est donnée par :
posséder une énergie E, est proportionnelle au facteur de Boltzmann : exp avec Ks constante de
Boltzmann.
○ pour simuler l'évolution d'un système physique vers son équilibre thermodynamique, il est possible d'utiliser
l'algorithme de Métropolis.
Cet algorithme offre l'avantage de pouvoir s'extraire d'un minimum local. Pour cela, un nombre compris entre 0 et 1 est généré
aléatoirement puis comparé à la probabilité P = exp , DE étant la variation de la fonction de coût. La modification des
paramètres sera acceptée si le nombre tiré au hasard est inférieur ou égal à la valeur de la probabilité.
En appliquant itérativement cette règle d'acceptation, on engendre une séquence des différentes configurations. On montre que
lorsque cette séquence est de longueur suffisante, le système se rapproche de l'équilibre thermodynamique, à la température
considérée.
Cette règle de Métropolis donne une grande importance à la valeur de la température. En effet si celle-ci est élevée, la probabilité P
sera proche de 1 et la plus part des modifications seront acceptées. Au contraire pour de faibles températures, la probabilité tendant
vers 0, peu de modification seront autorisées. Entre ces deux cas extrêmes, les modifications dégradant le résultat de la fonction de
coût seront prises comme conditions initiales de temps en temps, afin de s'extraire d'un minimum local.
Lorsque l'équilibre thermodynamique, pour une température donnée, est atteint au bout d'un certain nombre de tirages N(k), une
nouvelle séquence des configurations est réalisée après avoir baissé légèrement la température précédente.
L'algorithme est généralement stoppé lorsque la température atteint une valeur nulle ou si aucune dégradation de la fonction de
coût n'a été acceptée au cours des derniers paliers de température.
La méthode d'optimisation du recuit simulé offre généralement une solution satisfaisante au problème posé. Les résultats obtenus
par cette méthode dépendent directement du choix effectué sur les paramètres de l'algorithme :
○ choix de la fonction température T(k), généralement une fonction à décroissance lente,
○ nombre N(k) de répétitions entre deux descentes successives de température,
○ choix du critère d'arrêt de l'algorithme.
Dans le cas où le nombre de variables du problème est très élevé, une variante du recuit simulé à été développée : le recuit simulé
avec cycles de réchauffement /Bonnemoy & Hamma 91/. Dans cette variante, la procédure du recuit simulé est exécutée plusieurs
fois. Les cycles ainsi créés ont pour avantage, en repartant d'une température élevée et d'une configuration initiale affinée par une
procédure du recuit précédente, d'améliorer les chances d'aboutir au minimum global de la fonction de coût.
La présentation de la méthode d'optimisation étant faite, la partie suivante se propose de fournir les caractéristiques du régulateur
flou utilisé lors de la phase de simulation de la plate-forme d'essais en boucle fermée.
III.6:REGULATEUR FLOU UTILISE LORS DE LA SIMULATION DE LA PLATE-FORME D'ESSAIS
L'algorithme de simulation a été créé sous le logiciel de développement LabWindows. La résolution numérique des équations
différentielles est obtenue par la méthode de Runge-Kutta d'ordre 4. Les fonctions d'appartenance sont de forme triangulaire et
trapézoïdale et l'univers du discours est divisé en cinq nuances linguistiques : Très Négative, Négative, Zéro, Positive et Très
Positive .
Les matrices de règles choisies, pour l'angle et la position, sont les suivantes:
Les différents poids wi, associés aux règles sont donnés par : wi = min ( 1 , b.wQi + l.wXi ) wi
l et b représentent les coefficients de couplage entre la partie de la sortie du régulateur concernant la position et celle concernant
l'angle.
La défuzzification de la sortie du régulateur nous donne la commande :
avec Dui l'abscisse du centre de chaque valeur linguistique de sortie.
La structure du régulateur flou est :
La structure ayant été présentée, il s'agit de déterminer, par optimisation non linéaire, une combinaison des gains du régulateur
permettant de stabiliser l'ensemble du système.
III.7:OPTIMISATION DES GAINS DU REGULATEUR
Les différents paramètres de réglage du régulateur sont, d'une part les gains de normalisation GQ, GDQ, GX, GDX, et Gu qui
permettent d'agir sur la commande, les erreurs et leur variation et d'autre part les coefficients de couplage lambda et bêta, reliant les
deux entrées Q et X du régulateur.
L'algorithme du recuit simulé avec cycles de réchauffement a permis de définir ces différents gains et coefficients de couplage du
régulateur flou. L'utilisation d'un algorithme d'optimisation nécessite de définir la fonction de coût, ou critère, à minimiser.
Pour aller plus loin que l'utilisation de critères classiques, ISE, IAE,... ou de type quadratiques, un critère prenant en compte la
commande du système et son nombre d'oscillations /Ouattara 96/a été utilisé. Les paramètres du recuit simulé ont été choisis de la
façon suivante :
P = exp
Le déroulement de la séquence de recherche des paramètres du régulateur flou est le suivant :
Avec ce chapitre, se termine l'étude théorique. Un modèle de la plate-forme d'essais est élaboré et son comportement en simulation
semble correspondre au fonctionnement normal des différents matériels. Le régulateur flou, qui assure la commande du système est
suffisamment robuste pour permettre la régulation sur l'angle ainsi que la régulation et la poursuite sur la position X. Au vu de ces
résultats de simulation, la réalisation pratique de la plate-forme d'essais est alors envisageable. La décision a donc été prise de
passer les commandes du matériel nécessaire et de réaliser la plate-forme d'essais. Le déroulement de cette construction et la mise
au point font l'objet du chapitre suivant.
IV :REALISATION DE LA PLATE-FORME D'ESSAIS
Ce chapitre ce compose de deux parties, l'une concernant la mise en oeuvre des différents éléments de la plate-forme d'essais, la
seconde partie s'intéresse au problème de la sécurité des personnes et du matériel.
IV.1:FABRICATION DE LA PLATE-FORME D'ESSAIS
Le schéma de principe suivant donne l'ensemble des éléments constituant la plate-forme d'essais.
Dans ce qui suit, des précisions sont apportées sur les éléments déjà étudiés, le matériel manquant est à son tour défini et les
opérations de montage sont données.
IV.1.1 Rail de guidage
Les résultats obtenus lors de la simulation en boucle fermée montrent qu'il est possible, en partant d'une condition initiale Q0 = -P
rad, de réguler le pendule autour de la position zéro. Pour cela, la course maximale du chariot mobile est d'environs 0.8 mètres. A
partir de ce résultat et avec le soucis de réaliser une plate-forme d'essais de dimensions raisonnables, il a été décidé de commander
un rail de guidage ayant une course de quatre mètres. Cette course disponible sera alors scindée en trois zones .
La zone de travail est attribuée aux essais de commande du pendule inversé tandis que les deux zones de sécurité sont destinées,
comme leur nom l'indique, à stopper le chariot en toute sécurité, compte tenu de l'accélération et de la vitesse que peut atteindre ce
même chariot.
Afin de limiter le nombre d'intervenants dans la partie concernant le rail de guidage, la réalisation de la pièce qui permet
l'accouplement du moteur au rail a été confiée à la société INA.
Par soucis de diminuer l'encombrement de la plate-forme d'essais, il a été décidé de la fixer sur un mur porteur du laboratoire, à
l'aide d'équerres réalisées par l'atelier de mécanique. Le moteur quant à lui est supporté par un pied de maintien fixé au sol .
avec
X le vecteur d'état de dimension (n x 1 )
u le vecteur d'entrée de dimension ( r x 1 )
y le vecteur de sortie de dimension ( m x 1 )
A la matrice d'état de dimension ( n x n )
B la matrice d'entrée de dimension ( n x r )
C la matrice de sortie de dimension ( m x n )
D la matrice de couplage entrées-sorties de dimension ( m x r )
i l'instant d'échantillonnage
Le diagramme structurel de ce système multivariable est alors :
avec
Ces équations de récurrence sont calculées en temps inverse, à partir des valeurs finales K ( N ) = 0 et g ( N ) = 0.
Les valeurs de la matrice L et du vecteur m dépendent directement du choix des matrices Q et R qui agissent sur la rapidité et la
robustesse de la commande. Une première évaluation de ces matrices peut être effectuée avec la règle de Bryson /De Larminat 93/
qui donne :
et avec
Le choix des matrices de pondération est ensuite affiné par essais et erreurs en simulation.
La commande par retour d'état suppose que le vecteur d'état X ( i ) soit accessible. En règle générale seule les entrées et sorties du
système sont disponibles ; le vecteur d'état peut être alors remplacé par son estimation ^X ( i ) sans modifier les propriétés de la
commande. L'estimation est obtenue grâce à un reconstructeur d'état ou observateur qui est un modèle déterministe du système à
commander.
V.1.3. Reconstructeur d'état
Le rôle de l'observateur est de fournir une estimation de l'état réel du système à l'instant i+1, à partir des informations présentes à
l'instant i.
Une représentation du système et de son observateur est donné par le diagramme structurel suivant :
Les équations caractérisant l'observateur sont:
avec Kobs la matrice de gain de l'observateur, calculée par minimisation d'un critère quadratique et qui peut être déterminée
séparément de la commande (principe de séparation /Foulard & al.87/ ).
L'observateur donnant maintenant accès à toutes les variables d'état, la structure de commande est :
pour la position
pour l'angle
Pour obtenir un modèle plus précis du chariot-pendule, une optimisation des paramètres du modèle théorique a été réalisée. Dans
un premier temps, afin d'obtenir des courbes de sorties du système réel pour des petits angles, un régulateur de type avance de
phase a été mis en oeuvre sur l'angle du pendule. Des fichiers de points: X et Q fonction d'une séquence de commande sont alors
obtenus.
Les paramètres à optimiser sont : M equ la masse équivalente du chariot et f les frottements du chariot.
A l'aide des fichiers de points réels une procédure d'optimisation programmée sous l'environnement Matlab/Simulink a permis de
minimiser l'erreur entre modèle et système réel ; ce qui donne la représentation d'état continue :
Les matrices de la représentation d'état discrète de ce modèle linéaire sont (pour une période d'échantillonnage Te = 0.003 s):
Ad =
Bd = Cd = Dd =
Comme il est possible de le constater, ces matrices sont mal conditionnées. De plus l'observation des pôles ( 0, -2574.9, 9.9, -9.9,
-328.7, -18.5) de ce système d'ordre 6 laisse apparaître une constante de temps de 0.38ms négligeable par rapport à la période
d'échantillonnage. Un nouveau modèle d'ordre 5 est alors défini.
Les matrices de la représentation d'état discrète de ce nouveau modèle linéaire sont (pour une période d'échantillonnage Te = 0.003
s):
Adred = Bdred=
L=
Kobs =
avec Qobs = et Robs =
L'exemple de commande fourni figure suivante nous permet de constater que les régulations sur l'angle et la position sont assurées
malgré une oscillation entretenue. Celle-ci est due à une bande morte de +/- 0.5 volts. Effectivement, une tension de commande
minimale d'environ +/- 0.5 volts est nécessaire pour vaincre les inerties de l'ensemble de transmission, ainsi toutes les tensions de
commande comprises dans cet intervalle n'ont aucun effet sur le chariot-pendule ce qui a pour conséquence de laisser " retomber "
le pendule jusqu'à ce que l'erreur sur l'angle soit suffisante pour générer une tension de commande plus importante.
La commande est définie par les fonctions d'appartenance représentées figure suivante:
Sur l'exemple de réponse fourni par la figure suivante, on remarque qu'un seul balancement est nécessaire pour relever le pendule
de sa position initiale -P radians.
Cette répétition des séquences augmentant à chaque étape l'énergie du système, elle permet de ramener l'angle du pendule dans
l'intervalle [-0.5rads ; 0.5rads]. Dans ce cas la commande par retour d'état présentée précédemment est appliquée. Pour éviter d'une
part, que le bras n'arrive avec des vitesses trop importantes dans cette bande, et d'autre part que le basculement d'un régulateur sur
l'autre ne se fasse de façon trop brutale, une étape de décélération du bras est activée permettant ainsi de diminuer la vitesse Q' ( t ).
Les différents paramètres utilisés pour les trois séquences sont :
○ commande de 3 volts pour l'accélération de la séquence 1
○ distance max. parcourue par le chariot-pendule = 0.8 m
○ durée de la première séquence = 0.5s
○ coefficient a de la deuxième séquence = 2
V.2.2.2.Résultats
Le premier essai est réalisé à l'aide des conditions initiales suivantes : Q0 = P rads, Q '0 = 0 rad/s, Xg0 = 0 m avec la position de
consigne : Xgc = 0m. Les figures suivantes montrent en premier lieu le mouvement répété du chariot sur 1,6 s pour la séquence de
commandes donnée.
On remarque également que l'angle du pendule s'est rapproché, à chaque fin de cycle, de plus en plus de l'intervalle [-0,5 rad ; 0,5
rad], jusqu'à l'atteindre vers 1,6s. Le basculement sur le régulateur linéaire avec décélération de la vitesse du bras étant alors
effectué. Ce basculement effectué à basse vitesse angulaire, on retrouve le comportement attendu du régulateur linéaire avec l'effet
de la bande morte.
Réponse pour Q0 = P/8 rads, Q '0 = 0 rad/s, Xg0 = 0.3 m et Xgc = 0 m , perturbations à t=5 s et 11 s.
Enfin, le cinquième et dernier essai, présenté figure suivante correspond aux conditions initiales suivantes : Q0 = - P/2 rads, Q '0 =
10 rads/s, Xg0 = 0 m et la position de consigne: Xgc = 0 m. Ces conditions initiales sont obtenues obtenue en faisant " tournoyer " le
pendule avant le lancement du programme de commande.
Réponse pour Q0 = - P/2 rads, Q '0 = 10 rads/s, Xg0 = 0 m et Xgc = 0 m.
Encore une fois, la commande mise en oeuvre permet de ramener le système aux valeurs de consignes voulues même dans le cas
d'une vitesse angulaire initiale non nulle.
Ce chapitre a permis de dégager des lois de commande robustes vis-à-vis des conditions initiales et des perturbations. Ces lois de
commande sont spécifiques au problème du pendule inversé et ont permis de valider le matériel utilisé pour la plate-forme d'essais.
VI :CONCLUSION
Ce mémoire a présenté la réalisation et la commande d'un pendule inversé. La partie réalisation a été effectuée après une
simulation du comportement de l'ensemble de la plate-forme et a abouti à retenir une solution d'entraînement du chariot pendule
par courroie crantée. Les objectifs définis ont été atteints dans la mesure où le LAMIH dispose d'une plate-forme d'essais
permettant de tester des lois de commande et, que cette dernière est suffisamment flexible pour permettre une adaptation à d'autres
systèmes basés sur un principe similaire : double pendule inversé, contrôle d'un anti-balancement de charge, ...
Des algorithmes de commande ont été obtenus permettant la validation de l'ensemble de la plate-forme. En dehors des algorithmes
mis en oeuvre, il reste, bien entendu, des tests d'autres types de lois de commande à effectuer. Notamment, l'échec du passage de la
commande floue de la simulation à la réalité est un point négatif, et il conviendra de repenser à la structure du régulateur flou,
puisque ce type de commande a été utilisée avec succès dans d'autres études sur le pendule inversé /Yamakawa 89/.
Dans une perspective à court terme, des synthèses de lois de commande basées sur la logique floue, sur le retour d'état flou, et sur
les réseaux de neurones sont envisagées. Cette étude devrait permettre de comparer ces différentes lois de commande, en termes de
robustesse, de temps de développement,...
Enfin, à plus long terme, le passage de la plate-forme à une configuration de double pendule inversé est également envisagée. Pour
ce faire, une solution peut être d'adjoindre au pendule un second bras articulé à l'aide d'un capteur angulaire. Il restera bien entendu
à trouver des lois de commande adaptées,...
VII :BIBLIOGRAPHIE et LIENS