You are on page 1of 6

MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ BỘ ĐIỀU KHIỂN

Some various approaches to controller design

Nguyễn Duy Cương1, Đào Bá Phong, Phan Xuân Minh2


1
Đại học Kỹ thuật Công nghiệp Thái Nguyên 2 Đại học Bách khoa Hà Nội

TÓM TẮT
Bài báo này giới thiệu và đánh giá một số phương pháp thiết kế bộ điều khiển cho hệ
tuyến tính và phi tuyến như PID, LQG, bộ điều khiển thích nghi tham chiếu theo mô
hình mẫu MRAS (Model Reference Adaptive Systems) và bộ điều khiển learning
feed-forward dựa trên mạng nơron. Kết quả của các phương pháp thiết kế được mô
phỏng trên phần mềm 20-Sim và kiểm chứng trên mô hình thực nghiệm MeDe5.

ABSTRACT
This paper presents and evaluates some various design types of controller for both
linear and nonlinear system such as PID, LQG, MRAS (Model Reference Adaptive
Systems) and Learning Feed-forward Controller based on neural networks. The
results of design methods are simulated by 20-Sim software and tested on
experiment model MeDe5.

1. GIỚI THIỆU phương pháp đã được làm rõ. Trong thực tế,
Với mục đích cần có một mô hình thực tuỳ thuộc vào đối tượng điều khiển (tuyến
nghiệm để kiểm chứng các kết quả thiết kế tính hay phi tuyến) và yêu cầu về chất lượng
bộ điều khiển cho hệ thống tuyến tính và phi điều khiển mà hệ thống cần phải đạt, ta sẽ
tuyến, nhóm kỹ thuật điều khiển tại Khoa chọn lựa bộ điều khiển cho phù hợp.
Điện, Trường Twente, Hà Lan đã thiết kế và
chế tạo mô hình MeDe5 (The Mechatronic
Demonstration Setup - 2005) vào năm 2005
[1]. Kết cấu cơ khí được thiết kế dựa trên
nguyên lý của công nghệ in, ụ trượt có thể
chuyển động tiến và lùi một cách linh hoạt
nhờ sự dẫn động của động cơ điện một chiều
thông qua dây curoa. Trong mô hình thực
nghiệm này, người thiết kế đã bố trí toàn bộ
động cơ điện, thanh trượt, ụ trượt, dây
curoa,… trên một cái khung dẻo với mục Hình 1: Mô hình thực nghiệm MeDe5
đích để tạo ra sự rung lắc khi ụ trượt di Các thống số cơ bản của MeDe5
chuyển. Hệ thống điều khiển có sự tham gia Element Parameter Value
của máy tính, phần mềm 20-sim cung cấp DC Motor Motor constant 5.7
môi trường mô hình hoá và mô phỏng cho Inertia of motor 1e-5 kg
hệ thống [1,8]. Mục tiêu của chúng tôi là Frame Mass of frame 0.8 kg
thiết kế được những thuật toán điều khiển tốt Frame Flex Spring constant 6 kN/m
để giúp cho quá trình gia tốc, giảm tốc của ụ Damping in 6 Ns/m
trượt được êm hơn, điều này dẫn đến mức độ frame
rung lắc của khung được giảm. Dựa trên hệ
Load Mass of slider 0.3 kg
thống thực nghiệm này, các phương pháp
Belt Flex Spring constant 800 N/m
điều khiển: PID, LQG, MRAS (áp dụng cho
Damping in belt 1 Ns/m
bài toán với đối tượng được tuyến tính hoá)
và mạng nơron (áp dụng để giải quyết bài Damper Viscous friction 3 Ns/m
toán phi tuyến) đã lần lượt được thiết kế và Coulomb friction
thử nghiệm. Qua đó ưu nhược điểm của từng
MotorCurrent
K
DC Motor
FlexibleBelt

m F m m

FlexibleFrame
P
MotorSensor Slider

Damper
P
PositionSensorSlider
PositionSensorFrame
P

Hình 2: Mô hình hoá kết cấu cơ khí của MeDe5


bằng phần mềm 20-Sim Hình 5: Sai lệch giữa tín hiệu mẫu và tín hiệu
ra khi thông số của đối tượng thay đổi
Đối tượng điều khiển (hệ thống thực nghiệm
MeDe5) có mô hình toán học phụ thuộc vào Bộ điều khiển kinh điển PID (hình 3) đã và
các điều kiện biên đi kèm: đang được sử dụng rộng rãi để điều khiển
- Nếu xét đầy đủ các thành phần, đối tượng các đối tượng SISO bởi vì tính đơn giản của
có tính phi tuyến mạnh. nó cả về cấu trúc lẫn nguyên lý làm việc. Bộ
- Khi bỏ qua những thành phần phi tuyến điều chỉnh này làm việc rất tốt trong các hệ
của lực ma sát trên phần tử damper, ta thống có quán tính lớn như điều khiển nhiệt
nhận được mô hình toán học của đối độ, điều khiển mức,... và trong các hệ điều
tượng là khâu bậc 6 tuyến tính. khiển tuyến tính hay có mức độ phi tuyến
- Nếu coi dây curoa nối giữa động cơ và ụ thấp. Tuy nhiên, từ những phân tích lý
trượt là cứng và bỏ qua khối lượng rôto thuyết và kết quả mô phỏng với đối tượng
của động cơ thì đối tượng sẽ có dạng một bậc 2 tuyến tính đã chỉ ra một số hạn chế của
khâu bậc 4 tuyến tính. bộ điều khiển PID như sau:
- Tiếp tục, nếu ta coi khung là vững chắc - Kết quả mô phỏng trên hình 4 cho thấy: khi
thì đối tượng sẽ có dạng một khâu bậc 2 hệ thống bị tác động bởi nhiễu, nhiễu sẽ
tuyến tính. được đưa đến đầu vào thông qua mạch phản
hồi và tổng hợp cùng với tín hiệu mẫu do
2. BỘ ĐIỀU KHIỂN PID
vậy tín hiệu điều khiển cũng sẽ bao gồm
Kp nhiễu. Đây là một trong những nguyên nhân
R y ảnh hưởng đến tính ổn định của hệ thống và
Kd d/dt Qua trinh
độ chính xác điều khiển.
Ki ∫ - Biên độ sai lệch giữa tín hiệu mẫu và tín
hiệu ra là lớn và luôn tồn tại trong suốt quá
Vi tri u truot
trình điều khiển. Sai lệch này có xu hướng
Hình 3: Bộ điều khiển PID tăng khi thông số của đối tượng thay đổi
(hình 5).
- Bộ điều khiển PID được thiết kế trên cơ sở
mô hình tuyến tính hoá với những thông số
chính xác của đối tượng trong khi thực tế đối
tượng là phi tuyến và thông số là không
chính xác.
Tuy nhiên, nếu hệ thống làm việc trong môi
trường ít bị ảnh hưởng của nhiễu, thông số
của đối tượng chỉ thay đổi nhỏ trong quá
trình làm việc và yêu cầu về độ chính xác
Hình 4: Kết quả mô phỏng với thứ tự từ trên cũng như ổn định không cao thì PID vẫn là
xuống: nhiễu, tín hiệu ra, tín hiệu điều khiển một giải pháp hiệu quả.
3. BỘ ĐIỀU KHIỂN LQR (Linear thực và trạng thái ước lượng. Kết quả thiết
Quadratic Regulator) kế và mô phỏng bộ điều khiển LQR số kết
R u y hợp với bộ quan sát trạng thái của Kalman
LQR Qua trinh được cho trên hình 9 và 10.
D Process
K2 A K kM
-1
Z K
Toc do khung LQR K1 m F m m

∫z -1
Vi tri khung P

Toc do u truot LQE


L1 L2
Vi tri u truot -1 -1 A
Vi tri u truot

b1 Z a21 Z D

Hình 6: Nguyên lý bộ điều khiển LQR Toc do u truot uoc luong


a11 a22

Vi tri u truot uoc luong

LQR là thuật toán điều khiển được xây dựng Hình 9: Bộ điều khiển LQR số kết hợp với bộ
dựa trên cơ sở nguyên lý phản hồi trạng thái. quan sát trạng thái Kalman
Bộ điều khiển nhận tín hiệu vào là trạng thái
của hệ thống và tín hiệu mẫu sau đó tính
toán và chuyển thành tín hiệu điều khiển cho
quá trình.
R u y
LQR Qua trinh

Toc do khung* SVF


Vi tri khung*

Toc do u truot* Vi tri


SVF u truot
Vi tri u truot*
Hình 7: Bộ điều khiển LQR kết hợp với SVF Hình 10: Kết quả mô phỏng với thứ tự từ trên
Sử dụng mô hình đối tượng bậc 4 tuyến tính xuống: trạng thái thực, trạng thái ước lượng, sai
trong tính toán với bộ điều khiển LQR. Các lệch trạng thái, tín hiệu điều khiển
trạng thái của đối tượng có thể nhận được Mặt hạn chế thứ nhất của của bộ điều khiển
thông qua bốn cảm biến tuy nhiên khi đó bộ PID về vấn đề nhiễu đã được khắc phục. Kết
điều khiển chịu tác động của nhiễu (hình 6). quả mô phỏng (hình 10) cho thấy: tuy trạng
Để loại bỏ nhiễu, ta sử dụng các bộ lọc biến thái thực và sai lệch trạng thái có bao gồm
trạng thái SVF (State Variable Filter) (hình nhiễu nhưng trạng thái ước lượng và tín hiệu
7). Tuy nhiên SVF gây ra sự chậm pha của điều khiển là sạch (không chứa nhiễu).
trạng thái hồi tiếp. Để khắc phục nhược
điểm này, ta sử dụng bộ điều khiển LQG 4. HỆ THỐNG ĐIỀU KHIỂN THÍCH
(Linear Quadratic Gaussian) [6,7]. NGHI THÁM CHIẾU THEO MÔ
LQG = LQR + LQE
HÌNH MẪU MRAS
y 4.1. Bộ điều khiển MRAS trực tiếp
R u Bản chất của việc áp dụng MRAS (Model
LQR QUA TRINH
Reference Adaptive Systems) là thiết kế bộ
điều khiển sao cho hệ thống đạt được những
đặc tính mong muốn được đưa ra bởi một
LQE
T T uoc luong
Vi tri u truot mô hình toán (mô hình mẫu). Khi đặc tính
của hệ thống thực khác so với đặc tính lý
Hình 8: LQG là sự kết hợp của LQR và LQE tưởng của mô hình mẫu, hệ thống được thay
Chức năng của LQE (Linear Quadratic đổi bằng cách điều chỉnh các thông số của
Estimator) chính là quan sát trạng thái. bộ điều khiển (hình 11). Trong nghiên cứu
Trong truờng hợp này, bộ quan sát trạng thái của chúng tôi, luật điều khiển thích nghi
của Kalman được sử dụng để nhận được được xây dựng trên cơ sở lý thuyết ổn định
trạng thái ước lượng sạch của đối tượng và của Liapunov [2].
không gây ra sự lệch pha giữa trạng thái
bộ điều khiển PID thông thường và LQG
không thể thực hiện được.
U
Qua Yp
BDK trinh
4.2. Bộ điều khiển MRAS gián tiếp
BDK
thich nghi
R U y
BDK Doi tuong
Mo hinh Ym
mau

Hình 11: Bộ điều khiển MRAS trực tiếp BDK


thich nghi
Khi tính toán bộ điều khiển MRAS trực tiếp,
Mo hinh
ta sử dụng mô hình đối tượng bậc 2 tuyến kha chinh
tính và mô hình mẫu cũng có dạng bậc 2.
Kết quả thiết kế và mô phỏng bộ điều khiển Hình 14: Sử dụng MRAS để nhận dạng và ước
MRAS trực tiếp được cho trên hình 12 và lượng trạng thái đối tượng (MRAS gián tiếp)
hình 13. Nhận thấy, bộ điều khiển MRAS
trực tiếp trong trường hợp này chính là bộ Phần trên đã đề cập đến MRAS được sử
điều khiển PID tự chỉnh. dụng trong thích nghi trực tiếp các thông số
r Thich nghi
K K PROCESS
của bộ điều khiển như thế nào. Trong trường
hợp này, đối tượng cần phải tuân theo đáp
Kp
Amplifier MotorGain
SpringDamperBelt MassSlider
Tin hieu mau
m m m

ứng của mô hình mẫu. Tuy nhiên nếu đối


F
ForceActuator
SpringDamperFramMassFram
e e MotorInertia

Thich nghi Thich nghi

tượng và mô hình mẫu thay đổi vị trí cho


PositionSensorSlider
Ki Kd Damper
P

x2 Velocity Slider

Slider Position Error


Loc bien
trang thai nhau, khi đó mô hình mẫu được xem là mô
hình khả chỉnh và sẽ tuân theo đáp ứng của
P21

P22
Desired velocity

x1
Mo hinh mau
Desired Position

Position Slider
đối tượng. Điều này được thực hiện bằng
cách chỉnh định các thông số của mô hình
Hình 12: Sơ đồ cấu trúc bộ điều khiển MRAS
khả chỉnh. Trong quá trình thực hiện, hai
trực tiếp và hệ thống thực nghiệm
vấn đề sau đây được giải quyết [2]:
- Nhận dạng đối tượng: điều chỉnh các thông
số của mô hình khả chỉnh với mục đích để
nhận được các đáp ứng đầu ra giống nhau
giữa đối tượng và mô hình khả chỉnh. Kết
quả, sau một khoảng thời gian hiệu chỉnh,
các thông số của đối tượng và mô hình khả
chỉnh là tương đương nhau.
- Ước lượng trạng thái: sau khi quá trình
chỉnh định thông số của mô hình khả chỉnh
thành công, trạng thái của mô hình này sẽ
tương đương với trạng thái của đối tượng.
Trang thái của mô hình khả chỉnh có thể
Hình 13: Kết quả mô phỏng hệ thống ứng với
được xem như trạng thái ước lượng của đối
các hệ số ma sát của damper khác nhau (3 và 6
(N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí
tượng.
Những luật thích nghi cho bài toán toán
ụ trượt, thích nghi K p , K i va K d
thích nghi trực tiếp và thích nghi gián tiếp là
Từ kết quả mô phỏng nhận thấy ưu điểm của như nhau. Khi hệ thống bị tác động bởi
hệ điều khiển thích nghi trực tiếp là: khi nhiễu, cấu trúc như trên hình 14 cho phép
thông số của đối tượng thay đổi, bộ điều nhận được trạng thái ước lượng sạch của đối
khiển tự động hiệu chỉnh các thông số và sau tượng và khi đó MRAS đóng vai trò như là
một khoảng thời gian xác định, sai lệch của bộ quan sát trạng thái thích nghi. Với chức
hệ thống tiến dần đến 0. Đây là tính chất mà năng giống như bộ lọc Kalman, bộ quan sát
trạng thái thích nghi tạo ra trạng thái ước
lượng sạch của đối tượng. Khi hệ thống bị Nếu các thông số a m = a p , bm = b p và
tác động bởi nhiễu, trạng thái thực cũng như
c m = c p thì H = H r . Khi này, tại đầu ra của
sai lêch luôn bao gồm nhiễu. Tuy nhiên
trạng thái ước lượng (được dùng làm tín hiệu hệ thống nhận được tín hiệu mong muốn
phản hồi) và tín hiệu điều khiển luôn không ( y = r ) . Ta đi tìm một cơ chế học dựa trên
chứa nhiễu (hình 15). Một ưu điểm nổi bật sai lệch giữa tín hiệu ra của mô hình mẫu và
của bộ quan sát trạng thái thích nghi so với của đối tượng để thực hiện việc hiệu chỉnh
bộ quan sát Kalman đó là biên độ sai lệch các tham số a m , bm , và c m theo hướng hội
giữa trạng thái thực và trạng thái ước lượng tụ đến các thông số của đối tượng. Trong
giảm dần và tiến đến giá trị 0 sau một nghiên cứu của chúng tôi, luật điều khiển
khoảng thời gian xác định (hình 16). thích nghi được xây dựng trên cơ sở lý
thuyết ổn định của Liapunov.

Hình 15: Kết quả mô phỏng hệ thống với thứ tự


từ trên xuống: vị trí thực, vị trí ước lượng, sai
lệch vị trí và tín hiệu điều khiển
Hình 18: Kết quả mô phỏng hệ thống ứng với
các hệ số ma sát của damper khác nhau (3 và 6
N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí
ụ trượt, thích nghi a m , bm và c m

Giống như hệ thống với bộ điều khiển thích


nghi trực tiếp, khi thông số của đối tượng
Hình 16: So sánh bộ quan sát trạng thái Kalman thay đổi, bộ điều khiển learning feed-
và bộ quan sát trạng thái thích nghi forward dựa trên MRAS cũng có khả năng
4.3. Bộ điều khiển learning feed- tự động hiệu chỉnh các thông số của bộ điều
forward (LFFC) dựa trên MRAS khiển theo xu hướng đưa sai lệch tiến dần về
0. Tuy nhiên, ưu điểm vượt trội của mô hình
R Mo hinh u y điều khiển này so với LQG và MRAS trực
mau BDK Doi tuong
tiếp đó là tốc độ thích nghi nhanh hơn, độ ổn
định cao hơn và ít nhạy cảm với nhiễu [4,5].
BDK Phương pháp này chỉ áp dụng được khi mô
thich nghi
hình mẫu và đối tượng có dạng bậc 2. Như
vậy với những đối tượng có hàm truyền bậc
cao hơn, khi tính toán ta phải sử dụng hàm
Hình 17: Cấu trúc bộ điều khiển learning feed-
forward dựa trên MRAS xấp xỉ bậc 2 của chúng. Bộ điều khiển LFFC
dựa trên MRAS chỉ có thể áp dụng (bù và
Đối tượng được biểu diễn bởi hàm truyền hiệu chỉnh) cho hệ thống với đối tượng từ
đạt H p và mô hình mẫu có hàm truyền là bậc 2 trở xuống nên đây chính là hạn chế
H r thì hàm truyền của hệ thống từ r đến y của phương pháp này.
ω n2 a m s 2 + bm s + c m
sẽ là H = 2 .
s + 2ςω n s + ω n2 a p s 2 + b p s + c p
5. BỘ ĐIỀU KHIỂN LFFC DỰA TRÊN 6. KẾT LUẬN VÀ HƯỚNG PHÁT
MẠNG NƠRON TRIỂN
Các phương pháp thiết kế bộ điều khiển như Bài báo đã giới thiệu và đánh giá một số
đã đề cập ở trên đều dựa trên mô hình tuyến phương pháp thiết kế bộ điều khiển cho hệ
tính hoá của đối tượng. Tuy nhiên, nếu ta xét tuyến tính và phi tuyến như PID, LQG, bộ
đầy đủ các thành phần lực ma sát trên phần điều khiển thích nghi tham chiếu theo mô
tử damper, đối tượng điều khiển của ta sẽ có hình mẫu MRAS (Model Reference
tính phi tuyến gây ra bởi thành phần lực ma Adaptive Systems) và bộ điều khiển learning
sát Coulomb. Đối với hệ thống phi tuyến, feed-forward dựa trên mạng nơron. Qua đó
việc xác định thông số của đối tượng là rất ưu nhược điểm của từng phương pháp đã
khó khăn. Và nếu áp dụng các bộ điều khiển được làm rõ. Trong thực tế, tuỳ thuộc vào
như PID, LQG hay thậm chí là MRAS cho đối tượng điều khiển (tuyến tính hay phi
đối tượng phi tuyến này thì chất lượng hệ tuyến) và yêu cầu về chất lượng điều khiển
thống nhận được là không tốt. Vì vậy, mà hệ thống cần phải đạt, ta sẽ chọn lựa bộ
phương pháp thiết kế bộ điều khiển LFFC điều khiển cho phù hợp.
dựa trên mạng nơron đã được đề xuất [4,5].
TÀI LIỆU THAM KHẢO
Learning
Feedforward Phi tuyen 1. Hans Dirne; Memonstrator of Advanced
u2 d Controller, Master thesis; University of
y
R e Twente, The Netherlands, May 2005.
BDK Doi tuong
u1 u
2. Amerongen, J. van; Intelligent Control
(part 1)-MRAS, Lecture notes; University of
Twente, The Netherlands, March 2004.
Hình 19: Cấu trúc bộ điều khiển LFFC dựa trên 3. Amerongen, J. van & Vries, T.J.A;
mạng nơron Digitale regeltechniek; University of
Mô hình dự kiến của bộ điều khiển này được Twente, The Netherlands, May 2005.
thể hiện trên hình 20. Thành phần phi tuyến 4. Amerongen, J.van; A MRAS-based
của đối tượng (lực ma sát Coulomb) được learning feed-forward controller; University
of Twente, The Netherlands, 2006.
tách riêng và bù bởi hai mạng nơron kiểu B-
5. Vries T.J.A, Welthuis W.J.R, Idema L.J;
Spline riêng rẽ cho chuyển động thuận và Application of parsimonious learning
ngược của ụ trượt. Hiện nay phương pháp feedforward control to mechatronic systems,
này đang ở trong giai đoạn thiết kế và mô IEE Proceedings of Control Theory
phỏng. Kết quả của LFFC dựa trên mạng Applications, Vol 148 (No 4), July, pp 318-
nơron sẽ được trình bày trong báo cáo sau. 322, 2001.
BSplineNetwork
6. Karl J.Astrom & Bjorn Wittenmark;
Tin hieu mau Adaptive Control 2nd edition; Addison-
Wesley Publishing Company, 1995.
Gia toc mau 7. Yoan D. Landau; Adaptive Control - The
w^2 ∫ ∫
Vi tri mau
model reference approach; New York,
Toc do mau United States, 1979.
2*z*w
Kp
8. Controllab Products B.V; 20-Sim software
Loc bien trang thai Kd d/dt version 3.6, 2006, (http://www.20sim.com).

K Km
Amflifier MotorGain Qua trinh

m F m m

P
Potition Slider Sensor
P
Vi tri u truot

Hình 20: Bộ điều khiển LFFC dựa trên mạng


nơron cho đối tượng phi tuyến

You might also like