Professional Documents
Culture Documents
Tóm tắt: Bài báo này giới thiệu một số phương pháp thiết kế hệ thống điều khiển
thích nghi tham chiếu theo mô hình mẫu MRAS (Model Reference Adaptive
Systems). Luật điều khiển thích nghi được xây dựng trên cơ sở lý thuyết ổn định
của Liapunov. Kết quả của các phương pháp thiết kế được mô phỏng trên phần
mềm 20-Sim và kiểm chứng trên mô hình thực nghiệm. Kết quả lý thuyết và thực
nghiệm là tương đương nhau đã chứng minh tính đúng đắn của nghiên cứu.
Abstract: This paper presents some various types of design for model reference
adaptive systems (MRAS). That adaptive rules are built based on Liapunov’s
stability theory. The results of design methods are simulated by 20-Sim software
and tested on experiment model. The theoretical and experimental result are
equivalent is to prove the research’s accuracy.
1. Giới thiệu
Bản chất của việc áp dụng MRAS là thiết kế bộ điều khiển sao cho hệ thống đạt được những đặc
tính mong muốn được đưa ra bởi một mô hình toán (mô hình mẫu) [2]. Khi đặc tính của hệ thống
thực khác so với đặc tính lý tưởng của mô hình mẫu, hệ thống được thay đổi bằng cách điều chỉnh
các thông số của bộ điều khiển (hình 1) hoặc tạo thêm tín hiệu phụ (hình 2). Điều này có thể được
T
chuyển sang bài toán tối ưu với hàm mục tiêu C = ∫ e 2 dt → 0 (1)
0
U U Yp
Qua Yp u Qua
BDK trinh BDK trinh
BDK BDK
thich nghi thich nghi
Mo hinh Ym Mo hinh Ym
mau mau
Kb Ka Kb
Ka
beta ∫ ∫ alpha
?
Ym Ym
Mo hinh mau Mo hinh mau
Hình 3: Mô hình mẫu và quá trình Hình 4: Luật điều chỉnh dựa trên quy tắc MIT
Sự biến đổi thông số của a p có thể được bù bởi hệ số K a và sự thay đổi thông số của b p được điều
Kb + bp
chỉnh bởi hệ số K b . Khi đó hàm truyền đạt của đối tượng sẽ có dạng . Với mục
s 2 + (a p + K a ) s + 1
đích để nhận được các đáp ứng của qúa trình và của mô hình mẫu là như nhau, các hệ số K b và
K a sẽ được hiểu chỉnh sao cho sai lệch giữa ( K b + b p ) va bm cũng như sai lệch giữa ( K a + a p ) và
a m hội tụ đến giá trị zero. Dựa trên quy tắc MIT, các hệ số K b va K a được xác định theo các công
thức sau [2,5]:
K b (t ) = K b (0) + β ∫ (eu ) dt (4)
K a (t ) = K a (0) + α ∫ (ex 2 ) dt (5)
với α , β là các hệ số thích nghi, nó đặc trưng cho tốc độ của quá trình điều chỉnh.
2. Luật điều khiển thích nghi trên cơ sở lý thuyết ổn định của Liapunov [2]
2.1. Xác định vi phân sai lệch giữa mô hình mẫu và quá trình điều khiển
Quá trình điều khiển và mô hình mẫu được biểu diễn dưới dạng phương trình trạng thái có dạng
. .
x p = A p x p + B p u và x m = Am x m + Bm u (6)
. . .
e = x m − x p = Am x m − A p x p + Bm u − B p u
.
⇒ e = Am e + Ax p + Bu (7)
với A = Am − ( A + K a ) và B = Bm − ( B + K p )
*
p
*
p
14243 14243
Ap Bp
* *
A va B là các thông số của quá trình điều khiển được bù bởi các thông số của bộ điều khiển K a
p p
và K b . Việc điều chỉnh A và B tuân theo những luật thích nghi phi tuyến có dạng (4) và (5), do đó
phương trình vi phân (7) là phi tuyến.
2.2. Chọn hàm Liapunov
Để bảo đảm rằng sai lệch e tiến đến 0 khi thời gian tiến đến vô cùng, ta cần chứng minh rằng e = 0
là giải pháp cân bằng ổn định. Theo lý thuyết ổn định Liapunov, điều này được thực hiện bằng cách
chọn hàm Liapunov V (e) với các tính chất sau:
- V (e) là xác định dương, nghĩa là V > 0 với e ≠ 0 , V = 0 với e = 0
- V (e) là xác định âm, nghĩa là V < 0 với e ≠ 0 , V = 0 với e = 0
- V (e) → ∞ nếu | e |→ ∞
Một trong các hàm Liapunov đơn giản thường được sử dụng là [2]:
V (e) = e T Pe + a T αa + b T β b (8)
P là ma trận đối xứng xác định dương tuỳ chọn.
a và b là các vector chứa các thành phần khác zero của các ma trận A và B .
α và β là các ma trận đường chéo với các phần tử dương có chức năng xác định tốc độ của quá
trình thích nghi.
Với sự lựa chọn P , α và β như trên thì V (e) là một hàm xác định dương.
.
2.3. Xác định các điều kiện sao cho V (e) là một hàm xác định âm
Đạo hàm của V (e) có dạng (9)
. . . . .
V = e T Pe + e T P e + 2 a T αa + 2 b T β b (9)
Kết hợp (7) và (9) ta được:
. . .
V = ( Am e) T Pe + e T P( Am e) + 2e T PAx p + 2 a T αa + 2e T PBu + 2 b T βb
1444 424444 3 14444444244444443
(i ) ( ii )
Đặt A P + PAm = −Q
T
m (10)
.
Phần (i) của V (e) được viết lại thành e T ( AmT P + PAm )e = −e T Qe
Theo định lý Malkin, Q là ma trận xác định dương. Điều này có nghĩa giá trị của phần (i) là luôn
âm. Như vậy, sự ổn định của hệ thống sẽ được đảm bảo nếu phần (ii) có giá trị zero, tức là:
.
e T PAx p + a T αa = 0 (11)
.
e T PBu + b β b = 0
T
(12)
2.4. Xác định P theo phương trình (10)
Sau một số các biến đổi ta nhận được dạng tổng quát của luật điều chỉnh như sau:
. 1 ⎛ n ⎞ . 1 ⎛ n ⎞
a ni = − ⎜ ∑ Pnk ek ⎟ xi (13) ; b i = − ⎜ ∑ Pnk ek ⎟u i (14)
α ni ⎝ k =1 ⎠ β i ⎝ k =1 ⎠
với n là bậc của hệ thống. Pnk là các phần tử thuộc hàng thứ n và cột thứ k của ma trận P .
Với ma trận Q xác định dương chọn trước, giải phương trình (10) ta sẽ xác định được ma trận P .
Khi đó, luật điều khiển thích nghi tổng quát sẽ có dạng như sau:
t t
−1 ⎛ n ⎞ 1 ⎛ n ⎞
Ka = ∫ ⎜ ∑ Pnk ek ⎟xi dt + K a (0) (15) Kb = ∫ ⎜ ∑ Pnk ek ⎟u i dt + K b (0) (16)
α ni 0 ⎝ k =1 ⎠ β i 0 ⎝ k =1 ⎠
Các hệ số α và β do người thiết kế lựa chọn. Dựa vào kết quả mô phỏng ta sẽ chọn được bộ giá trị
α , β thích hợp.
3. Bộ điều khiển learning feed-forward dựa trên MRAS
1
.. Hp = (17)
r am a p s + bp s + c p
2
. + ω n2
r + Hr = (18)
bm s 2 + 2ςω n s + ω n2
+
R ω n2 r + 1 y
Hình 5: Nguyên lý điều
cm
s 2 + 2ςω n s + ω n2 a p s + bp s + c p
2
khiển learning feed-forward
Đối tượng được biểu diễn bởi hàm truyền đạt H p và mô hình mẫu có hàm truyền là H r thì hàm
ω n2 a m s 2 + bm s + c m
truyền của hệ thống từ r đến y sẽ là H = . Nếu các thông số
s 2 + 2ςω n s + ω n2 a p s 2 + b p s + c p
a m = a p , bm = b p và c m = c p thì H = H r . Khi này, tại đầu ra của hệ thống nhận được tín hiệu mong
muốn ( y = r ) . Ta đi tìm một cơ chế học sử dụng sai lệch giữa tín hiệu ra của mô hình mẫu và của đối tượng
và thực hiện việc hiệu chỉnh các tham số a m , bm , và c m theo hướng hội tụ đến các thông số của đối tượng
[4,6]. Luật điều chỉnh thich nghi được thực hiện như 4 bước đã nêu ở phần trên. Chỉ có một chú ý là trong
trường hợp này hàm Liapunov được chọn có dạng V = e T Pe + ε T αε .
Với đối tượng và mô hình mẫu có dạng như (17) và (18), các luật điều chỉnh có dạng như sau:
1 . .. 1 . .
am =
α1 ∫ [( p21e + p22 e) r ]dt + am (0) ; bm =
α2 ∫ [( p21e + p22 e) r ]dt + bm (0)
1 .
cm =
α3 ∫ [( p 21 e + p 22 e)r ]dt + c m (0) (19)
4. Nhận dạng và ước lượng trạng thái dựa trên MRAS (thích nghi gián tiếp)
Phần trên đã đề cập đến MRAS được sử dụng trong thích nghi trực tiếp các thông số của bộ điều
khiển như thế nào. Trong trường hợp này, đối tượng cần phải tuân theo đáp ứng của mô hình mẫu.
Tuy nhiên nếu đối tượng và mô hình mẫu thay đổi vị trí cho nhau, khi đó mô hình mẫu được xem là
mô hình khả chỉnh và sẽ tuân theo đáp ứng của đối tượng. Điều này được thực hiện bằng cách chỉnh
định các thông số của mô hình khả chỉnh. Trong quá trình thực hiện, hai vấn đề sau đây được giải
quyết [2]:
- Nhận dạng đối tượng: điều chỉnh các thông số của mô hình khả chỉnh với mục đích để nhận được
các đáp ứng đầu ra giống nhau giữa đối tượng và mô hình khả chỉnh. Kết quả, sau một khoảng thời
gian hiệu chỉnh, các thông số của đối tượng và mô hình khả chỉnh là tương đương nhau.
- Ước lượng trạng thái: sau khi quá trình chỉnh định thông số của mô hình khả chỉnh thành công,
trạng thái của mô hình này sẽ tương đương với trạng thái của đối tượng. Trang thái của mô hình khả
chỉnh có thể được xem như trạng thái ước lượng của đối tượng.
Cấu trúc hình 6 còn được hiểu là MRAS gián
U y tiếp. Những luật thích nghi cho bài toán nhận
BDK Doi tuong dạng và cho bài toán thích nghi trực tiếp, thích
nghi gián tiếp là như nhau. Tuy nhiên với lưu
ý rằng khi áp dụng tính toán cho bài toán nhận
BDK
thich nghi
dạng, trạng thái x p ,i được thay thế bởi x m,i .
Đối với công thức (10) thay vì ma trận Am
Mo hinh
kha chinh
của mô hình mẫu, ma trận A p của đối tượng
được sử dụng.
Hình 6: Nhận dạng và ước lượng trạng thái dựa
trên MRAS
Khi hệ thống bị tác động bởi nhiễu, cấu trúc như trên hình 6 cho phép nhận được trạng thái ước
lượng sạch của đối tượng và khi đó MRAS đóng vai trò như là bộ quan sát trạng thái thích nghi.
5. Hệ thống thực nghiệm MeDe5 (The Mechatronic Demonstration Setup - 2005)
Nhóm kỹ thuật điều khiển - Khoa Điện, Trường Twente, Hà Lan đã thiết kế và chế tạo mô hình này
vào năm 2005 với mục đích phục vụ cho việc nghiên cứu và chuyển giao công nghệ. Kết cấu cơ khí
được thiết kế dựa trên nguyên lý của công nghệ in, ụ trượt có thể chuyển động tiến và lùi một cách
linh hoạt nhờ sự dẫn động của động cơ điện một chiều thông qua dây curoa. Trong mô hình thực
nghiệm này, người thiết kế đã bố trí toàn bộ động cơ điện, thanh trượt, ụ trượt, dây curoa,… trên
một cái khung dẻo với mục đích để tạo ra sự rung lắc khi ụ trượt di chuyển [1].
Hệ thống điều khiển có sự tham gia của máy tính, phần mềm 20-sim cung cấp môi trường mô hình
hoá và mô phỏng cho hệ thống [7]. Dựa trên hệ thống thực nghiệm này, một số phương pháp điều
khiển truyền thống như PID, LQG, MRAS, STR (áp dụng cho bài toán với đối tượng được tuyến
tính hoá) cũng như các phương pháp điều khiển nâng cao như điều khiển mờ và mạng nơron (áp
dụng để giải quyết bài toán phi tuyến) đã được kiểm chứng. Qua đó nhược điểm của các phương
pháp điều khiển truyền thống cũng như ưu điểm của các phương pháp hiện đại không những được
chỉ ra trên lý thuyết mà còn được kiểm chứng trực quan trên mô hình thực nghiệm này.
Nếu ta thiết kế được những thuật toán điều khiển tốt sẽ giúp cho quá trình gia tốc, giảm tốc của ụ
trượt êm hơn, điều này dẫn đến mức độ rung lắc của khung được giảm.
MotorCurrent
K
DC Motor
FlexibleBelt
m F m m
FlexibleFrame
P
MotorSensor Slider
Damper
P
PositionSensorSlider
PositionSensorFrame
P
Hình 7: Mô hình thực nghiệm MeDe5 Hình 8: Mô hình hoá kết cấu cơ khí của MeDe5 bằng
phần mềm 20-Sim
Amplifier MotorGain
SpringDamperBelt MassSlider
Tin hieu mau
Thich nghi Thich nghi
Ki Kd m F m m
ForceActuator
SpringDamperFramMassFram
e e MotorInertia
PositionSensorSlider
Damper
P
P22 P21
Velocity Slider
Loc bien
Mo hinh mau trang thai
Slider Position Error
Desired Position
Position Slider
Hình 9: MeDe5 với bộ điều khiển PID thích nghi trực tiếp
ω n2
H ref = ; ω n = 5 ; ς = 0.75 ;
s 2 + 2ςω n s + ω n2
ω F2
H SVF = 2 ; ω F = 50 ; ξ = 0.7 ;
s + 2ξω F s + ω F2
α = 3500 ; β = 300; γ = −3000 ;
P21 = 0.01 ; P22 = 0.0015 ;
t
Kp = α ∫ ( p 21e1 + p 22 e2 )(r − x1 )dt + K p (0)
0
t
K i = β ∫ ( p 21e1 + p 22 e2 )rdt + K i (0) (21) Hình 10: Kết quả mô phỏng hệ thống ứng với các
0 hệ số ma sát của damper khác nhau (3 và 6
t
N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí ụ
K d = γ ∫ ( p 21e1 + p 22 e2 ) x 2 dt + K d (0) trượt, thích nghi K p , K i và K d
0
Từ kết quả mô phỏng nhận thấy ưu điểm của hệ điều khiển thích nghi trực tiếp là: khi thông số của
đối tượng thay đổi, bộ điều khiển tự động hiệu chỉnh các thông số K p , K i , K d và sau một khoảng
thời gian xác định, sai lệch của hệ thống tiến dần đến 0.
6.2. MeDe5 với bộ điều khiển learning feed-forward dựa trên MRAS
Quá trình tính toán dựa trên thông số của mô hình tuyến tính xấp xỉ bậc 2 của đối tượng bậc 6. Hai
bộ lọc biến trạng thái và mô hình mẫu H ref có cấu trúc giống nhau. Bộ lọc biến trạng thái thứ nhất
đóng vai trò tạo tín hiệu trạng thái mẫu. Bộ lọc biến trạng thái thứ hai được sử dụng để nhận được
.
đồng thời sai lệch vị trí của ụ trượt e và đạo hàm e của nó. Áp dụng các bước tính toán ở mục 2 và
mục 3, ta tính được các hệ số của ma trận P và các luật chỉnh định thích nghi các hệ số a m , bm và
c m của bộ điều khiển. Mô hình mô phỏng hệ thống MeDe5 với bộ điều khiển learning feed-forward
dựa trên MRAS được biểu diễn trong hình 11 và kết quả mô phỏng được thể hiện trong hình 12.
Hình 11: MeDe5 với bộ điều khiển learning feed-forward dựa trên MRAS
ω n2
H ref = ; ω n = 5 ; ς = 0.75 ;
s 2 + 2ςω n s + ω n2
ω F2
H SVF = 2 ; ω F = 50 ; ξ = 0.7 ;
s + 2ξω F s + ω F2
α a = 1.7 ; α b = 1200 ; α c = 150000 ;
P21 = 2 *10 −5 ; P22 = 7.17 * 10 −5 ; K p = 20 ;
. ..
a m = α a ∫ [( p 21e + p 22 e) r ]dt + a m (0)
. .
bm = α b ∫ [( p 21e + p 22 e) r ]dt + bm (0)
.
c m = α c ∫ [( p 21e + p 22 e)r ]dt + c m (0)
Giống như hệ thống với bộ điều khiển thích nghi trực tiếp, khi thông số của đối tượng thay đổi, bộ
điều khiển learning feed-forward dựa trên MRAS cũng có khả năng tự động hiệu chỉnh các thông số
của bộ điều khiển theo xu hướng đưa sai lệch tiến dần về 0. Tuy nhiên, ưu điểm vượt trội của mô
hình điều khiển này là tốc độ thích nghi nhanh hơn, độ ổn định cao hơn và ít nhạy cảm với nhiễu.
Công thức (19) chỉ áp dụng được khi mô hình mẫu và đối tượng có dạng bậc 2. Như vậy với những
đối tượng có hàm truyền bậc cao hơn, khi tính toán ta phải sử dụng hàm xấp xỉ bậc 2 của chúng. Bộ
điều khiển feed - forward chỉ có thể được áp dụng (bù, hiệu chỉnh) cho hệ thống với đối tượng có
dạng bậc 2 trở xuống nên đây chính là hạn chế của phương pháp này.
6.3. MeDe5 với bộ điều khiển thích nghi gián tiếp dựa trên MRAS (bộ quan sát trạng thái
thích nghi)
Ta phải thiết kế bộ quan sát trạng thái thích nghi với mục đích tạo ra trạng thái ước lượng sạch
(không chứa nhiễu) của đối tượng để cung cấp cho bộ điều khiển tối ưu LQR (Linear Quadratic
Regulator). Dựa vào đó, bộ điều khiển LQR tính toán và tạo ra tín hiệu điều khiển. Lưu ý ở đây,
trong công thức (10), ký hiệu AP của đối tượng được sử dụng.
Áp dụng các bước tính toán ở mục 2, ta tính được các hệ số của ma trận P và luật chỉnh định thích
nghi các hệ số K a và K b của bộ điều khiển theo công thức (15) và (16). Mô hình mô phỏng hệ
thống MeDe5 bộ điều khiển thích nghi gián tiếp dựa trên MRAS được biểu diễn trong hình 13 và
kết quả mô phỏng được thể hiện trong hình 14 và hình 15.
K b1 = β b1 ∫ ( p11e1 + p12 e2 + p13 e3 + p14 e4 )udt + K b1 (0) P11 = 214.2 , P12 = −15.488 ,
P13 = −4.4681 , P14 = 2013.5 ,
K b 3 = β b 3 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 )udt + K b 3 (0)
P31 = −4.4681 , P32 = −0.0066 ,
K a 33 = −α a 33 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 ) x3 dt + K a 33 (0)
P33 = 4.4448 , P34 = −0.0066 ,
K a 34 = −α a 34 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 ) x 4 dt + K a 34 (0) β b1 = 20 , β b 3 = 500 , α a 33 = −20
Amplifier MotorGain
PROCESS
LQR K K
SteeringSignal SpringDamperFrame MotorInertia SpringDamperBelt MassSlider
Reference
m F m m
ForceActuator1
MassFrame
Damper P
PositionSensorSlider V PositionSensorFrame
P
V
Slider Velocity Slider Position Frame Velocity Frame Position
Adaptive Adaptive
Ka33 Ka34
Estimative State
Adaptive
Kb1
∫ ∫ Adaptive
Kb3
∫ ∫
a32
a31
EstimatedSliderVelocity
a13
EstimatedFrameVelocity
Với chức năng giống như bộ lọc Kalman, bộ quan sát trạng thái thích nghi tạo ra trạng thái ước
lượng sạch của đối tượng. Điều này được thể hiện như trên hình 14. Khi hệ thống bị tác động bởi
nhiễu, trạng thái thực cũng như sai lêch luôn bao gồm nhiễu. Tuy nhiên trạng thái ước lượng (được
dùng làm tín hiệu phản hồi) và tín hiệu điều khiển luôn không chứa nhiễu.
Một ưu điểm nổi bật của bộ quan sát trạng thái thích nghi so với bộ quan sát Kalman đó là biên độ
sai lệch giữa trạng thái thực và trạng thái ước lượng giảm dần và tiến đến giá trị 0 sau một khoảng
thời gian xác định (hình 15).
7. Kết luận và hướng phát triển
Bài báo này giới thiệu 3 dạng thể hiện khác nhau của MRAS đó là trực tiếp, gián tiếp và learning
feed-forward. Căn cứ vào ưu khuyết điểm của từng phương pháp và bài toán cụ thể, ta sẽ lựa chọn
được phương án thiết kế bộ điều khiển phù hợp. Lý thuyết ổn định Liapunov được sử dụng trong
thiết kế bộ điều khiển do đó tiêu chí ổn định luôn được đảm bảo. Tuy nhiên, cả ba phương pháp
thiết kế trên đều dựa trên thông số của đối tượng được tuyến tính hoá. Do đó, nếu xét cả các thông
số gây ra tính phi tuyến cho đối tượng điều khiển thì phương án kết hợp MRAS với logíc mờ hay
mạng nơron sẽ được sử dụng. Kết quả của nghiên cứu này sẽ được trình bày trong những bài báo
tiếp theo.