You are on page 1of 9

Hệ thống điều khiển thích nghi tham chiếu theo mô hình mẫu MRAS

Nguyễn Duy Cương1, Đào Bá Phong, Phan Xuân Minh2


1
Đại học Kỹ thuật Công nghiệp Thái Nguyên
2
Đại học Bách khoa Hà Nội
nguyen_duy_an@yahoo.com, dbphong@gmail.com

Tóm tắt: Bài báo này giới thiệu một số phương pháp thiết kế hệ thống điều khiển
thích nghi tham chiếu theo mô hình mẫu MRAS (Model Reference Adaptive
Systems). Luật điều khiển thích nghi được xây dựng trên cơ sở lý thuyết ổn định
của Liapunov. Kết quả của các phương pháp thiết kế được mô phỏng trên phần
mềm 20-Sim và kiểm chứng trên mô hình thực nghiệm. Kết quả lý thuyết và thực
nghiệm là tương đương nhau đã chứng minh tính đúng đắn của nghiên cứu.
Abstract: This paper presents some various types of design for model reference
adaptive systems (MRAS). That adaptive rules are built based on Liapunov’s
stability theory. The results of design methods are simulated by 20-Sim software
and tested on experiment model. The theoretical and experimental result are
equivalent is to prove the research’s accuracy.

1. Giới thiệu
Bản chất của việc áp dụng MRAS là thiết kế bộ điều khiển sao cho hệ thống đạt được những đặc
tính mong muốn được đưa ra bởi một mô hình toán (mô hình mẫu) [2]. Khi đặc tính của hệ thống
thực khác so với đặc tính lý tưởng của mô hình mẫu, hệ thống được thay đổi bằng cách điều chỉnh
các thông số của bộ điều khiển (hình 1) hoặc tạo thêm tín hiệu phụ (hình 2). Điều này có thể được
T
chuyển sang bài toán tối ưu với hàm mục tiêu C = ∫ e 2 dt → 0 (1)
0

U U Yp
Qua Yp u Qua
BDK trinh BDK trinh

BDK BDK
thich nghi thich nghi

Mo hinh Ym Mo hinh Ym
mau mau

Hình 1: Hệ thích nghi tham số Hình 2: Hệ thích nghi tín hiệu


với e = y m − y p . Tuy nhiên, thay vì chỉ tối thiểu sai lệch giữa các tín hiệu ra của quá trình ( y p ) và
của mô hình mẫu ( y m ) , tất cả các biến trạng thái của quá trình và của mô hình mẫu có thể được đưa
vào tính toán. Nếu các biến trạng thái của quá trình được biểu thị ( x p ) và của mô hình mẫu là ( x m )
thì vector sai lệch (e) được xác định như sau e = x m − x p (2)
T
Trong trường hợp này, bài toán tối ưu sẽ có hàm mục tiêu là: C = ∫ (e T Pe)dt → 0 (3)
0
với P là một ma trận xác định dương. Cấu trúc hệ thống như trên hình 1 và hình 2 được hiểu là
MRAS trực tiếp. Để đơn giản việc phân tích và tính toán, ta xét hệ thống thích nghi tham chiếu theo
mô hình mẫu như trên hình 3. Đối tượng tuyến tính được biểu diễn bằng hàm truyền đạt có dạng
bp bm Kω n2
và mô hình mẫu có hàm truyền đạt là hay .
s2 + aps +1 s 2 + am s + 1 s 2 + 2ξω n s + ω n2
U x2 Yp U x2 Yp
bp ∫ ∫ bp ∫ ∫
QUA TRINH
ap ap QUA TRINH

Kb Ka Kb
Ka

beta ∫ ∫ alpha
?

Ym Ym
Mo hinh mau Mo hinh mau

Hình 3: Mô hình mẫu và quá trình Hình 4: Luật điều chỉnh dựa trên quy tắc MIT
Sự biến đổi thông số của a p có thể được bù bởi hệ số K a và sự thay đổi thông số của b p được điều
Kb + bp
chỉnh bởi hệ số K b . Khi đó hàm truyền đạt của đối tượng sẽ có dạng . Với mục
s 2 + (a p + K a ) s + 1
đích để nhận được các đáp ứng của qúa trình và của mô hình mẫu là như nhau, các hệ số K b và
K a sẽ được hiểu chỉnh sao cho sai lệch giữa ( K b + b p ) va bm cũng như sai lệch giữa ( K a + a p ) và
a m hội tụ đến giá trị zero. Dựa trên quy tắc MIT, các hệ số K b va K a được xác định theo các công
thức sau [2,5]:
K b (t ) = K b (0) + β ∫ (eu ) dt (4)
K a (t ) = K a (0) + α ∫ (ex 2 ) dt (5)
với α , β là các hệ số thích nghi, nó đặc trưng cho tốc độ của quá trình điều chỉnh.
2. Luật điều khiển thích nghi trên cơ sở lý thuyết ổn định của Liapunov [2]
2.1. Xác định vi phân sai lệch giữa mô hình mẫu và quá trình điều khiển
Quá trình điều khiển và mô hình mẫu được biểu diễn dưới dạng phương trình trạng thái có dạng
. .
x p = A p x p + B p u và x m = Am x m + Bm u (6)
. . .
e = x m − x p = Am x m − A p x p + Bm u − B p u
.
⇒ e = Am e + Ax p + Bu (7)
với A = Am − ( A + K a ) và B = Bm − ( B + K p )
*
p
*
p
14243 14243
Ap Bp
* *
A va B là các thông số của quá trình điều khiển được bù bởi các thông số của bộ điều khiển K a
p p

và K b . Việc điều chỉnh A và B tuân theo những luật thích nghi phi tuyến có dạng (4) và (5), do đó
phương trình vi phân (7) là phi tuyến.
2.2. Chọn hàm Liapunov
Để bảo đảm rằng sai lệch e tiến đến 0 khi thời gian tiến đến vô cùng, ta cần chứng minh rằng e = 0
là giải pháp cân bằng ổn định. Theo lý thuyết ổn định Liapunov, điều này được thực hiện bằng cách
chọn hàm Liapunov V (e) với các tính chất sau:
- V (e) là xác định dương, nghĩa là V > 0 với e ≠ 0 , V = 0 với e = 0
- V (e) là xác định âm, nghĩa là V < 0 với e ≠ 0 , V = 0 với e = 0
- V (e) → ∞ nếu | e |→ ∞
Một trong các hàm Liapunov đơn giản thường được sử dụng là [2]:
V (e) = e T Pe + a T αa + b T β b (8)
P là ma trận đối xứng xác định dương tuỳ chọn.
a và b là các vector chứa các thành phần khác zero của các ma trận A và B .
α và β là các ma trận đường chéo với các phần tử dương có chức năng xác định tốc độ của quá
trình thích nghi.
Với sự lựa chọn P , α và β như trên thì V (e) là một hàm xác định dương.
.
2.3. Xác định các điều kiện sao cho V (e) là một hàm xác định âm
Đạo hàm của V (e) có dạng (9)
. . . . .
V = e T Pe + e T P e + 2 a T αa + 2 b T β b (9)
Kết hợp (7) và (9) ta được:
. . .
V = ( Am e) T Pe + e T P( Am e) + 2e T PAx p + 2 a T αa + 2e T PBu + 2 b T βb
1444 424444 3 14444444244444443
(i ) ( ii )

Đặt A P + PAm = −Q
T
m (10)
.
Phần (i) của V (e) được viết lại thành e T ( AmT P + PAm )e = −e T Qe
Theo định lý Malkin, Q là ma trận xác định dương. Điều này có nghĩa giá trị của phần (i) là luôn
âm. Như vậy, sự ổn định của hệ thống sẽ được đảm bảo nếu phần (ii) có giá trị zero, tức là:
.
e T PAx p + a T αa = 0 (11)
.
e T PBu + b β b = 0
T
(12)
2.4. Xác định P theo phương trình (10)
Sau một số các biến đổi ta nhận được dạng tổng quát của luật điều chỉnh như sau:
. 1 ⎛ n ⎞ . 1 ⎛ n ⎞
a ni = − ⎜ ∑ Pnk ek ⎟ xi (13) ; b i = − ⎜ ∑ Pnk ek ⎟u i (14)
α ni ⎝ k =1 ⎠ β i ⎝ k =1 ⎠
với n là bậc của hệ thống. Pnk là các phần tử thuộc hàng thứ n và cột thứ k của ma trận P .
Với ma trận Q xác định dương chọn trước, giải phương trình (10) ta sẽ xác định được ma trận P .
Khi đó, luật điều khiển thích nghi tổng quát sẽ có dạng như sau:
t t
−1 ⎛ n ⎞ 1 ⎛ n ⎞
Ka = ∫ ⎜ ∑ Pnk ek ⎟xi dt + K a (0) (15) Kb = ∫ ⎜ ∑ Pnk ek ⎟u i dt + K b (0) (16)
α ni 0 ⎝ k =1 ⎠ β i 0 ⎝ k =1 ⎠

Các hệ số α và β do người thiết kế lựa chọn. Dựa vào kết quả mô phỏng ta sẽ chọn được bộ giá trị
α , β thích hợp.
3. Bộ điều khiển learning feed-forward dựa trên MRAS
1
.. Hp = (17)
r am a p s + bp s + c p
2

. + ω n2
r + Hr = (18)
bm s 2 + 2ςω n s + ω n2
+
R ω n2 r + 1 y
Hình 5: Nguyên lý điều
cm
s 2 + 2ςω n s + ω n2 a p s + bp s + c p
2
khiển learning feed-forward
Đối tượng được biểu diễn bởi hàm truyền đạt H p và mô hình mẫu có hàm truyền là H r thì hàm
ω n2 a m s 2 + bm s + c m
truyền của hệ thống từ r đến y sẽ là H = . Nếu các thông số
s 2 + 2ςω n s + ω n2 a p s 2 + b p s + c p
a m = a p , bm = b p và c m = c p thì H = H r . Khi này, tại đầu ra của hệ thống nhận được tín hiệu mong
muốn ( y = r ) . Ta đi tìm một cơ chế học sử dụng sai lệch giữa tín hiệu ra của mô hình mẫu và của đối tượng
và thực hiện việc hiệu chỉnh các tham số a m , bm , và c m theo hướng hội tụ đến các thông số của đối tượng
[4,6]. Luật điều chỉnh thich nghi được thực hiện như 4 bước đã nêu ở phần trên. Chỉ có một chú ý là trong
trường hợp này hàm Liapunov được chọn có dạng V = e T Pe + ε T αε .
Với đối tượng và mô hình mẫu có dạng như (17) và (18), các luật điều chỉnh có dạng như sau:
1 . .. 1 . .
am =
α1 ∫ [( p21e + p22 e) r ]dt + am (0) ; bm =
α2 ∫ [( p21e + p22 e) r ]dt + bm (0)
1 .
cm =
α3 ∫ [( p 21 e + p 22 e)r ]dt + c m (0) (19)

4. Nhận dạng và ước lượng trạng thái dựa trên MRAS (thích nghi gián tiếp)
Phần trên đã đề cập đến MRAS được sử dụng trong thích nghi trực tiếp các thông số của bộ điều
khiển như thế nào. Trong trường hợp này, đối tượng cần phải tuân theo đáp ứng của mô hình mẫu.
Tuy nhiên nếu đối tượng và mô hình mẫu thay đổi vị trí cho nhau, khi đó mô hình mẫu được xem là
mô hình khả chỉnh và sẽ tuân theo đáp ứng của đối tượng. Điều này được thực hiện bằng cách chỉnh
định các thông số của mô hình khả chỉnh. Trong quá trình thực hiện, hai vấn đề sau đây được giải
quyết [2]:
- Nhận dạng đối tượng: điều chỉnh các thông số của mô hình khả chỉnh với mục đích để nhận được
các đáp ứng đầu ra giống nhau giữa đối tượng và mô hình khả chỉnh. Kết quả, sau một khoảng thời
gian hiệu chỉnh, các thông số của đối tượng và mô hình khả chỉnh là tương đương nhau.
- Ước lượng trạng thái: sau khi quá trình chỉnh định thông số của mô hình khả chỉnh thành công,
trạng thái của mô hình này sẽ tương đương với trạng thái của đối tượng. Trang thái của mô hình khả
chỉnh có thể được xem như trạng thái ước lượng của đối tượng.
Cấu trúc hình 6 còn được hiểu là MRAS gián
U y tiếp. Những luật thích nghi cho bài toán nhận
BDK Doi tuong dạng và cho bài toán thích nghi trực tiếp, thích
nghi gián tiếp là như nhau. Tuy nhiên với lưu
ý rằng khi áp dụng tính toán cho bài toán nhận
BDK
thich nghi
dạng, trạng thái x p ,i được thay thế bởi x m,i .
Đối với công thức (10) thay vì ma trận Am
Mo hinh
kha chinh
của mô hình mẫu, ma trận A p của đối tượng
được sử dụng.
Hình 6: Nhận dạng và ước lượng trạng thái dựa
trên MRAS

Khi hệ thống bị tác động bởi nhiễu, cấu trúc như trên hình 6 cho phép nhận được trạng thái ước
lượng sạch của đối tượng và khi đó MRAS đóng vai trò như là bộ quan sát trạng thái thích nghi.
5. Hệ thống thực nghiệm MeDe5 (The Mechatronic Demonstration Setup - 2005)
Nhóm kỹ thuật điều khiển - Khoa Điện, Trường Twente, Hà Lan đã thiết kế và chế tạo mô hình này
vào năm 2005 với mục đích phục vụ cho việc nghiên cứu và chuyển giao công nghệ. Kết cấu cơ khí
được thiết kế dựa trên nguyên lý của công nghệ in, ụ trượt có thể chuyển động tiến và lùi một cách
linh hoạt nhờ sự dẫn động của động cơ điện một chiều thông qua dây curoa. Trong mô hình thực
nghiệm này, người thiết kế đã bố trí toàn bộ động cơ điện, thanh trượt, ụ trượt, dây curoa,… trên
một cái khung dẻo với mục đích để tạo ra sự rung lắc khi ụ trượt di chuyển [1].
Hệ thống điều khiển có sự tham gia của máy tính, phần mềm 20-sim cung cấp môi trường mô hình
hoá và mô phỏng cho hệ thống [7]. Dựa trên hệ thống thực nghiệm này, một số phương pháp điều
khiển truyền thống như PID, LQG, MRAS, STR (áp dụng cho bài toán với đối tượng được tuyến
tính hoá) cũng như các phương pháp điều khiển nâng cao như điều khiển mờ và mạng nơron (áp
dụng để giải quyết bài toán phi tuyến) đã được kiểm chứng. Qua đó nhược điểm của các phương
pháp điều khiển truyền thống cũng như ưu điểm của các phương pháp hiện đại không những được
chỉ ra trên lý thuyết mà còn được kiểm chứng trực quan trên mô hình thực nghiệm này.
Nếu ta thiết kế được những thuật toán điều khiển tốt sẽ giúp cho quá trình gia tốc, giảm tốc của ụ
trượt êm hơn, điều này dẫn đến mức độ rung lắc của khung được giảm.

MotorCurrent
K
DC Motor
FlexibleBelt

m F m m

FlexibleFrame
P
MotorSensor Slider

Damper
P
PositionSensorSlider
PositionSensorFrame
P

Hình 7: Mô hình thực nghiệm MeDe5 Hình 8: Mô hình hoá kết cấu cơ khí của MeDe5 bằng
phần mềm 20-Sim

Các thống số cơ bản phần cơ của MeDe5


Element Parameter Value Element Parameter Value
DC Motor Motor constant 5.7 Load Mass of slider 0.3 kg
Inertia of motor 1e-5 kg Belt Flex Spring constant 800 N/m
Frame Mass of frame 0.8 kg Damping in belt 1 Ns/m
Frame Flex Spring constant 6 kN/m Damper Viscous friction 3 Ns/m
Damping in frame 6 Ns/m Coulomb friction
Trong tính toán, khi bỏ qua những thành phần phi tuyến của lực ma sát trên phần tử damper, ta nhận
được mô hình toán của đối tượng là khâu bậc 6 tuyến tính. Nếu coi dây curoa nối giữa động cơ và ụ
trượt là cứng và bỏ qua khối lượng rôto của động cơ thì đối tượng sẽ có dạng một khâu bậc 4 tuyến
tính được biểu diễn bằng hệ phương trình trạng thái có dạng như (20a).
⎡. ⎤ ⎡0 0 − a13 0 ⎤ ⎡ v Load ⎤ ⎡ b1 ⎤ ⎡ v Load ⎤
⎢ v. Load ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢x ⎥
⎢ x Load ⎥ ⎢ 1 0 0 0 ⎥ ⎢ x Load ⎥ ⎢ 0 ⎥
⎢. ⎥ = ⎢a + F ; y = [0 1 0 0] ⎢ Load ⎥
+ [0]F (20a)
v a − a − a ⎥ ⎢ v Frame ⎥ ⎢b3 ⎥ ⎢ v Frame ⎥
⎢ Frame ⎥ ⎢ 31 32 33 34
⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ x. ⎥ ⎣0 0 1 0 ⎦ ⎣ x Frame ⎦ ⎣ 0 ⎦ ⎣ x Frame ⎦
⎣ Frame ⎦
v Load , x Load : vận tốc và vị trí của ụ trượt so với hệ toạ độ gốc.
v Frame , x Frame : vận tốc và vị trí của ụ trượt so với hệ toạ độ của khung.
Các thông số của ma trận A và B: a13 = 10 , a 31 = 7.5 , a 32 = 7500 , a 33 = 21.3 , a 34 = 7500 ;
b1 = 19 , b3 = 26.125 ;
Nếu ta coi khung là vững chắc thì đối tượng sẽ có dạng một khâu bậc 2 tuyến tính được biểu diễn
bằng hệ phương trình trạng thái có dạng (20b).
⎡. ⎤ ⎡ − d D 0⎤ ⎡ v ⎡ kM ⎤
⎡ v Load ⎤
Load ⎤
⎢. v Load ⎢
⎥ = mL ⎥ + ⎢ m L ⎥ F ; y = [0 1]⎢ + [ 0] F (20b)
⎢⎣ x Load ⎥⎦ ⎢ 1
⎢ ⎥
⎥ ⎣ x Load ⎦ ⎢ ⎥ ⎣ x Load ⎥⎦
⎣ 0⎦ ⎣ 0 ⎦
Khi đó các thông số của ma trận A và B là: a11 = −10 , b1 = 19 ;
6. Kết quả thực nghiệm
6.1. MeDe5 với bộ điều khiển thích nghi trực tiếp dựa trên MRAS
Công việc cần thiết kế chính là bộ điều khiển PID thích nghi. Mô hình mẫu bậc 2 được sử dụng với
hàm truyền có dạng H ref với các thông số được cho dưới đây. Trong công thức (10), ký hiệu Am
của mô hình mẫu được sử dụng. Bộ lọc biến trạng thái SVF được sử dụng để nhận được đồng thời
tín hiệu vị trí và tốc độ của ụ trượt. Áp dụng các bước tính toán ở mục 2, ta tính được các hệ số của
ma trận P và các luật chỉnh định thích nghi các hệ số K P , K i , K d của bộ điều khiển. Mô hình mô
phỏng hệ thống MeDe5 với bộ điều khiển thích nghi trực tiếp được biểu diễn trong hình 9 và kết
quả mô phỏng được thể hiện trong hình 10.
Thich nghi
Kp K K PROCESS

Amplifier MotorGain
SpringDamperBelt MassSlider
Tin hieu mau
Thich nghi Thich nghi
Ki Kd m F m m
ForceActuator
SpringDamperFramMassFram
e e MotorInertia

PositionSensorSlider
Damper
P
P22 P21

Velocity Slider
Loc bien
Mo hinh mau trang thai
Slider Position Error

Desired Position
Position Slider

Hình 9: MeDe5 với bộ điều khiển PID thích nghi trực tiếp

ω n2
H ref = ; ω n = 5 ; ς = 0.75 ;
s 2 + 2ςω n s + ω n2
ω F2
H SVF = 2 ; ω F = 50 ; ξ = 0.7 ;
s + 2ξω F s + ω F2
α = 3500 ; β = 300; γ = −3000 ;
P21 = 0.01 ; P22 = 0.0015 ;
t
Kp = α ∫ ( p 21e1 + p 22 e2 )(r − x1 )dt + K p (0)
0
t
K i = β ∫ ( p 21e1 + p 22 e2 )rdt + K i (0) (21) Hình 10: Kết quả mô phỏng hệ thống ứng với các
0 hệ số ma sát của damper khác nhau (3 và 6
t
N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí ụ
K d = γ ∫ ( p 21e1 + p 22 e2 ) x 2 dt + K d (0) trượt, thích nghi K p , K i và K d
0
Từ kết quả mô phỏng nhận thấy ưu điểm của hệ điều khiển thích nghi trực tiếp là: khi thông số của
đối tượng thay đổi, bộ điều khiển tự động hiệu chỉnh các thông số K p , K i , K d và sau một khoảng
thời gian xác định, sai lệch của hệ thống tiến dần đến 0.
6.2. MeDe5 với bộ điều khiển learning feed-forward dựa trên MRAS
Quá trình tính toán dựa trên thông số của mô hình tuyến tính xấp xỉ bậc 2 của đối tượng bậc 6. Hai
bộ lọc biến trạng thái và mô hình mẫu H ref có cấu trúc giống nhau. Bộ lọc biến trạng thái thứ nhất
đóng vai trò tạo tín hiệu trạng thái mẫu. Bộ lọc biến trạng thái thứ hai được sử dụng để nhận được
.
đồng thời sai lệch vị trí của ụ trượt e và đạo hàm e của nó. Áp dụng các bước tính toán ở mục 2 và
mục 3, ta tính được các hệ số của ma trận P và các luật chỉnh định thích nghi các hệ số a m , bm và
c m của bộ điều khiển. Mô hình mô phỏng hệ thống MeDe5 với bộ điều khiển learning feed-forward
dựa trên MRAS được biểu diễn trong hình 11 và kết quả mô phỏng được thể hiện trong hình 12.

Thich nghi P22


am Amplifier MotorGain
PROCESS
Thich nghi
Gia toc mau bm P21 K K
SpringDamperFrame MotorInertia SpringDamperBelt
Toc do mau Thic nghi
Loc bien
cm
trang thai m F m m
Damper
w^2 ∫ ∫ Kp MassFrame
ForceActuator
MassSlider
Vi tri mau
Tin hieu mau Nhieu do luong
PositionSensorSlider P
K PositionSensorFrame
P
LOC BIEN TRANG THAI

Desired Position Position Slider

Hình 11: MeDe5 với bộ điều khiển learning feed-forward dựa trên MRAS

ω n2
H ref = ; ω n = 5 ; ς = 0.75 ;
s 2 + 2ςω n s + ω n2
ω F2
H SVF = 2 ; ω F = 50 ; ξ = 0.7 ;
s + 2ξω F s + ω F2
α a = 1.7 ; α b = 1200 ; α c = 150000 ;
P21 = 2 *10 −5 ; P22 = 7.17 * 10 −5 ; K p = 20 ;
. ..
a m = α a ∫ [( p 21e + p 22 e) r ]dt + a m (0)
. .
bm = α b ∫ [( p 21e + p 22 e) r ]dt + bm (0)
.
c m = α c ∫ [( p 21e + p 22 e)r ]dt + c m (0)

Hình 12: Kết quả mô phỏng hệ thống ứng


với các hệ số ma sát của damper khác nhau
(3 và 6 N.s/m).Theo thứ tự từ trên xuống: sai
lệch vị trí ụ trượt, thích nghi a m , bm và c m

Giống như hệ thống với bộ điều khiển thích nghi trực tiếp, khi thông số của đối tượng thay đổi, bộ
điều khiển learning feed-forward dựa trên MRAS cũng có khả năng tự động hiệu chỉnh các thông số
của bộ điều khiển theo xu hướng đưa sai lệch tiến dần về 0. Tuy nhiên, ưu điểm vượt trội của mô
hình điều khiển này là tốc độ thích nghi nhanh hơn, độ ổn định cao hơn và ít nhạy cảm với nhiễu.
Công thức (19) chỉ áp dụng được khi mô hình mẫu và đối tượng có dạng bậc 2. Như vậy với những
đối tượng có hàm truyền bậc cao hơn, khi tính toán ta phải sử dụng hàm xấp xỉ bậc 2 của chúng. Bộ
điều khiển feed - forward chỉ có thể được áp dụng (bù, hiệu chỉnh) cho hệ thống với đối tượng có
dạng bậc 2 trở xuống nên đây chính là hạn chế của phương pháp này.
6.3. MeDe5 với bộ điều khiển thích nghi gián tiếp dựa trên MRAS (bộ quan sát trạng thái
thích nghi)
Ta phải thiết kế bộ quan sát trạng thái thích nghi với mục đích tạo ra trạng thái ước lượng sạch
(không chứa nhiễu) của đối tượng để cung cấp cho bộ điều khiển tối ưu LQR (Linear Quadratic
Regulator). Dựa vào đó, bộ điều khiển LQR tính toán và tạo ra tín hiệu điều khiển. Lưu ý ở đây,
trong công thức (10), ký hiệu AP của đối tượng được sử dụng.
Áp dụng các bước tính toán ở mục 2, ta tính được các hệ số của ma trận P và luật chỉnh định thích
nghi các hệ số K a và K b của bộ điều khiển theo công thức (15) và (16). Mô hình mô phỏng hệ
thống MeDe5 bộ điều khiển thích nghi gián tiếp dựa trên MRAS được biểu diễn trong hình 13 và
kết quả mô phỏng được thể hiện trong hình 14 và hình 15.
K b1 = β b1 ∫ ( p11e1 + p12 e2 + p13 e3 + p14 e4 )udt + K b1 (0) P11 = 214.2 , P12 = −15.488 ,
P13 = −4.4681 , P14 = 2013.5 ,
K b 3 = β b 3 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 )udt + K b 3 (0)
P31 = −4.4681 , P32 = −0.0066 ,
K a 33 = −α a 33 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 ) x3 dt + K a 33 (0)
P33 = 4.4448 , P34 = −0.0066 ,
K a 34 = −α a 34 ∫ ( p31e1 + p32 e2 + p33 e3 + p34 e4 ) x 4 dt + K a 34 (0) β b1 = 20 , β b 3 = 500 , α a 33 = −20
Amplifier MotorGain
PROCESS

LQR K K
SteeringSignal SpringDamperFrame MotorInertia SpringDamperBelt MassSlider
Reference
m F m m
ForceActuator1
MassFrame

Damper P
PositionSensorSlider V PositionSensorFrame
P
V
Slider Velocity Slider Position Frame Velocity Frame Position

P11 P12 P13 P14

P31 P32 P33


ADAPTIVE OBSERVER
EstimatedSliderPosition
P34
(ADJUSTABLE MODEL) EstimatedFramePosition

Adaptive Adaptive
Ka33 Ka34
Estimative State

Adaptive
Kb1
∫ ∫ Adaptive
Kb3
∫ ∫

a32

a31
EstimatedSliderVelocity
a13
EstimatedFrameVelocity

Hình 13: Bộ quan sát trạng thái thích nghi + LQR


Hình 14: Kết quả mô phỏng hệ thống với thứ tự từ Hình 15: Sai lệch vị trí giữa giá trị thực và giá
trên xuống: vị trí thực, vị trí ước lượng, sai lệch vị trị ước lượng của ụ trượt
trí và tín hiệu điều khiển

Với chức năng giống như bộ lọc Kalman, bộ quan sát trạng thái thích nghi tạo ra trạng thái ước
lượng sạch của đối tượng. Điều này được thể hiện như trên hình 14. Khi hệ thống bị tác động bởi
nhiễu, trạng thái thực cũng như sai lêch luôn bao gồm nhiễu. Tuy nhiên trạng thái ước lượng (được
dùng làm tín hiệu phản hồi) và tín hiệu điều khiển luôn không chứa nhiễu.
Một ưu điểm nổi bật của bộ quan sát trạng thái thích nghi so với bộ quan sát Kalman đó là biên độ
sai lệch giữa trạng thái thực và trạng thái ước lượng giảm dần và tiến đến giá trị 0 sau một khoảng
thời gian xác định (hình 15).
7. Kết luận và hướng phát triển
Bài báo này giới thiệu 3 dạng thể hiện khác nhau của MRAS đó là trực tiếp, gián tiếp và learning
feed-forward. Căn cứ vào ưu khuyết điểm của từng phương pháp và bài toán cụ thể, ta sẽ lựa chọn
được phương án thiết kế bộ điều khiển phù hợp. Lý thuyết ổn định Liapunov được sử dụng trong
thiết kế bộ điều khiển do đó tiêu chí ổn định luôn được đảm bảo. Tuy nhiên, cả ba phương pháp
thiết kế trên đều dựa trên thông số của đối tượng được tuyến tính hoá. Do đó, nếu xét cả các thông
số gây ra tính phi tuyến cho đối tượng điều khiển thì phương án kết hợp MRAS với logíc mờ hay
mạng nơron sẽ được sử dụng. Kết quả của nghiên cứu này sẽ được trình bày trong những bài báo
tiếp theo.

Tài liệu tham khảo


[1] Hans Dirne; Memonstrator of Advanced Controller, Master thesis; University of Twente,
The Netherlands, May 2005.
[2] Amerongen, J. van; Intelligent Control (part 1)-MRAS, Lecture notes; University of Twente,
The Netherlands, March 2004.
[3] Amerongen, J. van & Vries, T.J.A; Digitale regeltechniek; University of Twente, The
Netherlands, May 2005.
[4] Amerongen, J.van; A MRAS-based learning feed-forward controller; University of Twente,
The Netherlands, 2006.
[5] Karl J.Astrom & Bjorn Wittenmark,1995, Adaptive Control, 2nd edition, Addison - Wesley
Publishing Company.
[6] Yoan D. Landau, 1979, Adaptive Control - The model reference approach, New York,
United States.
[7] Controllab Products B.V, 2006, (http://www.20sim.com).

You might also like