You are on page 1of 6

Sử dụng bộ điều khiển nơron được tối ưu bằng giải thuật di truyền trong mạch truyền

thẳng điều khiển robot bằng phương pháp tính momen.


Tác giả:
Nguyễn Trần Hiệp - Học viện Kỹ thuật Quân sư.
Phạm Thượng Cát - Viện Công nghệ Thông tin.

Tóm tắt:
Phương pháp tính momen là một phương pháp phổ biến trong điều khiển robot hiện đại. Nó cho phép loại bỏ
được tất cả các thành phần phi tuyến và liên kết chéo trong robot. Nhược điểm của phương pháp này là các tham số
phi tuyến thường không được ước lượng chính xác và quá trình tính toán phức tạp đòi hỏi thời gian thực. Vì vậy
trong thực tế dao động và quá chỉnh thường xuyên xuất hiện khi điều khiển bằng phương pháp tính momen. Mạng
nơron và thuật di truyền có thể cho phép khắc phục được những nhược điểm này. Bài báo này giới thiệu việc sử
dụng mạng nơron được tối ưu bằng thuật di truyền thực hiện tính toán chính xác các tham số phi tuyến và liên kết
chéo của hệ robot. Hệ điều khiển được kiểm chứng bằng MATLAB SIMULINK 6.0 trên cánh tay máy hai bậc tự do.

Abstract:
The computed torque method is very popular in modern in rorbot control. The computed torque method involes
computation and cancellation of all non-linearities and cross-coupling terms. The disadvantage of this method is the
misestimation of non – linear parametes and the computation complexity of the real-time implementation. In practice
oscillation and overshoot always occurs when computed torque method applicated. The drawbacks of this method
are overcome by Neural network and genetic algorithm. This paper presents a neural netwokr optimied by genetic
algorithm to correct computation of all non-linearities and cross-coupling terms.. The controller was tested through
simulation by MATLAB simulink 6.0 on the 2 – DOF manipulator.
và robot sẽ được điều khiển bám sát quỹ đạo mong
1. Đặt vấn đề. muốn. Vì ma trận H là xác định dương và khả đảo
Phương pháp tuyến tính hoá phản hồi hay còn nên từ hình 1 và công thức 1.1 vòng điều khiển kín có
được gọi là phương pháp tính momen là một phương dạng:
pháp điều khiển hiện đại trong công nghiệp robot. Bộ && = u
q (1.3)
điều khiển được thực hiện trên cơ sở tách riêng mô Như vậy hệ kín có dạng là n tích phân riêng biệt
hình động lực học của robot thanh hai phần tuyến tính điều khiển độc lập n khớp và tín hiệu điều khiển độc
và phi tuyến, do đó các thành phần như trọng lực, lực lập tại mỗi khớp sẽ là:
ma sát, momen hướng tâm, lực Coriolis .v.v. sẽ được t (1.4)
bù đủ [18] [20]. Khi đó, bộ điều khiển PD hay PID u = &q& + k e + k ∫ e (τ )dτ + k e&
i di Pi i Ii i Di i
được sử dụng để điều khiển vị trí của robot tiệm cận 0
với quỹ đạo mong muốn. Sơ đồ hệ điều khiển tính
Khi ma trận H và vector h giả thiết được xác định
momen được biểu diễn như sau: chính xác, hệ thống sẽ là ổn định tiệm cận nếu các hệ
số kDi, kPi, kIi và thậm chí không còn xuất hiện dao
&& d
q động và độ quá chỉnh trong hệ thống [18]. Thực tế,
qd +K e+
&q&
u Tính: τ
q
ma trân H và vector h không thể biết được chính xác
P
Robot
d

+ K ∫ e dt + K e&
I D
H(q)u + h(q& , q) mà chúng ta chỉ nhận được một giá trị ước lượng H
~
q& d ~ ~ ~ ~
q&
và h ( H ≠ H ; h ≠ h ). Thay thế các giá trị ước lượng H
~
và h vào phương trình động lực học của robot ta
nhận được:
&& = (H -1H )u + H -1 (h - h )
~ ~
Hình 1: Phương pháp điều khiển tính momen q (1.5)
Rõ ràng phương trình này khác với phương trình
Dựa vào sơ đồ trên ta viết được phương trình: 1.3 và vì vậy luật điều khiển tính momen như trên sẽ
τ = H(q)u + h(q& ,q) (11) gây ra sai số. Trong thực tế phương pháp này phần
nào khắc phục được tính không xác định của mô hình
t
(1.2) vì hệ thống đã tính đến các thành phần phi tuyến của
u=q
&& + K e + K ∫ e(τ )dτ + K e&
d P I D đối tượng điều khiển và sai số của điều khiển phụ
0 ~
thuộc vào mức độ sai lệch giữa H(θ) và H(θ ) ; h(q,q& )
Trong đó e = qd – q; e& = q& − q& ~
d
và h(q,q& ) . Một khó khăn nữa của phương pháp tính
KI , KP, KD là các ma trận đường chéo xác định momen là đòi hỏi thực hiện ở chế độ thời gian thực.
dương. Nếu ma trận H và vector h được xác định Việc tính toán như vậy đòi hỏi những hệ tính toán
chính xác thì momen τ cũng được xác định chính xác

1
phức tạp và đắt tiền. Để nâng cao chất lượng của điều
khiển theo phương pháp phản hồi tuyến tính trong kỹ 2. Điều khiển robot hai bậc tự do sử dụng ANN
thuật điều khiển nói chung hay trong điều khiển robot được tối ưu bằng GAs theo phương pháp tính
nói riêng đã có nhiều nghiên cứu được đề xuất. Chủ momen.
yếu tập trung vào việc tính toán một cách chính xác Xét một mô hình robot hai bậc tự do được mô tả
~ ~ như hình 1.3.
và nhanh chóng các giá trị ước lượng H(θ ) , h(q,q& ) và
Phương trình chuyển động của robot hai bậc tự do
các hệ số KP, KI, KD của bộ điều khiển. Chẳng hạn
có sơ đồ như hình 1.3 được viết như sau:
như Keigo và Mohamad sử dụng ANN hay như đề
H(θ)&θ& + h(θ, θ& ) = τ (1.6)
xuất của Nguyễn Công Định sử dụng GAs và Fuzzy
τ = [τ1 , τ 2 ] ∈ R là momen của khớp robot.
T 2
để xác định các hệ số KP, KI, KD tối ưu của bộ điều
khiển [20]. Một phương pháp nữa là sử dụng ANN để
~ ~
[ ]T
θ = θ1 , θ 2 ∈ R 2 Biểu diễn góc quay của khớp robot.
xác định chính xác các giá trị ước lượng H(θ ) , h(q,q& ) H(θ)∈R là ma trận quán tính của robot có các phần
2x 2

mà M.Rodi và R.Safaric đã sử dụng [7][16][17]. Các tử được cho như sau:


phương pháp sử dụng ANN như đã trình bày ở trên
đều sử dụng thuật học BP. Vấn đề chính là ở chỗ 11 1 2

H = I + I + m l 2 + m l 2 + l 2 + 2l l cos θ
1 g1

2 ⎢⎣ n1
(1.7)
g2 n1 g2
( 2 )⎥⎦
thuật học BP và các thuật học khác sử dụng nguyên lý (1.8)
gradient suy giảm không có khả năng hội tụ toàn cục. H = H 21 = I 2 + m 2 ⎡l g2 2 + 2l n1l g 2 cos(θ 2 )⎤
12 ⎢⎣ ⎥⎦
Chỉ có giải thuật di truyền (GAs) mới có khả năng
làm cho quá trình học của ANN tiến tới hội tụ toàn H 22 = I 2 + m 2 l g 2
2 (1.9)
cục. Bài báo này đề xuất một phương pháp sử dụng I1, I2 là momen quán tính của khớp thứ nhất và khớp
mạng nơron nhân tạo (ANN) được học bằng GAs để thứ hai
~ ~
xác định chính xác các tham số phi tuyến H và h(q,q& ) lg1, lg2 ;ag khoảng cách từ khớp thứ nhất và khớp thứ
khi điều khiển robot bằng phương pháp tính momen. hai đến trọng tâm của khớp một và hai.
Khi đó đối tượng điều khiển (robot) được coi như là ln1; ln2 là chiều dài của khớp một và khớp hai.
một hệ tuyến tính và các hệ số KP, KI, KD, đảm bảo m1; m2 là khối lượng của khớp một và khớp hai.
cho hệ ổn định và có tốc độ hội tụ nhanh trong mm1; mm2 là khối lượng của động cơ khớp một và
trường hợp này có thể được xác định như với hệ điều khớp hai.
khiển PID cho các đối tượng tuyến tính. Hình 1.2 mô Vector h(q, q& )∈ R 2 biểu diễn thành phần của lực
tả hệ điều khiển tính momen có sử dụng ANN được
tối ưu tham số bằng GAs để bù các thành phần không y
xác định của đối tượng.
Số đầu vào của ANN như trên hình 1.2 chính là khớp
I2, m2
các biến trạng thái và đạo hàm của chúng, tín hiệu u
trên đầu ra của bộ lấy tích phân, tín hiệu điều khiển τ ln2
θ2
tác động lên đối tượng được tạo ra trên đầu ra của ln1
ANN. Thuật di truyền (GAs) đóng vai trò giám sát sẽ lg2
thay đổi các trọng số liên kết của ANN để tìm được I1, m1
tập hợp trọng số tối ưu sao cho chất lượng của điều lg1
khiển là tốt nhất. θ1 khớp
e x
Thuật học Hình 1.3: Biểu diễn robot hai bậc tự do
e& (GAs)
&e& Coriolis và trọng lực của hai khớp:
Hệ số KP, KI, KD Chỉnh trọng số wij h 1 = − m 2 l n1l g 2 sin ( θ 2 )( 2θ& 1 + θ& 2 )θ& 2 (1.10)
&& d
q
h = m l l sin ( θ )θ& (1.11)
qd +K e+
&q& Mạng Nơron τ q 2 2 n1 g 2 2 1
P
Robot
d

+ K ∫ e dt + K e& (ANN)
I
Với các tham số của robot được cho như sau:
D

q& d q&
Khớp thứ Khớp thứ
nhất hai
Hình 2: H ệ điều khiển tính momen d ùng Trọng lượng khớp mij [kg] 50.0 50.0
ANN v à thuật học G As
Trọng lượng của động cơ 5.0 5.0
mmi [kg]

2
Quán tính của khớp Ili 10.0 10.0 1.4 số lượng các liên kết của ANN sẽ là (7x8) + (9x2)
2 = 74. Hàm tác động của các nơron tại đầu vào là hàm
[kg.m ]
tuyến tính, tại lớp ẩn là hàm sigmoid lưỡng cực và
Quán tính của động cơ Imi 0.01 0.01 của nơron tại lớp ra là hàm dấu bão hoà[10].
2 Hệ thống điều khiển robot trong trường hợp này có
[kg.m ] sơ đồ cấu trúc như sau:
Khoảng cách li [m] 1.0 1.0
Khoảng cách lgi [m] 0.5 0.5
u1 Chỉnh trọng
Hệ số giảm tốc của hộp số 100 100 +
+
kri e& KD1 +

Quỹ đạo mong muốn của robot được giả thiết là +


Quỹ đạo KP1 +
hàm thời gian của vị trí, vận tốc và gia tốc góc [21]: mong +
muốn ∫ edt KI1
θd1(t) = 0.5 cos (πt); θd2(t) = 0.5 sin (πt) + 1.0 Ro GAs
θ ,θ& ANN bot
θ& d1 ( t ) = − 0.5πsin ( πt ) ; θ& d 2 ( t ) = 0.5πcos( πt ) d1 d1
&θ& ,θ ∫ edt KI2
&θ& ( t ) = − 0.5 π 2 cos( πt ) ; &θ& ( t ) = − 0.5 π 2 sin ( πt ) d1 d2
d1 d2
&θ ,&θ& + +
d2 d2 KP2
Mục đích của bài toán điều khiển là tìm momen tác
động lên các khớp của robot để robot chuyển động KD2 + +
đến vị trí mong muốn thoả mãn các yêu cầu của quá
+ + Chỉnh trọng
trình điều khiển. Sai số của mô hình robot, sự thay
đổi các tham số của robot, vị trí và đạo hàm của tín u2
hiệu phản hồi được dùng để tính toán chính xác tín
hiệu điều khiển tác động lên robot. Do tính không xác
định của mô hình robot nên phương trình 1.6 được Hình 1.4: Bộ điều khiển tính momen sử dụng ANN và
viết: thuật học GAs
~ ~ (1.12)
H(θ)&θ& + h(θ,θ& ) = τ
~ ~
H(θ ) và h(q,q& ) là các giá trị ước lượng của H(θ) và Cấu trúc mạng nơron được biểu diễn như sau:
h(q, q& ) . Kết hợp 1.8; 1.9; 1.10và 1.11 ta có:
t (1.13) qd q
i∫
&θ& = &θ& + K e& + K e + K edt q& d q&
d d P Thuật học GAs
0
q
&& d q
&&
Tín hiệu e = [e1, e2]T = [θd - θ] là các giá trị
sai lệch. Chỉnh trọng
~ ~ số Wi j
Khi H(θ ) và h(q,q& ) hoàn toàn giống như
H(θ) và h(q, q& ) thì phương trình của vector sai lệch sẽ 1
thoả mãn phương trình tuyến tính sau:
t (1.14) 1
&e&+ K D e& + K P e + K I ∫ edt = 0 Z2 τ1
0
Như vậy ta có thể chọn KP, KI, KD để hệ thống Z3
này ổn định như mong muốn.
Z4
Hệ điều khiển khi đó được coi như là một hệ tuyến τ2
tính, các hệ số KP, KI, KD lúc đó được chọn như khi Z5
thiết kế bộ điều khiển PID với đối tượng tuyến tính
cho hệ nhiều đầu vào/ra. Các hệ số này có thể chọn Z6
theo phương pháp dễ dàng nhất như phương pháp đặt Z7 Wi j
điểm cực.
Với ANN có cấu trúc 6-8-2 tức là có 6 nơron trên
[ ]
lớp vào u 1 , θ1 , θ& 1 , u 2 , θ 2 , θ& 2 , 8 nơron tại lớp ẩn và 2 Lớp đầu vào Lớp ẩn
Lớp đầu ra

nơron trên đầu ra [τ1 , τ 2 ] . Với cấu trúc như trên hình
Hình 1.5: Cấu trúc ANN và thuật học GAs

3
Trong đó tập hợp đầu vào z = [z2, z3, z4, z5, z6, z7]
[ ]
chính là tập hợp đầu vào u 1 , θ1 , θ& 1 , u 2 , θ 2 , θ& 2 .
Tín hiệu điều khiển τ = [τ1 , τ 2 ]T ∈ R 2 tìm được phải
thỏa mãn điều kiện làm việc thực tế của robot:
τ min ≤ τ ≤ τ max (1.14)
Trong đó τmin và τmax phụ thuộc vào công suất của
động cơ điều khiển tại các khớp của robot bởi vì nếu
giá trị τ tối ưu tìm được nằm ngoài khoảng này thì
động cơ của robot không có khả năng tạo được tín
hiệu điều khiển. Giải thiết quỹ đạo mong muốn của
robot qd nằm trong vùng hoạt động cho phép của
robot. Điều này cho phép tìm được một giá trị τ tối Biểu diễn góc dự định và góc thực tế tại khớp một
ưu đảm bảo cho q →qd.
Để sử dụng GAs trong quá trình học của ANN,
hàm mục tiêu được chọn theo nghịc đảo của giá trị sai
số trung bình bình phương [2] [3] [6]:
⎧0 q > q
⎪ nÕu
max
F ( chroms , q ( t )) = ⎨
i
⎪⎩ F1 ( q ( T c )) nÕu q ≤ q
max

TC là chu kỳ điều khiển.


q là giá trị tới hạn quy định vùng làm việc
max
của robot.
F(chromsi, q(t)) là giá trị ước lượng theo hàm mục
Biểu diễn vận tốc góc dự định và thực tế tại khớp
tiêu của cá thể thứ i.
một
F1 (q( TC )) là nghịgh đảo sai số bình phương trung
bình của các biếntrạng thái tại thời điểm TC.
1 (1.15)
F1 (q( TC )) =
∆e 2 + ∆e& 2 + ∆&e&2
∆e = e 0 (TC ) − e(TC ) ; ∆e& = e& 0 (TC ) − e& (TC ) ;
∆&e& = &e& 0 (TC ) − &e&(TC ) là sai lệch giữa sai số cho phép
tại thời điểm TC và sai số thực tế tại thời điểm TC.
Chương trình mô phỏng được thực hiện trên
MATLAB 6.0 với các tham số của GAs được cho
như sau:
Chu kỳ điều khiển TC 3 sec
Khoảng thời gian lấy mẫu 10 msec
Tỷ lệ liên kết chéo (PC) 0.5
Tỷ lệ biến đổi (Pm) 0.1 Biểu diễn của momen dự định và thực tế tại khớp một
Giá trị giới hạn của trọng số Wi max, Wi min ± 5
Số bit mã hóa nhị phân (có 1 bit dấu) 17
Kích thước của tập hợp (Psize) 300
Các giá trị của hệ số KP, KI, KD như đã nói ở trên
được xác định bằng phương pháp đặt điểm cực chọn
được Ki1 = 1; KP1 = 3; KD1 = 3; KI2 = 8; KD2 = 12 và
KP2 = 6. Kết quả mô phỏng được biểu diễn như sau:

4
khiển phụ thuộc vào độ chính xác của các giá trị ước
~ ~
lượng H(θ ) và h(q,q& ) và sự lựa chọn các hệ số KP,
KI, KD của bộ điều khiển PID. Tác giả đề xuất một
phương pháp sử dụng ANN được tối ưu bằng GAs để
~
xác định chính xác các giá trị ước lượng H(θ ) và
~
h(q,q& ) .
Các kết quả mô phỏng trên tay máy hai bậc tự
do cho thấy rằng phương pháp mà tác giả đề xuất ở
trên có thể là một đóng góp nhằm làm phong phú hơn
các thuật học của ANN cũng như sự phong phú khi
sử dụng ANN vào các quá trình điều khiển nói chung.

Tài liệu tham khảo:


[1] Nguyễn Trần Hiệp, Phạm Thượng Cát-
Biểu diễn góc dự định và góc thực tế tại khớp hai
Genetic Algorithm and its applications in Control
Engineering.
[2] Nguyễn Trần Hiệp, Phạm Thượng Cát- Nghiên
cứu bài toán dao động con lắc ngược sử dụng thuật
Gen bằng MATLAB. Hội thảo toàn quốc về phát
triển Phát triển công cụ tin học trợ giúp cho giảmg
dạy và nghiên cứu ứng dụng toán học – hà nội 4/199,
trang 326-334
[3] Nguyễn Trần Hiệp, Phạm Thượng Cát -
(1999) - Điều khiển con lắc ngược bằng phương pháp
Biểu diễn vận tốc góc dự định và thực tế tại khớp
hai trượt sử dụng mạng nơron được tối ưu bằng thuật gen
tr 30 – 38 Tạp chỉ KHKT số 90 năm 2000 - Học viện
Kỹ thuật Quân sự
[4] Nguyến Thanh Thuỷ, Trần Ngọc Hà, (1999)
Tích hợp kỹ thuật mạng nơron và giải thuật di truyền
trong phân tích dữ liệu. Tạp chí tin học và điều khiển
học T15, S.2
[5] Trần Văn Hãn - Đại số tuyến tính trong kỹ
thuật – Nhà xuất bản Đại học và trung học chuyên
nghiệp 1978.
[6] A. Haeussler, K. C. Ng Y. Li, D. J. Murray-
Biểu diễn của momen dự định và thực tế tại khớp hai
Smith, and K. C. Sharman - Neurocontrollers
Kết luận: designed by a genetic algorithm.
Trong bài báo này, tác giả đã trình bày phương
pháp khắc phục được những nhược điểm của phương In Proc. First IEE/IEEE Int. Conf. on GA in Eng.
pháp điều khiển tính momen. Hệ điều khiển có đặc Syst.: Innovations and Appl., pages 536-542,
trưng phi tuyến đượcđược đưa về hệ tuyến tính trên
cơ sở bù chính xác các thành phần phi tuyến là các Sheffield, U.K., September 1995.
~ ~
giá trị ước lượng H(θ ) và h(q,q& ) . Phương pháp này [7] Ales Hace, Riko Safaric, Karel Jezernik -
đảm bảo được độ chính xác và hội tụ của hệ điều Faculty of Electrical Engineering and computer
khiển. Độ chính xác và chất lượng của quá trình điều
Sciences University of Maribor Slovernia -Artificial

5
Neural Network control for Maipulators and of Engineering at Glasgow University – Technical
Lyapunov theory. Web site: http://robin2.r.uni- Reports CSC-96016. 1996.
mb.si/konference/ales/airtc95/airtc95.html. [18] J.Somlo - B.Lantos - P.T.Cat - Advanced
[8] A. Guez, J. L Eilbert, M. Kam - Neural Robot Control. Akademiai Kiado. Budapest 1997.
network Architecture for control , International
[19] John E. Gibson – Nonlinear automatic
Conference on Neural Networks, San Diego,
Control, Mc Graw-Hill Book Company, Inc. 1963.
California, June 21-24,, 1987, pp 22 – 25.
[20] Keigo Watanabe, Mohammad Teshnehlab –
[9] Bernard Friedland - New Jersey Institute of
Intelligent Control Base on Flexible Neural
Technology - Advanced Control System Design.
Networks, Kluwer Academic Publishers 1999.
Prentice-Hall International, Inc 1995.
[21] Mohammad Teshnehlab, Keigo Watanabe –
[10] Bart Kosko – Neural Networks and Fuzzy
Intelligent Control Based on Flexible Neural
Systems, Prentice-Hall, Inc. Asimon & Schuster
Networks, Kluwer Academic Publicshers Dordecht/
Company, 1992.
Boston/ London.
[11] Chin - Teng Lin and C.S George Lee - Neural
Fuzzy systems - Book is to the Chiao-Tung University
Centennial 1996.
[12] D. Psaltis, A Sideris, A. A Yamamura – A
Multilayered neural network controller, International
Conference on Neural Networks, San Diego,
California, June 21-24,, 1987, Vol 4, pp 17 – 21.
[13] D. Psaltis, A Sideris, A. A Yamamura –
Neural controllers, International Conference on
Neural Networks, San Diego, California, June 21-24,,
1987, Vol 4, pp 551 – 558.
[14] Eric Ronco – Incremental polynomial
controller networks: Two self-organising nonliear
controllers, Ph.D. Thesis 1997, Glasgow University,
Faculty of Engineering, Supervised by P.J. Gawthrop.
[15] E.W. McGookin, D.J. Murray-Smith, and Y.
Li - A population minimisation process for genetic
algorithms and its application to controller
optimisation, In Proc. 2nd Int. Conf. Genetic
Algorithms in Eng. Syst.: Innovations and
Applications, Glasgow, pages 79-84, Sept 1997.
[16] M. Rodi, R. Safaric – Syntesis of the Sling
mode NN Controller, Conference Proceding’ 97
Instanbul, 1997.
[17] M. A. Unar, D. J Murray-Smith, S. F. Ali
Shah – Design and Tuning of fixed structure PID
Controllers A survay. Centre for Systems and Control

You might also like