You are on page 1of 20

Chương 7: Suy Luận Không Chắc Chắn

Chương VII

SUY LUẬN KHÔNG CHẮC CHẮN

Nội dung chính: Trong chương này, chúng ta sẽ tìm hiểu về các phương pháp suy luận từ
các thông tin không chắc chắn hoặc không đầy đủ bao gồm suy luận Bayes, đại số chắc chắn
Standford và logic mờ.

Mục tiêu cần đạt : Sau chương này, sinh viên có thể :
¾ Vận dụng công thức Bayes để tính xác suất của một giả thuyết.
¾ Hiểu nguyên tắc hoạt động của HCG MYCIN
¾ Vận dụng đại số hệ số chắc chắn Stanford vào hệ chuyên gia MYCIN.
¾ Hiểu lý thuyết về logic mờ & ứng dụng của nó vào các HCG mờ.
¾ Biết lựa chọn phương pháp suy luận phù hợp với vấn đề cần giải quyết.
Kiến thức tiên quyết: Biểu diễn tri thức ở dạng luật, cơ bản về lý thuyết xác suất.

Tài liệu tham khảo :

[1] Geogre F. Luger – Artificial Intelligence, Structures and Strategies for Complex Problem
Solving– Addison – Wesley Publishing Company, Inc – 2002 (trang 247 – 290)

[2] Dealing with Uncertaincy


http://www.cs.appstate.edu/~blk/cs4440/chap07/ ch07.pdf

[3] Fuzzy Logic


http://pandora.compsci.ualr.edu/ milanova/7399-11/week14/ FuzzyLogic.ppt

Võ Huỳnh Trâm – Trần Ngân Bình 117


Giáo Trình Trí Tuệ Nhân Tạo

I GIỚI THIỆU:

Trong các chương trước, các thủ tục suy diễn của chúng ta đã tuân theo mô hình suy luận sử
dụng trong phép tính vị từ: từ các tiền đề đúng đắn, các luật suy diễn vững chắc sinh ra
những kết luận mới, đảm bảo là đúng đắn. Tuy nhiên, trong thực tế, có rất nhiều tình huống
chúng ta phải rút ra những kết luận tốt từ những bằng chứng được xác định nghèo nàn và
không chắc chắn thông qua việc sử dụng những suy diễn không vững chắc. Đây không phải
là một nhiệm vụ không thể thực hiện được, trái lại chúng ta thực hiện chúng rất thành công
trong hầu hết mọi khía cạnh của cuộc sống; chẳng hạn như chúng ta phát biểu những chẩn
đoán y học đúng đắn và đề xuất cách điều trị từ những triệu chứng không rõ ràng; phân tích
những trục trặc của xe ôtô từ những biểu hiện của nó; nhận ra bạn bè chỉ qua giọng nói hoặc
điệu bộ của họ,…

Như vậy, ở đây ta có hai loại thông tin không chắc chắn: một là dữ liệu ban đầu được cho là
không chắc chắn, không đủ, không đáng tin cậy,… hai là các luật mà ta sử dụng để suy luận
không hợp logic, suy luận ngược từ kết luận về điều kiện, hay có thể gọi là suy luận theo
kiểu phỏng đoán (abduction). Suy luận phỏng đoán khác với kiểu suy luận vững chắc đề cập
ở chương II. Luật modus ponens phát biểu rằng nếu ta có luật P → Q và có P thì ta có thể kết
luận Q, như trong luật sau đây:

If ắc quy hoặc dây cáp bị trục trặc

Then động cơ không khởi động được và đèn không sáng.

Đây là một luật luôn luôn đúng hay một suy diễn vững chắc (sound inference rule), nhưng nó
không giúp ích cho quá trình chẩn đoán các trục trặc xe hơi. Tuy nhiên, đảo ngược của nó:

If động cơ không khởi động được và đèn không sáng.

Then ắc quy hoặc dây cáp bị trục trặc

lại rất hữu dụng cho việc chẩn đoán trục trặc xe. Đây là một phỏng đoán (abduction) từ triệu
chứng quan sát được suy ngược trở lại nguyên nhân của chúng, nên gọi là luật suy diễn
không vững chắc (unsound inference rule) vì cũng có thể là ắc quy và dây cáp bình thường,
nhưng chiếc xe chỉ đơn giản là có môtơ khởi động hỏng và đèn pha đã bị đứt.

Mặc dù phỏng đoán là không vững chắc, nhưng nó thường đóng vai trò thiết yếu trong giải
quyết vấn đề. Trong chương này, chúng tôi đề cập đến hai tiếp cận xử lý suy diễn phỏng
đoán và sự không chắc chắn. Tiếp cận thứ nhất là tiếp cận thống kê, trong hướng tiếp cận
này sẽ trình bày hai phương pháp: lý thuyết xác suất Bayesian và đại số hệ số chắc chắn
Stanford. Tiếp cận thứ hai là suy luận theo logic mờ.

118 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

II TIẾP CẬN THỐNG KÊ ĐỐI VỚI TÍNH KHÔNG


CHẮC CHẮN

II.1 Suy luận Bayes

Suy luận Bayes dựa trên lý thuyết xác suất hình thức và được sử dụng rộng rãi trong một số
lĩnh vực nghiên cứu hiện nay, bao gồm cả nhận dạng và phân loại. Trước khi đi vào lý thuyết
về Bayes, ta hãy cùng nhau xem lại một số khái niệm cơ bản của lý thuyết xác suất.

II.1.1 Định nghĩa

„ Xác suất tiên nghiệm (prior probability) hay xác suất vô điều kiện
(unconditional probability): là xác suất của một sự kiện trong điều kiện không có
tri thức bổ sung cho sự có mặt hay vắng mặt của nó.

„ Xác suất hậu nghiệm (posterior probability) hay xác suất có điều kiện
(conditional probability): là xác suất của một sự kiện khi biết trước một hay
nhiều sự kiện khác.

|e1 and e2| Số lần xuất hiện cả hai sự kiện e1 và e2


P(e1|e2) = =
|e2| Số lần xuất hiện sự kiện e2

Ví dụ, cho trước một căn bệnh d và một triệu chứng s, thì xác suất một người có triệu chứng
s bị bệnh d được tính theo:

| d and s| Số người bị bệnh d có triệu chứng s


P(d | s) = =
|s| Số người có triệu chứng s

Để tính P(d | s) theo công thức trên thì ta phải thực hiện các cuộc điều tra thống kê trên một
phạm vi cộng đồng dân cư rộng lớn mới cho ta được một xác suất chính xác. Bayes đưa ra
một công thức tính khác cho phép ta tính được P(d | s) từ những kết quả thống kê đã có trước
đó hoặc những kết quả thống kê dễ đạt được hơn.

II.1.2 Công thức Bayes

Ta ký hiệu P(h | e) là xác suất khẳng định giả thuyết h đúng cho trước bằng chứng e. Công
thức Bayes được phát biểu như sau:

P(e | h) * P(h)
P(h | e) =
P(e)

Võ Huỳnh Trâm – Trần Ngân Bình 119


Giáo Trình Trí Tuệ Nhân Tạo

Công thức này nói rằng xác suất đúng của giả thuyết h khi quan sát được bằng chứng e, bằng
với xác xuất cho rằng chúng ta sẽ quan sát được bằng chứng e nếu giả thuyết h là đúng, nhân
với xác suất tiên nghiệm của h, tất cả chia cho xác suất tiên nghiệm của việc quan sát được
bằng chứng e.

Thí dụ 7.1: Bằng chứng (hay triệu chứng): bệnh nhân bị sốt

Giả thuyết (hay bệnh): bệnh nhân bị cảm cúm

P(cúm) * P(sốt|cúm) 0.001 * 0.9


P(cúm|sốt) = = = 0.3
P(sốt) 0.003

Câu hỏi :

Giả sử ta có các thông tin sau:


- 75% trường hợp bệnh nhân mắc bệnh quai bị đều bị cúm
- Cơ hội một người bị bệnh quai bị là 1/15000
- Cơ hội một người bị cúm là 1/1000
Hãy xác định xác suất điều kiện của một bệnh nhân mắc bệnh quai bị biết rằng người
này không bị cúm.

*Công thức Bayes tổng quát:

Trong thực tế có nhiều giả thuyết cạnh tranh nhau, vì vậy công thức Bayes tổng quát nhất là:

P(e | hi) * P(hi)


P(hi | e) =
Σk=1..n (P(e | hk) * P(hk) )

P(hi | e) là xác suất mà hi đúng khi biết bằng chứng e.

P(hi) là xác suất mà hi đúng tính trên tất cả các giả thuyết

P(e | hi) là xác suất quan sát được e khi hi đúng. Thông thường, tất cả các P(e | hk) phải độc
lập nhau.

n là số giả thuyết có khả năng

Lấy một ví dụ, giả sử chúng ta muốn khảo sát bằng chứng địa chất tại một địa điểm nào đó
để xem nó có thích hợp cho việc tìm kim loại đồng hay không. Chúng ta cần phải biết trước
xác suất tìm thấy từng loại trong tập hợp các khoáng sản (chính là các P(hk)) và xác suất của
cho sự hiện diện của một bằng chứng nào đó khi từng khoáng sản cụ thể được tìm thấy
(chính là các P(e | hk)). Khi đó, chúng ta có thể sử dụng định lý Bayes để xác định khả năng
thực sự đồng có ở đó, sau khi thu thập được các bằng chứng tại địa điểm đó. Phương pháp
này được sử dụng bởi PROSPECTOR, một hệ chuyên gia được xây dựng tại đại học
Standford và tổ chức SRI. Hệ chuyên gia này được dùng trong thăm dò khoáng sản và đã tìm
ra nhiều mỏ khoáng sản có giá trị lớn ở một số nơi.

120 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

II.1.3 Tại sao sử dụng luật Bayes

Điểm quan trọng của lý thuyết Bayes là các con số ở vế phải của công thức dễ dàng xác
định, ít nhất là khi so sánh với vế trái. Như trong ví dụ trên, do số lượng nhỏ hơn, nên việc
xác định số bệnh nhân bị cúm kèm theo triệu chứng sốt dễ hơn là xác định số người có triệu
chứng sốt bị cúm.

P (sốt | cúm) chính là tri thức về nguyên nhân (knowledge of causes), tức là xác suất hậu
nghiệm ở vế phải, thì dễ dàng có được hơn là tri thức về chẩn đoán (diagnostic knowledge),
P(cúm | sốt), tức là xác suất hậu nghiệm ở vế phải. Vì vậy, ta nói luật Bayes cho phép chúng
ta sử dụng tri thức về nguyên nhân để suy ra tri thức về chẩn đoán.

II.2 Đại số hệ số chắc chắn Stanford

Một số đề án hệ chuyên gia đã cố gắng cải biên những kỹ thuật Bayes để chúng thích nghi
với những nhu cầu giải quyết vấn đề của họ. Một tiếp cận quan trọng trong số những cải tiến
đó là đại số hệ số chắc chắn đã được sử dụng tại đại học Stanford trong quá trình phát triển
chương trình MYCIN.

Khi suy luận với tri thức heuristic, các chuyên gia có thể đưa ra các ước lượng niềm tin hữu
ích về các kết luận. Họ ước lượng các kết luận bằng các thuật ngữ như “có nhiều khả năng”,
“không chắc”, “hầu như chắc chắn” hay “có thể”. Những ước lượng này rõ ràng là không
dựa trên sự phân tích các xác suất một cách cẩn thận. Thay vào đó, tự chúng là những
heuristic được lấy ra từ kinh nghiệm trong quá trình suy luận về lĩnh vực của vấn đề. Vì vậy,
sẽ rất hữu ích nếu ta có thể lượng hóa các ước lượng niềm tin này để đưa chúng vào quá
trình suy luận.

II.2.1 Lý thuyết về đại số hệ số chắc chắn Stanford

Lý thuyết về độ chắc chắn Stanford (Stanford certainty theory) đưa ra một số giả thiết đơn
giản cho việc tạo ra các độ đo niềm tin và có một số quy tắc đơn giản tương đương cho việc
kết hợp những niềm tin này khi chương trình tiến đến kết luận của nó. Giả thiết thứ nhất là
tách “niềm tin ủng hộ” ra khỏi “niềm tin chống lại” một quan hệ:

Gọi MB(H | E) là độ đo của niềm tin vào khả năng đúng của giả thuyết H, khi có bằng
chứng E

Gọi MD(H | E) là độ đo của sự hoài nghi vào khả năng đúng của giả thuyết H, khi có bằng
chứng E

Giá trị của các độ đo này chỉ rơi vào một trong hai trường hợp:

0 < MB(H | E) < 1 trong khi MD(H | E) = 0,

hoặc: 0 < MD(H | E) < 1 trong khi MB(H | E) = 0

Hai độ đo này ràng buộc lẫn nhau ở chỗ một bằng chứng chỉ có thể hoặc là ủng hộ hoặc là
chống lại một giả thuyết nào đó. Đây là sự khác biệt quan trọng giữa lý thuyết chắc chắn và
lý thuyết xác suất. Ngay khi liên kết giữa các độ đo niềm tin và hoài nghi được thiết lặp
xong, chúng được ràng buộc với nhau thêm một lần nữa bởi hệ số chắc chắn CF:

Võ Huỳnh Trâm – Trần Ngân Bình 121


Giáo Trình Trí Tuệ Nhân Tạo

CF (H | E) = MB(H | E) – MD(H | E)

Như đã thảo luận ban đầu, ta có hai vấn đề không chắc chắn là dữ liệu và luật. Vì vậy, ở đây
ta cũng có 2 loại hệ số CF là hệ số chắc chắn cho dữ kiện (fact), và hệ số chắc chắn cho luật
(rule). Để dễ phân biệt ta sử dụng ký hiệu CFf cho dữ kiện và CFr cho luật

.II.2.1.1 Các hệ số chắc chắn Stanford


a. Hệ số chắc chắn dành cho dữ kiện: dữ kiện ở đây bao gồm dữ liệu ban đầu, dữ
liệu suy luận được và kết luận (giả thuyết):

CFf(fact) ∈[-1,1]:

¾ CFf càng tiến về 1 thể hiện sự tin tưởng dữ kiện là đúng càng mạnh

¾ CFf tiến về -1 thể hiện sự tin tưởng dữ kiện là không đúng càng mạnh

¾ CFf có giá trị xung quanh 0 cho thấy tồn tại rất ít bằng cớ cho việc ủng hộ hay chống
lại dữ kiện. Vì vậy, nếu lấy dữ liệu này đi suy luận thì độ chính xác sẽ rất thấp. Do
đó, người ta thường đưa ra một giới hạn (threshold) nhằm tránh việc suy luận với
thông tin không chắc chắn như vậy (vd: 0.2). Nghĩa là nếu dữ kiện nào có CF nhỏ
hơn giới hạn, ta sẽ không sử dụng trong quá trình suy luận.

b. Hệ số chắc chắn dành cho luật:

CFr(rule) ∈[-1,1] : thể hiện sự tin tưởng của các chuyên gia vào độ tin cậy của luật.

.II.2.1.2 Các quy tắc tính toán trên CF


c. Quy tắc kết hợp các CFf của các điều kiện:

Thông thường, một luật thường có tiền đề (vế trái) tạo thành từ những kết nối and/or của
nhiều điều kiện. Khi một luật sinh được sử dụng, các CF liên kết với mỗi điều kiện của tiền
đề sẽ được kết hợp với nhau để tạo ra một độ đo chắc chắn cho toàn bộ tiền đề (toàn bộ vế
trái của luật) theo công thức sau:

CF ( ĐK1 And ĐK2) = Min[CF(ĐK1), CF(ĐK2)]

CF (ĐK1 Or ĐK2) = Max[CF(ĐK1), CF(ĐK2)]

Thí dụ 7.2: CF(bệnh nhân bị sốt) = 0.9

CF(bệnh nhân bị hắc hơi) = 0.6

=> CF(bệnh nhân bị sốt And bệnh nhân bị hắc hơi) = 0.6

=> CF(bệnh nhân bị sốt Or bệnh nhân bị hắc hơi) = 0.9

122 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

d. Quy tắc tính CF cho dữ kiện suy ra từ luật:

Khi hệ thống sử dụng các luật không chắc chắn (nghĩa là đi kèm theo một hệ số CF) để suy
ra kết luận, thì các hệ số CF của tiền đề cũng sẽ được truyền từ tiền đề sang kết luận thông
qua luật theo quy tắc sau:

CFf(KL) = CFr(luật) * CFf(ĐK)

Thí dụ 7.3: CF(bệnh nhân bị sốt) = 0.8

CF(If bệnh nhân bị sốt Then bệnh nhân bị cúm) = 0.5

=> CF(bệnh nhân bị cúm) = 0.4

e. Quy tắc kết hợp nhiều CF của các kết luận từ nhiều luật

Khi có nhiều luật cùng đưa ra một kết luận (vế phải) giống nhau, thì các giá trị CF đạt được
từ các luật này sẽ được kết hợp theo quy tắc sau:

Nếu KL từ luật 1 có giá trị CFf1(KL)

Nếu KL từ luật 2 có giá trị CFf2(KL)

Thì,

CFf(KL) = CFf1(KL)+CFf2(KL) – CFf1(KL)*CFf2(KL), nếu CFf1(KL) & CFf2(KL)>0

= CFf1(KL)+CFf2(KL) +CFf1(KL)*CFf2(KL), nếu CFf1(KL) & CFf2(KL)<0


CFf1(KL) & CFf2(KL) , nếu CFf1(KL) & CFf2(KL) trái
=
1 – Min (|CFf1(KL)|, |CFf2(KL)|) dấu

Trong đó, |X| là trị tuyệt đối của X


Thí dụ 7.4: CF(bệnh nhân bị sốt) = 1
CF(bệnh nhân bị hắc hơi) = 0.8
CF(If bệnh nhân bị hắc hơi Then bệnh nhân bị cúm) = 0.5
CF(If bệnh nhân bị sốt Then bệnh nhân bị cúm) = 0.6
=> CF1(bệnh nhân bị cúm) = 0.4
=> CF2(bệnh nhân bị cúm) = 0.6
=> CF(bệnh nhân bị cúm) = 0.4 + 0.6 – 0.24 = 0.76

Sơ đồ sau đây minh họa cho các tính toán trên :

Võ Huỳnh Trâm – Trần Ngân Bình 123


Giáo Trình Trí Tuệ Nhân Tạo

0.0 0.2 0.4 0.6 0.8 1.0


0.76
CF1

CF2

Hình 7.1 – Minh họa tính kết hợp CF

Với cách tính toán này, ta có thể nhận thấy rằng kết quả CF phải luôn nằm trong khoảng [-
1,+1]. Kết hợp các CF cùng dấu sẽ làm tăng CF hay phép đo CF kết hợp mang tính tuyến
tính, và ngược lại, các CF nghịch nhau sẽ xóa bớt lẫn nhau.
Câu hỏi :

Ta có các tri thức sau:


- Nếu một người quan sát được UFO thì kết luận có sự xuất hiện của UFO (0.4)
- Nếu một máy rada phát hiện được một UFO thì kết luận có sự xuất hiện của UFO
(0.7)
Hãy cho biết giá trị CF của kết luận ‘Có sự xuất hiện của UFO’ là bao nhiêu biết rằng
có hai người quan sát được UFO (0.8) và một máy rada phát hiện được một UFO
(0.6).

II.2.2 Ví dụ: Hệ chuyên gia MYCIN

Như đã giới thiệu sơ qua ở chương VI, hệ chuyên gia MYCIN được phát triển tại đại học
Stanford vào thập niên 1970 bởi Feigenbaum, Buchanan and Ted Shortliffe (một bác sĩ).

Mục đích của hệ chuyên gia MYCIN là giúp đỡ các bác sĩ trong việc chẩn đoán và điều trị
các bệnh viêm màng não và nhiễm trùng máu. Chức năng chủ yếu của MYCIN là nhận dạng
các cơ quan bị nhiễm trùng và chọn các loại thuốc khống chế bệnh trên các cơ quan này.
Giao diện người dùng của MYCIN là sử dụng đối thoại dạng văn bản với bác sĩ để thu thập
dữ liệu bao gồm dữ liệu tổng quát về bệnh nhân, các kết quả xét nghiệm và các triệu chứng
của bệnh nhân.

Các vấn đề trong lĩnh vực y khoa thường phải suy luận với các thông tin không đầy đủ, mơ
hồ, không chắc chắn. Để đối phó với khó khăn này, MYCIN sử dụng lý thuyết chắc chắn
Stanford làm nền tảng cho suy luận của hệ. Vì vậy, mỗi dữ liệu, mỗi luật trong MYCIN đều
có một hệ số chắc chắn CF đi kèm

124 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

Dữ liệu được mô tả theo cấu trúc sau:

Thông số Ngữ cảnh Giá trị CF

Nhận ra Cơ_quan_1 Klebsiella 0.25

Nhạy cảm Cơ_quan_1 Penicillin -1.0

Ví dụ luật 50 của MYCIN có dạng:


IF (a) the infection is primary-bacteria, and
(b) the site of the culture is one of the serile sites, and
(c) the suspected portal of entry is gastrointestinal tract
THEN there is suggestive evidence (0.7) that infection is bacteroid
Trong luật trên số 0.7 được đặt trong ngoặc chính là hệ số CF của luật.

Cơ sở luật của MYCIN có khoảng 450 luật được viết bằng ngôn ngữ LISP. Động cơ suy diễn
của MYCIN được cài đặt với kỹ thuật suy luận hướng từ mục tiêu (goal-driven), nó tìm kiếm
gần như là vét cạn để chọn ra mục tiêu có chỉ số CF cao nhất làm kết luận cuối cùng của hệ
thống.

Để hiểu rõ hơn cơ chế suy luận của MYCIN, chúng ta hãy xét một ví dụ minh họa sau.

Thí dụ 7.5: MINI-MYCIN là một hệ chuyên gia nhỏ chuyên phân biệt giữa chân bị gãy, chân
bị quá mỏi hay chân bị nhiễm trùng.
Nó gồm các luật sau:
1. IF đau và sốt THEN bị nhiễm trùng 0.6
2. IF đau và sưng THEN bị chấn thương 0.8
3. IF quá tải THEN bị nhiễm trùng 0.5
4. IF bị chấn thương AND đỏ THEN bị gãy 0.8
5. IF bị chấn thương AND di chuyển được THEN quá mỏi 1.0
Sử dụng MINI-MYCIN để chẩn đoán tình trạng chân của Minh, biết rằng: chân của Minh
đang bị đau (1.0). Khi tôi kiểm tra nó, thấy nó sưng tấy (0.6) and hơi đỏ (0.1). Tôi không có
nhiệt kế nhưng tôi nghĩ anh ta có bị sốt (0.4). Tôi biết Minh là một vận động viên marathon,
các khớp của anh ta thường xuyên làm việc quá tải (1.0). Minh có thể di chuyển chân của
anh ấy.

Hãy vẽ đồ thị And/Or minh họa cho quá trình suy luận để đi đến kết luận của MINI-MYCIN.

Giải:

Vì MYCIN là hệ thống hoạt động theo cơ chế suy diễn lùi (hay hướng từ mục tiêu), nên hệ
thống sẽ lần lượt tính toán giá trị CF của từng mục tiêu. Các đồ thị And/Or sau đây sẽ được
trình bày lần lượt theo thứ tự thực hiện của hệ thống:

Võ Huỳnh Trâm – Trần Ngân Bình 125


Giáo Trình Trí Tuệ Nhân Tạo

Đau 1.0
0.48
Chấn thương 2
0.8 Sưng 0.6
Bị gãy 4
Đỏ 0.1
0.8
0.08
0.48
Chấn thương
Quá mỏi 5 1.0
1.0 Di chuyển được
0.48
Đau 1.0

1
0.24 Sốt 0.4
Bị nhiễm trùng 0.6

0.5
0.74 – 0.12 = 0.62 Quá tải 1.0
3
0.5

Hình 7.2 – Đồ thị AND/OR cho quá trình suy diễn lùi trong Thí dụ 7.5

Vậy: Bị nhiễm trùng là mục tiêu có giá trị CF cao nhất nên ta kết luận chân của Minh bị
nhiễm trùng.

Từ ví dụ minh họa ta thấy MYCIN hầu như kích hoạt tất cả các luật để tìm giá trị CF cho
từng mục tiêu.
Câu hỏi :

Tại sao hệ MYCIN phải kích hoạt hầu như tất cả các luật để có thể đưa ra kết luận ?

* Một số nhận xét về các luật của MYCIN:

¾ Mỗi luật của MYCIN là một sự kết hợp tri thức của nhiều lĩnh vực khác nhau. Ví dụ
như luật ‘IF tuổi bệnh nhân < 7 THEN không nên cấp thuốc tetracyline’ là sự kết
hợp của các loại tri thức:

• Tri thức về miền, mà cụ thể ở đây là tri thức về y học: Tetracyline làm đổi màu
xương đang phát triển và trẻ em dưới 7 tuổi thì đang mọc răng.

126 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

• Tri thức giải quyết vấn đề, cụ thể ở đây là tri thức về trị bệnh: Trước khi kê một loại
thuốc phải kiểm tra các chống chỉ định, có hai loại chống chỉ định: chỉ định liên quan
đến bệnh và chỉ định liên quan đến bệnh nhân.

• Tri thức về thế giới: Hầu hết mọi người đều cho rằng hàm răng màu nâu thì không
đẹp.

Tổng hợp các tri thức trên, các chuyên gia đưa ra một luật hết sức đơn giản. Chính
tính heuristic này đã hỗ trợ một phương pháp giải quyết vấn đề hiệu quả.

¾ Ngoài ra, điều khiển của quá trình suy luận cũng được thể hiện trong các luật của
MYCIN. Các điều kiện của vế trái luật được sắp xếp với thứ tự trước sau phù hợp với
tri thức của miền. Ví dụ luật sau:
IF sự nhiễm trùng là bệnh viêm màng não
And sự nhiễm trùng là do vi khuẩn
And chỉ có chứng cớ gián tiếp
And tuổi của bệnh nhân > 16
And bệnh nhân là một người nghiện rượu
THEN chứng cớ cho viêm phổi song cầu khuẩn 0.7
là kết quả của sự tổng hợp nhiều tri thức :

• Tri thức về miền: các bệnh nhân bị nghiện rượu thì đáng nghi ngờ với vi khuẩn
viêm phổi song cầu khuẩn

• Tri thức giải quyết vấn đề: lọc sự chẩn đoán theo từng bước; tức là hệ thống sẽ
kiểm tra từng điều kiện của vế trái theo thứ tự của nó. Chỉ khi điều kiện còn đúng
thì mới tiếp tục kiểm tra điều kiện kế tiếp.

• Tri thức về thế giới: người nghiện rượu thì hiếm khi dưới 17 tuổi. Vì vậy, cần
phải kiểm tra tuổi của bệnh nhân trước khi hỏi bệnh nhân có phải là người nghiện
rượu hay không. Vì nếu không, thì câu hỏi có thể gây sốc cho cha mẹ của các trẻ
nhỏ.

Lý thuyết chắc chắn có thể bị đánh giá như là một giải pháp quá tình thế (ad hoc). Mặc dù nó
được định nghĩa ở dạng đại số hình thức, nhưng ý nghĩa của các độ đo chắc chắn không có
nền tảng chặt chẽ như lý thuyết xác suất hình thức. Tuy nhiên, lý thuyết chắc chắn không cố
gắng tạo ra một kiểu đại số dành cho suy luận “chính xác”. Đúng hơn nó là sự ‘bôi trơn’ cho
phép hệ chuyên gia kết hợp những niềm tin khi nó suy luận vấn đề. Mặc dù CF được sử dụng
để duy trì chương trình chạy và thu thập thông tin, sức mạnh của chương trình chủ yếu vẫn
phụ thuộc vào chất lượng của các luật.

III SUY LUẬN VỚI CÁC TẬP MỜ (fUZZY LOGIC)

III.1 Logic truyền thống hay logic ‘giòn’:

Logic truyền thống chỉ quan tâm đến 2 giá trị tuyệt đối (đúng hoặc sai). Logic truyền thống
luôn tuân theo 2 giả thuyết. Một là tính thành viên của tập hợp: Với một phần tử và một tập

Võ Huỳnh Trâm – Trần Ngân Bình 127


Giáo Trình Trí Tuệ Nhân Tạo

hợp bất kỳ, thì phần tử hoặc là thuộc tập hợp đó, hoặc thuộc phần bù của tập đó. Giả thiết
thứ hai là định luật loại trừ trung gian, khẳng định một phần tử không thể vừa thuộc một tập
hợp vừa thuộc phần bù của nó.

Thí dụ 7.6: Nếu nhiệt độ trên 35 độ C thì nóng, ngược lại là không nóng. Hình bên dưới
minh họa tập hợp “NÓNG” gồm tất cả các nhiệt độ từ 35 độ C trở lên

Đúng
1

Sai NÓNG
0
35oC Nhiệt độ

Hình 7.3 - Biểu diễn tập nhiệt độ “NÓNG”.

Từ hình vẽ ta thấy logic giòn không thể hiện được sự khác biệt giữa các thành viên trong
cùng một tập hợp. Giữa hai nhiệt độ 45 và 55 độ C, logic này không thể hiện được nhiệt độ
nào nóng hơn nhiệt độ nào.

Ngoài ra, logic này còn có một nhược điểm khác quan trọng hơn đó là chúng không thể biểu
diễn được các dữ kiện mang tính mơ hồ, không chính xác mà trong thực tế lại có rất nhiều
phát biểu bằng ngôn ngữ tự nhiên ở dạng này; chẳng hạn như:

John thì khá cao => như vậy John có thuộc tập hợp những người cao hay không?

Hoặc: John thì rất cao => như thế nào là rất cao?

Vì vậy, logic truyền thống không thể hỗ trợ cho những suy luận trên những thông tin mang
tính mơ hồ, thiếu chính xác như vậy.

III.2 Khái niệm Logic mờ:

Để khắc phục khuyết điểm của logic truyền thống, Lotfi Zadeh đã đưa ra lý thuyết mới về
logic gọi là logic mờ (fuzzy logic).

Lý thuyết của Zadeh biểu diễn tính mờ hay tính thiếu chính xác trong các phát biểu (như ở
mục trên) theo cách định lượng bằng cách đưa ra một hàm tư cách thành viên tập hợp (set
membership function) nhận giá trị thực giữa 0 và 1.

III.2.1 Khái niệm về tập mờ:

Cho S là một tập hợp và x là một phần tử của tập hợp đó. Một tập con mờ F của S được định
nghĩa bởi một hàm tư cách thành viên μF(x) đo “mức độ” mà theo đó x thuộc về tập F. Trong
đó, 0 ≤ μF(x) ≤ 1.

Khi μF(x) = 0 nghĩa là x hoàn toàn không thuộc tập F.

128 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

Khi μF(x) = 1 nghĩa là x thuộc F hoàn toàn.

Nếu μF(x) = 0 hoặc 1 thì tập F được xem là “giòn”

Thí dụ 7.7: S là tập hợp tất cả các số nguyên dương và F là tập con mờ của S được gọi là “số
nguyên nhỏ”. Trong đó: μF(1) = 1.0, μF(2) = 1.0, μF(3) = 0.9, μF(4) = 0.8,.. μF(50) = 0.001,
v.v… được biểu diễn như trong hình 7.3:

μ
Số nguyên nhỏ
1

1 2 3 …

Hình 7.4 - Biểu diễn tập mờ của “các số nguyên nhỏ”

Thí dụ 7.8: Hình bên dưới minh họa hàm thành viên cho các tập mờ thể hiện người đàn ông
“Thấp”, “Cao” và “Trung bình”.

1
Thấp Trungbình Cao
μ

0 ||
4’ 4’6” 5’ 5’6” 6’ 6’6” Chiều cao

Hình 7.5 - Biểu diễn của các tập mờ “Thấp”, “Trung bình”, và “Cao”

Từ hình 7.5, ta thấy những người đàn ông cao 4’ thì hoàn toàn thuộc về tập mờ ‘Thấp’. Còn
những người đàn ông có chiều cao 4’8” thì vừa thuộc tập mờ ‘Thấp’, vừa thuộc tập mờ
‘Trung bình’. Còn những người đàn ông có chiều cao 6’1” thì chỉ thuộc tập mờ ‘Cao’ với μ
<1.

.III.2.1.1 Tính chất:


• Hai tập mờ bằng nhau: A = B nếu ∀x ∈ X, μA (x) = μB (x)

• Tập con: A ⊆ B nếu ∀x ∈ X, μA (x) ≤ μB (x)

• Một phần tử có thể thuộc về nhiều hơn một tập mờ. Như trong ví dụ 2 (hình 7.4), một
người đàn ông cao 5’10” thuộc về cả hai tập “trung bình” và “cao”.

- Tổng các giá trị mờ của một phần tử khác 1:


μThấp(x) + μTrungbình(x) + μCao(x) ≠ 1

- Từ hàm thành viên cho trước, ta có thể suy ra được mức độ một thành viên thuộc về
một tập hợp, hay có thể xác định được giá trị mờ của nó đối với một tập mờ.

Võ Huỳnh Trâm – Trần Ngân Bình 129


Giáo Trình Trí Tuệ Nhân Tạo

Thí dụ 7.9: Một hàm thành viên cho tập mờ thể hiện một người là “Trẻ”, “Trung niên” và
“Già”.

Các tập mờ
μ

Trẻ Trung niên Già


1
0.8

0.5
0.3
||
0 28 35
23 25 40 55 Tuổi

Hình 7.6 - Biểu diễn của các tập mờ “Trẻ”, “Trung niên”, và “Già”

Từ hình trên, nếu cho biết tuổi của một người, ta có thể xác định mức độ người đó thuộc về
lớp người trẻ, trung niên và già. Chẳng hạn như:

- An 28 tuổi => μTre(An) = 0.8 và μTrung niên(An) = 0.3

- Bảo 35 tuổi => μTre(Bảo) = 0.3 và μTrung niên(Bảo) = 0.8

- Châu 23 tuổi => μTre(Châu) = 1.0


Câu hỏi :

Hãy cho biết giá trị mờ μTrẻ, μTrung niên, μGià của các dữ liệu sau biết rằng:
1. Tấm 23 tuổi
2. Cám 35 tuổi

Ta gọi các con số 0.8, 0.2, 1.0 là các giá trị mờ (fuzzy values). Vậy từ các giá trị chính xác
hay giá trị ‘giòn’ (số tuổi: 28, 35, 23…), ta đã suy ra các giá trị mờ tương ứng. Thao tác này
gọi là mờ hóa (fuzzification) các giá trị giòn.

130 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

III.3 Các toán tử logic trên tập mờ:

Logic mờ không quan tâm đến cách thức các tập mờ được tạo ra như thế nào, mà quan tâm
đến các luật hỗ trợ cho việc suy luận trên các tập mờ này. Phần này sẽ trình bày các phép
toán thao tác trên các tập mờ, đó là phép bù (complement) phép hợp (union), phép giao
(intersection).

III.3.1 Phép hợp hay toán tử OR:


A∪B
Khái niệm: Hợp của hai tập mờ (A∪B) thể hiện mức
độ một phần tử thuộc về một trong hai tập là bao
nhiêu.

Công thức: μ A∨ B(x) = max (μA(x) , μB(x) ) B

Thí dụ 7.10:

μTre(An) = 0.8 và μTrung niên(An) = 0.3

=> μTre ∨ Trung Niên(An) = max( 0.8, 0.3) = 0.8

III.3.2 Phép giao hay toán tử AND: A∩B


Khái niệm: Giao của hai tập mờ (A∩B) thể hiện mức độ
một phần tử thuộc về cả hai tập là bao nhiêu.

Công thức: μ A∧ B(x) = min (μA(x) , μB(x) ) B

Thí dụ 7.11:

μTre(An) = 0.8 và μTrung niên(An) = 0.3

=> μTre ∧ Trung Niên(An) = min( 0.8, 0.3) = 0.3

III.3.3 Phép bù hay toán tử NOT:


A’
Khái niệm: Bù của một tập mờ thể hiện mức độ một phần
tử không thuộc về tập đó là bao nhiêu.

Công thức: μ ¬A(x) = 1 - μA(x)


Thí dụ 7.12: μTrẻ(An) = 0.8

μ ¬Trẻ(An) = 1 – 0.8 = 0.2

Nhận xét: Logic mờ không tuân theo các luật về tính bù


của logic truyền thống: μ ¬A∨ A(x) ≡ 1 và μ ¬A ∧ A(x) ≡ 0
Thí dụ 7.13: μ ¬A∨ A(x) = max (0.8, 0.2) = 0.8

Võ Huỳnh Trâm – Trần Ngân Bình 131


Giáo Trình Trí Tuệ Nhân Tạo

μ ¬A ∧ A(x) = min( 0.8, 0.2) = 0.2

III.3.4 Luật mờ

Một luật mờ là một biểu thức if- then được phát biểu ở dạng ngôn ngữ tự nhiên thể hiện sự
phụ thuộc nhân quả giữa các biến.

Thí dụ 7.14: if nhiệt độ là lạnh và giá dầu là rẻ then sưởi ấm nhiều.

Trong đó: - ‘nhiệt độ’, ‘giá dầu’ và ‘sưởi ấm’ là các biến

- ‘lạnh’, ‘rẻ’, ‘nhiều’ là các giá trị hay chính là các tập mờ.

Hoặc: if một người có chiều cao là cao và cơ bắp là lực lưỡng then chơi bóng rổ
hay.

Các biến ở đây sẽ là: ‘chiều cao’, ‘cơ bắp’, ‘chơi bóng rổ’

Các giá trị hay tập mờ là: ‘cao’, ‘lực lưỡng’, ‘hay’.

III.3.5 Thủ tục ra quyết định mờ: (fuzzy decision making procedure)

Để hệ thống mờ có thể suy luận bằng các luật mờ và đưa ra kết luận từ các số liệu chính xác
ở đầu vào, hệ thống thực hiện 3 bước:

Mờ hóa Suy luận Khử tính mờ


(fuzzification) h (defuzzification)

1. Mờ hóa: Tính toán các giá trị mờ từ các giá trị chính xác ở đầu vào.

2. Suy luận mờ: Áp dụng tất cả các luật mờ có thể áp dụng để tính ra giá trị mờ cho kết
luận, sau đó kết hợp các kết quả đầu ra.

3. Phi mờ hóa: Xác định giá trị chính xác từ kết quả mờ có được ở bước 2. Có nhiều kỹ
thuật phi mờ hóa có thể áp dụng được, phương pháp thông dụng nhất là phương pháp
trọng tâm (centriod method).

Thí dụ 7.15: Cho hệ thống mờ dùng trong điều trị bệnh gồm các luật sau đây:

1. IF sốt nhẹ THEN liều lượng asperine thấp

2. IF sốt THEN liều lượng asperine bình thường

3. IF sốt cao THEN liều lượng asperine cao

4. IF sốt rất cao THEN liều lượng asperine cao nhất

Và các tập mờ được biểu diễn như sau:

132 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

1
SN S SC SRC

o
37 38 39 40 41 C

T BT C CN

0 20 40 60 80 100 mg

Hình 7.7 - Biểu diễn của các tập mờ trong Thí dụ 7.15

Một bệnh nhân sốt ở 38.7 độ, hãy xác định liều lượng asperince cần thiết để cấp cho bệnh
nhân.

Giải:

Bước 1: Mờ hóa giá trị x = 38.7 đã cho: ta thấy 38.7 thuộc về các tập mờ như sau:

1
0.7 SN S SC SRC

0.3
o
37 38 38.7 39 40 41 C

μSốt nhẹ (x) = 0.3 μSốt (x) = 0.7 μSốt cao (x) = 0 μSốt rất cao (x) = 0

Bước 2: Ta thấy có 2 luật 1 và 2 có thể áp dụng cho ra hai liều lượng aspirine:

μThấp (x) = 0.3 μBình thường (x) = 0.7

Kết hợp các giá trị mờ này lại ta được vùng được tô màu sau đây:

BT
0.7
T
0.3

0 200 400 600 800 mg

Võ Huỳnh Trâm – Trần Ngân Bình 133


Giáo Trình Trí Tuệ Nhân Tạo

Bước 3: Phi mờ hóa kết quả bằng cách tính trọng tâm của diện tích được tô trong hình trên,
chiếu xuống trục hoành ta được giá trị ±480mg, đây chính là liều lượng aspirine cần cấp cho
bệnh nhân.

IV TỔNG KẾT CHƯƠNG VII :

Nội dung chính của chương này bao gồm:

− Mặc dù phỏng đoán là không vững chắc, nhưng nó thường đóng vai trò thiết yếu
trong giải quyết vấn đề. Có nhiều tiếp cận đã được đưa ra nhằm tạo ra các hệ thống
có thể suy luận trên những thông tin không chắc chắn hoặc không đầy đủ để đưa ra
các kết luận hữu ích.

− Luật Bayes dựa trên lý thuyết xác suất hình thức cho phép chúng ta sử dụng tri thức
về nguyên nhân để suy ra tri thức về chẩn đoán.

− Lý thuyết về yếu tố chắc chắn Standford đưa ra khái niệm hệ số chắc chắn CF cho
phép các chuyên gia kết hợp những niềm tin của mình vào dữ liệu và các luật khi
phát biểu. Đồng thời đại số chắc chắn Standford cũng cung cấp các quy tắc và công
thức sử dụng để tính các giá trị CF cho các kết luận trong quá trình suy luận.

− Lý thuyết mờ đưa ra khái niệm tập mờ và hàm thành viên thể hiện mức độ một thành
viên thuộc vào tập mờ, đồng thời đưa ra các quy tắc tính toán giá trị mờ khi suy luận
trên các luật mờ.

V BÀI TẬP CHƯƠNG VII

VII.1. Giả sử có một phương pháp xét nghiệm HIV.


- Gọi TP là sự kiện xét nghiệm cho kết quả dương tính.
- Gọi TN là sự kiện xét nghiệm cho kết quả âm tính.
- Gọi HP là sự kiện người đang được xét nghiệm có HIV dương tính.
- Gọi HN là sự kiện người đang được xét nghiệm có HIV âm tính.
Kết quả được gọi là ‘sai dương tính’ khi xét nghiệm cho kết quả dương tính trong
khi người đó thực sự không bị nhiễm HIV

Kết quả được gọi là ‘sai âm tính’ khi xét nghiệm cho kết quả âm tính trong khi
người đó thực sự có nhiễm HIV

Cho một số dữ liệu sau:


- Tỉ lệ ‘sai dương tính’ là: P(TP|HN) = 0.02
- Tỉ lệ ‘sai âm tính’ là: P(TN|HP) = 0.01
- Tỉ lệ người bị nhiễm HIV trong cộng đồng là 0.10

134 Võ Huỳnh Trâm – Trần Ngân Bình


Chương 7: Suy Luận Không Chắc Chắn

Nếu một người nhận được kết quả xét nghiệm dương tính, thì xác suất người đó thật sự bị
HIV là bao nhiêu?

VII.2. Sử dụng ví dụ nhỏ dưới đây để minh họa cơ chế suy luận của EMYCIN bằng đồ thị
AND/OR để cho thấy thứ tự sử dụng các luật, thứ tự các câu hỏi được đặt ra và thứ tự
các kết luận được đưa ra như thế nào,...

MINI-MINI-MYCIN là một hệ chuyên gia chuyên phân biệt bệnh dị ứng, sởi, hoặc
sốt vàng da. Nó bao gồm các luật sau:
1. IF cảm-thấy-khó-chịu AND chấm-đỏ THEN dị-ứng (0.6)
2. IF cảm-thấy-khó-chịu AND sốt THEN nhiễm-trùng (0.8)
3. IF du-lịch-nước-ngoài THEN sốt-vàng-da (0.5)
4. IF nhiễm-trùng AND chấm-đỏ THEN sởi (0.6)
5. IF nhiễm-trùng AND vàng-mắt THEN sốt-vàng-da (0.5)

Sử dụng các dữ liệu sau: John cảm thấy khó chịu (0.1). Có những chấm đỏ trên khắp
người (0.8). Tôi không có nhiệt kế nhưng tôi nghĩ anh ta bị sốt (0.5). Tôi biết John
vừa đi du lịch nước ngoài về (1.0). Mắt anh ta có vẻ vàng (0.4).

VII.3. Hãy cho biết các phát biểu sau đây thuộc loại không chắc chắn, mờ, cả hai hay không
có loại nào:
a. Cảnh sát phạt một chiếc xe đang tăng tốc
b. An thì cao hơn Bảo nhiều.
c. Chỉ có 20% khách đến tham dự thích biểu triển lãm.
d. Một nhóm rất đông sinh viên đã tham gia cuộc diễu hành.
e. Ăn quá nhiều muối có thể gây bệnh huyết áp cao.

Võ Huỳnh Trâm – Trần Ngân Bình 135


Giáo Trình Trí Tuệ Nhân Tạo

Chương VII ...........................................................................................................................117


SUY LUẬN KHÔNG CHẮC CHẮN...................................................................................117
I. GIỚI THIỆU: ...........................................................................................................118
II. TIẾP CẬN THỐNG KÊ ĐỐI VỚI TÍNH KHÔNG CHẮC CHẮN........................119
II.1. Suy luận Bayes ................................................................................................119
II.2. Đại số hệ số chắc chắn Stanford......................................................................121
III. SUY LUẬN VỚI CÁC TẬP MỜ (fUZZY LOGIC) ...........................................127
III.1. Logic truyền thống hay logic ‘giòn’: ..............................................................127
III.2. Khái niệm Logic mờ: ......................................................................................128
III.3. Các toán tử logic trên tập mờ: .........................................................................131
TỔNG KẾT CHƯƠNG VII : ...........................................................................................134
BÀI TẬP CHƯƠNG VII .......................................................................................134

136 Võ Huỳnh Trâm – Trần Ngân Bình

You might also like