Professional Documents
Culture Documents
PHÂN LỚP
DECISION TREE
Phan Hiền
KHÁI QUÁT
Cây quyết định là một phương pháp phân lớp
dựa vào nguyên lý học có giám sát.
Đầu tư 100
Hại: 15
Lợi: 200
Đầu tư 300
Mua vàng
Hại: 300
Lợi: 100
Đầu tư 1000
Hại: 500
XU HƯỚNG 1
Vấn đề được xét thêm yếu tố thường thấy
Một nhà đầu tư quyết định mua 3 dòng sản phẩm Xe,Vàng, Cổ
phiếu. Nhà đầu tư nhận thấy (mọi chuyện tốt đẹp) nếu bỏ 100
mua Xe thì lời thu được là 40, nếu có lỗ thì thiệt hại là 15. Nếu
bỏ 300 mua Vàng, nếu lời thu được là 200, nếu lỗ thì thiệt hại
là 300. Nếu bỏ 1000 mua cổ phiếu, lời có thể là 100, nhưng
thiệt hại có thể là 500.
Đối với mua xe, khả năng thành công là 0.7
Đối với mua vàng, khả năng thành công là 0.4
Đối với mua cổ phiếu, khả năng thành công là 0.8
Ta có thể xác định một tổ chức các kế hoạch cho
việc lựa chọn một quyết định đầu tư nào đó
XU HƯỚNG 1
Lợi: 40
0.7
Đầu tư 100
0.3 Hại: 15
Lợi: 200
0.4
Đầu tư 300
Mua vàng
0.6
Hại: 300
Lợi: 100
0.8
Đầu tư 1000
EV Pi *Vi
i
Pi là khả năng của nhánh i, Vi là giá trị đạt của nhánh i.
- Dùng hệ số hữu dụng (Utility)
Dựa vào hàm mũ để xác định tính chất độ hữu dụng giảm dần
khi được cung cấp quá nhiều.
- Dùng hệ số liều lỉnh (Risk)
XU HƯỚNG 1
Lợi: 40
0.7
Đầu tư 100 EV= 23.5
0.3 Hại: -15
Lợi: 200
EV= 23.5 0.4
Đầu tư 300
Mua vàng EV= -100
0.6
Hại: -300
Lợi: 100
0.8
Đầu tư 1000
EV= -20
0.2 Hại: -500
Xét độ đo En(Xe)
En(Xe) = [(7/12)*log2(12/7)] + [(3/12)*log2(12/3)] +
[(2/12)*log2(12/2)]
= 1.3844
THANG ĐO
IG (Information Gain) thông tin có ích.
IG thể hiện sự thay đổi của mức độ không
đáng tin của biến cố X từ lúc chưa có sự
xuất hiện của biến có A đến khi có sự xuất
hiện của biến cố A.
IG(X|A) = En(X) – En(X|A)
Nếu IG cao Sự xuất hiện A làm cho En(X)
giảm nhiều mức độ đáng tin xuất hiện các
trạng thái Xi là cao Ta chọn A để tách
nhóm theo độ thường xuyên cho đích là X.
THANG ĐO
En( X ) P( X i ) * Log2 P( X i )
i
Ai
En ( X | A)
Ai A A
* En( X / X j X )
A Ai
GT TN
{4,0,3} {0,4,1}
Giới Thu Giá Đi xe Giới Thu Giá Đi xe
tính nhập xăng tính nhập xăng
Nam [0,10) Cao Bus Nam [10,) Cao Taxi
Nu [0,10) Cao Bus Nu [10,) Cao Taxi
Nu [0,10) Cao Bus Nu [10,) Thap Cup
Nu [0,10) Thap Cup Nam [10,) Vua Taxi
Nam [0,10) Thap Bus Nu [10,) Vua Taxi
Nam [0,10) Vua Cup
Nam [0,10) Vua Cup
Ví dụ - Lần 2
Xét 2 thuộc tính GT và GX với TN = [10,)
GT GX
En(DX)=En({0,4,1})=0.721
GT GX
En(DX)=En({0,4,3})=0.985
Lần 4
Ta có 1 thuộc tính còn lại Chắc chắn chọn GT và ta có các
nhánh của GT đều có sự đồng nhất về thuộc tính đích.
Chấm dứt.
Kết quả
TN
[0,10): 7 [10,): 5
GX
GX
Nam: 1 Nu: 1
Bus Cup
Xuất luật
Nếu thu nhập trong khoảng [0,10) và giá
xăng cao thì lựa chọn là xe Bus.
….