Bai Tap Tim Can b&#97

MÔN HỌC: LÝ THUYẾT TRÒ CHƠI
ĐÁP ÁN BÀI TẬP SỐ 1: TƯƠNG TÁC CHIẾN LƯỢC
Trong 4 bài toán sau đây (câu 1 đến câu 4), hãy xác định:
a. Chiến lược phản ứng tốt nhất của các người chơi (Best response)
b. Chiến lược trội (nếu có) (Dominant strategy)
c. Chiến lược bị trội (nếu có) (Dominated strategy)
d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi
Câu 1:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
a. Chiến lược phản ứng tốt nhất của các người chơi (Best response - BR)
Đáp ứng tốt nhất (Best response – BR) của một người chơi là chiến lược mang lại thu
hoạch lớn nhất (lợi ích tối đa, thiệt hại tối thiểu) của người chơi đó đối với từng chiến
lược cụ thể của đối phương. Điều này nói lên rằng, với từng chiến lược của đối phương,
chúng ta luôn có ít nhất một BR tương ứng (trường hợp có nhiều hơn 1 BR là khi thu
hoạch của nhiều chiến lược của ta đối với một CL cụ thể của đối phương là bằng nhau)
Lời giải:
• Tìm Best Response của A đối với từng chiến lược (CL) của B:
Khi B đi CL: DA1  BR của A là DA2 vì thu hoạch mang lại lớn hơn (4>3) so với DA1
Khi B đi CL: DA2  BR của A là DA2 vì thu hoạch mang lại lớn hơn (3>2) so với DA1
• Tìm Best Response của B đối với từng chiến lược (CL) của A:
Khi A đi CL: DA1  BR của B là DA1 vì thu hoạch mang lại lớn hơn (5>4) so với DA2
Khi A đi CL: DA2  BR của B là DA1 vì thu hoạch mang lại lớn hơn (6>5) so với DA2
Lưu ý: Để tránh nhầm lẫn, ta cần phân biệt:

Dữ liệu (con số) phía bên phải, theo cột là thu hoạch mà mỗi chiến lược của A mang lại tương
ứng với từng chiến lược của B.
Dữ liệu (con số) phía bên trái, theo dòng là thu hoạch mà mỗi chiến lược của B mang lại tương
ứng với từng chiến lược của A.
1
b. Chiến lược trội (nếu có) (Dominant strategy)
Chiến lược trội (Dominant strategy): là CL đáp ứng tốt nhất (BR) đối với mọi CL của
đối phương, hay là CL mang lại cho ta những thu hoạch lớn hơn hẳn những thu hoạch
có được nhờ những CL khác (cũng của ta), bất luận lựa chọn của đối phương là gì.
Nếu một đấu thủ có một chiến lược trội thì tất cả những chiến lược khác của đấu thủ này
tất nhiên là những chiến lược bị trội.
Một đấu thủ duy lí (hay có lí trí) chỉ có thể lựa chọn chiến lược trội của mình để chơi.
Tuy nhiên, việc toàn thể các đấu thủ vận dụng – nếu có thể - những chiến lược trội của
mình có thể dẫn đến những tình trạng không tối ưu (trong nghĩa của Pareto), như ví dụ
của Thế lưỡng nan của những người tù cho thấy (hai người tù đều chọn CL trội của
mình lại dẫn đến việc phải ngồi tù lâu hơn  không tối ưu).
Có hai cách để tìm CL trội:

• Cách 1: Sau khi đã tìm Best Response, như đã làm ở câu a, ta có:
- Nếu với mọi CL của B ta thấy chỉ có 1 CL đáp ứng tốt nhất của A thì CL đó là CL trội, ta
thấy với cả 2 CL của B, A đều có BR là DA2, vậy có thể kết luận ngay là DA2 là CL trội
của A.
- Tương tự, DA1 là CL trội của B.
• Cách 2: Khi chưa tìm BR, thì ta so sánh nhanh những thu hoạch của các CL của từng đấu
thủ (người chơi) để kết luận:
- Đối với A: so sánh các thu hoạch từ các CL của A ( theo cột), xem hình:
Công ty A
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Ta thấy rằng, CL DA2 của A luôn mang lại thu hoạch lớn hơn CL DA1, bất kể B chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA2 của A là chiến lược trội.
- Đối với B: so sánh các thu hoạch từ các CL của B ( theo hàng), xem hình:
Công ty A
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Ta thấy rằng, CL DA1 của B luôn mang lại thu hoạch lớn hơn CL DA2, bất kể A chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA1 của B là chiến lược trội.
c. Chiến lược bị trội (nếu có) (Dominated strategy)
2
Chiến lược bị trội (Dominated strategy): là chiến lược của một đấu thủ trong mọi tình
huống (nghĩa là bất luận quyết định của các đấu thủ khác ra sao), mang về cho anh ta
một thu hoạch nhỏ hơn thu hoạch mà một chiến lược khác, cũng của anh ta, mang về
được.
Khi một đấu thủ chỉ có 2 CL, nếu có 1 CL bị trội thì CL kia sẽ là CL trội và ngược lại.
Một đấu thủ duy lí (hay có lí trí) sẽ loại bỏ chiến lược bị trội của mình ra khỏi không
gian chiến lược, tức là anh ta sẽ không bao giờ chơi CL ấy.
Dựa vào định nghĩa trên đây, và xem hình ở câu b, chúng ta thấy rằng:
- A có CL DA1 bị trội bởi CL DA2 của mình (A);
- B có CL DA2 bị trội bởi CL DA1 của mình (B);
Trạng thái cân bằng (Nash Equilibrium - NE) của cuộc chơi:
Định nghĩa 1: Cân bằng Nash là thế cân bằng mà ở đó, không một người chơi nào có
thể cải thiện được vị thế (thu hoạch) của mình, khi cho trước CL của đối phương.
Định nghĩa 2: Cân bằng Nash để chỉ mọi tổ hợp Chiến lược – một tổ hợp cho mỗi đấu
thủ - sao cho không có đấu thủ nào tiếc nuối lựa chọn của mình sau khi nhận thấy lựa
chọn của các đấu thủ khác.
Như vậy, ở một cân bằng Nash nào đó, chiến lược (tạo nên thế cân bằng) của đấu thủ
này sẽ là đáp ứng tốt nhất (BR) đối với CL (tạo nên thế cân bằng) của đấu thủ còn lại.
Ví dụ : NE của 2 đấu thủ A và B được tạo nên bởi CL X của A và CL Y của B thì X là
đáp ứng tốt nhất đối với Y và ngược lại, Y là đáp ứng tốt nhất của X. Có thể biểu diễn
như sau : NE = (SA*, SB*) = (X, Y) với X=BR(Y) và Y=BR(X).
Cân bằng Nash là lời giải trong lý thuyết trò chơi, còn gọi là kết cục của cuộc chơi.
Có thể có một, hai, nhiều hay vô số cân bằng Nash và cũng có thể không có cân bằng
Nash nào trong LTTC.
Cách tìm cân bằng Nash (Nash Equilibrium - NE) của cuộc chơi:
1. Nếu có CL trội, người chơi sẽ sử dụng nó
2. Nếu có CL bị trội, người chơi sẽ loại bỏ nó
3. Lần lượt dùng 2 cách (1) và (2) ở trên cho các người chơi để đơn giản hóa trò
chơi cho đến khi tìm thấy cân bằng của cuộc chơi.
4. Nếu không có CL trội lẫn bị trội thì tìm theo định nghĩa 2 ở trên, tìm BR của
từng đối thủ để xem xét.
3
Với câu 1, cân bằng Nash được tìm thấy bằng cách loại bỏ CL bị trội của A (DA1) và CL bị
trội của B (DA2) - (đồng nghĩa với việc chọn CL trội của A và B)
Công ty A Đường
Dự án 1 Dự án 2 Loại bỏ
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Vậy cân bằng của cuộc chơi tạo nên khi A làm Dự Án 2 và B làm Dự Án 1. Lúc đó, thu
hoạch mang lại cho A là 4 và mang về cho B là 6.
Lưu ý: CB Nash là tổ hợp chiến lược, chứ không phải là thu hoạch, ghi NE = (6,4) là sai 
Đúng là: NE = (ADA2, BDA1)
Câu 2:
Công ty A
Giữ giá Giảm giá
Giữ giá 3,3 1 , 40
Công ty B
Giảm giá 6 , -1 0,0
a.b.c. BR, CL trội, CL bị trội
• Xét A:
Khi B đi CL: Giữ Giá  BR của A là Giảm giá (40>3)
Khi B đi CL: Giảm giá  BR của A là Giảm giá (0>-1)
Giảm giá là CL trội của A và CL bị trội của A là CL Giữ giá
• Xét B:
Khi A đi CL: Giữ Giá  BR của B là Giảm giá (6>3)
Khi A đi CL: Giảm giá  BR của B là Giữ giá (1>0)
B không có CL trội và bị trội
A có CL trội là Giảm giá  A sẽ sử dụng CL này. B không có CL trội lẫn bị trội  B sẽ sử

dụng BR đối với CL trội của A là CL Giữ giá. Vậy cân bằng của cuộc chơi là khi A sử dụng
CL Giảm giá và B sử dụng CL Giữ giá. Khi đó thu hoạch của A và B lần lượt là 40 và 1.
Xem hình:
Công ty A
Giữ giá Giảm giá
Giữ giá 3,3 1 , 40
Công ty B
Giảm giá 6 , -1 0,0
4
Câu 3
Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25
a.b.c. BR, CL trội, CL bị trội
• Xét A:
Khi B đi CL: Thức ăn 1  BR của A là Thức ăn 1 (100>50)
Khi B đi CL: Thức ăn 2  BR của A là Thức ăn 1 (150>25)
Thức ăn 1 là CL trội của A và Thức ăn 2 của A là CL bị trội
• Xét B:
Khi A đi CL: Thức ăn 1  BR của B là Thức ăn 2 (150>100)
Khi A đi CL: Thức ăn 2  BR của B là Thức ăn 1 (150>50)
A có CL trội là Thức ăn 1  A sẽ sử dụng CL này. B không có CL trội lẫn bị trội  B sẽ sử

dụng BR đối với CL trội của A là CL Thức ăn 2. Vậy cân bằng của cuộc chơi là khi A sản
xuất Thức ăn 1 và B sản xuất Thức ăn 2. Khi đó thu hoạch của A và B lần lượt là 150, 150.
Xem hình:
Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25
Câu 4
Công ty A
Dự án 1 Dự án 2 Dự án 3
Dự án 1 -2 , 3 -1 , 1 4 , -3
Công ty B Dự án 2 5 , -4 2 , -3 3 , -4
Dự án 3 7 , -6 -3 , 2 -4 , 6
• Xét A:
Khi B đi CL: Dự án 1  BR của A là Dự án 1 (3>1 & 3>-3)
Khi B đi CL: Dự án 2  BR của A là Dự án 2 (-3>-4 & -3>-4 )
Khi B đi CL: Dự án 3  BR của A là Dự án 3 (6>2 & 6>-6)
A không có CL trội và bị trội
5
• Xét B:
Khi A đi CL: Dự án 1  BR của B là Dự án 3 (7>5 & 7>-2)
Khi A đi CL: Dự án 2  BR của B là Dự án 2 (2>-1 & 2>-3 )
Khi A đi CL: Dự án 3  BR của B là Dự án 1 (4>3 & 4>-4)
Vì cả 2 Công ty A và B đều không có chiến lược trội và bị trội nên ta tìm NE theo định nghĩa.
Từ trên ma trận (các ô vuông màu vàng và màu hồng) hoặc 2 dòng bôi vàng Đáp ứng tốt nhất
của 2 người chơi đối với chiến lược của nhau ta thấy rằng: Dự án 2 của A là đáp ứng tốt nhất
đối với Dự án 2 của B và ngược lại. Vậy đây chính là cân bằng Nash của cuộc chơi. Thu
hoạch mang lại cho A là -3 và B là 2.

Bai Tap Tim Can b&#97

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bai Tap Tim Can b&#97

Uploaded by

Copyright:

Available Formats

MÔN HỌC: LÝ THUYẾT TRÒ CHƠI

ĐÁP ÁN BÀI TẬP SỐ 1: TƯƠNG TÁC CHIẾN LƯỢC

Lưu ý: Để tránh nhầm lẫn, ta cần phân biệt:

Có hai cách để tìm CL trội:

c. Chiến lược bị trội (nếu có) (Dominated strategy)

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Giảm giá  A sẽ sử dụng CL này. B không có CL trội lẫn bị trội  B sẽ sử

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Thức ăn 1  A sẽ sử dụng CL này. B không có CL trội lẫn bị trội  B sẽ sử

You might also like