Professional Documents
Culture Documents
Trong 4 bài toán sau đây (câu 1 đến câu 4), hãy xác định:
a. Chiến lược phản ứng tốt nhất của các người chơi (Best response)
b. Chiến lược trội (nếu có) (Dominant strategy)
c. Chiến lược bị trội (nếu có) (Dominated strategy)
d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi
Câu 1:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
a. Chiến lược phản ứng tốt nhất của các người chơi (Best response - BR)
Đáp ứng tốt nhất (Best response – BR) của một người chơi là chiến lược mang lại thu
hoạch lớn nhất (lợi ích tối đa, thiệt hại tối thiểu) của người chơi đó đối với từng chiến
lược cụ thể của đối phương. Điều này nói lên rằng, với từng chiến lược của đối phương,
chúng ta luôn có ít nhất một BR tương ứng (trường hợp có nhiều hơn 1 BR là khi thu
hoạch của nhiều chiến lược của ta đối với một CL cụ thể của đối phương là bằng nhau)
Lời giải:
• Tìm Best Response của A đối với từng chiến lược (CL) của B:
Khi B đi CL: DA1 BR của A là DA2 vì thu hoạch mang lại lớn hơn (4>3) so với DA1
Khi B đi CL: DA2 BR của A là DA2 vì thu hoạch mang lại lớn hơn (3>2) so với DA1
• Tìm Best Response của B đối với từng chiến lược (CL) của A:
Khi A đi CL: DA1 BR của B là DA1 vì thu hoạch mang lại lớn hơn (5>4) so với DA2
Khi A đi CL: DA2 BR của B là DA1 vì thu hoạch mang lại lớn hơn (6>5) so với DA2
1
b. Chiến lược trội (nếu có) (Dominant strategy)
Chiến lược trội (Dominant strategy): là CL đáp ứng tốt nhất (BR) đối với mọi CL của
đối phương, hay là CL mang lại cho ta những thu hoạch lớn hơn hẳn những thu hoạch
có được nhờ những CL khác (cũng của ta), bất luận lựa chọn của đối phương là gì.
Nếu một đấu thủ có một chiến lược trội thì tất cả những chiến lược khác của đấu thủ này
tất nhiên là những chiến lược bị trội.
Một đấu thủ duy lí (hay có lí trí) chỉ có thể lựa chọn chiến lược trội của mình để chơi.
Tuy nhiên, việc toàn thể các đấu thủ vận dụng – nếu có thể - những chiến lược trội của
mình có thể dẫn đến những tình trạng không tối ưu (trong nghĩa của Pareto), như ví dụ
của Thế lưỡng nan của những người tù cho thấy (hai người tù đều chọn CL trội của
mình lại dẫn đến việc phải ngồi tù lâu hơn không tối ưu).
• Cách 2: Khi chưa tìm BR, thì ta so sánh nhanh những thu hoạch của các CL của từng đấu
thủ (người chơi) để kết luận:
- Đối với A: so sánh các thu hoạch từ các CL của A ( theo cột), xem hình:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Ta thấy rằng, CL DA2 của A luôn mang lại thu hoạch lớn hơn CL DA1, bất kể B chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA2 của A là chiến lược trội.
- Đối với B: so sánh các thu hoạch từ các CL của B ( theo hàng), xem hình:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Ta thấy rằng, CL DA1 của B luôn mang lại thu hoạch lớn hơn CL DA2, bất kể A chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA1 của B là chiến lược trội.
2
Chiến lược bị trội (Dominated strategy): là chiến lược của một đấu thủ trong mọi tình
huống (nghĩa là bất luận quyết định của các đấu thủ khác ra sao), mang về cho anh ta
một thu hoạch nhỏ hơn thu hoạch mà một chiến lược khác, cũng của anh ta, mang về
được.
Khi một đấu thủ chỉ có 2 CL, nếu có 1 CL bị trội thì CL kia sẽ là CL trội và ngược lại.
Một đấu thủ duy lí (hay có lí trí) sẽ loại bỏ chiến lược bị trội của mình ra khỏi không
gian chiến lược, tức là anh ta sẽ không bao giờ chơi CL ấy.
Dựa vào định nghĩa trên đây, và xem hình ở câu b, chúng ta thấy rằng:
- A có CL DA1 bị trội bởi CL DA2 của mình (A);
- B có CL DA2 bị trội bởi CL DA1 của mình (B);
Trạng thái cân bằng (Nash Equilibrium - NE) của cuộc chơi:
Định nghĩa 1: Cân bằng Nash là thế cân bằng mà ở đó, không một người chơi nào có
thể cải thiện được vị thế (thu hoạch) của mình, khi cho trước CL của đối phương.
Định nghĩa 2: Cân bằng Nash để chỉ mọi tổ hợp Chiến lược – một tổ hợp cho mỗi đấu
thủ - sao cho không có đấu thủ nào tiếc nuối lựa chọn của mình sau khi nhận thấy lựa
chọn của các đấu thủ khác.
Như vậy, ở một cân bằng Nash nào đó, chiến lược (tạo nên thế cân bằng) của đấu thủ
này sẽ là đáp ứng tốt nhất (BR) đối với CL (tạo nên thế cân bằng) của đấu thủ còn lại.
Ví dụ : NE của 2 đấu thủ A và B được tạo nên bởi CL X của A và CL Y của B thì X là
đáp ứng tốt nhất đối với Y và ngược lại, Y là đáp ứng tốt nhất của X. Có thể biểu diễn
như sau : NE = (SA*, SB*) = (X, Y) với X=BR(Y) và Y=BR(X).
Cân bằng Nash là lời giải trong lý thuyết trò chơi, còn gọi là kết cục của cuộc chơi.
Có thể có một, hai, nhiều hay vô số cân bằng Nash và cũng có thể không có cân bằng
Nash nào trong LTTC.
Cách tìm cân bằng Nash (Nash Equilibrium - NE) của cuộc chơi:
1. Nếu có CL trội, người chơi sẽ sử dụng nó
2. Nếu có CL bị trội, người chơi sẽ loại bỏ nó
3. Lần lượt dùng 2 cách (1) và (2) ở trên cho các người chơi để đơn giản hóa trò
chơi cho đến khi tìm thấy cân bằng của cuộc chơi.
4. Nếu không có CL trội lẫn bị trội thì tìm theo định nghĩa 2 ở trên, tìm BR của
từng đối thủ để xem xét.
3
Với câu 1, cân bằng Nash được tìm thấy bằng cách loại bỏ CL bị trội của A (DA1) và CL bị
trội của B (DA2) - (đồng nghĩa với việc chọn CL trội của A và B)
Công ty A Đường
Dự án 1 Dự án 2 Loại bỏ
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3
Vậy cân bằng của cuộc chơi tạo nên khi A làm Dự Án 2 và B làm Dự Án 1. Lúc đó, thu
hoạch mang lại cho A là 4 và mang về cho B là 6.
Lưu ý: CB Nash là tổ hợp chiến lược, chứ không phải là thu hoạch, ghi NE = (6,4) là sai
Đúng là: NE = (ADA2, BDA1)
Câu 2:
Công ty A
Giữ giá Giảm giá
Giữ giá 3,3 1 , 40
Công ty B
Giảm giá 6 , -1 0,0
a.b.c. BR, CL trội, CL bị trội
• Xét A:
Khi B đi CL: Giữ Giá BR của A là Giảm giá (40>3)
Khi B đi CL: Giảm giá BR của A là Giảm giá (0>-1)
Giảm giá là CL trội của A và CL bị trội của A là CL Giữ giá
• Xét B:
Khi A đi CL: Giữ Giá BR của B là Giảm giá (6>3)
Khi A đi CL: Giảm giá BR của B là Giữ giá (1>0)
B không có CL trội và bị trội
Công ty A
Giữ giá Giảm giá
Giữ giá 3,3 1 , 40
Công ty B
Giảm giá 6 , -1 0,0
4
Câu 3
Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25
a.b.c. BR, CL trội, CL bị trội
• Xét A:
Khi B đi CL: Thức ăn 1 BR của A là Thức ăn 1 (100>50)
Khi B đi CL: Thức ăn 2 BR của A là Thức ăn 1 (150>25)
Thức ăn 1 là CL trội của A và Thức ăn 2 của A là CL bị trội
• Xét B:
Khi A đi CL: Thức ăn 1 BR của B là Thức ăn 2 (150>100)
Khi A đi CL: Thức ăn 2 BR của B là Thức ăn 1 (150>50)
B không có CL trội và bị trội
Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25
Câu 4
Công ty A
Dự án 1 Dự án 2 Dự án 3
Dự án 1 -2 , 3 -1 , 1 4 , -3
Công ty B Dự án 2 5 , -4 2 , -3 3 , -4
Dự án 3 7 , -6 -3 , 2 -4 , 6
• Xét A:
Khi B đi CL: Dự án 1 BR của A là Dự án 1 (3>1 & 3>-3)
Khi B đi CL: Dự án 2 BR của A là Dự án 2 (-3>-4 & -3>-4 )
Khi B đi CL: Dự án 3 BR của A là Dự án 3 (6>2 & 6>-6)
A không có CL trội và bị trội
5
• Xét B:
Khi A đi CL: Dự án 1 BR của B là Dự án 3 (7>5 & 7>-2)
Khi A đi CL: Dự án 2 BR của B là Dự án 2 (2>-1 & 2>-3 )
Khi A đi CL: Dự án 3 BR của B là Dự án 1 (4>3 & 4>-4)
B không có CL trội và bị trội
Vì cả 2 Công ty A và B đều không có chiến lược trội và bị trội nên ta tìm NE theo định nghĩa.
Từ trên ma trận (các ô vuông màu vàng và màu hồng) hoặc 2 dòng bôi vàng Đáp ứng tốt nhất
của 2 người chơi đối với chiến lược của nhau ta thấy rằng: Dự án 2 của A là đáp ứng tốt nhất
đối với Dự án 2 của B và ngược lại. Vậy đây chính là cân bằng Nash của cuộc chơi. Thu
hoạch mang lại cho A là -3 và B là 2.