You are on page 1of 7

MÔN HỌC: LÝ THUYẾT TRÒ CHƠI

ĐÁP ÁN BÀI TẬP SỐ 1: TƯƠNG TÁC CHIẾN LƯỢC

Trong 4 bài toán sau đây (câu 1 đến câu 4), hãy xác định:
a. Chiến lược phản ứng tốt nhất của các người chơi (Best response)
b. Chiến lược trội (nếu có) (Dominant strategy)
c. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi
Lưu ý: Cách diễn giải để có được các kết quả trên.

Câu 1:

Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3

a. Chiến lược phản ứng tốt nhất của các người chơi (Best response - BR)

Đáp ứng tốt nhất (Best response – BR) của một người chơi là chiến lược mang lại thu
hoạch lớn nhất (lợi ích tối đa, thiệt hại tối thiểu) của người chơi đó đối với từng chiến
lược cụ thể của đối phương. Điều này nói lên rằng, với từng chiến lược của đối phương,
chúng ta luôn có ít nhất một BR tương ứng (trường hợp có nhiều hơn 1 BR là khi thu
hoạch của nhiều chiến lược của ta đối với một CL cụ thể của đối phương là bằng nhau)

Lời giải:
• Tìm Best Response của A đối với từng chiến lược (CL) của B:
Khi B đi CL: DA1  BR của A là DA2 vì thu hoạch mang lại lớn hơn (4>3) so với DA1
Khi B đi CL: DA2  BR của A là DA2 vì thu hoạch mang lại lớn hơn (3>2) so với DA1
• Tìm Best Response của B đối với từng chiến lược (CL) của A:
Khi A đi CL: DA1  BR của B là DA1 vì thu hoạch mang lại lớn hơn (5>4) so với DA2
Khi A đi CL: DA2  BR của B là DA1 vì thu hoạch mang lại lớn hơn (6>5) so với DA2

Lưu ý: Để tránh nhầm lẫn, ta cần phân biệt:


Dữ liệu (con số) phía bên phải, theo cột là thu hoạch mà mỗi chiến lược của A mang lại tương
ứng với từng chiến lược của B.
Dữ liệu (con số) phía bên trái, theo dòng là thu hoạch mà mỗi chiến lược của B mang lại tương
ứng với từng chiến lược của A.

1
b. Chiến lược trội (nếu có) (Dominant strategy)

Chiến lược trội (Dominant strategy): là CL đáp ứng tốt nhất (BR) đối với mọi CL của
đối phương, hay là CL mang lại cho ta những thu hoạch lớn hơn những thu hoạch có
được nhờ những CL khác (cũng của ta), bất luận lựa chọn của đối phương là gì.
Nếu một đấu thủ có một chiến lược trội thì tất cả những chiến lược khác của đấu thủ này
tất nhiên là những chiến lược bị trội (khái niệm này tôi sẽ để cập sau nếu có thời gian)
Một đấu thủ duy lí (hay có lí trí) chỉ có thể lựa chọn chiến lược trội của mình để chơi.
Tuy nhiên, việc toàn thể các đấu thủ vận dụng – nếu có thể - những chiến lược trội của
mình có thể dẫn đến những tình trạng không tối ưu (trong nghĩa của Pareto), như ví dụ
của Thế lưỡng nan của những người tù cho thấy (hai người tù đều chọn CL trội của
mình lại dẫn đến việc phải ngồi tù lâu hơn  không tối ưu).

Có hai cách để tìm CL trội:


• Cách 1: Sau khi đã tìm Best Response, như đã làm ở câu a, ta có:
- Nếu với mọi CL của B ta thấy chỉ có 1 CL đáp ứng tốt nhất của A thì CL đó là CL trội, ta
thấy với cả 2 CL của B, A đều có BR là DA2, vậy có thể kết luận ngay là DA2 là CL trội
của A.
- Tương tự, DA1 là CL trội của B.

• Cách 2: Khi chưa tìm BR, thì ta so sánh nhanh những thu hoạch của các CL của từng đấu
thủ (người chơi) để kết luận:
- Đối với A: so sánh các thu hoạch từ các CL của A ( theo cột), xem hình:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3

Ta thấy rằng, CL DA2 của A luôn mang lại thu hoạch lớn hơn CL DA1, bất kể B chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA2 của A là chiến lược trội.
- Đối với B: so sánh các thu hoạch từ các CL của B ( theo hàng), xem hình:
Công ty A
Dự án 1 Dự án 2
Dự án 1 5,3 6,4
Công ty B
Dự án 2 4,2 5,3

Ta thấy rằng, CL DA1 của B luôn mang lại thu hoạch lớn hơn CL DA2, bất kể A chọn CL
DA nào. Vậy ta có thể kết luận rằng, CL DA1 của B là chiến lược trội.

2
c. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

Trạng thái cân bằng (Nash Equilibrium - NE) của cuộc chơi:
Định nghĩa 1: Cân bằng Nash là thế cân bằng mà ở đó, không một người chơi nào có
thể cải thiện được vị thế (thu hoạch) của mình, khi cho trước CL của đối phương.

Định nghĩa 2: Cân bằng Nash để chỉ mọi tổ hợp Chiến lược – một tổ hợp cho mỗi đấu
thủ - sao cho không có đấu thủ nào tiếc nuối lựa chọn của mình sau khi nhận thấy lựa
chọn của các đấu thủ khác.
Như vậy, ở một cân bằng Nash nào đó, chiến lược (tạo nên thế cân bằng) của đấu thủ
này sẽ là đáp ứng tốt nhất (BR) đối với CL (tạo nên thế cân bằng) của đấu thủ kia và
ngược lại.

Ví dụ : NE của 2 đấu thủ A và B được tạo nên bởi CL X của A và CL Y của B thì X là
đáp ứng tốt nhất đối với Y và ngược lại, Y là đáp ứng tốt nhất của X. Có thể biểu diễn
như sau : NE = (SA*, SB*) = (X, Y) với X=BR(Y) và Y=BR(X).
Cân bằng Nash là lời giải trong lý thuyết trò chơi, còn gọi là kết cục của cuộc chơi.
Có thể có một, hai, nhiều hay vô số cân bằng Nash và cũng có thể không có cân bằng
Nash nào trong LTTC.

Cách tìm cân bằng Nash (Nash Equilibrium - NE) của cuộc chơi:
1. Nếu có CL trội, người chơi sẽ sử dụng nó

2. Nếu có CL bị trội, người chơi sẽ loại bỏ nó (đề cập sau)


3. Lần lượt dùng 2 cách (1) và (2) ở trên cho các người chơi để đơn giản hóa trò
chơi cho đến khi tìm thấy cân bằng của cuộc chơi.
4. Nếu không có CL trội lẫn bị trội thì tìm theo định nghĩa 2 ở trên, tìm BR của

Với câu 1, cân bằng Nash được tìm thấy bằng cách loại bỏ CL bị trội của A (DA1) và CL bị
trội của B (DA2) - (đồng nghĩa với việc chọn CL trội của A và B)

Công ty A Đường
Dự án 1 Dự án 2 Loại bỏ
Công ty B Dự án 1 5,3 6,4
Dự án 2 4,2 5,3

Vậy cân bằng của cuộc chơi tạo nên khi A làm Dự Án 2 và B làm Dự Án 1. Lúc đó, thu
hoạch mang lại cho A là 4 và mang về cho B là 6.

Lưu ý: CB Nash là tổ hợp chiến lược, chứ không phải là thu hoạch, ghi NE = (6,4) là sai 
Đúng là: NE = (ADA2, BDA1)

3
Câu 2:

Công ty A
Giữ giá Giảm giá
Giữ giá 3,3 1 , 40
Công ty B
Giảm giá 6 , -1 0,0
a.b. BR, CL trội
• Xét A:
Khi B đi CL: Giữ Giá  BR của A là Giảm giá (40>3)
Khi B đi CL: Giảm giá  BR của A là Giảm giá (0>-1)
Giảm giá là CL trội của A
• Xét B:
Khi A đi CL: Giữ Giá  BR của B là Giảm giá (6>3)
Khi A đi CL: Giảm giá  BR của B là Giữ giá (1>0)
B không có CL trội

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Giảm giá  A sẽ sử dụng CL này. B không có CL trội  B sẽ sử dụng BR


đối với CL trội của A là CL Giữ giá. Vậy cân bằng của cuộc chơi là khi A sử dụng CL Giảm
giá và B sử dụng CL Giữ giá. Khi đó thu hoạch của A và B lần lượt là 40 và 1. Xem hình:

Công ty A
Giữ giá Giảm giá
Công ty B Giữ giá 3,3 1 , 40
Giảm giá 6 , -1 0,0

Câu 3

Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25
a.b. BR, CL trội
• Xét A:
Khi B đi CL: Thức ăn 1  BR của A là Thức ăn 1 (100>50)
Khi B đi CL: Thức ăn 2  BR của A là Thức ăn 1 (150>25)
Thức ăn 1 là CL trội của A
• Xét B:
Khi A đi CL: Thức ăn 1  BR của B là Thức ăn 2 (150>100)
Khi A đi CL: Thức ăn 2  BR của B là Thức ăn 1 (150>50)
B không có CL trội

4
d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Thức ăn 1  A sẽ sử dụng CL này. B không có CL trội  B sẽ sử dụng BR


đối với CL trội của A là CL Thức ăn 2. Vậy cân bằng của cuộc chơi là khi A sản xuất Thức
ăn 1 và B sản xuất Thức ăn 2. Khi đó thu hoạch của A và B lần lượt là 150, 150. Xem hình:

Công ty A
Thức ăn 1 Thức ăn 2
Thức ăn 1 100 , 100 150 , 50
Công ty B
Thức ăn 2 150 , 150 50 , 25

Câu 4

Công ty A
Dự án 1 Dự án 2 Dự án 3
Dự án 1 -2 , 3 -1 , 1 4 , -3
Công ty B Dự án 2 5 , -4 2 , -3 3 , -4
Dự án 3 7 , -6 -3 , 2 -4 , 6

• Xét A:
Khi B đi CL: Dự án 1  BR của A là Dự án 1 (3>1 & 3>-3)
Khi B đi CL: Dự án 2  BR của A là Dự án 2 (-3>-4 & -3>-4 )
Khi B đi CL: Dự án 3  BR của A là Dự án 3 (6>2 & 6>-6)
A không có CL trội

• Xét B:
Khi A đi CL: Dự án 1  BR của B là Dự án 3 (7>5 & 7>-2)
Khi A đi CL: Dự án 2  BR của B là Dự án 2 (2>-1 & 2>-3 )
Khi A đi CL: Dự án 3  BR của B là Dự án 1 (4>3 & 4>-4)
B không có CL trội
Vì cả 2 Công ty A và B đều không có chiến lược trội nên ta tìm NE theo định nghĩa.
Từ trên ma trận trên (các ô vuông màu vàng và màu hồng) hoặc 2 dòng bôi vàng (Đáp ứng tốt
nhất của 2 người chơi đối với chiến lược của nhau), ta thấy rằng: Dự án 2 của A là đáp ứng
tốt nhất đối với Dự án 2 của B và ngược lại. Vậy đây chính là cân bằng Nash của cuộc chơi.
Thu hoạch mang lại cho A là -3 và B là 2.

5
CÂU 5 VÀ 6:
(Đọc thêm sách Tư duy chiến lược)

Câu 5
Đàm phán: Trên Sapa có bà người Mèo, rất thích nuôi mèo. Con mèo thích ra suối bắt cá,
không may, ngà xuống suối, và chết. Ông Tày ở hạ nguồn, vớt được xác mèo. Và bà Mèo
muốn chuộc lại xác con mèo yêu quý để làm ma chay. Ông Tày là độc quyền bán, đòi 6K. Bà
Mèo là độc quyền mua, chỉ trả 4K. Vậy cuối cùng, giá thỏa thuận sẽ là bao nhiêu?
(Gợi ý: Nếu đàm phán không thành, và chuyển sang ngày thứ hai, đàm phán tiếp, thì
bà Mèo ở vào thế mạnh, vì con mèo bị chết, phát mùi, gây tổn hại cho ông Tày. Nghĩ
vậy, ông Tày nên đồng ý ngay với giá 4K bà Mèo yêu cầu)

Câu 6
Đàm phán: Hai bé con, Hoa 10 tuổi, và Minh 11 tuổi, ở nhà chơi một mình. Bố mẹ phải đi
thăm họ hàng. Mẹ thương hai con, mua vội một chiệc bánh kem, dặn hai anh em chia nhau.
Anh nhường em lấy phần trước.
a. Khi hai bố mẹ đã đi, hai anh em thèm ăn chiếc bánh kem, liền lôi nó từ tủ lạnh ra để chia
nhau. Trời quá nóng, chiếc bánh kem sẽ bị chẩy rất nhanh. Vì vậy, chỉ kịp thời gian cho
Hoa đòi phần. Và nếu Minh đồng ý, thì ai nhận phần người nấy. Nếu Minh từ chối, hai
đứa bé sẽ tranh cãi, và chiếc bánh kem sẽ bị chẩy. Chẳng ai được gì hết. Giả sử Hoa đành
hanh, đòi ăn cả miếng bánh kem, chỉ cho Minh “liếm” một cái. Liệu Minh có chấp nhận
đòi hỏi của em mình không?

(Gợi ý: Nếu Minh hiểu rằng, mình mà từ chối thì chiếc bánh kem sẽ chẩy hết. Và Minh sẽ
chẳng được gì cả. Vì vậy, Minh nên chấp nhận tính đành hanh của em mà nhường nó).

b. Bây giờ giả sử trời mát hơn. Chiếc bánh kem lại được đặt trên bàn, sau khi bố mẹ đi. Hoa
lại được quyền đòi phần trước. Nếu Minh từ chối, thì lúc đó chiếc bánh kem chỉ bị chẩy
đi có một nửa. Và lúc đó Minh tất nhiên có quyền đòi mình được bao nhiêu. Nhưng nếu
Hoa đành hanh, không chịu để anh chia phần kế tiếp, thì nửa còn lại cũng bị chẩy mất. Và
chẳng ai được gì. Hãy bỏ qua vấn đề nhường nhịn anh em. Và phú cho Hoa khả năng
“nhìn xa rông rộng”. Liệu vào lúc đầu, Hoa nên đòi phần bánh là bao nhiêu để khỏi bị
nhìn thấy chiếc bánh kem bị chẩy đi mất một nửa, nếu bị Minh chối từ?

(Gợi ý: Hoa phải đặt mình vào giai đoạn cuối của Đàm phán, và hiểu rằng Minh sẽ ở vào
thế mạnh, vì nếu Hoa từ chối thì sẽ chẳng còn kem đem ra chia. Vậy nên Minh sẽ đòi hầu
hết nửa chiếc bánh kem còn lại. Hiểu vậy, vào lúc đầu, Hoa nên chỉ đòi cho minh một nửa
cái. Kết cục chia đều, 50:50 sẽ diễn ra).

c. Bây giờ giả sử trời còn mát hơn nữa, đủ để chiếc bánh kem chỉ bị chẩy mất một phần ba,
rồi hai phần ba, rồi mới chẩy hết, nếu hai anh em giằng co nhau tới 3 lần, mà vẫn không
phân thắng bại. Cũng vẫn cùng một logic, nếu Hoa đề đạt mà Minh chối từ, thì Minh sẽ

6
đề đạt cách chia phần ở vòng hai (lúc cái bánh kem đã chảy mất 1/3). Và nếu Hoa vẫn
không chịu, thì sẽ phải nói cho Minh biết cách chia phần thế nào (ở vòng ba, lúc đó cái
bánh kem đã bị chẩy tới 2/3). Và cuối cùng, nếu chẳng ai chịu ai nữa, thì cái bánh sẽ bị
chẩy hết. Vậy Hoa nên đề đạt phần của mình là bao nhiêu ngay từ vòng đầu để Minh chấp
nhận, và cuộc chơi kết thúc. Không ai phải chứng kiến cái bánh kem tan dần.

(Gợi ý: Ở vòng cuối cùng, Hoa ở vào thế mạnh, vì Minh biết rằng, nếu Minh từ chối thì
chẳng còn gì đem ra chia. Vì vậy Hoa sẽ đòi cho mình hầu hết cái 1/3 cái bánh cuối cùng,
chưa kịp tan, Và chỉ cho Minh lick một cái. Biết như vậy, ở vòng hai, Minh chỉ nên đòi
một nửa của 2/3 cái bánh kem chưa bị chẩy. Để lại cho Hoa 1/3 cái bánh kem (một nửa
của 2/3), đúng bằng phần mà Hoa sẽ được hưởng, nếu để việc tranh cãi sang tới vòng ba.
Cuối cùng, trở về vòng đầu tiên, Hoa sẽ đòi 2/3 cái Bánh, để lại cho Minh 1/3, và Minh
nên đồng ý ngay.

Ở đây có hai nhận xét đáng chú ý: (i) tại số vòng chẵn, lợi ích chia bôi bao giờ cũng
theo tỷ lệ 50:50. (ii) Khi số lần đàm phán tăng lên, thì phần đòi hỏi hợp lý ban đầu của
Hoa sẽ giảm dần. Và có thể chứng minh được phần đó giảm xuống 50% khi số lần đàm
phán là rất lớn. (Điều này lý giải tại sao tỷ lệ chia 50:50 hay xẩy ra trên thực tế).

You might also like