Professional Documents
Culture Documents
Dùng bài tập về trình độ học vấn ảnh hưởng tới mức lương, bạn hãy xây dựng và kiểm định mô hình hồi quy
đơn sau:
Salary = β0 + β1*EXP
Bạn có nhận xét gì về mối quan hệ giữa hai biến salary và EXP?
1. Mức lương sẽ tăng bao nhiêu phần trăm (%) khi kinh nghiệm tăng thêm 1 năm?
2. Mức lương sẽ tăng thêm bao nhiêu phần trăm (%) nếu như kinh nghiệm tăng thêm 1%?
3. Mức lương sẽ tăng lên bao nhiêu nếu như kinh nghiệm của bạn tăng 1%?
Nhận xét: trạng thái biến phụ thuộc và biến độc lập đã thay đổi từ giá trị tuyệt đối (biến phụ thuộc đơn vị
tiền và biến độc lập đơn vị năm) sang giá trị tương đối (phần trăm).
Đặc điểm: nghiên cứu phần trăm sự thay đổi của biến phụ thuộc khi biến độc lập thay đổi 1 đơn vị.
Ln(salary) = β0 + β1 *EXP
Ý nghĩa hệ số hồi quy 100*β1: là sự thay đổi (đơn vị %) về mức lương khi số năm kinh nghiệm thay đổi
(tăng) 1 năm
Đặc điểm: nghiên cứu phần trăm sự thay đổi của biến phụ thuộc khi biến độc lập thay đổi 1%.
LOG(SALARY) = β0 + β 1 *LOG(EXP)
Ý nghĩa hệ số β 1: phần trăm sự thay đổi của biến lương khi số năm kinh nghiệm thay đổi 1%. (β1 chính là hệ
số co giãn)
β1>1: mức lương thay đổi mạnh khi tăng số năm kinh nghiệm (co giãn mạnh)
β1<1: Mức lương thay đổi ít khi tăng số năm kinh nghiệm. (co giãn ít)
β1=1: Mức lương thay đổi với tỷ lệ như mức số năm kinh nghiệm. (co giãn đơn vị)
Đặc điểm: sự thay đổi (số tuyệt đối) của biến phụ thuộc khi số biến độc lập thay đổi 1%.
SALARY = β0 + β1 *LOG(EXP)
Ý nghĩa β1/100: là sự thay đổi về mức lương khi số năm kinh nghiệm tăng 1%.
Ôn tập
− ^ −
3. Xét quan hệ sau:
∑n n ∑n n ∑n n
( y − y ) = ( 2
y − y ) 2
+ e 2
^
4. Hãy xét quan hệ sau: Var βˆ = Var ( β − β )
ˆ =β
Điều này đúng, khi Eβ
σ2
5. Để đi đến kết luận là βˆ ~ N ( β, ), ta có thể phải cần những yêu cầu sau:
S XX
^ σ2
(i) ˆ =β
Eβ (ii) V a(βr ) =
SX X
iid
(iii) Các biến ngẫu nhiên εn ≈ N (0, σ 2 ), n = 1,2,.., N là theo phân bố chuẩn.
Cần cả (i), (ii), và (iii)
6. Phương pháp LS cho ta ước lượng: β̂ = β + ∑c n ε n .
Hãy xét các mệnh đề sau:
^
(i) Ước lượng β là một đại lượng ngẫu nhiên
(ii) Nếu không có tác động ngẫu nhiên, thì việc hồi quy trở thành tầm thường, vì ta luôn có: ˆ =β.
β
Ta cần điều kiện là εn , n =1,2,.., N là các biến ngẫu nhiên độc lập, và Var ε n = σ 2
8. Hãy xét tính không chệch của ước lượng LS: Eβˆ = E ( β + ∑c n εn ) = β
^
βˆ − β β − β
9. Kiểm định t-stat có dạng sau: t = = ^ ~ t(N − 2) .
s2 S X X s (β e)
Để xây dựng thống kê này, ta có thể cần các điều kiện sau:
σ2
(i) βˆ ~ N ( β , )
S XX
1
(ii) s2 =
N −2
∑ e2
n n là ước lượng không chệch của σ 2
Chúng ta cần điều kiện (i) và (ii)
Có thể so sánh t-stat với giá trị tra bảng t λ , nhưng cũng có thể dùng p-value của t-stat để ra quyết định bác bỏ
hay chấp nhận giả thuyết.
(
ESS = ∑en2 = ∑ yn − αˆ − βˆxn ) 2
→ min αˆ , βˆ
n n
^
11. Chứng minh rằng khi ước lượng theo phương pháp LS, ta có đẳng thức sau:
α
∑e
n
n =0
^
Trả lời: Điều kiện cực tiểu của tổng bình phương sai số là đạo hàm riêng của ESS theo phải bằng zero. Tức là:
α
∂E S S ^ ^
^ ∑ n n ∑ n
−= 2 (y − α − β x ) = 0 ⇒ e = 0
∂α
^ − ^− ^ ^
12. Sử dụng kết quả ước lượng:
α = y− β x , và biểu diễn: yn = α + β xn + en .
−
Hãy chứng minh rằng, độ lệch của biến cần được giải thích so với trung bình mẫu của nó, ( y n − y ) , có thể được
^ ^ − ^ ^−
Trả lời: ta có
yn = α + β xn + en và y = α + β x . Do vậy, lấy hiệu của hai đại lượng, ta có ngay kết quả cần chứng minh:
− ^ −
y n − y = β [ x n − x] + en
^ ^ ^ − ^ −
yn = α + β xn + en , tức là: y = y + e . Trừ cả hai vế cho y n − y = [ y n − y ] + en .
−
Tiếp theo, sử dụng y , ta có điều cần chứng minh:
n n n
− ^ −
13. Giả sử từ điều kiện trên:
yn − y = [ y n − y] + en , ta có thể suy ra được rằng:
− ^ −
∑n n ∑n n ∑n n
( y − y ) = 2
( y − y ) 2
+ e 2 (*)
Hãy chỉ ra rằng, phương pháp OLS bao hàm việc làm tăng cao nhất mức độ phù hợp của đường hồi quy
^ −
^ ^
R2 =
∑ (n y n − y) 2
với chuỗi dữ liệu quan sát. Tức là chọn
α ,β sao cho −
là lớn nhất.
∑ (n y n − y) 2
^ −
2 , ta có: 1 = ∑
^ − ( y − y ) 2
∑e 2
∑ n ( y n − y)
n n n
Trả lời: chia hai vế của đẳng thức (*) cho + n
− .
−
∑n ( y n − y ) 2
∑ n
( y n − y ) 2
^ −
− .
−
∑ (y − y) 2
∑ ( y − y)
n n
2 n n
Tức là, OLS làm tăng cao nhất mức độ phù hợp, đo bời R 2 .
−
S
14. Sử dụng ước lượng β = X Y =
^
∑ ( x − x) y n
n n ; hãy chứng minh rằng:
^
β =β+∑
( x − x)
cn nε n ở đó, c n = Sn .
−
SX X SX X XX
^
Trả lời: β = ∑ n cn yn
^
β = ∑ n cn (α + β xn + ε n ) = α∑ cn n + β ∑c n x n + ∑c n ε n
^
Ta có: β = β + ∑ n cnε n .
iid
15. Sử dụng giả thiết về bản chất của các quá trình ngẫu nhiên: ε n ~ N (0, σ 2 ) , hãy chứng minh rằng,
^
E (β ) = β [ước lượng là không chệch]
^
Trả lời: E β = E (β + ∑ n cnε n ) = β + ∑n c n Eε n = β
16. Hãy giải thích ý nghĩa của công thức tính độ phù hợp, R 2 . Sử dụng đồ thị để minh họa.
− ^ −
Trả lời: câu này sử dụng công thức:
yn − y = β [ xn − x] + en , sau đó vẽ đồ thị biểu diễn.
− ^ −
Tiếp đó, từ đẳng thức vừa nêu, ta rút ra:
yn − y = [ y n − y] + en . Tiếp theo, người ta có thể chứng minh được là:
− ^ −
∑n n ∑n n ∑n n
( y − y ) = ( y − y2
) 2
+ e 2.
Hãy nhận định xem, nếu S XX tăng, thì hiệu quả ước lượng tăng hay giảm?
Bài toán.
Giả sử chúng ta nghiên cứu mối quan hệ giữa chi tiêu cho nghiên cứu và phát triển (ký hiệu là R & D , tính bằng tỷ
dollars, giá cố định 1992) với số lượng bằng sáng chế phát minh (ký hiệu là PATTENTS , tình bằng số lượng nghìn),
tại Mỹ từ năm 1960 -1993. Tức là có N = 34 quan sát. Dưới đây là bảng báo cáo kết quả hồi quy
19. Nếu thu chi tiêu cho nghiên cứu phát triển R & D tăng thêm lên 1 tỷ dollars, thì số lượng bằng phát minh
21. Hãy tìm khoảng tin cậy của hệ số α của tổng thể.
22. Nếu phương sai mẫu S XX giảm đi, thì hiệu quả ước lượng tăng hay giảm?
23. Một nhà báo nói rằng, cứ 1 tỷ dollars chi tiêu cho nghiên cứu phát triển R & D , thì sẽ làm tăng số lượng
bằng phát minh sáng chế lên vào khoảng 500. Hãy kiểm định lại nhận định đó với mức độ có ý nghĩa là
10%, tức là sử dụng t 0.05 [32 ] =1.679 .
Bài toán: Giả sử chúng ta nghiên cứu mối quan hệ giữa thuế thu nhập (ký hiệu là TAX ), với tổng thu nhập của dân
cư tại từng bang của Mỹ (ký hiệu là INCOME ), cả hai đại lượng được tính bằng tỷ dollars. Số liệu thu thập tại 51
tiểu bang. Dưới đây là bảng báo cáo kết quả hồi quy
24.Liệu các dấu đi kèm với các hệ số ước lượng có phù hợp với kỳ vọng của các em về những dấu đó không?
Tại sao?
25.Các em diễn giải kết quả ước lượng này như thế nào? Khi thu nhập của một bang tăng thêm 1 tỷ dollars, thì
thu thuế của chính phủ tăng bao nhiêu?
26. Cho trước t 0.025 [49 ] = 2.000 . Hãy tìm khoảng tin cậy của hệ số β của tổng thể.
27. Hãy tìm khoảng tin cậy của hệ số α của tổng thể.
28. Một nhà báo nói rằng, tổng thu nhập của từng bang ít có ý nghĩa giải thích cho số lượng thu thuế của bang
đó. Hãy kiểm định lại nhận định đó với mức độ có ý nghĩa là 5%, tức là sử dụng
Trả lời: câu này sai (S) vì rằng hai phương trình đầu phải viết là:
yn = α + βxn + εn
yn = αˆ + βˆxn + en
30. Người ta có thể đo lường được sai số ước lượng en =y n −yˆ n nhưng không thể đo lường được εn.
Trả lời: (Đ), vì nếu đo lường được εn thì không cần phải ước lượng nữa.
∑e n = ∑ yn − α (
ˆ − βˆxn ) =0
n n
^ ^−
Trả lời: (S), vì (1) tương đương với việc nói rằng
y= α + β x ; tức là nằm trên đường hồi quy.
(x, y)
Điều kiện (2) nói rằng hồi quy chỉ có ý nghĩa nếu những thay đổi giữa x và y là có tương quan với nhau.
^
x không giải thích cho y .
Nếu chúng không có tương quan, thì về trung bình, β = 0 , tức là
ESS
Là cách viết khác của R 2 =1 −
TSS
Kết quả này nói lên rằng mức tiêu dùng (CONS) thiết yếu là 7.38; và nếu thu nhập (INCOME) tăng lên 1, thì
tiêu dùng (CONS) giảm 0.23%.
Trả lời: (S), vì phải nói tiêu dùng tăng 0.23%.
E ( yn / xn ) = α + β xn (1)
36. Các giả thiết của mô hình hồi quy có thể viết gọn lại như sau:
ε n ≈ N (0,σ )
2
(2)
(a) Giả thiết (1) nói lên rằng Eεn = 0 , với mọi quan sát n.
Trả lời: (Đ), vì mô hình cơ bản là: yn = α + βxn + ε n ;
Do vậy, E ( yn | xn ) = α + βxn + Eε n .
(b) Giả thiết (2) nói lên rằng Var ε n = σ 2 , với mọi quan sát n
Trả lời: (Đ)Giả thiết (2) cũng nói rằng với mọi m ≠ n , COV (εn , εm ) = 0
Trả lời: (Đ), vì theo giả thiết mô hình, đây là phân phối chuẩn, iid, đồng nhất, độc lập, có phân bố chuẩn. Tính độc
lập thể hiện là COV (εn , εm ) = 0 .
37. Chỉ ra rằng β̂có phân bố chuẩn. Nêu giả thiết mà anh/chị đã dùng để chứng minh mệnh đề đó.
Trả lời: (Đ), vì β̂ là tổ hợp tuyến tính của các εn , mà chúng có phân bố chuẩn.
38. Chứng minh rằng ˆ =β
Eβ hay nói cách khác, β̂ là ước lượng không chệch của β tổng thể.
^ ^ ^
ˆV (β − aEβˆ) = rE(β − E β )2 = V β a r
.
Tiếp theo, vì β = β + ∑
ˆ cnεn ; và ˆ =β ;
n
Eβ cho nên,
Var βˆ =Var ( β
ˆ − Eβ
ˆ) =
∑cn2Var εn = σ 2 ∑cn2
n n
.
1 ˆ =σ
2
Nhưng cái cuối cùng là định nghĩa của trung bình mẫu.
42.Cơ sở lý thuyết xác suất thống kê. Hãy xét các mệnh đề sau:
(i) Var (aX +bY ) = a 2Var ( X ) +b 2 ⋅Var (Y )
(ii) Var (aX +bY ) = a 2Var ( X ) +b 2 ⋅Var (Y ) +2ab cov( X , Y ) (iii) Var (a) = 0 (iv) Var ( X ) =Var ( X − Ex )
(v) Var ( X ) = EX 2 −( Ex )2 (vi) E (a) = 0
Mệnh đề (i) chỉ đúng khi X và Y là độc lập
Mệnh đề (iv) có thể được suy ra từ mệnh đề (v)
^
Ước lượng LS: yˆ n = β 1 + βˆ2 xn và sai số ước lượng: e n = y n − yˆ n .
(i): ∑e
n
n =0 (ii) : ∑e
n
n xn = 0 .
∑ ( x n − x )( y n − y )
(iv): β̂ 2 =
n
.
∑ n
( xn − x ) 2
− ^ −
Mệnh đề (iii) và (iv) nói lên
( yn − y) = β 2 (xn − x) + en
44.Xét quan hệ sau
− ^ −
(i)
∑n n ∑n n ∑n n
( y − y ) = ( 2
y − y ) 2
+ e 2.
(ii) Quan hệ này được sử dụng để xác định hệ số R 2
Bài toán
Một công ty bảo hiểm muốn đanh giá mối quan hệ giữa khoản ma bảo hiểm nhân thọ (INSUR, đo bằng 1000USD)
của một gia đình, với thu nhập của gia đình đó (INC, đo bằng 1000USD). Từ số mẫu 20 quan sát mà họ đã thu thập
được
45.Cơ sở lý luận cho việc lập hàm tương quan ước lượng này là:
Khả năng xẩy ra rủi ro
Số thu nhập bằng tiền bị mất đi, nếu rủi ro xẩy ra
Tâm lý sợ rủi ro của khách hàng mua bảo hiểm
46.Giả sử nhóm nghiên cứu thị trường của Công ty đề xuất mô hình về nhu cầu mua bảo hiểm có dạng như sau:
INSUR t = β1 + β 2 INC t + ε t , t = 1,2,3..., 20 .
Bảng kết quả ước lượng được ghi lại như sau:
47.Theo kết quả ước lượng, nếu thu nhập tăng thêm 1000USD, thì nhu cầu mua bảo hiểm sẽ tăng lên là bao
nhiêu?
3880 USD
48.Nếu thành viên M1 của ban quản lý tuyên bố ràng, cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo
hiểm nhân thọ lên 5.88 (ngàn USD). Thành viên M2 nói rằng việc tăng 1000USD không có ảnh hưởng gì tới
nhu cầu mua bảo hiểm nhân thọ; và thành viên M3 lại nói, cứ 1000USD tăng về thu nhập thì làm tăng nhu
câu mua bảo hiểm nhân họ lên 3.99 (ngànUSD). Liệu kết quả ước lượng nêu trên có hỗ trợ cho các lời tuyên
bố này với mức ý nghĩa 5% (5% significance level)?
Hãy kiểm định ở mức ý nghĩa 5%, với t 0.025 [18 ] = 2.101
Biết rằng, kết quả ước lượng này có thể viết lại như sau: (∆INSUR / INS ) = 0.958 (∆INC / INC ) .
Trong đó, ( ∆INSUR / INS ), (∆INC / INC ) lần lượt là thay đổi % của INSUR và thay đổi % của INC.
Khi thu nhập tăng 1% thì chi cho bảo hiểm tăng 0.958%
Bài toán
Mỗi tuần, chi nhánh McDonal ở Hong Kong phải quyết định chi bao nhiêu cho quảng cáo (advertising, a). Đây là
một thương hiệu lớn và nó chi hàng nghìn dollars vào quảng cáo mỗi tuần ở trên TV hoặc tạp chí. Cụ thể là nó
quan tâm liệu chi cho quảng cáo làm tăng tổng doanh số (total receipts, tr) là bao nhiêu. Nó cũng phải quan tâm
đâu là chiến lược giá (price, p) tốt nhất. Cần nói rằng, các thực đơn với hamburger thường là tương tự nhau, và giá
của hầu hết các sản phẩm đó đuợc giữ không đổi. Tuy nhiên, một vài sản phẩm được giảm giá đặc biệt, hoặc được
bán kèm với quà biếu. (Đây cũng là một chiến lược làm quảng cáo). Thêm vào đó, một vài sản phẩm mới được
tung ra thị trường với giá lựa chọn ở mức thấp. Điều cần quan tâm là giảm giá sẽ dẫn đến sự gia tăng thế nào về
tổng doanh số. Nếu như sự giảm giá chỉ dẫn đến một sự gia tăng không đáng kể của số lượng bán, tổng doanh số
sẽ giảm (nhu cầu là ít co giãn: demand is price inelastic); nếu giảm giá dẫn đến sự gia tăng đáng kể của số lượng
bán thì điều đó sẽ dẫn tới việc tăng doanh số (nhu cầu là co giãn: demand is price elastic).
Hãy hình dung Việt nam đã gia nhập WTO, và em được thuê bởi McDonal làm nhà tư vấn chiến lược cho chi
nhánh của nó ở Hong kong. Để biết xem nên có chiến lược giá và quảng cáo thế nào, em lập mô hình như sau:
Mô hình A: tr = β1 + β2 p + β3 a
Ở đó, tr là tổng doanh số bán trong một tuần (nghìn dollars); p là giá bán (dollars); và a là chi phí quảng cáo
trong tuần đó (nghìn dollars).
50.Hãy dự đoán dấu của các tham số, giải thích ngắn gọn tại sao em lại chọn như vậy;
Dependent Variable: TR
Method: Least Squares
Date: 03/31/09 Time: 13:06
Sample: 1 78
Included observations: 78
lượng: e n = y n − yˆ n . Trong các phương trình dưới đây, phương trình nào là đúng?
a. ∑n en =0
b. ∑n en x n =0
c. ∑n ε n =0
d. ∑n ε n x n =0
Trả lời: câu a và b đúng, vì đó là FOC cho beta 1 và beta 2 để ước lượng nhằm cực tiểu ESS.
Trả lời: Điều này đã ghi trong giáo trình, Chương 2, công thức (2.12)
^
b. Giả sử
β 2 > 0 . Hãy dùng đồ thị, chứng minh rằng, nếu xn tăng so với trung bình mẫu x , thì yn cũng tăng so
−
với trung bình mẫu y .
a. Eε n = 0
b. Eε n2 =0
c. Eε n2 = σ 2
Hãy nói rõ giả thiết nào cần phải sử dụng để chứng minh ước lượng LS, β̂, là ước lượng không chệch.
Trả lời: Xem chương 3, công thức 3.3, và sử dụng giả thuyết Eε n = 0
(diễn giải ở mục 3.3 Tiêu chuẩn thống kê… dẫn đến công thức (3.4))
58. Tại sao có thể nói V ar β̂là trung bình (kỳ vọng) của bình phương sai số ước lượng. Và nói rõ xem
ˆ =σ
2
V
ar β̂lớn hay nhỏ thì là tốt? Nêu giả thuyết cơ bản nào em cần dung để chứng minh Var β S XX
^ ^ ^
Trả lời:
V βˆ = Ea(β − E β r) = E(β − β ,)
2 2 tức là kỳ vọng của sai số ước lượng bình phương. Cái cuối cùng là do ước lượng không
ˆ =σ
2
Về công thức Var β , sử dụng giả thuyết epsilon p bố chuẩn với p sai sigma^ 2, và là iid, tức là
S XX
independent và identical (xem them ở công thức (3.5)).
^
59. Tại sao sai số chuẩn (standard error) s e( β ) tăng, thì khoảng tin cậy 90% (90% confidence interval) cũng
^
tăng? Điều đó là tốt hơn hay tồi hơn, nếu s e( β ) giảm.
^ ^
β ∈ {β ± s (β )etλ (N − 2) }
^
Trả lời: Vì công thức CI là (3.7): . Nếu s e( β ) giảm thì tốt hơn, vì độ chính xác cao hơn, hay CI
2
co hẹp lại.
^
β−b
| t0 |= ^ ≥ tλ (N − 2) ,
2
s (β e)
và chúng ta sẽ không bác bỏ ( DNRH 0 ), nếu
^
β−b
^
≤ tλ (N − 2) .
2
s (eβ )
Nếu chúng ta tăng mức độ có ý nghĩa λ từ 5% lên 10%, thì sẽ làm khả năng bác bỏ giả thuyết giả thuyết
H 0 : β = b tăng lên hay giảm đi?
Trả lời: khi tăng mức độ có ý nghĩa λ từ 5% lên 10%, ta dễ bác bỏ Ho hơn.