You are on page 1of 11

Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

hCâu 1: đề bài
1. Hãy sử dụng file số liệu hhliving.dta
Các biến sử dụng trong tập tin là:
hhsize : số nhân khẩu trong hộ gia đình (người)
dependancyratio: tỷ lệ người phụ thuộc trong hộ (%)
gender: giới tính của chủ hộ, gender=1 nếu chủ hộ là nam và 0, nếu là
nữ
dur_aaset: giá trị của những tài sản lâu bền trong hộ (000 đồng)
totalexp: tổng chi tiêu của hộ (000 đồng)
rincome: tổng thu nhập thực của hộ (000 đồng)
i) Hãy ước lượng mô hình:
totalexpi = α 0 + α 1rincomei + α 2dur_aaseti + α 3hhsizei +
α 4dependancyratioi + α 5genderi + ei
ln(totalexpi)=β 0+β 1ln(rincomei)+β 2ln(dur_aaseti)+β 3hhsizei+
β 4dependancyratioi + β 5genderi + vi
Diễn giải kết quả ước lượng.
ii) Hãy kiểm định giả thuyết về phương sai sai số thay đổi. Dùng một biện
pháp để khắc phục hiện tượng trên nếu có.
iii) Kiểm định giả thuyết về sự khác biệt trong chi tiêu giữa chủ hộ là nam và
nữ.
iv) Trước khi ước lượng các hàm số trên, bạn giả định gì về dấu của các hệ
số β2, β3, và β4 ? Kết quả ước lượng có ủng hộ giả định của bạn không?
v) Dựa vào những phân tích của bạn, bạn sẽ chọn mô hình nào trong 2 mô
hình trên trong ứng dụng thực tế? Tại sao?
vi) Theo bạn, cần đưa thêm biến giải thích nào vào mô hình để tăng mức độ
giải thích sự biến động của biến phụ thuộc? Tại sao?
BÀI LÀM
i) ước lượng mô hình:
totalexpi = α 0 + α 1rincomei + α 2dur_aaseti + α 3hhsizei +
α 4dependancyratioi + α 5genderi + ei (1)
. reg totalexp rincome dur_aaset hhsize dependancyratio gender

Source SS df MS Number of obs = 5999


F( 5, 5993) = 2865.50
Model 5.9482e+11 5 1.1896e+11 Prob > F = 0.0000
Residual 2.4880e+11 5993 41515932.5 R-squared = 0.7051
Adj R-squared = 0.7048
Total 8.4362e+11 5998 140651047 Root MSE = 6443.3

totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]

rincome .1580457 .0058593 26.97 0.000 .1465593 .1695321


dur_aaset 2.226961 .0328979 67.69 0.000 2.162469 2.291452
hhsize 1341.105 48.86395 27.45 0.000 1245.314 1436.896
dependancy~o -31.83316 4.053526 -7.85 0.000 -39.77953 -23.88679
gender -698.8884 194.5865 -3.59 0.000 -1080.348 -317.4289
_cons 2759.239 240.1691 11.49 0.000 2288.421 3230.057

1
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

Diễn giải:
Mô hình ước lượng mẫu:
totalexpi = 2759.24 + 0.158rincomei + 2.227dur_aaseti + 1341.1hhsizei - 31.833dependancyratioi -689.888genderi
se = (240.17) (0.00585) (0.03289) (48.863) ( 4.053) (194.58)
t = (11.49)*** (26.97)*** (67.69)*** (27.45)*** (-7.85)*** (-3.59)***

R2 = 70.51%

NHẬN XÉT :
R2 = 70.51% chứng tỏ các biến độc lập trong mô hình đã giải thích được
70.51% sự biến động trong chi tiêu của hộ. Còn 29.49% còn lại được giải
thích bởi các yếu tố khác ngoài mô hình.
Ta có Prob > F = 0.000 => bác bỏ giả thiết Ho nghĩa là có ít nhất một hệ số
ước lượng α khác 0.
Do tất cả các giá trị t đều lớn hơn giá trị t1,5%, nên ta bác bỏ giả thiết Ho rằng
các hệ số α bằng 0. Hay có thể gọi các hệ số ước lượng đều có ý nghĩa ở
mức 1%.
 Khi thu nhập tăng thêm 1 nghìn đồng, chi tiêu bình quân tăng 0.158
(nghìn đồng), trong điều kiện các yếu tố khác không đổi.
 Khi giá trị của những tài sản lâu bền trong hộ tăng thêm 1 nghìn đồng,
chi tiêu bình quân tăng 2.227 (nghìn đồng), trong điều kiện các yếu tố khác
không đổi.
 Khi số nhân khẩu trong hộ tăng thêm 1 người, chi tiêu bình quân trong
hộ tăng 1341.1 (nghìn đồng), trong điều kiện các yếu tố khác không đổi.
 Khi tỉ lệ người phụ thuộc trong hộ tăng thêm 1% , chi tiêu bình quân
trong hộ giảm 31.833 (nghìn đồng), trong điều kiện các yếu tố khác không
đổi.
 Khi giới tính của chủ hộ là nam thì chi tiêu bình quân trong hộ sẽ giảm
689.888 (nghìn đồng), trong điều kiện các yếu tố khác không đổi.

Ước lượng mô hình :


ln(totalexpi)=β 0+β 1ln(rincomei)+β 2ln(dur_aaseti)+β 3hhsizei+
β 4dependancyratioi + β 5genderi + vi (2)

2
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

. reg ln_totalexp ln_rincome ln_dur_aaset hhsize dependancyratio gender

Source SS df MS Number of obs = 5928


F( 5, 5922) = 3858.01
Model 1967.2023 5 393.44046 Prob > F = 0.0000
Residual 603.927221 5922 .10198028 R-squared = 0.7651
Adj R-squared = 0.7649
Total 2571.12952 5927 .43379948 Root MSE = .31934

ln_totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_rincome .2415803 .0064371 37.53 0.000 .2289613 .2541993


ln_dur_aaset .2406139 .0037054 64.94 0.000 .23335 .2478778
hhsize .0762742 .0025345 30.09 0.000 .0713057 .0812428
dependancy~o -.0002404 .0002027 -1.19 0.236 -.0006379 .000157
gender -.0235017 .0096999 -2.42 0.015 -.042517 -.0044865
_cons 5.174596 .0461185 112.20 0.000 5.084187 5.265005

Diễn giải :
Mô hình ước lượng mẫu :
ln(totalexpi) = 5.1745 + 0.2415ln(rincomei) + 0.2406ln(dur_aaseti) + 0.0762hhsizei - 0.00024dependancyratioi - 0.0235genderi
se =(0.046) (0.0064) (0.0037) (0.0025) (0.0002) (0.0097)
t =(112.2)*** (37.53)*** (64.94)*** (30.09)*** (-1.19) (-2.42)**
R2 = 76.51%
NHẬN XÉT :
R2 = 76.51% chứng tỏ các biến độc lập trong mô hình đã giải thích được
76.51% sự biến động trong chi tiêu của hộ. Còn 23.49% còn lại được giải
thích bởi các yếu tố khác ngoài mô hình.
Ta có Prob > F = 0.000 => bác bỏ giả thiết Ho nghĩa là có ít nhất một hệ số
ước lượng β khác 0.
Ta nhận thấy rằng các hệ số ước lượng β 0, β 1, β 2, β 3, β 5 đều có ý nghĩa
ở mức 5% => bác bỏ giả thiết Ho về các hệ số β = 0 => phần trăm thay đổi
trong chi tiêu sẽ phụ thuộc vào phần trăm thay đổi của thu nhập, phụ thuộc
vào phần trăm thay đổi trong giá trị của các tài sản lâu bền và phụ thuộc vào
số nhân khẩu trong hộ, giới tính của chủ hộ.
Trong đó, có hệ số ước lượng β 4 có giá trị P_value rất lớn (23.6%) => chấp
nhận giả thiết Ho về hệ số β 4 = 0 => phần trăm thay đổi trong chi tiêu sẽ
không phụ thuộc vào tỉ lệ người phụ thuộc trong hộ.
 Khi thu nhập của hộ tăng thêm 1% thì chi tiêu bình quân của hộ sẽ tăng
thêm 0.2415%, trong điều kiện các yếu tố khác không đổi.
 Khi giá trị của các tài sản lâu bền trong hộ tăng thêm 1% thì chi tiêu
bình quân của hộ sẽ tăng thêm 0.2406%, trong điều kiện các yếu tố khác
không đổi.
 Khi số nhân khẩu trong hộ tăng thêm 1 người thì chi tiêu bình quân của
hộ sẽ tăng thêm 0.0762%, trong điều kiện các yếu tố khác không đổi.
 Khi chủ hộ là nam thì chi tiêu bình quân của hộ sẽ giảm 0.0235%

3
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

ii) Kiểm định giả thiết về phương sai sai số thay đổi của mô hình
(1)
1. vẽ đồ thị sai số của mô hình với các biến độc lập
- mối quan hệ giữa sai số và biến tổng thu nhập :

200000
100000
Residuals
0
-100000

0 100000 200000 300000 400000 500000


Real Total Income

Dựa vào đồ thị ta thấy rằng với một mức thu nhập nhất định nào đó thì
các sai số tập trung và giao động quanh một trục, tuy nhiên, khi thu nhập
ngày càng tăng thì các sai số có vẻ như càng phân tán ra xa trục ban đầu
của nó => có thể có hiện tượng phương sai sai số thay đổi.
. reg ln_e2 ln_ricome

Source SS df MS Number of obs = 5980


F( 1, 5978) = 437.38
Model 2339.1808 1 2339.1808 Prob > F = 0.0000
Residual 31971.5957 5978 5.34820938 R-squared = 0.0682
Adj R-squared = 0.0680
Total 34310.7765 5979 5.73854766 Root MSE = 2.3126

ln_e2 Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_ricome .6970889 .0333319 20.91 0.000 .6317462 .7624315


_cons 8.762587 .3094876 28.31 0.000 8.15588 9.369294

 có phương sai sai số thay đổi


- mối quan hệ giữa sai số và biến giá trị tài sản lâu bền :
200000
100000
Residuals
0
-100000

0 20000 40000 60000 80000


Consumer durable - use value

4
. reg ln_e2 ln_dur_aaset

Source SS df MS Number of obs = 5947


F( 1, 5945) = 409.54
Bài tập nhóm môn kinh2213.45735
Model tế lượng 1 2213.45735 Prob GVGD:
> F Lê Tấn
= Nghiêm
0.0000
Residual 32131.4951 5945 5.40479312 R-squared = 0.0644
Adj R-squared = 0.0643
Total 34344.9524 5946 5.77614404 Root MSE = 2.3248
Dựa vào đồ thị ta thấy rằng ứng với một giá trị tài sản lâu bền nào đó thì sai
số tập trung
ln_e2 quanh trục
Coef.nhưng
Std.khi giá trị tài
Err. t sảnP>|t|
lâu bền của
[95%hộ càngInterval]
Conf. tăng thì
sai số phân tán cũng
ln_dur_aaset
càng tăng
.4151846
theo =>20.24
.0205161
có thể có hiện tượng
0.000
phương.4554036
.3749656
sai sai
số thay_cons
đổi. 12.4531 .1388407 89.69 0.000 12.18092 12.72528

 có hiện tượng phương sai sai số thay đổi


- môi quan hệ giữa sai số và biến số nhân khẩu trong hộ :
200000
100000
Residuals
0
-100000

0 5 10 15 20
(max) idcode

Dựa vào đồ thị ta có thể thấy rằng sai số có vẻ phân tán quanh trục nhưng
không đồng đều và có nhiều quan sát dị biệt => có thể có hiện tượng phương
sai sai số thay đổi.
. reg ln_e2 ln_hhsize

Source SS df MS Number of obs = 5999


F( 1, 5997) = 142.24
Model 798.557637 1 798.557637 Prob > F = 0.0000
Residual 33667.8348 5997 5.61411285 R-squared = 0.0232
Adj R-squared = 0.0230
Total 34466.3924 5998 5.74631418 Root MSE = 2.3694

ln_e2 Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_hhsize .7691147 .0644879 11.93 0.000 .6426951 .8955343


_cons 14.07493 .0993028 141.74 0.000 13.88026 14.2696

 có hiện tượng phương sai sai số thay đổi

5
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

-mối quan hệ giữa sai số và biến số tỉ lệ người phụ thuộc trong hộ :

200000
100000
Residuals
0
-100000

0 20 40 60 80
dependancyratio

Dựa vào đồ thị ta có thể thấy rằng sai số có vẻ phân tán không đồng đều khi
tỉ lệ người phụ thuộc tăng lên => có thể có hiện tượng phương sai sai số thay
đổi.
. reg ln_e2 ln_dependancy

Source SS df MS Number of obs = 4458


F( 1, 4456) = 69.96
Model 413.359476 1 413.359476 Prob > F = 0.0000
Residual 26327.5047 4456 5.9083269 R-squared = 0.0155
Adj R-squared = 0.0152
Total 26740.8642 4457 5.99974515 Root MSE = 2.4307

ln_e2 Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_dependa~y -.7001385 .0837052 -8.36 0.000 -.8642422 -.5360348


_cons 17.7781 .3072827 57.86 0.000 17.17567 18.38053

 có hiện tượng phương sai sai số thay đổi

- mối quan hệ giữa sai số và biến giới tính của chủ hộ :


200000
100000
Residuals
0
-100000

0 .2 .4 .6 .8 1
gender

6
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

Dựa vào đồ thị trên ta thấy sai số có vẻ phân tán rộng hơn nếu chủ hộ là
nam và phân tán hẹp hơn nếu chủ hộ là nữ => có thể có hiện tượng phương
sai sai số thay đổi.

. reg ln_e2 ln_gender

Source SS df MS Number of obs = 4375


F( 0, 4374) = 0.00
Model 0 0 . Prob > F = .
Residual 26021.9924 4374 5.9492438 R-squared = 0.0000
Adj R-squared = 0.0000
Total 26021.9924 4374 5.9492438 Root MSE = 2.4391

ln_e2 Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_gender (dropped)
_cons 15.15294 .0368758 410.92 0.000 15.08065 15.22524

 có hiện tượng phương sai sai số thay đổi

2. Kiểm định Breusch-pagan


. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of totalexp

c h1)
i2( 13853.95
=
P r o b > c h i 20.0000
=

Ta thấy rằng P_value có giá trị rất nhỏ (0.0000) =>bác bỏ giả thiết Ho =>
phương sai sai số thay đổi.
3. Kiểm định Park

. reg ln_e_exp ln_Yhat

Source SS df MS Number of obs = 5999


F( 1, 5997) = 919.60
Model 4582.49858 1 4582.49858 Prob > F = 0.0000
Residual 29883.8938 5997 4.98314054 R-squared = 0.1330
Adj R-squared = 0.1328
Total 34466.3924 5998 5.74631418 Root MSE = 2.2323

ln_e_exp Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_Yhat 1.723572 .0568368 30.32 0.000 1.612152 1.834993


_cons -1.02314 .5358078 -1.91 0.056 -2.073516 .0272364

Vì P_value = 0.000 có giá trị rất nhỏ nên bác bỏ giả thiết Ho về phương sai
sai số không đổi

7
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

Ngoài ra, ta cũng có thể kiểm định phương sai sai số thay đổi bằng kiểm
định White hay nhiều kiểm định khác.
Khắc phục hiện tượng phương sai sai số thay đổi trong mô hình (1)
Do bản chất của hiện tượng phương sai sai số thay đổi là làm cho sai số của
mô hình không còn bé nhất nữa, các kiểm định t và F đều không đáng tin
cậy nữa, nhưng mô hình vẫn là tuyến tính theo tham số và vẫn là ước lượng
không chệch nên khi khắc phục hiện tượng phương sai sai số thay đổi thì ta
vẫn giữ nguyên hệ số β và làm sao cho khoảng tin cậy đáng tin cậy hơn.
. reg totalexp rincome dur_aaset hhsize dependancyratio gender, vce(robust)

Linear regression Number of obs = 5999


F( 5, 5993) = 342.54
Prob > F = 0.0000
R-squared = 0.7051
Root MSE = 6443.3

Robust
totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]

rincome .1580457 .0242988 6.50 0.000 .1104112 .2056802


dur_aaset 2.226961 .1916531 11.62 0.000 1.851252 2.60267
hhsize 1341.105 74.67612 17.96 0.000 1194.713 1487.498
dependancy~o -31.83316 4.981806 -6.39 0.000 -41.59929 -22.06703
gender -698.8884 215.8667 -3.24 0.001 -1122.065 -275.7121
_cons 2759.239 283.8881 9.72 0.000 2202.717 3315.762

Sau khi kiểm định giả thuyết về phương sai sai số thay đổi và khắc phục
được hiện tượng này, để kiểm tra thêm mô hình có được gọi là ước lượng
không chệch tuyến tính tốt nhất không trong mô hình đa biến theo không
gian ta nên kiểm tra thêm về hiện tượng đa cộng tuyến.
. vif

Variable VIF 1/VIF

rincome 1.70 0.586867


dur_aaset 1.61 0.620274
hhsize 1.33 0.750690
dependancy~o 1.23 0.813818
gender 1.08 0.925773

Mean VIF 1.39

Vì các nhân tố phóng đại phương sai giữa các biến có giá trị nhỏ (gần với 1)
=> không có hiện tượng đa cộng tuyến. Vì vậy chỉ cần khắc phục hiện tượng
phương sai sai số thay đổi là các ước lượng được xem là ước lượng không
chệch tuyến tính tốt nhất.

Kiểm định giả thiết về phương sai sai số thay đổi trong mô hình (2) :
kiểm định Breusch-pagan :
. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of ln_totalexp
8
c h1)i 2 ( = 17.55
P r o b > c h i0.0000
2 =
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

Vì giá trị P_value rất nhỏ (0.0000) nên bác bỏ giả thiết Ho về phương sai sai
số không đổi nghĩa là phương sai sai số thay đổi.
Biện pháp khắc phục :
. reg ln_totalexp ln_rincome ln_dur_aaset hhsize dependancyratio gender, vce(r
> obust)

Linear regression Number of obs = 5928


F( 5, 5922) = 2864.57
Prob > F = 0.0000
R-squared = 0.7651
Root MSE = .31934

Robust
ln_totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]

ln_rincome .2415803 .0094793 25.48 0.000 .2229973 .2601632


ln_dur_aaset .2406139 .0047564 50.59 0.000 .2312896 .2499382
hhsize .0762742 .0026774 28.49 0.000 .0710255 .081523
dependancy~o -.0002404 .0002021 -1.19 0.234 -.0006365 .0001557
gender -.0235017 .0102602 -2.29 0.022 -.0436155 -.003388
_cons 5.174596 .065313 79.23 0.000 5.046559 5.302634

Cũng tương tự, sau khi kiểm định và khắc phục được hiện tượng phương sai
sai số thay đổi để xem mô hình có phải chính xác là có ước lượng không
chệch tuyến tính tốt nhất không trong mô hình đa biến theo không gian ta
nên kiêm tra hiện tượng đa cộng tuyến.
. vif

Variable VIF 1/VIF

ln_rincome 1.92 0.521286


ln_dur_asset 1.72 0.580001
hhsize 1.44 0.696207
dependancy~o 1.23 0.810114
gender 1.08 0.926048

Mean VIF 1.48

Vì các nhân tố phóng đại phương sai giữa các biến có giá trị tương gần với 1
=> không có hiện tượng đa cộng tuyến. Vì vậy chỉ cần khắc phục hiện tượng
phương sai sai số thay đổi là các ước lượng được xem là ước lượng không
chệch tuyến tính tốt nhất.

iii) kiểm định sự khác biệt trong chi tiêu của chủ hộ là nam và nữ.
Đặt giả thiết Ho : không có sự khác biệt trong chi tiêu bình quân giữa chủ
hộ là nam và chủ hộ là nữ.
đối với mô hình (1) :
P_value = 0.000 => bác bỏ giả thiết Ho => có sự khác biệt trong chi tiêu
bình quân giữa chủ hộ nam và chủ hộ nữ.
đối với mô hình (2) :

9
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

P_value = 0.015 < 0.05 = >bác bỏ giả thiết Ho => có sự khác biệt trong
chi tiêu bình quân giữa chủ hộ nam và chủ hộ nữ.
iv) Trước khi ước lượng hàm số trên, theo lí thuyết mà ta đã học thì
các hệ số β 2, β 3, β 4 đều có liên hệ dương với biến phụ thuộc là
chi tiêu. Nhưng theo kết quả ước lượng trên chỉ có β 2, β 3 là ủng
hộ cho giả thiết của ta. Tức là giá trị của những tài sản lâu bền và
số nhân khẩu của hộ tăng thì chi tiêu bình quân trong hộ cũng sẽ
tăng theo. Riêng chỉ có β 4 là không ủng hộ cho giả thiết của ta,
tức là khi tỉ lệ người phụ thuộc trong hộ tăng thì chi tiêu bình quân
trong hộ lại giảm.

v) Dựa vào những phân tích trên ta nên chọn mô hình (2) trong ứng
dụng thực tế, bởi vì trong thực tế khi giải thích hay dự báo một
hiện tượng kinh tế nào đó người ta thường sử dụng những con số
tương đối (%) để đo lường được hệ số co dãn của biến phụ thuộc
theo các biến độc lập. Như trên, các biến độc lập trong mô hình (2)
sẽ phản ánh được phần trăm thay đổi của chi tiêu khi các biến độc
lập trong mô hình thay đổi, tuy nhiên đối với mô hình (1) sự thay
đổi của chi tiêu là một số tuyệt đối và ít gặp trong thực tế. Và hơn
thế nữa, tình trạng phương sai sai số không đồng nhất sẽ bớt
nghiêm trọng hơn so với mô hình (1) bởi vì khi được logarit hóa,
độ lớn các biến bị nén lại.

vi) Trước khi thêm biến vào ta nên kiểm tra xem mô hình có bị sót
biến hay không ?
Dùng kiểm định RESET của Ramsey :
Đối với mô hình (1):
. ovtest

Ramsey RESET test using powers of the fitted values of totalexp


Ho: model has no omitted variables
F ( 3 , 143.07
5990) =
P r o b > F = 0.0000
Ta thấy rằng giá trị Prob > F = 0.0000 => bác bỏ giả thuyết Ho
nghĩa là mô hình đã bị bỏ sót biến.
Vì mô hình (2) được logarit hóa bởi các biến trong mô hình (1) nên mô hình
(1) bị bỏ sót biến nên mô hình (2) cũng bị bỏ sót biến.
Theo ý kiến của nhóm, khi tìm hiểu trong thực tế thì nên đưa biến ‘khu vực’
vào trong mô hình để giải thích thêm cho biến phụ thuộc là chi tiêu của hộ.
Trong đó, ‘khu vực’ bằng 1 nếu hộ gia đình ở thành thị và bằng 0 nếu ở
nông thôn. Vì trong thực tế có thể chi tiêu của những hộ gia đình ở thành thị

10
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm

sẽ cao hơn chi tiêu của những hộ ở nông thôn. Vì ở thành thị chi phí sẽ cao
hơn rất nhiều ở nông thôn.

11

You might also like