Professional Documents
Culture Documents
hCâu 1: đề bài
1. Hãy sử dụng file số liệu hhliving.dta
Các biến sử dụng trong tập tin là:
hhsize : số nhân khẩu trong hộ gia đình (người)
dependancyratio: tỷ lệ người phụ thuộc trong hộ (%)
gender: giới tính của chủ hộ, gender=1 nếu chủ hộ là nam và 0, nếu là
nữ
dur_aaset: giá trị của những tài sản lâu bền trong hộ (000 đồng)
totalexp: tổng chi tiêu của hộ (000 đồng)
rincome: tổng thu nhập thực của hộ (000 đồng)
i) Hãy ước lượng mô hình:
totalexpi = α 0 + α 1rincomei + α 2dur_aaseti + α 3hhsizei +
α 4dependancyratioi + α 5genderi + ei
ln(totalexpi)=β 0+β 1ln(rincomei)+β 2ln(dur_aaseti)+β 3hhsizei+
β 4dependancyratioi + β 5genderi + vi
Diễn giải kết quả ước lượng.
ii) Hãy kiểm định giả thuyết về phương sai sai số thay đổi. Dùng một biện
pháp để khắc phục hiện tượng trên nếu có.
iii) Kiểm định giả thuyết về sự khác biệt trong chi tiêu giữa chủ hộ là nam và
nữ.
iv) Trước khi ước lượng các hàm số trên, bạn giả định gì về dấu của các hệ
số β2, β3, và β4 ? Kết quả ước lượng có ủng hộ giả định của bạn không?
v) Dựa vào những phân tích của bạn, bạn sẽ chọn mô hình nào trong 2 mô
hình trên trong ứng dụng thực tế? Tại sao?
vi) Theo bạn, cần đưa thêm biến giải thích nào vào mô hình để tăng mức độ
giải thích sự biến động của biến phụ thuộc? Tại sao?
BÀI LÀM
i) ước lượng mô hình:
totalexpi = α 0 + α 1rincomei + α 2dur_aaseti + α 3hhsizei +
α 4dependancyratioi + α 5genderi + ei (1)
. reg totalexp rincome dur_aaset hhsize dependancyratio gender
1
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
Diễn giải:
Mô hình ước lượng mẫu:
totalexpi = 2759.24 + 0.158rincomei + 2.227dur_aaseti + 1341.1hhsizei - 31.833dependancyratioi -689.888genderi
se = (240.17) (0.00585) (0.03289) (48.863) ( 4.053) (194.58)
t = (11.49)*** (26.97)*** (67.69)*** (27.45)*** (-7.85)*** (-3.59)***
R2 = 70.51%
NHẬN XÉT :
R2 = 70.51% chứng tỏ các biến độc lập trong mô hình đã giải thích được
70.51% sự biến động trong chi tiêu của hộ. Còn 29.49% còn lại được giải
thích bởi các yếu tố khác ngoài mô hình.
Ta có Prob > F = 0.000 => bác bỏ giả thiết Ho nghĩa là có ít nhất một hệ số
ước lượng α khác 0.
Do tất cả các giá trị t đều lớn hơn giá trị t1,5%, nên ta bác bỏ giả thiết Ho rằng
các hệ số α bằng 0. Hay có thể gọi các hệ số ước lượng đều có ý nghĩa ở
mức 1%.
Khi thu nhập tăng thêm 1 nghìn đồng, chi tiêu bình quân tăng 0.158
(nghìn đồng), trong điều kiện các yếu tố khác không đổi.
Khi giá trị của những tài sản lâu bền trong hộ tăng thêm 1 nghìn đồng,
chi tiêu bình quân tăng 2.227 (nghìn đồng), trong điều kiện các yếu tố khác
không đổi.
Khi số nhân khẩu trong hộ tăng thêm 1 người, chi tiêu bình quân trong
hộ tăng 1341.1 (nghìn đồng), trong điều kiện các yếu tố khác không đổi.
Khi tỉ lệ người phụ thuộc trong hộ tăng thêm 1% , chi tiêu bình quân
trong hộ giảm 31.833 (nghìn đồng), trong điều kiện các yếu tố khác không
đổi.
Khi giới tính của chủ hộ là nam thì chi tiêu bình quân trong hộ sẽ giảm
689.888 (nghìn đồng), trong điều kiện các yếu tố khác không đổi.
2
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
Diễn giải :
Mô hình ước lượng mẫu :
ln(totalexpi) = 5.1745 + 0.2415ln(rincomei) + 0.2406ln(dur_aaseti) + 0.0762hhsizei - 0.00024dependancyratioi - 0.0235genderi
se =(0.046) (0.0064) (0.0037) (0.0025) (0.0002) (0.0097)
t =(112.2)*** (37.53)*** (64.94)*** (30.09)*** (-1.19) (-2.42)**
R2 = 76.51%
NHẬN XÉT :
R2 = 76.51% chứng tỏ các biến độc lập trong mô hình đã giải thích được
76.51% sự biến động trong chi tiêu của hộ. Còn 23.49% còn lại được giải
thích bởi các yếu tố khác ngoài mô hình.
Ta có Prob > F = 0.000 => bác bỏ giả thiết Ho nghĩa là có ít nhất một hệ số
ước lượng β khác 0.
Ta nhận thấy rằng các hệ số ước lượng β 0, β 1, β 2, β 3, β 5 đều có ý nghĩa
ở mức 5% => bác bỏ giả thiết Ho về các hệ số β = 0 => phần trăm thay đổi
trong chi tiêu sẽ phụ thuộc vào phần trăm thay đổi của thu nhập, phụ thuộc
vào phần trăm thay đổi trong giá trị của các tài sản lâu bền và phụ thuộc vào
số nhân khẩu trong hộ, giới tính của chủ hộ.
Trong đó, có hệ số ước lượng β 4 có giá trị P_value rất lớn (23.6%) => chấp
nhận giả thiết Ho về hệ số β 4 = 0 => phần trăm thay đổi trong chi tiêu sẽ
không phụ thuộc vào tỉ lệ người phụ thuộc trong hộ.
Khi thu nhập của hộ tăng thêm 1% thì chi tiêu bình quân của hộ sẽ tăng
thêm 0.2415%, trong điều kiện các yếu tố khác không đổi.
Khi giá trị của các tài sản lâu bền trong hộ tăng thêm 1% thì chi tiêu
bình quân của hộ sẽ tăng thêm 0.2406%, trong điều kiện các yếu tố khác
không đổi.
Khi số nhân khẩu trong hộ tăng thêm 1 người thì chi tiêu bình quân của
hộ sẽ tăng thêm 0.0762%, trong điều kiện các yếu tố khác không đổi.
Khi chủ hộ là nam thì chi tiêu bình quân của hộ sẽ giảm 0.0235%
3
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
ii) Kiểm định giả thiết về phương sai sai số thay đổi của mô hình
(1)
1. vẽ đồ thị sai số của mô hình với các biến độc lập
- mối quan hệ giữa sai số và biến tổng thu nhập :
200000
100000
Residuals
0
-100000
Dựa vào đồ thị ta thấy rằng với một mức thu nhập nhất định nào đó thì
các sai số tập trung và giao động quanh một trục, tuy nhiên, khi thu nhập
ngày càng tăng thì các sai số có vẻ như càng phân tán ra xa trục ban đầu
của nó => có thể có hiện tượng phương sai sai số thay đổi.
. reg ln_e2 ln_ricome
4
. reg ln_e2 ln_dur_aaset
0 5 10 15 20
(max) idcode
Dựa vào đồ thị ta có thể thấy rằng sai số có vẻ phân tán quanh trục nhưng
không đồng đều và có nhiều quan sát dị biệt => có thể có hiện tượng phương
sai sai số thay đổi.
. reg ln_e2 ln_hhsize
5
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
200000
100000
Residuals
0
-100000
0 20 40 60 80
dependancyratio
Dựa vào đồ thị ta có thể thấy rằng sai số có vẻ phân tán không đồng đều khi
tỉ lệ người phụ thuộc tăng lên => có thể có hiện tượng phương sai sai số thay
đổi.
. reg ln_e2 ln_dependancy
0 .2 .4 .6 .8 1
gender
6
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
Dựa vào đồ thị trên ta thấy sai số có vẻ phân tán rộng hơn nếu chủ hộ là
nam và phân tán hẹp hơn nếu chủ hộ là nữ => có thể có hiện tượng phương
sai sai số thay đổi.
ln_gender (dropped)
_cons 15.15294 .0368758 410.92 0.000 15.08065 15.22524
c h1)
i2( 13853.95
=
P r o b > c h i 20.0000
=
Ta thấy rằng P_value có giá trị rất nhỏ (0.0000) =>bác bỏ giả thiết Ho =>
phương sai sai số thay đổi.
3. Kiểm định Park
Vì P_value = 0.000 có giá trị rất nhỏ nên bác bỏ giả thiết Ho về phương sai
sai số không đổi
7
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
Ngoài ra, ta cũng có thể kiểm định phương sai sai số thay đổi bằng kiểm
định White hay nhiều kiểm định khác.
Khắc phục hiện tượng phương sai sai số thay đổi trong mô hình (1)
Do bản chất của hiện tượng phương sai sai số thay đổi là làm cho sai số của
mô hình không còn bé nhất nữa, các kiểm định t và F đều không đáng tin
cậy nữa, nhưng mô hình vẫn là tuyến tính theo tham số và vẫn là ước lượng
không chệch nên khi khắc phục hiện tượng phương sai sai số thay đổi thì ta
vẫn giữ nguyên hệ số β và làm sao cho khoảng tin cậy đáng tin cậy hơn.
. reg totalexp rincome dur_aaset hhsize dependancyratio gender, vce(robust)
Robust
totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]
Sau khi kiểm định giả thuyết về phương sai sai số thay đổi và khắc phục
được hiện tượng này, để kiểm tra thêm mô hình có được gọi là ước lượng
không chệch tuyến tính tốt nhất không trong mô hình đa biến theo không
gian ta nên kiểm tra thêm về hiện tượng đa cộng tuyến.
. vif
Vì các nhân tố phóng đại phương sai giữa các biến có giá trị nhỏ (gần với 1)
=> không có hiện tượng đa cộng tuyến. Vì vậy chỉ cần khắc phục hiện tượng
phương sai sai số thay đổi là các ước lượng được xem là ước lượng không
chệch tuyến tính tốt nhất.
Kiểm định giả thiết về phương sai sai số thay đổi trong mô hình (2) :
kiểm định Breusch-pagan :
. hettest
Vì giá trị P_value rất nhỏ (0.0000) nên bác bỏ giả thiết Ho về phương sai sai
số không đổi nghĩa là phương sai sai số thay đổi.
Biện pháp khắc phục :
. reg ln_totalexp ln_rincome ln_dur_aaset hhsize dependancyratio gender, vce(r
> obust)
Robust
ln_totalexp Coef. Std. Err. t P>|t| [95% Conf. Interval]
Cũng tương tự, sau khi kiểm định và khắc phục được hiện tượng phương sai
sai số thay đổi để xem mô hình có phải chính xác là có ước lượng không
chệch tuyến tính tốt nhất không trong mô hình đa biến theo không gian ta
nên kiêm tra hiện tượng đa cộng tuyến.
. vif
Vì các nhân tố phóng đại phương sai giữa các biến có giá trị tương gần với 1
=> không có hiện tượng đa cộng tuyến. Vì vậy chỉ cần khắc phục hiện tượng
phương sai sai số thay đổi là các ước lượng được xem là ước lượng không
chệch tuyến tính tốt nhất.
iii) kiểm định sự khác biệt trong chi tiêu của chủ hộ là nam và nữ.
Đặt giả thiết Ho : không có sự khác biệt trong chi tiêu bình quân giữa chủ
hộ là nam và chủ hộ là nữ.
đối với mô hình (1) :
P_value = 0.000 => bác bỏ giả thiết Ho => có sự khác biệt trong chi tiêu
bình quân giữa chủ hộ nam và chủ hộ nữ.
đối với mô hình (2) :
9
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
P_value = 0.015 < 0.05 = >bác bỏ giả thiết Ho => có sự khác biệt trong
chi tiêu bình quân giữa chủ hộ nam và chủ hộ nữ.
iv) Trước khi ước lượng hàm số trên, theo lí thuyết mà ta đã học thì
các hệ số β 2, β 3, β 4 đều có liên hệ dương với biến phụ thuộc là
chi tiêu. Nhưng theo kết quả ước lượng trên chỉ có β 2, β 3 là ủng
hộ cho giả thiết của ta. Tức là giá trị của những tài sản lâu bền và
số nhân khẩu của hộ tăng thì chi tiêu bình quân trong hộ cũng sẽ
tăng theo. Riêng chỉ có β 4 là không ủng hộ cho giả thiết của ta,
tức là khi tỉ lệ người phụ thuộc trong hộ tăng thì chi tiêu bình quân
trong hộ lại giảm.
v) Dựa vào những phân tích trên ta nên chọn mô hình (2) trong ứng
dụng thực tế, bởi vì trong thực tế khi giải thích hay dự báo một
hiện tượng kinh tế nào đó người ta thường sử dụng những con số
tương đối (%) để đo lường được hệ số co dãn của biến phụ thuộc
theo các biến độc lập. Như trên, các biến độc lập trong mô hình (2)
sẽ phản ánh được phần trăm thay đổi của chi tiêu khi các biến độc
lập trong mô hình thay đổi, tuy nhiên đối với mô hình (1) sự thay
đổi của chi tiêu là một số tuyệt đối và ít gặp trong thực tế. Và hơn
thế nữa, tình trạng phương sai sai số không đồng nhất sẽ bớt
nghiêm trọng hơn so với mô hình (1) bởi vì khi được logarit hóa,
độ lớn các biến bị nén lại.
vi) Trước khi thêm biến vào ta nên kiểm tra xem mô hình có bị sót
biến hay không ?
Dùng kiểm định RESET của Ramsey :
Đối với mô hình (1):
. ovtest
10
Bài tập nhóm môn kinh tế lượng GVGD: Lê Tấn Nghiêm
sẽ cao hơn chi tiêu của những hộ ở nông thôn. Vì ở thành thị chi phí sẽ cao
hơn rất nhiều ở nông thôn.
11