You are on page 1of 30

.

Mục Lục

Câu 1: Thực hiện các yêu cầu phân tích hồi quy bội

Hồi quy bội còn gọi là phương pháp hồi quy đa biến, dùng phân tích mối quan hệ
giữa nhiều biến số độc lập (tức biến giải thích hay biến nguyên nhân) ảnh hưởng đến 1
biến phụ thuộc (tức biến phân tích hay biến kết quả).
Trong thực tế, có rất nhiều bài toán kinh tế - cả lĩnh vực kinh doanh và kinh tế học,
phải cần đến phương pháp hồi quy đa biến. Chẳng hạn như phân tích những nhân tố ảnh
hưởng đến thu nhập quốc dân, sự biến động của tỷ giá ngoại hối; xét doanh thu trong
trường hợp có nhiều mặt hàng; phân tích tổng chi phí với nhiều nhân tố tác động; phân
tích giá thành chi tiết; những nguyên nhân ảnh hưởng đến khối lượng tiêu thụ…
Một chỉ tiêu kinh tế chịu sự tác động cùng lúc của rất nhiều nhân tố thuận chiều
hoặc trái chiều nhau. Chẳng hạn như doanh thu lệ thuộc và giá cả, thu nhập bình quân xã
hội, lãi suất tiền gửi, mùa vụ, thời tiết, quảng cáo tiếp thị… Mặt khác, giữa những nhân
tố lại cũng có sự tương quan tuyến tính nội tại với nhau. Phân tích hồi quy giúp ta vừa
kiểm định lại giả thiết về những nhân tố tác động và mức độ ảnh hưởng, vừa định lượng
được các quan hệ kinh tế giữa chúng. Từ đó, làm nền tảng cho phân tích dự báo và có
những quyết sách phù hợp, hiệu quả, thúc đẩy tăng trưởng.
Mô hình hồi quy tuyến tính k biến (PRF):

E(Y/X2i,…,Xki) = β 1+ β 2X2i +…+ β kXki


Yi = β 1+ β 2X2i + …+ β kXki + Ui
Trong đó :
Y - biến phụ thuộc
X2,…,Xk - các biến độc lập
Ui: Sai số ngẫu nhiên
β 1 là hệ số tự do
β j là các hệ số hồi quy riêng,

1
β j cho biết khi Xj tăng 1 đơn vị thì trung bình của Y sẽ thay đổi β j đơn vị trong
trường hợp các yếu tố khác không đổi (j=2,…,k)
Khi k=3 ta sẽ có mô hình hồi quy tuyến tính 3 biến
E(Y/X2, X3) = β 1+ β 2X2 + β 3X3 (PRF)
Yi = β 1+ β 2X2i + β 3X3i + Ui (PRM)

1.1. Mối Liên hệ giữ mô hình hồi quy đơn biến va hồi quy bội

Báng so sánh về dạng hàm của mô hình hồi quy đa biến so với trường hợp đơn biến

Hồi quy đơn biến Hồi quy đa biến


Ví Dụ CONS = β1 + β 2 INC + ε INV = β1 + β2T + β3 G + β4 INT + ε
Dạng mô Hình Y = β1 + β 2 X + ε Y = β1 + β2 X 2 + β3 X 3 + β4 X 4 + ε
Với mỗi quan sat Yn = β1 + β2 X n + ε n Yn = β1 + β2 X n 2 + β3 X n 3 + β4 X n 4 + ε n
Như vậy hồi quy đa biến là sự mở rộng tự nhiên của trường hợp đơn biến ,khi số biến giải
thích lớn hơn 2, kể cả hằng sô.

1.2. Thực hiện mô hình hồi quy 3 biến .


a. Ứớc lượng các tham số cho mô hình hồi quy ba biến
E(Y/X2, X3) = β 1+ β 2X2 + β 3X3 (PRF)
Yi = β 1+ β 2X2i + β 3X3i + Ui (PRM)
Hồi quy mẫu
Giả sử có một mẫu gồm n quan sát các giá trị (Yi, X2i, X3i). Theo phương pháp
OLS,
Tìm β̂(j=
j 1,2,3) phải thoả mãn :
Yi = Yˆi + ei = βˆ1 + βˆ2 X 2i + βˆ3 X 3i + ei

Q= ∑e 2 = ∑(Yi − βˆ1 − βˆ 2 X 2i − βˆ3 X 3i ) 2 → min


Tức là:

2
Giải hệ ta có:
βˆ2 = ∑
x2i yi ∑x3i2 − ∑x2ix3i ∑x3i yi
∑x ∑x −( ∑x x ) 2
2i
2
3i 2i 3i
2

βˆ =
∑x y ∑x − ∑x x ∑x
3i i
2
2i 2i 3i 2i yi
∑x ∑x −( ∑x x )
3 2 2 2
2i 3i 2i 3i
x = X −X
i i
βˆ1 =yY =
−Yβˆ2−
XY2 − βˆ3 X 3
i i

=> yˆ i = βˆ 2 x 2 + βˆ3 x3 → Hàm hồi quy mẫu đi qua gốc tọa độ

b. Phương sai của các ước lượng là:

ˆ
1
Var ( β1 ) =  +
∑ ( X 2 x3i − X 3x2i )
2

 ×σ 2
 n ∑ 2i ∑ 3i ∑ 2i 3i 
x 2
x 2
− ( x x )2

Var ( βˆ2 ) =
∑x3i2 ×σ 2
∑ 2i ∑ 3i ∑ 2i 3i
x 2
x 2
− ( x x )2

Var ( βˆ3 ) =
∑x 2
2i
×σ 2
∑x ∑x 2
2i
2
3i − ( ∑ x2ix3i ) 2

Trong đó : Trong đó : σ 2 = Var(Ui) (σ 2 là phương sai của Ui )


σ 2 chưa biết nên trong thực tế người ta dùng ước lượng không chệch của nó

σˆ 2 =
∑e 2
i
=
(1 − R 2 ) ∑ y i
2

n−3 n−3
c . Hệ số xác định bội R2 và Hệ số xác định hiệu chỉnh
∑(Y −Y ) ∑(Y ) ∑(Yˆ −Y )
2 2
−Yˆi
2
i = i + i

TSS = ESS + RSS

Hệ số xác định bội R2


n
∑ ei2
ESS RSS i =1
R2= =1- =1- n
TSS TSS
∑y
i =1
2
i

Mô hình hồi quy 3 biến

3
2
βˆ 2 ∑ y i x 2i + βˆ3 ∑ y i x3i
R= 2
∑ yi
Hệ số xác định hiệu chỉnh
ei2

(n − k )
R2 =
y i2
∑ (n − 1)
Với k là tham số của môi hình kể cả hệ số tự do
Mối quan hệ giữa R và R
n −1
R 2 = 1 − (1 − R 2 )
n −k
Nếu k=1 thì R2= R 2
Nếu k>=1 thì R2= R 2
R 2 có thể âm
Người ta dùng R 2 để xem sét việc đưa thêm 1 biến vào mô hình .Biến mới đưa vào mô
hình phải thỏa mãn 2 điều kiện
 Làm R 2 tăng
 Khi kiểm định giả thiết hệ số của biến này trong mô hình với giả thiết H 0 thì
phải bác bỏ H0
d. Khoảng tin cậy của tham số
Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1- α
β i ∈ ( βˆi − ε i ; βˆi + ε i )
Với độ tin cậy 1- α cho trước ,khoảng tin cậy của các hệ số hồi quy
βˆ j − Se ( βˆ j )t a / 2 (n − 2) < β j < βˆ j + Se ( βˆ j )t a / 2 ( n − 2)
ˆ − Se ( β
β ˆ )t ( n −2) < β
j j a/2 j

ˆ + Se ( β
β ˆ )t ( n −2) (j=1,2)
j j a/2

εi =SE( ( β
ˆ )t
i ( n −3,α / 2 )

e. Phương sai σ 2:
σˆ 2 ( n − 2) σˆ 2 (n − 2)
<σ2 < 2
χ a / 2 (n − 2) χ1−a / 2 (n − 2)
σˆ (n − 2)
2
<σ2
χa 2( n −2)

σˆ 2 (n − 2)
σ2 <
χ 12−(an/−22)
f. Kiểm định giả thiết
Kiểm định giả thiết H0 β i = β i*
βˆi − β i*
ti =
SE ( βˆi )
Nguyên tắc quyết định
Nếu ti < t ( n −3,α/ 2 ) hoặc ti <- t ( n −3,α/ 2 ) : bác bỏ H0

4
Nếu - t ( n −3,α/ 2 ) ≤ t i ≤ - t ( n −3,α/ 2 ) :chấp nhận H0
Kiểm định giả thiết đồng thời bằng không
H0: β 2 = β3 = 0 ( H1 : ít nhất 1 trong 2 tham số ≠ 0
R 2 ( n − 3)
F=
(1 − R 2 ) 2
Nguyên tắc quyết định
 F> Fα (2, n − 3) : Bác bỏ H0 :mô hình phù hợp
 F ≤ Fα ( 2, n −3) :Chấp nhận H0: mô hình không phù hợp

Ví dụ :
Ta có 3 giá trị sau:
Y: Bushels per acre of corn;
X1: Fertilizer;
X2: Insecticides

Với bảng dữ liệu sau

Y X1 X2 y x1 x2

40 6 4 -17 -12 -8
44 10 4 -13 -8 -8
46 12 5 -11 -6 -7
48 14 7 -9 -4 -5
52 16 9 -5 -2 -3
58 18 12 1 0 0
60 22 14 3 4 2
68 24 20 11 6 8
74 26 21 17 8 9
80 32 24 23 14 12

∑Y −570 ∑X −180 ∑X −120


Y = 57
1

X 1 = 18
2

X 2 = 120
∑Y −0 ∑X 1 −0 ∑X 2 −0

Tính toán :
x1y x2y x1x2 x12 x22

5
204 136 96 144 64
104 104 64 64 64
66 77 42 36 49
36 45 20 16 25
10 15 6 4 9
0 0 0 0 0
12 6 8 16 4
66 88 48 36 64
136 153 72 64 81
322 276 168 196 144

∑x ∑x ∑x x ∑x ∑x
2 2
1 y −956 2 y − 900 1 2 − 524 1 − 576 2 − 504

Thực hiện trên ta được Yˆi =31 ,98 +0,65 X 1 +1,11 X 2

Tính R2 và F
Ta có bảng thực hiện như sau:

Y X1 X2 Yˆ e e2 y2

40 6 4 40.32 -0.32 0.1024 289


44 10 4 42.92 1.08 1.1664 169
46 12 5 45.33 0.67 0.4489 121
48 14 7 48.85 -0.85 0.7225 80
52 16 9 52.37 -0.37 0.1369 25
58 18 12 57.00 1.00 1.0000 1
60 22 14 61.82 -1.82 3.3124 9
68 24 20 69.78 -1.78 3.1684 121
74 26 21 72.19 1.81 3.2761 289
80 32 24 79.42 0.58 0.3364 529

∑e =0 ∑e 2
=13 .6740 ∑y 2
=1634

R 2 = 0,991 (99 ,1%) và F = 413 ,17 với α = 0.05 ta tính F α

1.3 .Mô hình hồi quy k biến

a. Mô hình :Mô hình hồi quy trog đó biến phụ thuộc Y phụ thuộc vào k-1 biến giải thích
X2,…,Xk có dạng
E(Yi) = β 1+ β 2X2i + …+ β kXki+ Ui (PRF)
β
Yi = 1 + β2 X 2i + ... + βk X ki + u i (PRM)

6
(i = 1,…, n)
Hàm hồi quy mẫu
Yi = Yˆi + ei = βˆ1 + βˆ 2 X 2i + ... + βˆ k X ki + ei
Với i=1..n ta có dạng ma trận sau
Y1 = β1 + β2 X 21 + ... + βk X k 1 + u1
Y2 = β1 + β2 X 22 + ... + βk X k 2 + u 2
… ⇔
Yn −1 = β1 + β2 X 2 n −1 +... + βk X kn −1 + u n −1
Yn = β1 + β2 X 2 n + ... + βk X kn + u n

Y=X ×β +U → E(Y)=X β
Tương tự ,đặt

b. Sử dụng phương pháp OLS(phương pháp bình phương nhỏ nhất)


Tìm β( j =1,2,3... k ) thỏa mãn
n n

∑ ei2 = ∑ (Yi − βˆ1 − βˆ2 X 2i − βˆ3 X 3i − ... − βˆk X ki ) 2 → min


i =1 i =1

Tương đương ta sẽ có
n
∂ ∑ ei2 n
i =1
= −2∑ (Yi − βˆ1 − βˆ 2 X 2i − βˆ3 X 3i − ... − βˆ k X ki ) = 0
∂βˆ1 i =1
n
∂ ∑ ei2 n
i =1
= −2∑ (Yi − βˆ1 − βˆ 2 X 2i − βˆ3 X 3i − ... − βˆ k X ki ) X 2i = 0
∂βˆ 2 i =1


n
∂ ∑ ei2 n
i =1
= −2∑ (Yi − βˆ1 − βˆ 2 X 2i − βˆ3 X 3i − ... − βˆ k X ki ) X ki = 0
∂βˆ k i =1

c. Các tham số dưới dạng ước lượng


Kỳ vọng : E ( βˆ ) = β
Phương sai

7
e' e
Với σ 2 được ước lượng bởi σˆ 2 =
n−k

d. Hàm số xác định bội và bội hiệu chỉnh

 Hàm số xác định bội

R =
2 ESS
=1−
RSS
=1−
∑ei 2

TSS TSS ∑ yi2


∑e 2
i = RSS = TSS − ESS
= ∑yi2 − βˆ2 ∑x2i yi −... − βˆk ∑xki yi

Cho biết tỉ lệ sự biến đọng của biến phụ thuộc được giải thích bởi tất cả các biến giải
thích có trong mô hình
2
R có các tính chất sau:
+ 0 ≤ R2 ≤ 1
Tính chất này dùng đẻ đánh giá mức độ thích hợp của hàm hồi quy
+ Giá trị của R2 đồng biến với số biến giải thích của mô hình .Tuy nhiên không thể lấy
điều đó xem xét việc đã thêm biến giải thischvaof mô hình

 Hệ số xác định bội hiệu chỉnh

R 2
=1−
∑e 2
i /( n − k )
∑y 2
i /( n − 1)

hay
n −1
R 2 =1 − (1 − R 2 )
n −k

R 2 có các tính chất sau :


- R 2 có thể âm, trong trường hợp âm, ta coi giá trị của nó bằng 0.
- Khi số biến giải thích của mô hình tăng lên thì R 2 tăng chậm hơn R 2
R 2 ≤ R2 ≤ 1
Tính chất này được dùng làm căn cứ xem sét việc đã thêm biến giải thích vào mô hình

 Các sử dụng R 2 để quyết định đưa thêm biến vào mô hình

Mô hình hai biến Mô hình ba biến

8
ˆ +β
Yˆi = β ˆ X Yˆi = βˆ1 + βˆ2 X 2 i + βˆ3 X 3i (2)
1 2 2 i (1)

R12
R22

R12 R22
Nếu R1 > R2 thì chọn mô hình (1) tức là không cần thêm biến X3 vào ngược lại hì chọn
2 2

mô hình (2)

e. Khoảng tin cậu của tham số kiểm định các giả thiết hồi quy

 Khoảng tin cậy của tham số


βi ∈ ( βˆi − ε i ; βˆi + ε )
Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1- α
β i ∈ ( βˆi − ε i ; βˆi + ε i )
Với độ tin cậy 1- α cho trước ,khoảng tin cậy của các hệ số hồi quy
βˆ j − Se ( βˆ j )t a / 2 (n − 2) < β j < βˆ j + Se ( βˆ j )t a / 2 ( n − 2)
ˆ − Se ( β
β ˆ )t ( n −2) < β
j j a/2 j

ˆ + Se ( β
β ˆ )t ( n −2) (j=1,2)
j j a/2

εi =SE( ( β
ˆ )t
i ( n −3,α / 2 )

f. Phương sai σ 2

σˆ 2 (n − 2) σˆ 2 ( n − 2)
<σ2 < 2
χ a / 2 ( n − 2) χ1−a / 2 (n − 2)
σˆ (n − 2)
2
<σ2
χ a2( n − 2)
σˆ 2 (n − 2)
σ2 <
χ 12−(an/−22)

ε i = SE ( βˆi )t ( n −k ,α / 2 )
g .Kiểm định giả tiết
Kiểm định giả thiết H0 : β i = β i*
βˆi − β i*
ti =
SE ( βˆ )i

Nguyên tắc quyết định

Nếu t i > t ( n −k ,α / 2 ) hoặc t i < t ( n −k ,α / 2 ) :


bác bỏ H0
Nếu − t ( n −k ,α / 2 ) ≤ t i ≤ t ( n −k ,α / 2 ) : chấp nhận H0

9
h Xác định sự phù hợp của mô hình

∑Yi X 2i + βˆ3 ∑Yi X 3i + ... + βˆ k ∑Yi X ki


R2 =
∑ y i2
n −1
R 2 = 1 − (1 − R 2 )
n −k
Kiểm định sự phù hợp của mô hình tức là kiểm định giả thiết đồng thời bằng không
H0: β 2 = β3 = ... = β k = 0 ;(H1 :ít nhất 1 trong k tham số khác 0)
R 2 (n − k )
F =
(1 − R 2 )( k −1)
Nguyên tắc quyết định
Nếu F > Fα (k −1, n − k )
:Bác bỏ H0 mô hình phù hợp
Nếu F ≤ Fα (k −1, n − k )
: Chấp nhận H0 : mô hình không phù hợp

1.4. Hướng dẫn phân tích hồi quy 3 biến băng phần mềm SPSS
Giả sử ta có tập dữ liệu như sau :

Y:tổng doanh thu


X2:doanh thu bình quân
X3: mức doanh thu

Bây giờ tiến hành hồi quy biến Y theo X1,X2 bắt đầu từ Menu Analyze, chọn mục
Regression
Và Linear biến y đưa vào Dependent(biến phụ thuộc)còn biến x2 và x3 đưa vào
Independent (biến độc lập)

10
Ta sẽ thu được 4 bảng
Bảng 1:

Bảng 2 : Bảng đánh giá sự phù hợp của mô hình mẫu

Hệ số tương quan :R=0.346 R2=0.119


Bảng 3: Bảng đánh giá sự phù hợp của mô hình hồi quy tổng thể(Anovab)

11
Tổng bình phương hồi quy :0.918
Tổng bình phương phần dư là:13.544
Trung bình bình phương hồi qui: 1.836/ 2 (bậc tự do)=0.918
Trung bình bình phương phần dư: 13.544/ 7(bậc tự do=n-2)=1.935
F=0.474
Bảng 4 :Đánh giá ý nghĩa của các hệ số hồi quy

phương trình hồi quy: Yˆ i=6.046-0.518X2+0.252X3

Câu 2: Phân tích xu thế chuỗi thời gian.

Từ xu hướng phát triển của hiện tượng nghiên cứu ta xác định được phương trình hồi
quy lý thuyết , đó là phương trình phù hợp với xu hướng và đặc điểm biến động của hiện
tượng nghiên cứu , từ đó có thể ngoại suy hàm su thế để xác định mức độ phát triển trong
tương lai

2.1. Mô hình phân tích chuỗi thời gian

Phân tích chuỗi thời gian được chia làm hai phương pháp
 Phương pháp phân rã
 Phương pháp Box-RenKins

a. Phương pháp phân rã:


Chuỗi dữ liệu được nghiên cứu tách biệt thành hai yếu tố
 Xu thế dữ liệu (vĩ mô)
 Biến đổi theo mùa(vi mô)

12
Phân tích xu thế : Đây là một phân tích liên quan đến chuỗi nhiều năm, do đó ta sẽ sử dụng số
liệu hàng năm để phân tích .một cách tổng quát ta cần phải một chuỗi dài ít là 10->15 năm
 Để đánh giá yếu tố xu thế, phương pháp sử dụng phổ biến là phương pháp bình
phương tối thiểu (BPTT)
 Đấy là phương pháp cho phép xác định được đường cong (thẳng) hoặc mặt phẳng biểu
thị xu thế số liệu ,giới thiệu tốt nhất số liệu trong quá khứ
 Trong trường hợp cá biệt khi nhận thấy xu thế của biến khảo sát trong thời gian dài là
tuyến tính ,.Phương trình sẽ được xác định bởi
Y=a+bt
t: biểu thị thời gian
a,b:là những tham số quy định vị trí của đường hồi quy
Từ phương trình này,bằng phương pháp bình phương nhỏ nhất hoặc thông qua việc đặt thứ tự
thời gian (t) trong dãy số để tính tham số a,b

Gọi ∆y i là khoảng cách thẳng đứng từ điểm quan sát (ti ,Yi )đến đường thẳng cần xác định
.Ta cần định nghĩa hàm mục tiêu
n n
D= ∑ ∆Yi = ∑ [Yi − (a + bt i )] ⇒ min
2

i =1 i =1

Yi: Quan sát


a: Xu thế
Đây là một hàm hai biến a và b, để cho D cực trị (với ý nghĩa vật lý của bài toán ta biết đó là
cực tiểu) ta phải có

∂D
=0
∂a

∂D
=0
∂b

13
Từ đó :

∑2[y
i
i − (a + bt i )] = 0 [1]
∑2[y
i
i − (a + bt i )].t i = 0 [2]
Giải hệ phương trình trên ta có

∑t y − N .t . y
i i
b= i

(∑t ) − N .t
2 2
i
i
a = y i − bt i

∑t i
t1+..+t n
t = i =1
=
N N

Chú ý trong trường hợp xu thế không phải tuyến tính ta có thể xét đến dạng đường cong hàm
mũ y=abt hoặc dạng parabol y=a+bt+ct2. Các tham số a,b,c vẫn xác định dựa vào khái niệm
bình phương tối thiểu mà ta vừa nghiên cứu trên

b. Đánh giá sự biến đổi theo mùa


Để nhận biết ảnh hưởng của thành phần mùa lên chuỗi thời gian khảo sát ta dùng thông số gọi
là chỉ số mùa
- Nếu số liệu theo tháng, ta có 12 tháng giá trị is.
- Nếu số liệu theo quý ,ta có 12 giá trị is.
- Nếu giá trị tính theo 6 tháng ,ta có 2 giá trị is.
Tính chỉ số mùa
Từ số liệu quan trắc chỉ số mùa được tính từ is,t như sau:

is,t=[giá trị quan trắc]/[giá trị cho bởi y=[a+bt]t


Chú ý: Có bao nhiêu số liệu quan trắc → có bấy nhiêu is,t và giá trị is,t thay đổi quanh giá trị
1

Từ các giá trị đại biểu is,t , các giá trị đại biểu is được tính bằng giá trị trung bình của các
tháng (quý) tương ứng :
Theo tháng
n

is,k= ∑ s ,t =k i
1
; k = 1,12
N

Theo quý

14
n

is,k= ∑ s ,t =ki
1
; k = 1,4
N
Với N (số tháng ,quý,…) có trong chuỗi số liệu phân tích

Giá trị chỉ số mùa hiệu chỉnh

Ta phải có :
12 4

∑is ,t = 12(tháng )
i =1
∑i
i =1
s ,t = 4(quý )

Hiệu chỉnh
12 4
i s ,k = 12
i s ,k (tháng ) i s ,k = 4
i s , k ( quý )
∑i
i =1
s ,i ∑i
i =1
s ,i

Chuỗi CVS(loại bỏ ảnh hưởng mùa trong chuỗi giá trị quan sát)

Sự hiệu chỉnh mùa này cho phép chúng ta muốn so sánh kết quả của các tháng khác nhau
trog một mùa nhằm để biết nếu có sự tăng hay giảm đã xảy ra so với giá trị bình
thường .Giá trị hiệu chỉnh mùa sẽ được tính như sau
yt
y t*.k = → y t*,k → chuỗi CVS
i s ,k
k=1,12 (số liệu tháng) hay 1,4( số liệu quý)

Dự báo với mô hình phân rã

Giá trị dự báo tại thời điểm t của biến nghiên cứu yt* được xác định như sau:
y t* = [ a + bt ] * i s , k
[ a +bt ] :
giá trị cho bởi đường xu thế
k:ứng với tháng (mùa) tại thời điểm t

Ví dụ : số liệu kinh doanh của quý (CA, tỷ đồng) của Công ty cho 6 năm gần nhất như sau

15
a. Xác định xu thế biểu diễn bởi đường thảng bằng phương pháp bình phương tối thiểu
.Từ đó xác định hệ số biến đổi mùa đại biểu cho 4 quý.
b. Xác định doanh thu tính từ mô hình (quý 1/năm 1 đến quý 2/ năm 6)
c. Hãy dự báo doanh thu cho quý 3 và 4 của năm cuối cùng và quý 1,2 của năm kế tiếp

Bài làm :

16
Áp dụng phương pháp bình phương tối thiểu :
ta thu được kết quả :
a= 33.49 , b=1.347 và mô hình dự báo

2.2.Thực hiện phân tích chuỗi thời gian trong phần mềm SPSS

Giả sử ta có bảng dữ liệu như sau:

17
Ban đầu bạn chọn chế độ hiển thị cho biểu đồ chuỗi thời gian
Bạn chon Graphs-Legacy Dialogs –Line (chọn kiểu khung hiển thị ví dụ :Line(đường
dây). Bar (hình cột ) hoặc 3-D Bar …) tiếp đó cửa sổ Line Chart hiện ra bạn chọn
(Simple cho thể hiện 1 đường ,Multiple cho 2 đường hoặc Drop-Line): Simple và trong
ô Data in Are là Values of individual cases để hiển thị giá trị

Bấm Define cửa cổ mới xuất hiện bạn điền thông tin trong ô Line Represents (đường dây
thuộc tính muốn thể hiện ):CA và Variable (sự biến thiên theo giá trị ví dụ: thời gian)
chọn :DATE_ thì ta đã có biêu đồ dạng như sau:

18
Bây giờ tiến hành phân tích chuỗi thời gian
Bắt đầu chon :Analyze –Forecasting-Create model
Trong hộp thoại Time series Modeler:
 Tab Valiables đưa biến cần dự báo (biến CA) ,và chọn Exponential smoothing ở
khung Methord,chọn Criteria để khai báo là mô hình nhân tính hay công tính
 Tab Statistics ,đánh dấu Root mean square để tính RMSE của mô hình.Đánh dấu
Display forecasts để thể hiện kết quả dự báo trên mà hình Viewer
 Chọn Tab Plots,và đánh dấu Forecasts,Fit Values để vẽ đường biểu diễn cả giá trị
dự báo và giá trị thực tế lên cùng một đồ thị để nhằm đánh giá độ chính xác
 Tab Options, Nhấp chọn First case after end of estimation period through a
special date , và nhập vào ô Year ,và ô Qarter, gồm thông tin dự báo tháng nào ?
năm bao nhiêu…?.Nếu bạn muốn lưu các giá trị dự báo về File dữ liệu thì bấm vào
Tab Save
Click Ok ta có kết quả dự báo như sau

19
Mô hình dự báo bằng đồ thị

Và các mô hình
1. Mô hình Model Fit

2.Mô hình thống kê

3.Mô hình dự báo (ForeCast)

20
Câu 3 : Thực hiện tập dữ liệu trên SPSS

Tìm tập dữ liệu (trong các tạp chí quốc tế hoặc Việt Nam) áp dụng phương pháp phân tích
dữ liệu thích hợp cho tập dữ liệu đó
Bài làm :Tập dữ liệu
Trong các loại cây lương thực lấy hạt ở Việt Nam thì lúa và ngô và khoai là ba loại cây
lương thực chính, song so với tổng sản lượng của ba loại cây này thì sản lượng ngô chỉ vào
khoảng trên dưới 10%. Sản lượng ba loại cây này tăng liên tục trong những năm qua Nguyên
nhân tăng năng suất và sản lượng lúa, ngô ,khoai là do những thay đổi về cơ chế chính sách
đầu tư vốn và sự kết hợp đẩy mạnh ứng dụng các tiến bộ kỹ thuật mới vào sản xuất như giống
mới,
Đây là kết quả mối quan hệ về sản lượng nông nghiệp với sản lượng thóc ,sản lượng khoai
lang và sản lượng ngô năm 2001.
Nguồn dữ liệu trang Wed : http://www.gso.gov.vn

Đơn vị :ngàn tấn


obs Y X2 X3 X4
1994 1748.000 1508.000 163.0000 82.00000
1995 1665.000 1418.000 99.00000 48.00000
1996 1685.000 1413.000 92.00000 77.00000
1997 1935.000 1660.000 94.00000 78.00000
1998 1996.000 1675.000 108.0000 110.0000
1999 2384.000 2103.000 81.00000 96.00000
2000 2541.000 2202.000 118.0000 117.0000
2001 2654.000 2335.000 101.0000 112.0000
2002 2853.000 2417.000 194.0000 124.0000
2003 2787.000 2375.000 150.0000 143.0000
2004 3000.000 2529.000 175.0000 204.0000

Trong đó
Y:tổng sản lượng nông nghiệp
X2:Sản lượng thóc
X3: Sản lượng khoai lang
X4:Sản lượng ngô
Bài làm
3.1 .Hàm hồi quy bội
Ta có tập dữ liệu 4 biến nên dùng phương pháp hồi quy bội có hàm như sau:
Yi = β 1 + β 2 X2 + β 3 X3 + β 4X4
Trong đó :
Yi :là biến phụ thuộc
X2, X3 ,X4 là biến giải thích
β 1 :là hệ số chặn
β 2,β 3,β 4 :là hệ số góc

21
Trên cơ sở đó ta có mô hình hồi quy tổng thể’:
Yi = β 1 + β 2 X2 + β 3 X3 + β 4X4 + Ui (1)
3.2.Ước lượng hồi
Ước lượng hồi quy tổng khối lượng hàng hóa vận chuyển theo khối lượng hàng hóa vận
chuyển bằng đường sắt và đường biển

Bằng việc sử dụng phần mềm SPSS ta thực hiện tập dữ liệu sau:

Thực hiện phân tích hồi quy đa biến Click Analyze –Regression – Linear

22
Với Y:là biến phụ thuộc và X2, X3 là biến độc lập ta thu được kết quả như sau

23
∧ ∧ ∧
Bảng có các thông tin cho ta: β1 =50.245 β2 = 1.058 β3 = 0.497 β̂4 =0.944
Từ kết quả ước lượng nêu trên ta thu được hàm hồi quy mẫu như sau:

Yˆ i =50.245 + 1.058*X2 +0.497 *X3 + 0.944*X4


Và kết quả ước lượng:
R2=0.997 (tương ứng 99.7% sự thay đổi vốn đầu tư là sự thay đổi của các sản lượng)

β1 β̂2 , β̂3 , β̂4 > 0 ⇒phù hợp với lý thuyết thống kê
Ý nghĩa của các hệ số trong mô hình :

β1 :khi không có sự tăng trưởng vốn đầu tư thì tổng sản lượng là :50,245 nghìn tấn
β̂2 =1.058 cho biết khi sản lượng lúa tăng lên 1 nghìn tấn thì tổng sản lượng
tăng1.058 nghìn tấn
β̂3 =0.497 cho biết khi sản lượng khoai tăng lên 1 nghìn tấn thì tổng sản lượng tăng
0.497 nghìn tấn
β̂4 =0.944 cho biết khi sản lượng ngô tăng lên 1 nghìn tấn thì tổng sản lượng tăng
0.944 nghìn tấn
3.2.Kiểm định các khuyết tật của mô hình

3.2.1 Kiểm định β2


Kiểm định giả thiết :
H0: β2=0;
H1 : β 2 ≠ 0
Tiêu chuẩn kiểm định

24
Kiểm định giả thiết H0 β i = β i*
βˆ 2 − 0
T= ˆ ∼ T(n-3).
Se ( β2 )
( n −3)
Miền bác bỏ :: Wα = {T/ T > T α/ 2 }
Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0.05 ta có:

Tqs =26.718> T0.025(8) = 2.306


⇒ Tqs Є Wα => Bác bỏ H0 chấp nhận H1
Vậy biến X2 trong mô hình phù hợp
3.2.2 Kiểm định β3
Kiểm định cặp giả thuyết :
H0: β3=0;
H1 : β 3 ≠ 0
Ta sử dụng tiêu chuẩn kiểm định
βˆ −0
∼ T(n-3).
3
T=
Se ( βˆ )
3
( n −3)
Miền bác bỏ : Wα = {T/ T > T α/ 2 }
Theo kết quả báo cáo 1(mức ý nghĩa α = 0.05) ta có:

Tqs =1.567< T0.025(8) = 2.306

Tqs ∉ Wα=> Chưa đủ cơ sở để bác bỏ H0


Vậy X3 trong mô hình phù hợp

3.2.3 Kiểm định β4


Kiểm định cặp giả thuyết :
H0: β4=0;
H1 : β 4 ≠ 0
Ta sử dụng tiêu chuẩn kiểm định
βˆ 4 − 0
T= ∼ T(n-3).
Se ( βˆ 4 )
( n −3 )
Miền bác bỏ : Wα = {T/ T > T α /2 }

Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0.05 ta có:
Tqs =2.073< T0.025(8) = 2.306

Tqs ∉ Wα=> Chưa đủ cơ sở để bác bỏ H0


Vậy biến X4 của mô hinh phù hợp

3.3.Kiểm định sự phù hợp của mô hình hồi quy

Ramsey RESET Test:

25
F-statistic 0.940047 Prob. F(1,6) 0.369710
Log likelihood ratio 1.601040 Prob. Chi-Square(1) 0.205756

Kiểm định cặp giả thuyết :


H0 : mô hình (1) không phù hợp
H1 : mô hình (1) phù hợp
R12 /( k − 1)
+) Sử dụng tiêu chuẩn kiểm định F =(1 − R12 ) /( n − k ) ~ F ( k -1, n-k )

Trong đó k là số biến có mặt trong (1) , R12 là hệ số xác định bội của (1) , n là số quan sát.
Miền bác bỏ : Wα = { Fq/s / Fq/s > Fα ( k-1 , n-k ) }

Với α = 0,05, n = 11 thì F0,05(1,6) =5,99


Theo báo cáo : Fqs = 0,940047
Ta có Fqs< F0,05(1,6) nên chưa đủ cơ sở để bác bỏ H0
Vậy mô hình đã cho phù hợp

3.4.Phân tích dựa vào kết quả ước lượng (Khoảng tin cậy )

3.4.1.Với biến độc lập X2


Khi một biến độc lập thay đổi một đơn vị thì biến phụ thuộc thay đổi như thế nào?
 Khi sản lượng thóc thay đổi 1 nghìn tấn với điều kiện sản lượng khoai lang và
sản lượng ngô không thay đổi thì tổng sản lượng nông nghiệp thay đổi trong
khoảng:
β̂2
-Se( β̂2
) t0.025(11) < β 2
< β̂2
+Se( β̂
2
)*t0.025(11)

1.058 – 0.04*2.2010 < β 2


< 1.058 + 0.04*2.2010

0.971 < β 2
< 1.145

 Khi sản lượng thóc tăng 1 nghìn tấn với điều kiện sản lượng khoai lang và sản
lượng ngô không thay đổi thì tổng sản lượng nông nghiệp tăn tối đa

β 2
≤ β̂ 2
+Se( β̂ 2
)*t0.05(11)

β ≤ 1.058+ 0.04*1.7960
2

β ≤ 1.128954
2

26
 Khi sản lượng thóc tăng 1 nghìn tấn với điều kiện sản lượng khoai lang và sản
lượng ngô không thay đổi thì tổng sản lượng nông nghiệp tăn tối thiểu

β̂ 2
-Se( β̂ 2
β
)* t0.05(11) ≤ 2

1.058 - 0.04*1.7960 ≤ β 2

0.986616 ≤ β 2

3.4.2.Với biến độc lập X3

 Khi sản lượng khoai lang thay đổi 1 nghìn tấn với điều kiện sản lượng thóc và
sản lượng ngô không thay đổi thì tổng sản lượng nông nghiệp thay đổi trong
khoảng :
β̂ -Se( β̂ ) * t
3 3
β < β̂ +Se( β̂ )*t
0.025
(11)
< 3 3 3
0.025
(11)

0.497– 0.317*2.2010 < β < 0.497 + 0.317 *2.2010 3

-0.200717 < β < 1.194717 3

 Khi sản lượng khoai lang tăng 1 nghìn tấn với điều kiện sản lượng thóc và sản
lượng ngô không thay đổi thì tổng sản lượng nông nghiệp tăng tối đa
β ≤ β̂ +Se( β̂ )t
3 3 3
0.05
(11)

β ≤ 0.497 + 0.317 *1.7960


3

β ≤ 1.066332
3

 Khi sản lượng thóc tăng 1 nghìn tấn với điều kiện sản lượng khoai lang và sản
lượng ngô không thay đổi thì tổng sản lượng nông nghiệp tăng tối thiểu :
β̂ -Se( β̂ ) * t
3 3
0.05
(11)
≤ β 3

0.497 - 0.317 *1.7960 ≤ β 3

-0.072332 ≤ β 3
3.4.3.Với biến độc lập X4

 Khi sản lượng ngô thay đổi 1 nghìn tấn với điều kiện sản lượng thóc và sản
lượng khoai lang không thay đổi thì tổng sản lượng nông ngiệp thay đổi trong
khoảng
∧ ∧ (11) ∧ ∧
β 4 - Se( β 4) *t0.025 < β 4 < β 4 + Se( β 4)*t0.025(11)

0.944 – 0.455 *2.2010 < β 4 < 0.944 + 0.455 *2.2010

27
-0.057455 < β 4 < 1.945455
 Khi sản lượng ngô tăng 1 nghìn tấn với điều kiện sản lượng khoai và sản lượng
thóc không thay đổi thì tổng sản lượng nông nghiệp tăng tối đa
∧ ∧
β 4 ≤ β 4 + Se( β 4)*t0.05
(11)

β 4 ≤ 0.944 + 0.455 *1.7960


β 4 ≤ 1.76118
 Khi sản lượng ngô tăng 1 ngàn tấn với điều kiện sản lượng khoai lang và sản
lượng thóc không thay đổi thì tổng sản lượng nông nghiệp tăng tối thiểu :
∧ ∧
≤ β4
β 4 - Se( β 4) * t0.05
(11)

0.944 – 0.455 *1.7960 ≤ β 4


0.12682 ≤ β 4

3.5 Tìm khoản tin cậy


Tìm khoản tin cậy của 2 phía σ 2 với DTC 95%
}/ χ /χ
2(n-4) 2(n-3)
{(n-4)* δ ^2
α /2 ≤ δ 2
≤ {(n-4)* δ ^2
1- α /2 }
{7*275.8398 }/ χ {7*275.8398 }/ χ
2(7) 2(7)
0.025 ≤ δ 2
≤ 0.975

120.58 ≤ δ 2
≤ 1142.62
Vậy với DTC 95% sự biến động của tốc dọ tăng trưởng hàng hóa vận chuyển phụ thuộc
vào phương sai do yếu tố ngẫu nhiên gây ra nằm trong đoạn :[120:58;1142.62]

3.6 .Dùng SPSS để dự báo kết quả


Từ mô hình ban đầu

28
Ta có thể dự báo mô hình sản lượng từ các năm 2001 đến năm 2011 như sau :

29
5.6 Đánh giá mô hình

Mô hình trên cho ta thấy được mức ảnh hưởng của 3 nhân tố về tổng sản lượng nông
nghiệp và xu hướng dự đoán cho từng sản lượng.

Tài Liệu Tham Khảo

1. Giáo Trình Kinh Tế Lượng PGS.TS.Nguyễn Thống Trường Cao Đẳng Kinh
Tế Kỹ Thuật Sài Gon
2. Phân tích và dự báo kinh tế của Th.s NGUYỄN VĂN HUÂN & VŨ XUÂN NAM
3. Thống kê kinh doanh và SPSS của Trương Minh Chiến Sưu tập và biên soạn
4. Giáo trình kinh tế lượng Đại Học Quốc Gia –TPHCM
5. Phân tích hoạt động kinh doanh –TS .Tăng Thị Thanh Thủy
6. Cộng đồng Cao Học Kinh tế(http://caohockinhte.info/forum/)
7. Trang Wed Tổng cục thống kê (http://www.gso.gov.vn/default.aspx?tabid=217)
……………………………………………………………………………….
Và một số tài liệu sử dụng SPSS trong quá trình thực hiện đề tài

-----------------The End-------------

30

You might also like