PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐA BIẾN

Mô hình hồi qui tuyến tính đơn biến dùng để xem xét mối quan hệ tuyến tính giữa
biến phụ thuộc y (biến kết cục) và biến độc lập x (biến dự đoán). Phương trình tuyến
tính (đường thẳng) đơn biến có dạng:

y=  + xi+i
Trong đó  là điểm cắt trên trục tung, β là độ dốc (trong thống kê gọi là hệ số hồi
qui) và  là phần dư. Ví dụ tìm sự liện hệ giữa lượng cholesterol máu ( x) và bề dày
lớp nội trung mạc (NTM) động mạch cảnh (y).
Tuy nhiên trong y sinh học, thường có rất nhiều yếu tố khác nhau dẫn đến một hiện
tượng. Ví dụ như hiện tượng dày lớp NTM động mạch cảnh không chỉ do lượng
cholesterol máu mà còn do nhiều yếu tố khác như di truyền, chủng tộc, mắc bịnh tim
mạch, tuổi, giới, BMI, tăng huyết áp, đái tháo đường....Vì vậy cần phải có mô hình
hồi qui tuyến tính đa biến. Trong ví dụ này ta không đề cập các yếu tố di truyền,
chủng tộc, giới, mắc bịnh tim mạch... mà chỉ lưu ý đến các biến số như: tuổi,
cholesterol, glucose, huyết áp tâm thu và BMI.
Ví dụ: dữ liệu đo bề dày lớp NTM động mạch cảnh trên siêu âm ở 100 bệnh nhân có
bệnh tim mạch như sau:
Dữ liệu này có 7 cột: ID bệnh nhân, tuổi (năm), BMI (kg/m2), huyết áp tâm thu
(mmHg), glucose máu (mmol/L), cholesterol (mmol/L), bề dày lớp NTM trên siêu âm
(mm). (Ghi chú: có thể copy dữ liệu này vào Excel, sau đó chuyển vào SPSS để
thực tập)
Bảng 1. Dữ liệu bề dày NTM của 100 bệnh nhân
ID
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

TUOI
56
76
63
78
87
76
55
74
81
77
29
71
77
59
58
34
74
61
53
65
80
71
90

BMI
21
18
16
20
20
19
31
22
21
24
20
22
21
18
27
19
22
19
20
28
19
25
24

HA
160
150
160
100
110
150
160
100
120
160
120
160
160
150
130
130
100
170
130
140
160
160
160

GLUCOSE
14.0
12.0
4.4
4.0
4.6
4.6
5.5
6.8
5.8
5.4
3.8
3.3
5.1
6.0
6.9
4.5
10.6
18.0
25.0
6.5
4.8
6.2
4.7

CHOLESTEROL
6.00
4.97
6.39
7.00
4.10
2.74
4.60
5.04
4.75
6.94
4.84
6.63
4.93
4.55
6.70
3.20
4.30
6.80
5.50
6.80
5.74
6.90
7.00

BEDAYNTM
1.95
1.33
.83
2.00
1.30
1.16
1.00
1.00
.80
1.60
.65
1.00
.97
.73
1.10
1.10
1.10
.80
.99
1.00
1.13
1.00
1.70

50 4.9 3.94 3.00 .81 .97 .70 1.75 4.47 6.20 .67 1.0 3.00 7.57 6.1 4.9 7.00 6.50 4.73 4.66 .31 3.3 17.2 11.89 .89 .90 4.8 4.00 3.85 3.97 .79 5.0 6.9 6.00 5.00 .80 .7 4.9 5.88 5.00 8.82 .1 4.2 11.70 3.4 6.00 1.7 2.01 4.4 11.0 4.00 3.00 5.99 1.9 6.3 6.81 1.89 .97 .4 5.30 4.2 8.0 18.80 1.60 6.89 1.0 5.06 1.90 .84 6.10 .80 .2 4.70 4.6 10.80 1.70 1.82 1.13 1.1 6.90 .16 7.1 9.60 5.91 5.80 .00 .97 .00 2.4 7.6 4.1 4.50 .10 .90 1.1 7.40 4.7 4.19 .70 2.3 7.30 .15 1.0 5.1 6.92 1.3 5.0 3.10 3.62 1.15 5.7 10.5 6.70 .6 5.30 5.20 4.7 6.13 5.79 .88 .92 6.89 .90 .19 3.9 26.07 3.9 4.0 4.93 7.0 5.18 8.3 5.49 7.0 3.90 4.9 4.80 .2 5.71 2.90 1.0 4.30 2.00 6.10 .10 1.60 1.83 4.70 7.2 5.15 3.2 22.0 5.70 1.13 1.80 1.61 4.3 4.70 .7 5.00 6.2 5.08 6.62 8.00 4.7 5.24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 44 91 75 60 51 91 45 62 65 70 56 51 75 58 61 72 82 95 56 36 67 64 81 46 56 60 35 55 70 64 64 58 73 41 74 21 67 57 69 53 58 54 49 59 65 42 75 72 82 70 42 32 61 60 76 78 71 49 36 74 53 56 60 83 68 69 31 34 41 72 54 54 55 76 70 85 24 27 22 24 22 29 24 24 19 22 27 19 18 32 19 18 25 24 21 28 18 22 22 22 22 24 19 21 20 23 19 27 23 24 23 23 25 23 21 34 23 29 17 22 23 22 24 21 24 18 24 19 21 26 19 27 26 24 23 21 21 19 20 21 23 19 21 21 20 22 22 28 24 15 25 21 120 150 160 140 150 120 170 140 150 160 150 120 140 160 160 120 90 120 160 130 100 130 140 160 150 140 120 160 150 130 160 160 140 110 100 160 150 140 120 140 160 130 130 140 150 150 100 140 190 160 160 140 140 130 160 120 150 140 140 140 140 140 160 120 130 100 120 140 120 160 170 150 160 140 180 160 6.91 5.74 2.4 6.39 6.60 5.80 1.31 4.15 .89 .4 4.61 6.20 .40 5.73 3.80 .2 3.81 .16 .4 12.71 5.06 4.6 8.20 3.3 4.48 5.2 4.82 .70 1.97 .1 7.75 5.20 5.00 1.30 2.40 6.1 4.5 5.0 3.0 3.01 1.20 .54 3.80 7.88 4.2 4.78 5.4 6.0 5.6 4.24 4.30 6.16 .97 .25 5.16 1.70 .97 .20 .0 5.0 6.5 6.00 2.56 .

Nếu muốn so sánh phải đổi các yếu tố có cùng đơn vị là độ lệch chuẩn. Vào SPSS. Trị số p (p value): càng nhỏ mức ảnh hưởng càng mạnh. Nhắp chuyển BEDAYNTM vào ô Dependent (trục tung) và cholesterol vào ô Independent (trục hoành).. x2=cholesterol.14). glucose (0.20 2...42). x3=glucose. tuy nhiên các yếu tố có đơn vị khác nhau (tuổi.+.+ kxki + i Với ví dụ trên ta có thể viết phương trình hồi qui tuyến tính đa biến với 5 yếu tố (x1=tuổi.. Bình phương của R (R square): yếu tố nào có R2 càng lớn thì mối quan hệ giữa yếu tố đó và biến y càng chặt chẽ.22).10) và BMI (0. phân tích từng đơn biến để xem các trị số này: Phân tích hồi qui tuyến tính đơn biến trong SPSS..) nên không thể so sánh mức ảnh hưởng giữa các yếu tố. Hệ số tương quan R (coefficient of correlation): yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều 2. Hệ số hồi qui  (regression coefficient): yếu tố nào có  cao thì ảnh hưởng nhiều hơn. ta cần biết mức độ ảnh hưởng của từng yếu tố lên biến kết cục y (bề dày lớp NTM trong ví dụ này)... mmol/L. mmHg... . cholesterol (0.. lúc đó ta có hệ số hồi qui chuẩn hóa: S= .02) 4. Vào Analyse> Regression > Linear Mở hộp thoại Linear Regression. 3.+  Trong phân tích hồi qui tuyến tính đa biến.. Muốn biết mức độ ảnh hưởng cần lưu ý đến các trị số sau: 1... ta tính được hệ số hồi qui chuẩn của tuổi (0.0 5. x4=huyết áp TT và x5= BMI) như sau: Bề dày NTM=  +  1(tuổi) +  2(cholesterol) +  3(glucose) +  4(huyết áp TT) +  5 (BMI) + . huyết áp (0.100 87 22 130 9. Dựa vào công thức trên. 𝑆𝑥 𝑆𝑦 ( Với Sx là độ lệch chuẩn của x tương ứng và Sy là độ lệch chuẩn của y)...30 Mô hình hồi qui tuyến tính đa biến có dạng: y=  +  1x1i+ 2x2i + 3x3i + ....

Nhấn vào nút Statistics. R squared change và Descriptives. Model fit. Nhấn nút Continue. đánh dấu nháy vào các ô: Estimates. sau đó nhấn OK Kết quả như sau: .

107 0..001 0.748 0.771 0. p: ý nghĩa thống kê Ta có thể viết các phương trình tuyến tính đơn sau: 1.013 0.003 0.002 (Huyết áp TT) .406 + 0.027 0.020 0..999 0.011 0. Bề dày NTM= 0.408 0.002 0.140 0.748 + 0.165 HA tâm thu 0.290 BMI 0.981 0.166 0.219 0.062 0.048 0. Bề dày NTM= 0.062 (cholesterol) 2. R: hệ số tương quan.011 (tuổi) 3. Bề dày NTM= 0.771 + 0.406 0..062 (glucose) 4. glucose.788 Các yếu tố : Hệ số hồi qui.  :điểm cắt trên trục tung.000 Cholesterol 0. Bề dày NTM= 0.Tương tự thay thế cholesterol bằng yếu tố khác: tuổi.011 0. Tổng hợp các trị số trong phân tích hồi qui tuyến tính đơn   R R2 p Tuổi 0.981 + 0.ta có thể tóm tắt các trị số trong bảng sau: Bảng 2.020 Glucose 0.

BMI) vào ô Independent (s) và nhắp chuyển BEDAYNTM vào ô Dependent.999 + 0.6% sự thay đổi bề dày của lớp NTM. Hệ số hồi qui  (nếu +: tỉ lệ thuận và – tỉ lệ nghịch). Bây giờ nếu đưa tất cả các biến vào cùng lúc để phân tích đa biến.003 mm. Trong thống kê trị số R2 được diễn dịch như sau: Sự thay đổi của tuổi giải thích được 16. Nếu nhìn trị số p ( p value) ta thấy chỉ có 2 yếu tố có ý nghĩa thống kê là tuổi và cholesterol. GLUCOSE. Như vậy tuổi và cholesterol là 2 yếu tố có ảnh hưởng nhiều nhất làm dày lớp NTM.1% sự thay đổi lớp bề dày NTM.003 (BMI) Nhìn vào bảng phân tích đơn biến ta thấy hệ số tương quan R của tuổi cao nhất (0.027). chủng tộc. và BMI chỉ giải thích được 0. Mở hộp thoại Linear Regession. giới tính hoặc mắc bệnh tim mạch (không thuộc phạm vi bài nghiên cứu này).6% sự thay đổi của bề dày lớp NTM Sự thay đổi của cholesterol giải thích được 4.013 mm Cứ HA tâm thu tăng lên 1 đơn vị (1 mmHg) thì bề dày lớp NTM tăng lên 0. Tóm lại nếu cộng lại tất cả các yếu tố trên chỉ giải thích được khoảng 24.011 mm Cứ cholesterol tăng lên 1 đơn vị (1mmol/L) thì bề dày lớp NTM tăng lên 0.062 mm Cứ glucose tăng lên 1 đơn vị (1 mmol/L) thì bề dày lớp NTM tăng lên 0. Nhắp chuyển tất cả 5 biến (TUOI. Tương tự glucose giải thích được 2%.140) >HA tâm thu (0.107)>BMI (0. Như vậy có thể còn có nhiều yếu tố khác làm tăng bề dày lớp NTM như do di truyền. CHOLESTEROL. Bề dày NTM= 0. Vào Analyse> Regression> Linear Regession. HUYETAPTT.8% sự thay đổi của bề dày lớp NTM. Trị số R2 cũng tương tự như vậy.002 mm Cứ BMI tăng lên 1 đơn vị (kg/m2) thì bề dày lớp NTM tăng lên 0. .1%.408) rồi đến >cholesterol (0.219)>Glucose (0.5. HA tâm thu giải thích được 1.Trong thống kê hệ số hồi qui được diễn dịch như sau: Cứ tuổi tăng lên 1 đơn vị (1 tuổi) thì bề dày lớp NTM tăng lên 0.

kết quả như sau: .Nhấn OK.

Nephron Clin Pract. Trong phân tích đa biến chỉ còn tuổi là có ý nghĩa độc lập giải thích sự thay đổi bề dày lớp NTT. Hoàng Trọng và Chu Nguyễn Mộng Ngọc. email:rangbvag@yahoo. chỉ có tuổi là có giá trị thống kê với p=0. Kết luận: Chỉ có tuổi là yếu tố độc lập có ý nghĩa dự đoán bề dày lớp NTM động mạch cảnh. Tripepi G. 2. huyết áp. 3. Jager KJ. Như vậy trong phân tích từng biến riêng lẻ (phân tích đơn biến) thì tuổi và cholesterol có ý nghĩa thống kê. Dekker FW.).com Website:bvag. 2011 Feb 23. How to Deal with Continuous and Dichotomic Outcomes in Epidemiological Research: Linear and Logistic Regression Analyses. Dtsch Arztebl Int. các yếu tố khác như cholesterol. Zoccali C. Linear regression analysis: part 14 of a series on evaluation of scientific publications. Phân tích dữ liệu nghiên cứu với SPSS.008 (glucose) + 0. Bốn yếu tố còn lại giải thích vào khoảng 5% sự tăng bề dày lớp NTM. glucose. Schneider A. TS Nguyễn Ngọc Rạng.108 + 0.002 (huyết áp) ( Bỏ BMI vì hệ số hồi qui gần bằng 0) Hệ số tương quan chung là R=0. BMI không có hoặc có rất ít ảnh hưởng trên bề dày lớp NTM.6% sự thay đổi của bề dày NTM. giữa tuổi và bề dày lớp NTM có tương quan cao nhất (R=0.vn Tài liệu tham khảo: 1. 2010 Nov.457 và tất cả 5 yếu tố này chỉ giải thích được gần 21% (R2=0. Stel VS.000. Nhà xuất bản thống kê năm 2005 . Nhìn vào trị số p (cột cuối cùng-Sig. Blettner M.Lúc này phương trình hồi qui tuyến tính đa biến có thể viết như sau: Bề dày NTM= -0.01(tuổi) + 0.038 (cholesterol) + 0. Hommel G.209) sự thay đổi của bề dày NTM. Thật vậy.118(4):c399c406.408) và giải thích 16.107(44):776-82.com.