Hướng dẫn thực hành SPSS cơ bản

SPSS 16.0

GV: Th.S Phạm Lê Hồng Nhung

CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES (Tính tần số) 1. Sau khi mở file dữ liệu, vào menu Analyze  Descriptive Statistics  Frequencies

Màn hình sẽ xuất hiện hộp thoại sau:

Vẽ biểu đồ

2. Chọn biến muốn tính tần số (biến Place V1) bằng cách click chuột vào tên biến rồi đưa sang khung Variable(s). 3. Click Ok. Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok. 4. Để vẽ biểu đồ click chuột vào ô Charts…. Chọn dạng biểu đồ ở Chart type, chọn giá trị thể hiện trên biểu đồ là số đếm (frequencies) hay phần trăm (percentages). Click Continue để trở lại hộp thoại Frequencies  Ok để thực hiện lệnh.

1

Hướng dẫn thực hành SPSS cơ bản

GV: Th.S Phạm Lê Hồng Nhung

2

Hướng dẫn thực hành SPSS cơ bản

GV: Th.S Phạm Lê Hồng Nhung

TÍNH TRỊ TRUNG BÌNH (2 CÁCH)
CÁCH 1. DÙNG LỆNH FREQUENCY 1. Vào menu Analyze  Descriptive Statistics  Frequencies. Đưa biến cần tính trị trung bình vào ô variables như bước 1 và 2 ở phần trước. 2. Click chọn thẻ Statistic, mở hộp thoại, và click chọn các thông số cần thiết:

3. Ý nghĩa một số thông số thông dụng: Mean: trung bình cộng Sum: tổng cộng (cộng tất cả các giá tị trong tập dữ liệu quan sát) Std. Deviation: độ lệch chuẩn Minimum: giá trị nhỏ nhất Maximum: giá trị lớn nhất S.E. mean: sai số chuẩn khi ước lượng trị trung bình

CÁCH 2. DÙNG LỆNH DESCRIPTIVES (Tính điểm trung bình) 1. Vào menu Analyze  Descriptive Statistics  Descriptives…, xuất hiện hộp thoại

3

Hướng dẫn thực hành SPSS cơ bản

GV: Th.S Phạm Lê Hồng Nhung

2. Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s). 3. Click vào ô Options… để xuất hiện hộp thoại Descriptive Options. Chọn các đại lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết. 4. Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần (Descending list). 5. Click Continue để trở về hộp thoại Descriptive  Ok để thực hiện lệnh.

Ý nghĩa của từng giá trị trung bình đối với thang đo khoảng (Interval Scale)
Giá trị khoảng cách = (Maximum - Minimum) / n = (5 -1) / 5 = 0.8 Giá trị trung bình 1.00 - 1.80 1.81 - 2.60 2.61 - 3.40 3.41 - 4.20 4.21 - 5.00 Ý nghĩa

Rất không đồng ý/Rất không hài lòng/Rất không quan trọng Không đồng ý/Không hài lòng/ Không quan trọng Không ý kiến/trung bình Đồng ý/ Hài lòng/ Quan trọng Rất đồng ý/ Rất hài lòng/ Rất quan trọng
4

Cách thức tiến hành với SPSS như sau: 1. 4. Click vào ô Statistics.Hướng dẫn thực hành SPSS cơ bản GV: Th.S Phạm Lê Hồng Nhung CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION) Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square). 2. Vào menu Analyze  Descriptive Statistics  Crosstabs…. xuất hiện hộp thoại sau: 5 . Xuất hiện hộp thoại sau: 3. Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến).

Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự.S Phạm Lê Hồng Nhung 5. 6. Ở ô Counts chọn Observed (thể hiện tần số quan sát). 8. Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square). . 6 . Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages. 9. Click vào continue để trở lại hộp thoại Crosstabs  Click vào ô Cells. Trong trường hợp muốn thể hiện tần số mong đợi chọn Expected. . Click Continue để trở lại hộp thoại Crosstabs  Ok để thực hiện lệnh. hộp thoại sau xuất hiện: 7.Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu danh.Hướng dẫn thực hành SPSS cơ bản GV: Th. Chọn các kiểm định cần thiết.

708 . Không có mối quan hệ giữa các biến cần kiểm định.) > α (mức ý nghĩa)  chấp nhận H0.S Phạm Lê Hồng Nhung CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH Khi thực hiện kiểm định. (2-sided) p-value . ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG Hàng đầu tiên của bảng Chi-square tests thể hiện giá trị P Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases 16. ta có 2 giả thuyết.Hướng dẫn thực hành SPSS cơ bản GV: Th.) để kết luận là chấp nhận hay bác bỏ giả thuyết H0 p-value (sig. 7 .4%) have expected count less than 5.202 511 a. H0: không có mối quan hệ giữa các biến.217 a df 8 8 1 Asymp. Có nghĩa là có mối quan hệ có ý nghĩa giữa các biến cần kiểm định.69. Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần suất mong đợi dưới 5. 8 cells (44. nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình phương không còn đáng tin cậy.653 18.017 .4% số ô có tần số mong đợi dưới 5. Sig.) ≤ α (mức ý nghĩa)  bác bỏ giả thuyết H0. Để kết luận là chấp nhận hay bác bỏ giả thuyết H0.039 . p-value (sig. Trong ví dụ trên có đến 44. Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn. ta sẽ dùng các kiểm định phù hợp. H1: có mối quan hệ giữa các biến. The minimum expected count is 1. Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig. biện pháp cho trường hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm.

S Phạm Lê Hồng Nhung CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH CỦA 2 TỔNG THỂ ĐỘC LẬP (Independent Samples T-test) 1. Chọn Define Groups… để nhập mã số của 2 nhóm.Hướng dẫn thực hành SPSS cơ bản GV: Th. 3. Chọn biến định tính chia số quan sát thành 2 nhóm mẫu để so sánh giữa 2 nhóm này với nhau đưa vào khung Grouping Variable. Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s). Vào menu Analyze  Compare Means  Independent-samples T-test 2. Click Continue để trở lại hộp thoại chính  Click Ok để thực hiện lệnh 8 .

ta sử dụng kết quả kiểm định t ở dòng Equal variances not assumed.002 -.083 -3.05 thì phương sai của 2 tổng thể khác nhau. 9 .003 -.138 . Nếu Sig. Trong VD trên Sig. Nếu Sig. t df Sig. = 0.040 448.100 . > α (mức ý nghĩa)  không có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể.380 -.002 < 0. Nếu Sig.379 -.075 Lower Upper -. ta sử dụng kết quả kiểm định t ở dòng Equal variances assumed.05  có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể.231 .71 > 0. của kiểm định t ≤ α (mức ý nghĩa)  có sự phác biệt có ý nghĩa về trung bình của 2 tổng thể.710 -3. của kiểm định F = 0. Phương sai diễn tả mức độ đồng đều hoặc không đồng đều (độ phân tán) của dữ liệu quan sát.Cleanliness and comfort of room Equal variances assumed Levene's Test for Equality of F Variances t-test for Equality of Means Equal variances not assumed . (2-tailed) Mean Difference Std. trong kiểm định Levene (kiểm định F) < 0.05  chấp nhận giả thuyết H0 không có sự khác nhau về phương sai của 2 tổng thể  sử dụng kết quả ở dòng Equal variances assumed.082 Sig.231 . Error Difference 95% Confidence Interval of the Difference Nếu giá trị Sig. Independent Samples Test A.076 -.066 509 . ta cần dựa vào kết quả kiểm định sự bằng nhau của 2 phương sai tổng thể (kiểm định Levene). Trong VD trên sig.Hướng dẫn thực hành SPSS cơ bản GV: Th.05 thì phương sai của 2 tổng thể không khác nhau.S Phạm Lê Hồng Nhung Trong kiểm định Independent-samples T-test. ≥ 0.

4.S Phạm Lê Hồng Nhung CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH CỦA 2 TỔNG THỂ PHỤ THUỘC HAY PHỐI HỢP TỪNG CẶP (Paired-Samples T-test) 1. 5. Xem cách đọc kết quả kiểm định ở phần trên. Có thể chọn nhiều cặp để so sánh cùng 1 lúc. Vào menu Analyze  Compare means  Paired-samples T-test 2. Click Ok để thực hiện lệnh. 3. 10 . Chọn cặp biến muốn so sánh (nhấn giữ phím ctrl để chọn 2 biến) đưa vào khung Paired Variable(s). nhập độ tin cậy vào khung Confidence Interval. Có thể chỉnh lại độ tin cậy bằng cách click vào ô Option.Hướng dẫn thực hành SPSS cơ bản GV: Th. Cũng dùng giá trị Sig.

Có 2 kỹ thuật phân tích phương sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố(2 hay nhiều biến để phân loại). Click chọn ô Homogeneity of variance test để kiểm định sự bằng nhau của các phương sai nhóm (thực hiện kiểm định Levene).S Phạm Lê Hồng Nhung CÁCH THỨC TIẾN HÀNH PHÂN TÍCH PHƯƠNG SAI (ANOVA – Analysis of Variance) Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của 3 nhóm trở lên. - 1. 11 - . Một số giả định đối với phân tích phương sai một yếu tố: Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên. xuất hiện hộp thoại sau: 2 kỹ thuật dùng để kiểm định sâu ANOVA 2. Đưa biến phân loại xác định các nhóm cần so sánh với nhau vào khung Factor. Từ menu Analyze  Compare Means  One-Way ANOVA. Ở phần thực hành cơ bản chỉ đề cập đến phân tích phương sai 1 yếu tố (One-way ANOVA). Phương sai của các nhóm so sánh phải đồng nhất.Hướng dẫn thực hành SPSS cơ bản GV: Th. Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn. Click vào nút Option để mở hộp thoại One-Way ANOVA Options. Đưa biến định lượng (trị trung bình) vào khung Dependent list. 3. Trong hộp thoại One-way ANOVA Options: Click chọn ô Descriptive để tính đại lượng thống kê mô tả (tính trị trung bình) theo từng nhóm so sánh.

Bonferroni: giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến hành so sánh bội dựa trên số lần tiến hành so sánh. Các phương pháp kiểm định thống kê của Post-Hoc test thường được sử dụng: LSD: đây là phép kiểm định dùng kiểm định t lần lượt cho từng cặp trung bình nhóm. Đây là một trong những thủ tục kiểm định đơn giản nhất và hay được sử dụng cho mục tiêu này. Phân tích sâu ANOVA – Xác định chỗ khác biệt Có 2 phương pháp để phân tích sâu ANOVA. đó là kiểm định “trước” (kiểm định Priori Contrasts) và kiểm định “sau” (kiểm định Post-Hoc test). Tuy nhiên có thể thực hiện kiểm định ANOVA và sâu ANOVA cùng lúc với nhau. Dựa vào sự chấp nhận hay bác bỏ giả thuyết H0 để quan tâm hay không quan tâm đến kết quả kiểm định sâu ANOVA. Nếu H0 bị bác bỏ  có sự khác biệt có ý nghĩa giữa các nhóm  trở lại hộp thoại One – way ANOVA để thực hiện kiểm định sâu ANOVA nhằm xác định cụ thể trung bình của nhóm nào khác với nhóm nào.Hướng dẫn thực hành SPSS cơ bản GV: Th. nghĩa là tìm xem sự khác biệt của các nhóm xảy ra ở đâu. do vậy nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc. 12 - . 6. nếu H0 được chấp nhận thì kết luận không có sự khác biệt có ý nghĩa giữa các nhóm với nhau. Click chọn Continue để trở lại hộp thoại ban đầu  click Ok để thực hiện lệnh. Nên trong phần này ta sẽ sử dụng PostHoc test để thực hiện kiểm định sâu ANOVA nhằm tìm ra chỗ khác biệt. Dựa vào kết quả kiểm định ANOVA. 5.S Phạm Lê Hồng Nhung 4. Phương pháp kiểm định gần với phương pháp nghiên cứu thực là Post-Hoc test.

Hướng dẫn thực hành SPSS cơ bản GV: Th.500 . N Single Married/Living with partner Divorced Widowed Total 153 341 15 2 511 Mean 4.S Phạm Lê Hồng Nhung - Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm khác biệt. Bảng thứ 2 thể hiện kết quả kiểm định Levene.54 10.72 -1.035 . SPSS mặc định chọn nhóm cuối (last) để làm nhóm điều khiển.273 > mức ý nghĩa 0.811 .707 .645 . Trong VD này Sig.17 Upper Bound 4.29 Minimum 1. Test of Homogeneity of Variances Willingness to introduce Levene Statistic 1.35 4.066 . = 0. Dunnett: là thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu còn lại với trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra so sánh (nhóm điều khiển). Nhưng kiểm định này không phù hợp khi kích cỡ các nhóm mẫu không bằng nhau.50 4.00 4.00 1.85 4.85 4.25 4. - - Sử dụng kiểm định nào là tuỳ thuộc vào mục đích của nhà nghiên cứu và tình hình thực tế nghiên cứu.00 Maximum 5 5 5 5 5 2.303 df1 3 df2 507 Sig.28 4.1  chấp nhận giả thuyết H0  phương sai các nhóm không khác nhau một cách có ý nghĩa  có thể sử dụng kết quả phân tích ANOVA ở bảng tiếp theo.704 Std.00 3. đầu tiên tiến hành kiểm định lại toàn bộ các giá trị trung bình nhóm xem có bằng nhau không.743 .22 3.031 Lower Bound 3.192 . Tukey hiệu quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều. Đọc kết quả phân tích phương sai 1.23 Deviation . Bảng đầu tiên thể hiện các đại lượng thống kê mô tả Descriptives Willingness to introduce 95% Confidence Interval for Mean Std.99 4.273 13 . Error . R-E-G-W: thực hiện 2 bước kiểm định.13 4.00 1. .12 4. Nó sử dụng bảng phân phối Studentizze range distribution. nếu không bằng thì bước kế tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệt thật sự với nhau về trị trung bình.

216 .36 -.367 Dựa vào kết quả kiểm định LSD này.528 .934 .444 . Bảng thứ 4 thể hiện kết quả kiểm định sâu ANOVA (dùng kiểm định LSD).60 -.498 .40 -.167 * .51 . 14 . 95% Confidence Interval Lower Bound Upper Bound -.30 .216 .382 .36 .19 -.40 -.36 . = 0.076 .415 . Multiple Comparisons Willingness to introduce LSD Mean (I) Marital status Single (J) Marital status Married/Living with partner Divorced Widowed Married/Living with partner Single Divorced Widowed Divorced Single Married/Living with partner Widowed Widowed Single Married/Living with partner Divorced *.488 .60 .185 .528 .190 .382 .015 .Hướng dẫn thực hành SPSS cơ bản GV: Th.39 .185 .499 .151 -.36 1.05 level.015 .089 4.228 249. Trong VD này nhóm đã kết hôn sẽ sẵn lòng giới thiệu hơn nhóm độc thân (xem bảng thống kê mô tả).068 .S Phạm Lê Hồng Nhung 3.415 . The mean difference is significant at the 0.934 .21 -1.67 -.751 df 3 507 510 Mean Square 1.30 -.665 . Trong VD này sig. Difference (I-J) Std.39 -1.068 .51 -1.190 .444 .665 .03 -.76 -.492 F 2.67 1. ta có thể kết luận chỉ có hai nhóm đã kết hôn và độc thân là có sự khác nhau về mức độ sẵn lòng giới thiệu. ANOVA Willingness to introduce Sum of Squares Between Groups Within Groups Total 3.016 -.1  bác bỏ giả thuyết H0  có sự khác biệt có ý nghĩa về giá trị trung bình của mức độ sẵn lòng giới thiệu của các nhóm tình trạng hôn nhân. Error Sig.498 .03 .21 .499 .488 -.76 .19 1. Bảng thứ 3 thể hiện kết quả kiểm định ANOVA.167 * .089 < mức ý nghĩa 0.151 -. .523 252.367 .186 Sig.016 -.

Từ menu Analyze  Regression  Linear… 2.S Phạm Lê Hồng Nhung MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI 1.Hướng dẫn thực hành SPSS cơ bản GV: Th. 3. Chọn phương pháp đưa biến vào ở ô Method. Đưa biến độc lập vào khung Independent(s). Xuất hiện hộp thoại sau: - Đưa biến phụ thuộc vào khung Dependent(s). 15 .

Độ chấp nhận của biến (Tolerances) và hệ số phóng đại 16 . biến có hệ số tương quan nhỏ nhất sẽ được kiểm tra đầu tiên. POUT. Phương pháp đưa vào dần (forward selection). không có biến nào được đưa vào mô hình. Lúc này mô hình này sẽ được tính toán lại mà không có biến độc lập vừa loại. Biến độc lập đầu tiên được xem xét để đưa vào mô hình là biến có tương quan lớn nhất với biến phụ thuộc. Tiếp tục SPSS sẽ xét điều kiện để đưa các biến độc lập còn lại vào mô hình. 4. - - - Phương pháp chọn từng bước (stepwise selection) là sự kết hợp của phương pháp đưa vào dần vào loại trừ dần và là phương pháp được sử dụng thông thường nhất. Phương pháp loại trừ dần (backward elimination). Và phương pháp được sử dụng nhiều nhất là phương pháp chọn từng bước (stepwise selection). để mở hộp thoại sau: - Click chọn ô Collinearity diagnostics để kiểm tra hiện tượng Đa cộng tuyến (Multicollinearity).Hướng dẫn thực hành SPSS cơ bản GV: Th. FIN. Đây là phương pháp mà SPSS sẽ xử lý tất cả các biến độc lập mà nhà nghiên cứu muốn đưa vào mô hình. Đầu tiên tất cả các biến độc lập được đưa vào mô hình. Nếu biến đầu tiên không thoả điều kiện vào thì thủ tục này sẽ chấm dứt. Click vào ô Statistics….  Sử dụng phương pháp đưa biến vào nào phụ thuộc vào tính chất của cuộc nghiên cứu. FOUT.S Phạm Lê Hồng Nhung - Mặc định SPSS sẽ chọn phương pháp đưa biến vào là Enter.  Tham khảo điều kiện để đưa vào và loại ra PIN. nếu không thoả điều kiện sẽ bị loại ra. Tiếp theo SPSS sẽ lặp lại thủ tục trên cho đến khi nào giá trị F của biến có hệ số tương quan nhỏ nhất lớn hơn điều kiện thì quá trình này sẽ dừng lại.

381 .461 . Error of the Estimate . Đánh giá độ phù hợp của mô hình Hệ số xác định R2 và R2 hiệu chỉnh (Adjusted R square) được dùng để đánh giá độ phù hợp của mô hình.  Mức độ phù hợp của mô hình tương đối cao.455 . 5. Để kiểm định độ phù hợp của mô hình hồi quy tuyến tính đa bội ta dùng giá trị F ở bàng phân tích ANOVA sau: 17 . Click Continue để trở lại hộp thoại Linear Regressions  click Ok để thực hiện lệnh.468 Square .618 .429 R Square .463  46. R2 hiệu chỉnh càng lớn thể hiện độ phù hợp của mô hình càng cao.432 .439 .439 .441 . 1.459 . 2. Model Summary Adjusted R Model 1 2 3 4 R . Để kiểm định xem có thể suy diễn mô hình cho tổng thể thực hay không ta phải kiểm định độ phù hợp của mô hình.S Phạm Lê Hồng Nhung phương sai (Variance inflation factor – VIF) được dùng để phát hiện hiện tượng đa cộng tuyến.382 .684 R2 hiệu chỉnh của mô hình số 4 là 0.  tiếp tục đánh giá mô hình. Mô hình: sự hài lòng của DK về điểm đến = α + β1 (sự hài lòng về dịch vụ lưu trú) + β2 (sự hài lòng về dịch vụ ăn uống) + β3 (sự hài lòng về dịch vụ mua sắm) + β4 (sự hài lòng về dịch vụ vận chuyển) Giá trị Tolerances và VIF ở bảng số 3 (bảng Coefficients) cho thấy không hiện diện hiện tượng đa cộng tuyến của các biến.664 a b c d Std.677 . Vì R2 sẽ tăng khi đưa thêm biến độc lập vào mô hình nên dùng R2 hiệu chỉnh sẽ an toàn hơn khi đánh giá độ phù hợp của mô hình.Hướng dẫn thực hành SPSS cơ bản GV: Th. Kiểm định độ phù hợp của mô hình Giả thuyết H0: β1 = β2 = β3 = β4 = 0.3% sự biến thiên của mức độ hài lòng của DK về điểm đến được giải thích bởi mối liên hệ tuyến tính của các biến độc lập. Các bước đánh giá mô hình VD: sử dụng stepwsise để đưa các biến độc lập vào mô hình.463 . Quy tắc là khi VIF vượt quá 10 là dấu hiệu của đa cộng tuyến. Tuy nhiên sự phù hợp này chỉ đúng với dữ liệu mẫu.

474 . của trị F của mô hình số 4 rất nhỏ (< mức ý nghĩa)  bác bỏ giả thuyết H0  mô hình phù hợp với tập dữ liệu và có thể suy rộng ra cho toàn tổng thể.168 .119 80.603 - Ý nghĩa của hệ số riêng phần là βk đo lường sự thay đồi giá trị trung bình Y khi Xk thay đổi 1 đơn vị.000 .404 .872 175.000 d Giá trị sig.131 .990 Collinearity Statistics Tolerance VIF .296 94.041 a Standardized Coefficients Beta t 8.000 .109 .624 1.213 F 314.904 108.121 2.823 175.172 .Hướng dẫn thực hành SPSS cơ bản ANOVA Model 1 Regression Residual Total 2 Regression Residual Total 3 Regression Residual Total 4 Regression Residual Total Sum of Squares 66.218 5. giữ các biến độc lập còn lại không đổi. .000 b 26.595 .000 a 38.000 c 20.041 .697 1.103 .335 7. Ý nghĩa các hệ số hồi quy riêng phần trong mô hình Coefficients Unstandardized Coefficients Model 4 (Constant) Overall satisfaction Accommodation Overall satisfaction Transportation Overall satisfaction Food Overall satisfaction Shopping a.475 . Hệ số Beta (cột thứ 4 từ bên trái) được dùng để so sánh khi các biến độc lập không cùng đơn vị đo lường.119 81.947 .119 77. 18 - .589 .150 3.331 Sig.904 .223 175.003 .857 1. .248 97.502 1.624 .300 Std.765 .032 .139 . 3.216 175. Dependent Variable: Overall satisfied B 1.035 .S Phạm Lê Hồng Nhung Mean Square 66.136 .538 .686 Sig.119 df 1 509 510 2 508 510 3 507 510 4 506 510 e GV: Th. Error .001 .897 93.000 .168 .187 143.193 200.184 111.

103(hài lòng về mua sắm).S Phạm Lê Hồng Nhung - Ở VD này ta có thể viết lại mô hình như sau: Hài lòng về điểm đến = 1. Trong đó sự hài lòng về dịch vụ lưu trú có tác động mạnh nhất đến sự hài lòng về điểm đến. các biến cộng tuyến có thể không nghiêm trọng như trong mẫu đầu tiên.94. và mua sắm có tác động tỷ lệ thuận với sự hài lòng chung của du khách về điểm đến.92. Thu thập thêm số liệu hoặc lấy mẫu mới Vấn đề đa cộng tuyến là một đặc tính của mẫu.172 + 0. Bước 2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến. tăng cỡ mẫu có thể làm giảm bớt vấn đề cộng tuyến. VD: R2 của hàm có mặt 2 biến là 0. Giả sử X3 và X4 có tương quan chặc chẽ với nhau. Loại trừ một biến giải thích ra khỏi mô hình Bước 1: Xem cặp biến có quan hệ chặc chẽ. 3. vận chuyển. Giải thích mô hình: Phương trình hồi quy bội được phương pháp stepwise ước lượng cho thấy sự hài lòng của du khách về 4 dịch vụ: lưu trú. MỘT SỐ BIỆN PHÁP KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN TRONG MÔ HÌNH HỒI QUY TUYẾN TÍNH (Đề nghị tham khảo chi tiết hơn trong giáo trình Kinh tế lượng của Tiến sĩ Mai Văn Nam) 1. 2. ăn uống. không có mặt 1 trong 2 biến.168(hài lòng về vận chuyển) + 0. Vì vậy.139(hài lòng về ăn uống) + 0.Hướng dẫn thực hành SPSS cơ bản GV: Th. Bước 3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó lớn hơn. Sử dụng thông tin tiên nghiệm Thông tin tiên nghiệm có thể từ các công việc thực tế trước đây trong đó đã xảy ra hiện tượng cộng tuyến nhưng ít nghiêm trọng hoặc từ các lý thuyết tương ứng trong lĩnh vực nghiên cứu.300(hài lòng về lưu trú) + 0.87  loại biến X3 ra khỏi mô hình. R2 của mô hình không có biến X3 là 0. có thể là trong một mẫu khác. 19 . R2 của mô hình không có biến X4 là 0.

Hướng dẫn thực hành SPSS cơ bản GV: Th. Chọn phương pháp đưa biến vào (Method) tương tự như hồi quy tuyến tính thông thường. và biến độc lập sang khung Covariate. Forward: LR là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa (maximum-likelihood estimates). xuất hiện hộp thoại sau: 2. - - - 20 . các biến trong khối biến độc lập được đưa vào trong một bước. Cách thức tiến hành phân tích hồi quy Binary Logistic với SPSS 1. Forward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Wald. Vào menu Analyze  Regression  Binary Logistic. Forward: Conditional là phương pháp đưa dần vào theo điều kiện.S Phạm Lê Hồng Nhung HỒI QUY BINARY LOGISTIC Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. I. Đưa biến phụ thuộc Y dạng nhị phân vào ô dependent. 3. Enter: đưa vào bắt buộc. Khi biến phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy thông thường mà phải sử dụng hồi quy Binary Logistic. Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện. Tuy nhiên điều kiện căn cứ trên số thống kê likelihood-ratio (tỷ lệ thích hợp) hay số thống kê Wald.

Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện. 5.Hướng dẫn thực hành SPSS cơ bản GV: Th. ta chọn Predict value trong hộp thoại Save. Muốn tính được giá trị dự đoán. chọn Option. - - - 4. Backward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Wald.S Phạm Lê Hồng Nhung - Backward: Conditional là phương pháp loại trừ dần theo điều kiện. Stepwise: hồi quy từng bước. Click Continue trở về hộp thoại đầu tiên. hay số thống kê Wald. 21 . là xác suất mà một đối tượng sẽ … (biến phụ thuộc Y). Backward: LR là phương pháp loại trừ dần vào kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa. chọn Classification plots trong phần Statistics and plots. Để hiện đồ thị phân loại giá trị thật và giá trị dự báo của biến phụ thuộc. số thống kê được sử dụng cho các biến được đưa vào và loại ra căn cứ trên số thống kê Likelihood-ratio. Chọn Continue  Ok để thực hiện lệnh.

Model Summary Cox & Snell R Step 1 -2 Log likelihood 26. Kiểm định này xem xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập. Kết quả bảng 2 cho thấy giá trị của -2LL = 26. Khác với hồi quy tuyến tính thông thường hệ số R2 càng lớn thì mô hình càng phù hợp.Hướng dẫn thực hành SPSS cơ bản GV: Th.459 df 4 4 4 Sig. -2LL càng nhỏ càng thể hiện độ phù hợp cao.000 Ở bảng 1. .793 a Nagelkerke R Square Square . Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig.001. Y: mức độ hài lòng chung về điểm đến (0: không hài lòng. như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể. 1: hài lòng) X1  X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính) Thực hiện các bước trên để tiến hành phân tích. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình có độ phù hợp hoàn hảo.000 nên ta bác bỏ H0. Estimation terminated at iteration number 6 because parameter estimates changed by less than .769 a.595 . Kết quả xuất hiện với rất nhiều bảng.S Phạm Lê Hồng Nhung II. hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình.472 không cao lắm. Bảng 2. Bảng 2 thể hiện kết quả độ phù hợp của mô hình.459 178. = 0. Cách thức đọc kết quả phân tích hồi quy Binary Logistic Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter.000 . Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô hình có ý nghĩa trong việc giải thích cho biến phụ thuộc.000 . Ta sẽ chú ý phân tích các bảng sau: Bảng 1. Omnibus Tests of Model Coefficients Chi-square Step 1 Step Block Model 178. ta đọc kết quả kiểm định H0: 1 = 2 = … =  k = 0.459 178. Phân tích mức độ ảnh hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch của du khách. 22 .

737 a. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt.546 1.2.672 . Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác không).a.1%.2.6 86.002 . Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuyết H0: k=0.249 .2. bảng này cho thấy trong 73 trường hợp không hài lòng về điểm đến (xem theo cột) mô hình đã dự đoán đúng 49 trường hợp (xem theo hàng). Còn với 438 trường hợp hài lòng về điểm đến. Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1. đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.2.0 94. Còn đối với hồi quy Binary Logistic. Variable(s) entered on step 1: Q3. Bảng 4.05  bác bỏ H0.6%.959 2.222 .347 Wald 37.812 3.s. The cut value is . Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig. lúc đó mô hình hồi quy không có tác dụng dự đoán.) nhỏ hơn mức ý nghĩa  = 0.f.228 1.E.051 9. Variables in the Equation B Step 1 a S.S Phạm Lê Hồng Nhung Predicted Satisfied dummy Observed Step 1 Satisfied dummy Dissatisfied Satisfied Overall Percentage a.000 .273 75.567 .164 16.500 Dissatisfied 51 22 Satisfied 49 389 Percentage Correct 51. . Từ đó ta tính được tỷ lệ dự đoán đúng của toàn bộ mô hình là 86.505 .918 -11. tỷ lệ đúng là 94.000 Exp(B) 4. vậy tỷ lệ đúng là 51%.031 . Q3.1 Mức độ chính xác cũng được thể hiện ở bảng 3. Q3.435 .891 df 1 1 1 1 1 Sig. tức xác suất để sự kiện xảy ra hay không xảy ra như nhau.255 . .000 Satisfied with Accom Satisfied with Food Satisfied with Shopping Satisfied with Transp Constant 1.Hướng dẫn thực hành SPSS cơ bản Bảng 3.t. Q3.794 1.000 . 23 . mô hình dự đoán sai 22 trường hợp. Classification Table a GV: Th.

VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó.3925.Hướng dẫn thực hành SPSS cơ bản GV: Th. Cụ thể tác động biên của mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban đầu = 0.5 thì tác động này bằng 0.5(1-0. Ta sử dụng công thức sau: 24 . trong đó hài lòng về DV lưu trú tác động mạnh nhất.S Phạm Lê Hồng Nhung Từ các hệ số hồi quy này ta viết được phương trình: Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau: Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm đến .5)1.57 = 0.

25 . Click chọn ô Descriptives….S Phạm Lê Hồng Nhung CÁCH THỨC TIẾN HÀNH PHÂN TÍCH NHÂN TỐ 1. Từ menu Analyze  Data Reduction  Factor 2.Hướng dẫn thực hành SPSS cơ bản GV: Th. Chọn tất cả các biến cần gom nhóm vào ô Variables. Xuất hiện hộp thoại sau: 3. 4. xuất hiện hộp thoại sau: - Chọn các tham số thống kê mô tả.

Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích.S Phạm Lê Hồng Nhung - Chọn tính các ma trận hệ số tương quan. Chỉ có những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích. Click continue để trở lại hộp thoại Factor analysis - 5. Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng không thích hợp. phương pháp mặc định là rút các thành phần chính – Principal components. 26 . Chọn kiểm định Bartlett. Nhà nghiên cứu xác định số nhân tố ở ô Number of factors. Có 2 cách để xác định tiêu chuẩn này ở ô Extract:  Xác định từ trước dựa vào ý đồ của nhà nghiên cứu và kết quả của các cuộc nghiên cứu trước. 6.Hướng dẫn thực hành SPSS cơ bản GV: Th. Click chọn ô Extraction để mở hộp thoại sau: - Chọn phương pháp rút trích nhân tố. Trong phân tích nhân tố. cần kiểm định mối tương quan của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng thể). Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau: Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn. Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze.  Xác định dựa vào Eigenvalue (Determination based on eigenvalue. - - Click Continue để trở lại hộp thoại Factor Analysis. Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display.

7. Nhân số của nhân tố thứ i bằng: Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới này. hồi quy…).Hướng dẫn thực hành SPSS cơ bản GV: Th. Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị đo lường độ lệch chuẩn). Click Continue để trở lại hộp thoại chính. Click chọn ô Factor Score để tính điểm các nhân tố Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các phương pháp phân tích đa biến tiếp theo (phân tích ANOVA. ta có thể tính toán ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một.S Phạm Lê Hồng Nhung Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số lớn tại cùng một nhân tố. 27 . vì vậy sẽ tăng cường khả năng giải thích các nhân tố).

000 .33 3.065 .096 .315 .470 1.198 .940 .993 1.393 .392 .130 .000 .072 1. Bảng 1.129 .535 .581 .372 1.161 .522 .281 .569 1.325 .021 .270 1.298 .123 .034 nuoc .479 1.60 3.000 .393 .607 1.871 Analysis N 43 43 43 43 43 43 43 43 43 43 Bảng 2.034 .365 .303 song .219 .Hướng dẫn thực hành SPSS cơ bản GV: Th.313 .378 .063 .298 .478 .174 .288 .281 .79 4.209 .528 .275 .581 .67 3. nuoc 3.219 28 .365 .257 .275 vui choi.291 .238 1.000 .372 gan truong .28 3.307 . giai tri phong co gac lung co nha ve sinh trong phong noi qui dien.209 lung co nha ve sinh .401 .378 .313 .238 .607 .291 choi.478 . nuoc .950 .S Phạm Lê Hồng Nhung - Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor … Click Continue để trở lại hộp thoại ban đầu  click Ok để thực hiện lệnh.238 ve sinh .801 . Correlation Matrix Correlation moi truong gia ca gia ca ve sinh an ninh moi truong song gan truong gan khu vui .198 .049 .130 .801 1.142 .303 .479 .142 .569 gac lung . phong co sinh trong giai tri .811 1.337 .05 4.191 .021 .238 .174 .402 .288 trong phong noi qui dien.000 gan khu co nha ve dien.000 .535 .129 .337 .470 .325 phong .09 3.528 .948 .315 . Deviation 1.049 .096 . Descriptive Statistics Mean gia ca ve sinh an ninh moi truong song gan truong gan khu vui choi. ĐỌC KẾT QUẢ CỦA VÍ DỤ SAU VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa công nghệ trường Đại học Cần thơ.123 .270 .35 4.191 .401 1.000 .16 Std.000 .257 . giai tri phong co gac .000 . noi qui .402 .392 an ninh .522 1.000 .91 4.307 .

896 18.903 10 .829 66. Dựa vào bảng 5 và theo tiêu chuẩn eigenvalue lớn hơn 1 thì chỉ có 3 nhân tố được rút trích ra. Bảng số 4 (bảng Cummunalities) cho biết thông tin về phần biến thiên được giải thích bởi các nhân tố chung. Bảng 2 thể hiện ma trận tương quan giữa các biến.526 5. 29 .116 8 . .591E1 98.668 9.324 3. Bảng 3.238 9 .933 45 .552 92.290 2.006 20. Để dễ dàng giải thích các nhân tố hơn ta sử dụng bảng số 7 để đọc kết quả. Ta thấy hệ số tương quan giữa các biến trong ma trận này tương đối cao.Hướng dẫn thực hành SPSS cơ bản GV: Th.283 12.829 4 .758 47.694 5 .259 7 . Giá trị Cumulative % cho biết 3 nhân tố đầu giải thích 66. Bartlett's Test of Sphericity Approx.949 2.406 14.058 53.778 % of Variance 39.809 1. Dựa vào kết quả này ta có thể bác bỏ H0 (Các biến không có tương quan với nhau).778 1. KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Total Variance Explained Component 1 Initial Eigenvalues Total % of Variance Cumulative % Extraction Sums of Squared Cumulative % Loadings Rotation Sums Total of Squared Loadings Cumulative % 27.78% biến thiên của dữ liệu.989 39.  Phân tích nhân tố là phương pháp phù hợp để phân tích ma trận tương quan ở bảng 2.892 39.406 14.949 1.293 6 .714 167.056 66.119 1.892 2 1.000 Bảng 5.965 Total % of Variance 3.000E2 Extraction Method: Principal Component Analysis.283 12.916 75. Bảng 3 thể hiện kết quả của kiểm định Barlett.892 8.758 53.058 3 1.892 2.760 7.814 66.892 3. Chi-Square df Sig.412 4.S Phạm Lê Hồng Nhung Bảng 1 thể hiện đại lượng thống kê mô tả.776 27.989 39.778 1.599 83.191 88. Bảng số 6 là bảng thể hiện các nhân tố chưa xoay.

838 .Hướng dẫn thực hành SPSS cơ bản Bảng 6.778 .3. nuoc .176 .041 .127 -. nuoc (10) .498 .369 .896 . nhóm 2 là nhân tố điều kiện sinh hoạt.746 . giai tri (6) phong co gac lung (7) co nha ve sinh trong phong (8) noi qui (9) dien.514 .601 .651 .285 -.647 . 30 .069 .020 .358 -.875 . Các biến 5.056 .525 .718 2 -.660 .4 có tương quan mạnh với nhau và thuộc nhân tố thứ 1.179 -.529 . Component Matrix a GV: Th.198 .014 . 3 components extracted. Dựa vào những điểm giống nhau (thể hiện tính chung) của biến nằm trong nhân tố và những nghiên cứu trước nhà nghiên cứu sẽ đặt tên cho những nhân tố này.S Phạm Lê Hồng Nhung Component 1 gia ca ve sinh an ninh moi truong song gan truong gan khu vui choi.039 -.288 -.743 .573 .198 .661 .015 .215 Dựa vào bảng số 7 ta thấy biến 1.419 -. nhóm 3 là nhân tố vị trí thuận lợi.689 3 .245 -.280 .149 .364 2 .667 .312 -.527 .184 .7 là các biến giải thích cho nhân tố 3. Rotated Component Matrix a Component 1 gia ca (1) ve sinh (2) an ninh (3) moi truong song (4) gan truong (5) gan khu vui choi.604 .324 .206 -.221 -.814 .119 .124 .762 . VD: nhóm 1 là nhân tố an toàn. giai tri phong co gac lung co nha ve sinh trong phong noi qui dien.205 -.10.379 -.6.148 .286 .369 Extraction Method: Principal Component Analysis.040 3 -. Bảng 7. Tương tự nhân tố 2 bao gồm các biến 8.268 .9.781 . a.2.

191 -.386 .309 .006 -. Dựa vào bảng 8.138 .495 2 .090 .Hướng dẫn thực hành SPSS cơ bản Bảng 8.S Phạm Lê Hồng Nhung Extraction Method: Principal Component Analysis.883 -.000 1.000 .448*gần khu vui chơi + 0. Component Score Covariance Matrix Component 1 2 3 1 1.004 Extraction Method: Principal Component Analysis.515 .143 -.397*có gác lửng 31 .060 -.461 -.309*môi trường sống F2 = 0.354*an ninh + 0.341 3 .516 -.012 -.000 3 .034 -. Component Score Coefficient Matrix Component 1 gia ca ve sinh an ninh moi truong song gan truong gan khu vui choi.354 .852 3 .134 -.397 . Rotation Method: Varimax with Kaiser Normalization.218 . Component Scores. nuoc .218*giá cả + 0.418 .161 -. Bảng 10. Rotation Method: Varimax with Kaiser Normalization.430 .122 -.418*có nhà vệ sinh trong phòng + 0.171 GV: Th.076 -.108 .030 -.437 .000 . Bảng 9.000 .341*điện nước F3 = 0. Component Transformation Matrix Component 1 2 3 1 .213 .448 .000 .000 2 .430*gần trường + 0. giai tri phong co gac lung co nha ve sinh trong phong noi qui dien.000 Extraction Method: Principal Component Analysis.386*vệ sinh + 0.003 2 -.515*nội quy + 0.103 . Component Scores.736 -. 9 và 10 ta xác định nhân số như sau: F1 = 0.036 -. Rotation Method: Varimax with Kaiser Normalization.076 -.000 1.065 .

6. bệnh nhân có thể cùng một lúc có nhiều phẩu thuật trước đây. Ví dụ: câu hỏi về tiền sử phẫu thuật. có tiền sử mổ lấy thai sẽ nhập vào số 2. Cách thức khai báo Value: có 2 cách thức Cách 1: dùng dạng câu hỏi phân đôi Có – Không (Dạng biến Dichotomy) - Cách 2: dùng chính số thứ tự của biến để mã hoá. có những câu hỏi cho phép người trả lời chọn nhiều hơn 1 lựa chọn. Đây được gọi là câu hỏi nhiều lựa chọn.S Phạm Lê Hồng Nhung XỬ LÝ CÂU HỎI NHIỀU LỰA CHỌN 1. Công cụ dùng xử lý câu hỏi nhiều lựa chọn là Multiple Response. CÁCH THỨC XỬ LÝ Đối với câu hỏi nhiều lựa chọn. (Dạng biến Category) 2. MÃ HOÁ Trong quá trình nghiên cứu. Theo ví dụ trên ta sẽ mã hoá thành 6 biến. 32 . Nếu bệnh nhân nào có tiền sử cắt viêm ruột thừa sẽ nhập vào số 1. mỗi một lựa chọn sẽ được mã hoá thành 1 biến. Tên phẫu thuật Cắt viêm ruột thừa Mổ lấy thai Cắt tử cung Phẫu thuật u buồng trứng Viêm túi mật Phẫu thuật khác Đánh dấu và ghi chú (nếu có) Đối với câu hỏi nhiều lựa chọn. 3. 4. khi cần phân tích tần số chúng ta không sử dụng công cụ thống kê mô tả tính Frequency thông thường. 5. Số thứ tự 1.Hướng dẫn thực hành SPSS cơ bản GV: Th. 2.

Định dạng biến tổng hợp 1. Click vào Add để xác nhận biến tổng hợp đã được tạo  Click chọn Close để hoàn tất quá trình định dạng biến tổng hợp. ta sẽ đếm từ giá trị 1 đến 6 tại ô Range: 1 through: 6. do ta khai báo 1. Khai báo cách mã hoá ở khung Variables Are Coded As: Nếu dùng cách mã hoá 1: dùng dạng câu hỏi phân đôi Có – Không. Từ menu Analyze  Multiple Response  Define Variable Sets… để mở hộp thoại sau: 2. 2. ta sẽ khai báo biến ở dòng Dichotomies. xuất hiện hộp thoại sau: 33 . Không.Hướng dẫn thực hành SPSS cơ bản GV: Th. và đếm các số thứ tự của biến. Từ menu Analyze  Multiple Response  Frequency.2. ta sẽ khai báo ở dòng Categories. Trong ví dụ trên có 6 biến. Và sẽ đếm giá trị “Có” ở ô Counted value. - 4. nên ở ô này ta sẽ nhập giá trị cần đếm là “2” Nếu dùng cách mã hoá 2. Có.S Phạm Lê Hồng Nhung 2. Khai báo tên và nhãn biến ở khung Name và Label. Chọn tất cả các biến thuộc câu nhiều lựa chọn đưa vào khung Variables in Set. 3. 5. Đối với ví dụ trên. Phân tích tần số (Frequency) 1. 2.1.

0% 4. Đưa biến tổng hợp vừa tạo ở phần trên vào ô Tables for  Click chọn Ok để hoàn tất thao tác.5% 3.0% Percent 38 3 2 3 9 55 69.0% tien su cat viem ruot thua tien su mo lay thai tien su mo cat tu cung tien su phau thuat u buong trung ts mo do benh khac Total a.0% 110.0% 6. 3.4% 100.0% 18. Kết quả hiện ra ở cửa sổ Output như sau: $TSPHAUTHUATTH Frequencies Responses N TIEN SU PHAU THUAT TONG HOP a Percent of Cases 76.6% 5.5% 16.0% 6. - Percent of Cases: phần trăm trên tổng số bệnh nhân được quan sát (50 bệnh nhân) Percent of Responses: phần trăm trên tổng sự trả lời (vì mỗi bệnh nhân có thể có nhiều tiền sử phẩu thuật nên tổng sự trả lời = 55 > cỡ mẫu quan sát = 50) 34 .1% 5.Hướng dẫn thực hành SPSS cơ bản GV: Th.S Phạm Lê Hồng Nhung 2. Dichotomy group tabulated at value 2.

3. nhà nghiên cứu lại muốn sử dụng nhóm tuổi để phân tích và viết báo cáo: 1. Đến khi xử lý số liệu. 4. chúng ta sử dụng thang đo tỷ lệ (dùng chính xác số tuổi của bệnh nhân: 52. < 30 tuổi 30 – 39 tuổi 40 – 49 tuổi 50 – 59 tuổi ≥ 60 tuổi Quy trình mã hoá lại biến như sau: 1. Vào menu Transform  Recode into Different Variables… Nếu chúng ta chọn Recode into Same Variables… thì biến cũ (số tuổi chính xác) sẽ mất đi và được thay thế bằng một biến mới với các biểu hiện mới (là nhóm tuổi). hay 81 tuổi…). 67. 5. Thông thường ta sẽ chọn Recode into Different Variables… để tạo ra biến mới mà vẫn giữ lại biến cũ.Hướng dẫn thực hành SPSS cơ bản GV: Th. 2. Ví dụ: Khi thu thập thông tin về độ tuổi của bệnh nhân. Xuất hiện hộp thoại sau: 35 .S Phạm Lê Hồng Nhung MÃ HOÁ LẠI BIẾN Trong quá trình phân tích dữ liệu người làm nghiên cứu đôi khi sẽ phải mã hoá lại biến để sử dụng cho nhiều mục đích khác nhau. và trường hợp đơn cử nhất là: Khi nhà nghiên cứu muốn chuyển một biến định lượng (thang đo tỷ lệ) sang một biến định tính (thang đo biểu danh hay thứ tự). 2.

khai báo tên và nhãn cho biến mới  Click chọn Change để thực hiện thay biến.Hướng dẫn thực hành SPSS cơ bản GV: Th. 4. Đưa biến cần mã hoá lại từ khung chứa bộ biến sang khung Numeric Variable -> Output Variable. mở hộp thoại sau: 36 . 5. Tiếp tục thay đổi giá trị của biến bằng cách click chọn Old and New Values…. Tại khung Output Variable.S Phạm Lê Hồng Nhung 3.

Ta lần lượt khai báo giá trị cũ bên tay trái (Old Value) thành giá trị mới bên tay phải (New Value)  Click chọn Add sau mỗi lần khai báo. 8.Range. Chọn Continue trở về hộp thoại trước. LOWEST through value: một khoảng giá trị từ giá trị nhỏ nhất đến một giá trị được nhập vào . và chọn OK để hoàn tất kệnh. Với giá trị cũ có các dạng sau đây: Value: từng giá trị cũ rời rạc System-missing: giá trị khuyết hệ thống System or user missing: giá trị khuyết của hệ thống hoặc do người sử dụng định nghĩa . 37 .S Phạm Lê Hồng Nhung 6.Hướng dẫn thực hành SPSS cơ bản GV: Th. Khai báo value cho biến vừa tạo tại ô Value của cửa sổ Variable View như hình sau: 9. value through HIGHEST: một khoảng giá trị từ giá trị nhập vào đến giá trị lớn nhất 7.Range: một khoảng giá trị (từ … đến … / range: … through: …) .Range. Tiếp tục thực hiện các phép thống kê mô tả hay kiểm định dựa trên biến mới vừa tạo nhằm phục vụ cho mục tiêu nghiên cứu.

38 . Ví dụ: kết quả sau khi tiến hành phân tích nhân tố như sau KẾT QUẢ PHÂN TÍCH NHÂN TỐ KẾT QUẢ SAU KHI COMPUTE VÀ THỐNG KÊ MÔ TẢ Với N1. N3 là ký hiệu mã hoá cho 3 nhóm được gom từ 12 biến đánh giá chất lượng dịch vụ. Sau khi tiến hành gom nhóm các yếu tố có cùng tính chất. ANOVA hay phân tích hồi quy liên quan đến các tiêu chí đánh giá chất lượng dịch vụ này. ta sẽ tính toán giá trị của nhóm bằng thủ tục Compute này. Nếu những bước tiếp theo của đề tài cần thực hiện kiểm định t. Đặc biệt đối với những đề tài có sử dụng phân tích nhân tố để gom nhóm.S Phạm Lê Hồng Nhung CÁCH TÍNH TOÁN GIÁ TRỊ BIẾN MỚI TỪ BIẾN CÓ SẴN Có thể sử dụng SPSS để cộng. N2.Hướng dẫn thực hành SPSS cơ bản GV: Th. Vì vậy. thủ tục tính toán này thường được tiến hành sau khi đã chỉnh lý dữ liệu. nhân chia các biến đã có sẵn để trở thành 1 biến mới (thủ tục TransformCompute). Thủ tục tính toán này được sử dụng khá nhiều trong phân tích số liệu. trừ. chúng ta sẽ không dùng 12 biến để thực hiện mà dùng nhóm lớn (3 nhóm). Tuy nhiên biến mới được tính toán này không tự động thay đổi nếu ta thay đổi các biến thành phần như công cụ tính toán trong Excel.

xuất hiện hộp thoại sau: PHÍM CÔNG CỤ CHO CÁC PHÉP TÍNH MŨI TÊN ĐƯA BIẾN VÀO Ô CÔNG THỨC 39 .S Phạm Lê Hồng Nhung Để tính được giá trị cho các nhóm lớn (bằng trị trung bình của các biến trong nhóm) nhằm phục vụ cho mục đích kiểm định t.Hướng dẫn thực hành SPSS cơ bản GV: Th. sau khi phân tích nhân tố ta có được 3 nhóm. Mã hoá biến mới (nhóm lớn) Đối với ví dụ trên. Tiến hành tính toán cho nhóm Vào menu Transform  Compute Variables. chúng ta sẽ thao tác trong SPSS theo trình tự như sau 6. vậy ta sẽ tiến hành mã hoá 3 biến mới (đại diện cho 3 nhóm) trong bộ số liệu đã có tại cửa sổ Variable View. 7. ANOVA hay phân tích hồi quy.

chia. hiệu số. và N3 này.6. Chú ý cần nhập đúng tên đã khai báo ở bước 1. Thao tác tương tự nếu chúng ta cần các phép tính nhân. 5. Lệnh compute đã giúp ta tính toán được nhóm lớn (3 nhóm) cho từng quan sát (từng đối tượng nghiên cứu một) GIÁ TRỊ CỦA BIẾN N1. nhóm 1 gồm 5 biến 5. Tại ô Numberic Expression. ta tiếp tục chọn OK. VÀ N3 CHO QUAN SÁT 1 Chúng ta có thể thực hiện lệnh thống kê mô tả (tính trị trung bình của các nhóm trên tổng mẫu quan sát – kết quả 2 cột cuối cùng ở VD trang 1). ta nhập vào tên biến mới sẽ chứa giá trị tính toán (tên biến của nhóm). Sau đó chọn nút OK để hoàn tất lệnh.S Phạm Lê Hồng Nhung Tại ô Target Variable. 5. ************************ CHÚC THÀNH CÔNG ************************ 40 . ta nhập công thức tính toán cho biến mới. một hộp thoại xuất hiện để xác định quá trình tính toán biến. và sử dụng các phím công cụ cho phép tính trong cửa sổ này hoặc trên bàn phím máy vi tính.1.Hướng dẫn thực hành SPSS cơ bản GV: Th. Cách nhập công thức tại ô này như sau: ta chọn biến từ khung chứa các biến rồi dùng dấu mũi tên đưa biến vào ô công thức. ANOVA hay phân tích hồi quy (đối với nhà nghiên cứu thuộc trường phái đồng ý trị trung bình làm biến độc lập X) trên 3 biến N1.7. Trong ví dụ trên. N2.8 và 5. hay kết hợp nhiều phép tính.9. kiểm định t. Kết quả sau khi compute sẽ thể hiện rõ tại cửa sổ Data View. 5. N2. Như vậy biến mới (N1) sẽ bằng trung bình của 5 biến. ta tính trị trung bình. Trong ví dụ này. Đến đây thao tác tính toán biến đã hoàn thành.