You are on page 1of 48

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

I. Các khái niệm và thao tác cơ bản ........................................................................... 2


A. Chạy SPSS và đóng SPSS 2
B. File dữ liệu 2
C. Các loại file chính 3
D. Mở file, lưu file, đóng file 3
E. Cửa sổ biến và cửa sổ dữ liệu 4
F. Cách tạo một biến mới 5
G. Quy định kiểu. Type 5
H. Quy định độ rộng (dài). Width 6
I. Số chữ số thập phân. Decimal 7
J. Nhãn của biến. Label 7
K. Nhãn của giá trị. Values 7
L. Dữ liệu bị thiếu. Missing 7
M. Độ rộng của cột. Column 8
N. Canh dòng. Alignment 8
O. Thang độ đo. Measure. 8

II. Nhập, sửa dữ liệu ..................................................................................................... 9


A. Nhập 9
B. Sửa 9
C. Hủy việc nhập hoặc sửa 9
D. Chọn các ô 10
E. Chọn cả cột 10
F. Chọn cả hàng 10
G. Xóa dữ liệu 10
H. Xóa một hàng (1 trường hợp) 10
I. Xóa một cột (1 biến) 10
J. Copy dữ liệu 10
K. Cắt dữ liệu 11
L. Di chuyển vị trí các biến 11

III. Các thao tác chung ............................................................................................. 12


A. Hủy lệnh mới làm 12
B. Lấy lệnh đã hủy 12
C. Lưu các sửa đổi 13
D. Câu hỏi 13
E. Bài tập: 13
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

IV. Mã hóa lại (recode).............................................................................................. 15


A. Recode lại chính X 15
B. Recode qua một biến khác 18
C. Giải thích thêm về Old Value và New Value 22

V. Tính toán dữ liệu (compute) .................................................................................. 25


A. Ghi chú về cách gõ công thức 28

VI. Sắp xếp ................................................................................................................ 29

VII. Chọn các trường hợp ......................................................................................... 30


A. Chọn các trường hợp thỏa mãn điều kiện nào đó 30
B. Hủy chọn 33

VIII. Tần suất (frequency) ........................................................................................... 33


A. Riêng biệt Error! Bookmark not defined.
B. Tính tần suất của biến này trong biến kia 36

IX. Lặp lại lệnh đã thực hiện .................................................................................... 36


A. Gọi lại lệnh bằng Recall 36
B. Lưu lệnh bằng file syntax 37

X. Chương III: Thống kê mô tả..........................................Error! Bookmark not defined.

I. Các khái niệm và thao tác cơ bản

A. Chạy SPSS và đóng SPSS

B. File dữ liệu
Dữ liệu được lưu vào file có đuôi là sav.

Hình 1. Các file dữ liệu của SPSS


Cách lưu file dữ liệu:
File
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Save
Đặt tên file
Bấm nút Save

File sẽ có đuôi là sav

C. Các loại file chính

1. File dữ liệu (data)


Như đã nói ở trên.

2. File kết quả (output)


Là file chứa kết quả sau khi phân tích.

3. File cú pháp (syntax)


Là file chứa các dòng lệnh.

D. Mở file, lưu file, đóng file


Mở:
File
Open
Lưu
File
Save
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Đóng
File
Close

E. Cửa sổ biến và cửa sổ dữ liệu

1. Các khái niệm


Variable: Biến. một tính chất của các trường hợp cần nghiên cứu: mã, tuổi, giới, tình trạng hôn
nhân…
Case: một trường hợp trong nghiên cứu, ví dụ : mỗi người bệnh là một trường hợp…
Case còn được gọi là một quan sát (Observation).

Hình 2. Case  Hàng ; Variable  Cột

2. Cửa sổ biến
Dùng để định nghĩa các biến (tên biến, kiểu là số hay chữ…).
Bấm chuột vào Variable View ở dưới

Cửa sổ biến như sau:

Name: Tên biến


Type: Kiểu là số (numeric) hay chuỗi chữ (string)
Width: Độ rộng của chuỗi chữ hay độ lớn của số.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Decimals : Số chữ số thập phân.


Label : Nhãn của biến (để dễ hiểu hơn) và nó sẽ xuất hiện trong các phân tích Phân biệt với
tên biến.
Values : Định nghĩa nhãn cho từng giá trị (để dễ hiểu hơn), ví dụ 0 là DB, 1 là MN. Phân biệt
với giá trị thực của các biến.
Missing : Xử lý các trường hợp không có dữ liệu.

F. Cách tạo một biến mới

1. Đặt tên. Name


Vào cửa sổ biến
Gõ tên vào cột Name.
Quy tắc:
Không quá 8 ký tự. Không có dấu cách. Không bắt đầu bằng con số.
Thông báo khi đặt tên sai:

Hình 3. “Biến chứa ký tự đầu tiên không hợp lệ”

Hình 4. “Biến chứa ký tự không hợp lệ”


 Ghi chú: Nên cân nhắc khi đặt tên biến. Tên biến có thể dựa vào mã của bảng điều
tra, chẳng cau1, cau2… để việc nhập dữ liệu được thuận lợi. Nhất thiết phải dùng
Label để tránh nhầm lẫn.

 Tên biến là Cau1, Label là Gioi tinh Tên biến là Cau2, Label là Tuoi

G. Quy định kiểu. Type


Ban đầu biến mặc nhiên có kiểu là Numeric.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Để đổi kiểu, bấm vào nút chấm chấm bên cạnh:

Xuất hiện cửa sổ để chọn kiểu

Chọn kiểu và bấm OK.


 Ghi chú:
 1) Kiểu số nhập nhanh hơn và không gây nhầm lẫn bằng kiểu chuỗi chữ.
 Nghĩa là trong khi thu thập số liệu nên mã hóa trước bằng số
 Ví dụ nghề nghiệp có thể mã hóa thành
 1- Nông 2-Buôn bán 3- Công chức
 Còn để diễn giải các giá trị để dễ hiểu ta dùng tính chất Values để gán nhãn cho các
giá trị.
 2) Trong khi phân tích SPSS sẽ kèm theo một hình để ta biết đó là biến số hay biến ký
tự

 Trong hình trên ta biết Ma bn [id] là kiểu số. Dia chi [diachi] là kiểu chuỗi.

H. Quy định độ rộng (dài). Width


Gõ con số vào cột Width.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Ví dụ chuỗi có giá trị là 8 thì người nhập không gõ tiếp được chữ số thứ 9 nếu số chữ đã gõ đã
đến 8.

I. Số chữ số thập phân. Decimal


Gõ con số vào Decimal
Ví dụ biến tuổi, biến huyết áp tối đa nên có Decimal là 0. Cân nặng (kg) có decimal là 1
Chiều cao (m) có decimal là 2, nhưng tính bằng cm thì có decimal là 0 (?).

J. Nhãn của biến. Label


Gõ tên nhãn vào cột Label.
 Ghi chú: Nhãn sẽ xuất hiện kèm theo, hoặc thay thế tên biến trong các thao tác, đặc
biệt là kết quả phân tích.

K. Nhãn của giá trị. Values


Giả sử muốn quy ước giá trị 0 là Nam, 1 là Nữ cho biến c2

Bấm vào nút ở cột Values.


Gõ Value là 0 (sẽ là giá trị nhập vào).
Gõ Value Label (sẽ là nhãn của giá trị 0).
Bấm vào nút Add.

Gỡ bỏ nhãn đã có : Chọn nhãn, bấm Remove.
Sửa nhãn đã có : Chọn nhãn, bấm Change.
 Ghi chú : Phân biệt giá trị và nhãn của giá trị. Người dùng phải nhập 0, 1 mà không
nhập Nam, Nu nhưng khi phân tích thì xuất hiện là Nam, Nu.

L. Dữ liệu bị thiếu. Missing

1. System missing
Nếu không nhập thì ô bị trống (có dấu chấm nếu là số).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Hình 5. Hàng thứ nhất và thứ ba ở cau4 là system missing.

2. User missing
Biến nhận giá trị nhưng ta cho là missing.
Ví dụ:
Câu 10: Theo Anh, Chị chương trình học là:
1- Quá nặng 2-Vừa phải 3- Rất nhẹ 4-Không trả lời.
Có hai kiểu missing xảy ra:
Câu này không được ghi nhận (không nhập liệu, vì không đánh dấu vào lựa chọn nào cả); tức
là xem như bỏ sót câu này. Đây là system missing
Người được phỏng vấn từ chối trả lời và lựa chọn 4 được ghi nhận.
Khi phân tích ta có thể xem 4 là giá trị missing. Đây là user missing.

M. Độ rộng của cột. Column


Là độ rộng để hiển thị của cột trong cửa sổ Data View. Không liên quan đến độ rộng (width)
của biến.

N. Canh dòng. Alignment

O. Thang độ đo. Measure.

Hình 6. Các loại thang độ đo


Scale: Nhận các con số liên tục (có thể xếp thứ tự, có thể đánh giá lớn hơn, nhỏ hơn, ví dụ
huyết áp, chiều cao…)
Nominal: Định danh (không có thứ bậc, ví dụ giới tính)
Ordinal: Định danh nhưng có thứ bậc, ví dụ: Thu nhập thấp, thu nhập trung bình, thu nhập
cao. Học lực giỏi, học lực trung bình, học lực kém
Chú ý:
Cần xác định rõ thang độ đo của biến vì các phân tích bao giờ cũng kèm theo điều kiện biến
đưa vào là theo kiểu gì.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

 Biến có kiểu số chưa chắc là Scale, đó là các trường hợp dùng cách mã hóa. Chẳng
hạn nếu quy ước 1 là nam 2 là nữ, thì biến sẽ nhận giá trị 1, 2. Nhưng biến này là
kiểu Nominal (định danh không thứ bậc), nói cách khác ở đây ta không thể cho là 2
lớn hơn 1 và ngược lại không thể cho là 1 nhỏ hơn 2.
 Có một loại gọi là Dischotomous (nhị nguyên) chỉ nhận hai giá trị, là 0 và 1. Loại
biến này hay gặp để diễn tả một tính chất chỉ có hai giá trị (có bệnh hay không có
bệnh, nam hay nữ, có gia đình hay không có gia đình)…

II. Nhập, sửa dữ liệu


Chuyển qua cửa sổ dữ liệu
Bấm nút Data View.

A. Nhập
Nhập vào ô,
Bấm enter hoặc bấm nút mũi tên.

B. Sửa
Chọn ô muốn sửa.
Bấm F2 và sửa.
Phân biệt giữa việc sửa và nhập:
Khi nhập thì giá trị cũ của ô sẽ biến mất.
Khi sửa thì giá trị cũ của ô còn đó, ta chỉ sửa mà thôi.

C. Hủy việc nhập hoặc sửa


Bấm phím Esc
Dữ liệu trở về như cũ (hoặc trống, nếu trước đó chưa có).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

D. Chọn các ô
Nhấn phím Shift.
Bấm phím mũi tên theo chiều thích hợp.

E. Chọn cả cột
Đưa chuột lên đầu cột
Bấm chuột

F. Chọn cả hàng
Đưa chuột ra đầu hàng.
Bấm chuột.

G. Xóa dữ liệu
Chọn ô (hoặc nhiều ô) muốn xóa.
Bấm phím Delete.

H. Xóa một hàng (1 trường hợp)


Chọn hàng muốn xóa.
Bấm phím Delete.
Ghi chú: Xóa một hàng là xóa cả một trường hợp (case). Xóa các ô (đã có dữ liệu) của một
hàng chỉ có nghĩa là xóa dữ liệu của trường hợp đó, nhưng trường hợp này vẫn còn (vẫn còn
được tính trong các phân tích).

I. Xóa một cột (1 biến)


Chọn cột muốn xóa.
Bấm phím Delete.
Ghi chú:
Xóa một cột là xóa cả một biến, đương nhiên dữ liệu kèm theo biến đó cũng bị mất luôn. Xóa
các ô (đã có dữ liệu) của một cột chỉ có nghĩa là xóa dữ liệu của biến đó, nhưng biến này vẫn
còn.

J. Copy dữ liệu
Chọn ô (hoặc nhiều ô) muốn copy.
Bấm Ctrl + C
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

K. Cắt dữ liệu
Chọn ô (hoặc nhiều ô) muốn cắt.
Bấm Ctrl + X (dữ liệu sẽ biến mất).
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Ghi chú:
Động tác này được xem như chuyển chỗ.

L. Di chuyển vị trí các biến


Vào cửa sổ Variable View
Bấm chọn một hàng
Nhấn giữ chuột
Kéo chuột lên trên hoặc xuống.
Ví dụ sau chuyển biến “tuoi” lên trên biến “gioi”

Ghi chú:
Có thể thực hiện việc này ở cửa sổ Data View nhưng lúc này lại chọn cả cột và kéo qua trái
hoặc phải.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

III. Các thao tác chung

A. Hủy lệnh mới làm


Bấm chuột vào nút Undo.

B. Lấy lệnh đã hủy


Bấm chuột vào nút Redo
Ví dụ:
1. Nhập 9
2. Nhập 10

Undo lần đầu (hủy thao tác nhập 10)

Undo lần nữa: (hủy thao tác nhập 9)


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Redo một lần: lấy lại thao tác mới hủy, tức thao tác nhập 9, kết quả là:

Redo lần nữa: lấy lại thao tác đã hủy tiếp đó tức là thao tác nhập 10, kết quả là

 Ghi chú: Không phải lệnh nào cũng undo được.

C. Lưu các sửa đổi


Nếu dữ liệu thay đổi thì phải lưu (nếu muốn) bằng cách bấm Ctrl + S
Ghi chú về bài tập: Nghiên cứu 200 bệnh nhân được chẩn đoán là cao huyết áp vô căn. Mục
tiêu nghiên cứu là đánh giá tỉ lệ mắc bệnh và các yếu tố liên quan, số liệu được lấy từ phiếu
khám (xem bảng số liệu).

D. Câu hỏi

E. Bài tập:
1) Chạy SPSS
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2) Lưu file với tên là HA


3) Chọn Variables View và
Tạo các biến sau
Tên biến Kiểu Độ rộng Số số lẻ Nhãn biến Nhãn giá trị
ID Số 8 0 Ma bn
Cau1 Số 8 0 Gioi tinh 0: Nam
1: Nu
Cau2 Số 8 0 Tuoi
Cau3 Chữ 10 0 Dia chi
Cau4 Số 8 0 Nghe nghiep 0: Nong
1: Cong nhan
2: Buon ban
3: CNVC
Cau5 Số 8 1 Chieu cao
Cau6 Số 8 1 CanNang
Cau7 Số 8 0 HA tam thu
Cau8 Số 8 0 HA tam truong

4) Vào Data View và


Nhập 20 dữ liệu sau:

5) Nhận xét về biến Cau3 (Địa chỉ)


6) Đóng file lại
7) Đóng SPSS
8) Chạy lại SPSS
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

9) Mở file HA nói trên.

IV. Mã hóa lại (recode)


Recode là công đoạn cần làm sau khi nhập dữ liệu, vì các lý do sau:
- Dữ liệu nhập bị nhầm.
- Nhóm các dữ liệu thành các nhóm, ví dụ quy định các nhóm tuổi dựa vào tuổi cụ thể
của mỗi người.
Khi recode một biến X thì có thể:
- Recode lại chính X: Thay đổi luôn dữ liệu của biến X. Trường hợp này có thể xem
Recode là thao tác thay đổi dữ liệu hàng loạt.
- Recode và đưa dữ liệu mới vào biến mới Y, (X vẫn như cũ).

A. Recode lại chính X


Giả sử, ở biến Cau3 ta cần đổi T Binh thành TB, Duy xuye thành DX…
Transform
Recode
Into Same Variables

Bấm chọn biến Cau3


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm nút mũi tên, biến DiaChi[cau3] xuất hiện bên phải.

Bấm chọn Old and New Values.


Gõ giá trị cũ ở khung Old Value và giá trị mới khung New Value.

Bấm nút Add thì ở khung Old  New có dòng ‘Duy Xuye’  ‘DX’ cho biết giá trị cũ Duy
Xuye sẽ thành giá trị mới DX.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Làm tương tự với các giá trị khác

Nếu không muốn tiến hành đổi một giá trị nào đó thì bấm ở khung Old  New và chọn
Remove.

Sau khi xác định các giá trị cần đổi. Bấm Continue.
Bấm OK
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

B. Recode qua một biến khác


Recode biến X thành biến Y. X vẫn như cũ. Nên sử dụng cách này vì 2 lý do :
- Giữ lại dữ liệu gốc. Nếu Recode nhầm X thì có nguy cơ không truy lại được dữ liệu
gốc.
- Recode chỉ có mục đích phân nhóm, chẳng hạn recode tuổi thành các nhóm tuổi, thì
tuổi vẫn nên giữ lại, để sử dụng phân tích sau này (chẳng hạn tính tuổi trung bình, lớn
nhất, nhỏ nhất v.v…).
Giả sử, ta cần phân nhóm tuổi theo quy định sau :
1- 19 gộp thành nhóm 1
20-29 gộp thành nhóm 2
30-39 gộp thành nhóm 3
40-49 gộp thành nhóm 4
50-59 gộp thành nhóm 5
60-69 gộp thành nhóm 6
70 trở lên gộp thành nhóm 7
Ta sẽ Recode biến Cau2 và phân thành nhóm vào biến mới gọi DoTuoi.
Transform
Recode
Into Different Variables

Chọn Tuoi[cau2]
Bấm nút mũi tên
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Trong Output Variable (biến đầu ra) gõ DoTuoi. Bấm nút Change.

Lúc này dòng cau2  ? sẽ trở thành cau2  Dotuoi, nghĩa là dữ liệu (độ tuổi) sẽ được vào
biến mới là Dotuoi
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm nút Old and New Values…


a) Đổi từ 1 đến 19 vào nhóm 1:
Old Value:
Bấm nút Range (dãy), Gõ 1 (through, đến) 19
New Value:
Bấm nút Value, Gõ 1

Bấm nút Add.


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Trong khung Old  New ta có dòng 1 thru 20  1 có nghĩa là các giá trị 1 đến 20 ở biến
Cau2 sẽ được chuyển thành 1 ở biến Dotuoi.
v.v…
Tiếp tục làm như vậy cho các nhóm khác

Riêng nhóm cuối cùng (từ 70 trở lên) thì:


Old Value:
Bấm chọn Range (ở through highest) và gõ 70,
New Value
Chọn Value gõ 7.
Nghĩa là dãy từ 70 đến các số lớn hơn, được quy thành nhóm 7 trong Dotuoi
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm Continue.
Bấm OK.
Lưu ý: Khi recode xong thì hai biến không còn liên hệ gì với nhau. Ví dụ ban đầu tuổi bệnh
nhân (biến Tuoi) là 30, ta ra lệnh recode qua biến DoTuoi là nhóm 3. Thì sau này nếu có sửa
tuổi thành 50 (DoTuoi là 5) thì phải Recode lại. Kinh nghiệm cho thấy là các lệnh Recode nên
lưu lại trong file syntax để sau này chạy lại cho nhanh.
Xem mục Lặp lại lệnh.

C. Giải thích thêm về Old Value và New Value

1. Đổi 1 giá trị Old Value cụ thể thành 1 giá trị New Value
Recode giá trị 1 (old value) ở biến X thành 2 (new value) ở biến Y
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2. Đổi các giá trị Old Value trong một giới hạn thành 1 giá trị New Value.
Recode các giá trị từ 10 đến 20 (old value) ở biến X thành 3 (new value) ở biến Y

3. Đổi các giá trị Old Value nhỏ hơn một giới hạn thành 1 giá trị New
Value
Recode các giá trị nhỏ hơn hoặc bằng 30 (old value) ở biến X thành 7 (new value) ở biến Y

4. Đổi các giá trị Old Value từ một giới hạn trở lên thành 1 giá trị New
Value
Recode các giá trị từ 70 (old value) trở lên ở biến X thành 9 (new value) ở biến Y
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

5. Đổi tất cả các giá trị Old Value còn lại thành 1 giá trị New Value.
Ví dụ: Ta có các huyện (biến DiaChi) sau: TM, TP, TK, DX, DL
Ta quan tâm đến 2 vùng miền núi và đồng bằng.
Cách nhanh nhất là Recode vào biến Vung bằng cách:
Đổi TM, TP thành MN.
Các giá trị còn lại là DB

6. Biến mới (new value) là biến chuỗi


Ban đầu, biến mới mặc định là biến số.
Muốn cho ra biến chuỗi, Ví dụ:
Dưới 20 gộp thành nhóm có tên ‘Duoi 20’ thay vì là nhóm 1
20-29 gộp thành nhóm có tên là ‘20 den 29’ thay vì là nhóm 2
v.v…
ta phải chọn Output Variables are string, và gõ độ dài của biến vào ô Width.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bài tập 2:
1) Chạy SPSS
2) Mở file Cao huyet ap
3) Recode lại dữ liêu của biến cau3 thành các tên tắt của Huyện cho vào biến diachi1
4) Xóa biến diachi1.
5) Đổi tên biến diachi1 thành cau3.
6) Phân các nhóm tuổi thành 2 loại cho vào biến Tuoi1 với quy định dưới 50 là nhóm 0 và
từ 50 trở lên là nhóm 1.
7) Chuyển vị trí biến Tuoi1 cho nằm bên cạnh biến cau2.
8) Phân các nhóm tuổi thành các loại cho vào biến Tuoi2 với quy định sau:
Dưới 20 gộp thành nhóm có tên ‘Duoi 20’
20-29 gộp thành nhóm có tên là ‘20 den 29’
30-39 gộp thành nhóm có tên là ‘30 den 39’
40-49 gộp thành nhóm có tên là ‘40 den 49’
50-59 gộp thành nhóm có tên là ‘50 den 59’
60-69 gộp thành nhóm có tên là ‘60 den 69’
70 trở lên gộp thành nhóm có tên là ’70 tro len’
9) Lưu file và thoát SPSS

V. Tính toán dữ liệu (compute)


Đôi khi cần phải tạo ra các biến mới, dựa trên dữ liệu của một hay nhiều biến cũ, nhưng giá trị
mới là một biểu thức phức tạp thì không dùng Recode mà phải dùng Compute.
Ví dụ: Cần tạo ra biến mới là BMI (chỉ số khối cơ thể) dựa trên Cân nặng và Chiều cao của
mỗi đối tượng nghiên cứu.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

BMI = (cân nặng)/(chiều cao)2


Ta làm như sau.
Transform
Compute…

Gõ tên biến mới vào Taget Variable

Trong khung Numeric Expression gõ công thức để đưa vào biến


BMI:
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Gõ OK.
Ví dụ 2: Tạo biến mới là CaoHA với quy định
CaoHA là 1 nếu HA tối đa (cau7) >140 hoặc HA tối thiểu (cau8) >90
Numeric Expression cho CaoHA là
Cau7>140 | Cau8>90
Biểu thức trên gọi là biểu thức logic hoặc. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó
sai.
Biểu thức logic hoặc này đúng khi chỉ cần 1 trong 2 phép so sánh Cau7>140 hoặc Cau8>90
đúng.
Ví dụ 3: Tạo biến mới là CaoTT (chỉ cao HA tâm thu, tâm trương bình thường) với quy định
CaoTT là 1 nếu HA tối đa (cau7) >140 và HA tối thiểu (cau8) <= 90
Numeric Expression cho CaoHA là
Cau7>140 & Cau8>90
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Biểu thức trên gọi là biểu thức logic và. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó sai.
Phép và này chỉ đúng khi cả 2 phép so sánh Cau7>140 và Cau8>90 là đúng.

A. Ghi chú về cách gõ công thức


Công thức gồm các biến, các phép toán số học, các hàm.
+ Cộng
- Trừ
* Nhân
/ Chia
** Lũy thừa
| Phép hoặc (đúng khi chỉ cần 1 cái đúng)
& Phép và (đúng khi tất cả đều đúng)
Bài tập 3:
1) Chạy SPSS
2) Mở file Cao huyet ap
3) Tạo biến mới BMI để tính chỉ số khối của cơ thể
4) Tạo biến mới CaoHA, với 1 là chẩn đoán có cao HA và 0 là không.
5) Tạo biến mới CaoTT với 1 chỉ cao HA tâm thu (mà không cao tâm trương), 0 là không.
6) Tạo biến mới CaoTTr với 1 chỉ cao HA tâm trương (mà không cao tâm thu), 0 là
không có.
7) Tạo biến mới Cao2 với chẩn đoán là cao cả hai HA tâm thu và tâm trương.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

VI. Sắp xếp


Sắp xếp theo thứ tự theo một hoặc nhiều biến. Giả sử ta muốn sắp xếp dữ liệu theo thứ tự tuổi
(tăng dần: ascending), rồi đến huyết áp tâm thu (giảm dần: descending).
Data
Sort Cases…

Trong cửa sổ Sort Cases bấm chọn tuổi

Bấm nút mũi tên để đưa qua khung Sort by:

Sau đó chọn tiếp HA tam thu (cau7) bấm qua. Chọn Descending.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm OK thì SPSS sẽ xếp theo tuổi từ nhỏ đến lớn, nếu cùng tuổi thì xếp theo HA tâm thu (từ
lớn xuống).

VII. Chọn các trường hợp

A. Chọn các trường hợp thỏa mãn điều kiện nào đó


Trường hợp chỉ cần quan tâm tới một số trường hợp (case) thỏa mãn điều kiện nào đó để phân
tích thì ta dùng lệnh Select Cases. Sau khi dùng lệnh này, thì các lệnh phân tích sẽ chỉ tính
toán trên các trường hợp đã chọn. Ví dụ sau khi chọn các trường hợp có tuổi dưới 40 và tính
trung bình của chiều cao, thì chiều cao này là chiều cao của các trường hợp đó, mà bỏ qua các
trường hợp khác (có tuổi từ 40 trở lên).
Ví dụ ta chọn các trường hợp có tuổi dưới 40 như sau:
Data
Select Cases…

Ban đầu ta thấy dấu All cases được chọn, nghĩa là tới lúc này tất cả các trường hợp đều được
tính đến.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm chọn If condition is satisfied (nếu điều kiện được thỏa mãn)

Bấm nút If…


Xuất hiện khung như trong trường hợp Compute (xem lại cách ghi biểu thức).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Gõ biểu thức.
Bấm Continue.
Lúc này cửa sổ Select Cases bên cạnh nút if có ghi biểu thức trên.

Bấm OK.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Các trường hợp dưới 40 tuổi đã được chọn, số thứ tự không bị gạch chéo, các trường hợp bị
gạch chéo sẽ được xem như không có trong dữ liệu.

B. Hủy chọn
Data
Select Cases…
Chọn lại All Cases.

VIII. Tần suất (frequency)

A. Nhắc lại
Là số lần xuất hiện của các giá trị
Mã Giới tính
01 Nam
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

02 Nu
03 Nam
04 Nam
05 Nu
06 Nu
07 Nu
Frequency của Giới tính:
Nam: 3
Nu: 4

B. Thực hiện
Analyze
Tables
Tables of frenquency

1. Tính tần suất riêng cho từng biến


Chọn biến muốn tính tần suất. Bấm nút mũi tên qua phải
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Chọn nút Layout…

Chọn Count Display (để hiển thị số lượng), chọn Percents Display (để hiển thị %)
Bấm Continue.
Bấm OK.
Kết quả:
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

 Ghi chú: Có thể tính tần suất của nhiều biến cùng một lần.

2. Tính tần suất của biến này trong biến kia


Muốn tính tần suất của biến này trong biến kia, ví dụ, tính tần suất của Nghe nghiep, sau đó
trong mỗi nghề nghiệp, ta tính nam bao nhiêu nữ bao nhiêu thì làm như sau:
Khi xuất hiện cửa sổ Table of frequencies sau khi chọn Nghe nghiep để đưa qua Frequency
for, sau đó chọn Gioi tinh để đưa qua Subgroup, in each tables: (nhóm phụ trong mỗi bảng)

Kết quả:

IX. Lặp lại lệnh đã thực hiện


Thường thì thực hiện một lệnh phải tốn nhiều nhiều thao tác: như bấm chọn menu, chọn các
biến, chọn các thông số v.v…
Có hai cách để thực hiện lại một cách nhanh chóng những lệnh đã làm là dùng nút Recall hay
lưu lại lệnh trong một file syntax

A. Gọi lại lệnh bằng Recall


Chọn nút Dialog Recall.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Hiện ra danh sách các lệnh đã dùng. Chọn lệnh muốn thực hiện lại.

B. Lưu lệnh bằng file syntax


Để lưu lại một lệnh ta làm như sau:
Sau khi thực hiện việc chọn các biến, tham số… ta bấm nút Paste

Xuất hiện cửa sổ syntax:


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Ta bấm nút lưu và đặt tên file.

Sau này muốn chạy lại lệnh ta làm như sau:


File
Open
Syntax…

Bấm chọn file syntax đã lưu


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Xuất hiện (các) dòng lệnh trong file này:

Nếu muốn chạy lệnh này thì ta bấm vào nút mũi tên.

X. Kiểm định tỉ lệ
Mục đích: Xác định tỉ lệ của các nhóm có bằng nhau hay không hay phù hợp với các tỉ lệ đã
định trước hay không.
 Giả thiết H0 : các nhóm trong một biến có tỉ lệ bằng nhau
 Tiến hành Chi-square test.
 Căn cứ vào Asym. Sig (p-value) nếu nhỏ hơn 0.05 : bác bỏ H0- nếu lớn hơn có thể kết
luận tỉ lệ các nhóm là bằng nhau
Ví dụ 1 : Khảo sát 100 học sinh ta có 58 nam, 42 nữ. Số nam lớn hơn số nữ (trong mẫu của
chúng ta); nhưng kết luận này có ý nghĩa thống kê hay không ?
H0 : tỉ lệ nam bằng tỉ lệ nữ (hoặc tỉ lệ nam :nữ là 50 :50)
Ví dụ 2 : Theo một lý thuyết, bài kiểm tra nên có 25% học sinh đạt điểm kém, 50% đạt điểm
trung bình và 25% đạt điểm giỏi. Khảo sát của chúng ta trên một bài kiểm tra cụ thể có 10 học
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

sinh đạt điểm kém, 17 học sinh đạt điểm trung bình và 9 học sinh đạt điểm giỏi. Kết quả này
có phù hợp với lý thuyết hay không ?
H0 : Tỉ lệ điểm trong khảo sát của ta theo cơ cấu 25 :50 : 25

A. Kiểm định các tỉ lệ có bằng nhau hay không


Ví dụ : Tỉ lệ các nghề nghiệp có bằng nhau không ?
Analyze
Non-parametric test
Chi-Square

Chọn biến để đưa qua


Chọn All categories equal (các nhóm bằng nhau)
OK

Kết quả :
Nghe nghiep

Observed N Expected N Residual


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Nong dan 40 50.0 -10.0


Cong nhan 53 50.0 3.0
Buon ban 57 50.0 7.0
CNVC 50 50.0 .0
Total 200

Test Statistics

Nghe nghiep
Chi-Square(a) 3.160
Df 3
Asymp. Sig. .368

Diễn giải:
Observed N: số lượng quan sát
Expected N: tần suất mong đợi (tần suất theo giả thiết H0)
Chi-Square: thống kê Chi-Square.
Df: bậc tự do.
Asymp. Sig: giá trị p-value: xác suất để giả thiết đúng
Giả thiết H0 : tỉ lệ các nghề nghiệp là bằng nhau.
Asymp. Sig: xác suất để giả thiết đúng là 0.368 khá lớn (lớn hơn 0.05), nói cách khác:
- có nhiều khả năng tỉ lệ các nghề nghiệp là bằng nhau hoặc:
- các nghề nghiệp khác nhau không có ý nghĩa thống kê.
Nếu Asymp. Sig nhỏ hơn 0.05 ta kết luận là tỉ lệ nghề nghiệp khác nhau có ý nghĩa thống kê.

B. Kiểm định tỉ lệ các nhóm có khác với cơ cấu tỉ lệ cho trước


Ví dụ : Nghiên cứu trên 150 bệnh nhân, ta thấy số mắc bệnh X là 50 người. Tỉ lệ là 50/150 =
30%. Tỉ lệ của một tác giả khác là 20%. Tỉ lệ mắc bệnh của ta có cao hơn có ý nghĩa thống kê
hay không ?
Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20
Giả sử biến MacBenh được mã hóa là : 0 : không có bệnh, 1 : có bệnh.
Tiến hành Chi square test như trên, nhưng thay vì chọn All categories equal (tức là tỉ lệ không
có bệnh :có bệnh là 50 :50) ta sẽ chỉ định SPPS tiến hành kiểm định với tỉ lệ không có bệnh :
có bệnh là 80 :20)
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Chọn Values và gõ giá trị 0.2 ; chọn nút Add.


Lại gõ giá trị 0.8 ; chọn nút Add

Cẩn thận : Không mắc bệnh là 0.


Mắc bệnh là 1.
Thứ tự là 0 rồi mới đến 1. Do đó phải đưa giá trị 0.8 (tỉ lệ không mắc) trước 0.2 (tỉ lệ mắc)
Kết quả :
MACBENH

Observed N Expected N Residual


.00 50 160.0 -110.0
1.00 150 40.0 110.0
Total 200
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Test Statistics

MACBENH
Chi-
378.125
Square(a)
Df 1
Asymp. Sig. .000
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 40.0.

Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20


Asymp Sig. là .000  bác bỏ H0; nói cách khác tỉ lệ mắc bệnh của ta khác tác giả kia (trong
trường hợp này là lớn hơn) với mức ý nghĩa nhỏ hơn 0.01.
Trở lại ví dụ về cơ cấu điểm bài thi.
Nếu mã hóa : 1 : kém ; 2 : trung bình ; 3 : giỏi
Giả thiết H0 : Cơ cấu tỉ lệ 1 :2 : 3 là 25 :50 :25
Khi tiến hành ta phải chọn các value là lần lượt là 0.25, 0.50, 0.25
 Cũng có thể chọn là 25 :50 :25 hoặc 2.5 :5.0 :2.5… vì vấn đề ở đây là cơ cấu tỉ lệ
không phải là số lượng.

XI. Kiểm định mối liên hệ của hai biến định tính
Mục đích : Xem hai biến (hai yếu tố) có liên hệ như thế nào: có độc lập hay có ảnh hưởng
nhau?
Ví dụ : Nhóm tuổi có ảnh hưởng đến việc mắc bệnh hay không.
Nghề nghiệp có ảnh hưởng đến việc mắc bệnh hay không.
Ta sẽ dùng bảng cross-tab (bảng chéo) và các kiểm định Chi-square.
Giả sử ta muốn xem giới tính có độc lập với việc mắc bệnh cao huyết áp hay không.
Giả thiết H0 : Giới tính độc lập với việc mắc bệnh cao huyết áp

Analyze
Descriptive
Crosstabs

Đưa hai biến vào ô Rows và Columns


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Kết quả :
Gioi tinh * CAOHA Crosstabulation

Count
CAOHA
.00 1.00 Total
Gioi Nu 19 47 66
tinh Nam 25 109 134
Total 44 156 200

Chi-Square Tests

Asymp. Sig. Exact Sig. Exact Sig.


Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 2.645(b) 1 .104
Continuity Correction(a) 2.088 1 .149
Likelihood Ratio 2.568 1 .109
Fisher's Exact Test .146 .076
Linear-by-Linear Association
2.632 1 .105
N of Valid Cases 200
a Computed only for a 2x2 table
b 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.52.

Diễn giải: mức ý nghĩa Asymp. Sig. là 0.104 nên ta không bác bỏ được H0, nghĩa là có thể kết
luận giới tính và bệnh cao huyết áp độc lập với nhau.

XII. Tương quan giữa hai biến : hệ số Pearson


Mục đích : Tính hệ số tương quan tuyến tính (Pearson) giữa hai biến định lượng.
Nếu kết quả gần 0 : hai biến không có tương quan
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Nếu kết quả càng gần 1 : hai biến càng có tương quan tỉ lệ thuận, biến này tăng thì biến kia
cũng tăng.
Nếu kết quả càng gần -1 : hai biến càng có tương quan tỉ lệ nghịch, biến này tăng thì biến kia
giảm.
Với bất kỳ kết quả nào, hệ số tương quan phải được xét với mức ý nghĩa (sig. = significance)
Mức ý nghĩa càng thấp thì hệ số tương quan càng có giá trị (không lớn hơn 0.05)
Hệ số tương quan dù gần -1 hoặc 1 nhưng có mức ý nghĩa thấp cũng không đủ kết luận.
Ví dụ : Chiều cao và cân nặng có hệ số tương quan như thế nào ?
Analyze
Correlate
Bivariate

Chọn 2 biến cần tính

OK
Kết quả:
Correlations

Chieu cao Can nang


Chieu cao Pearson
1 -.179(*)
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Correlation
Sig. (2-tailed) . .011
N 200 200
Can nang Pearson
-.179(*) 1
Correlation
Sig. (2-tailed) .011 .
N 200 200
* Correlation is significant at the 0.05 level (2-tailed).

Diễn giải
Pearson Correlation là 1 với mức ý nghĩa Sig. là 0.011 (nhỏ).
Ta kết luận hai biến này có mối tương quan tuyến tính thuận có ý nghĩa thống kê.

XIII. So sánh trị trung bình của một mẫu với một giá trị- One
sample T-test
Mục đích: Xem giá trị trung bình của một biến có sai khác với một giá trị nào đó?
Ví dụ: Ta đo chiều cao một mẫu 200 thanh niên từ 20-30 tuổi ở một địa phương và xét xem có
thể kết luận chiều cao trung bình của họ có sai khác với chiều cao trung bình của thanh niên ở
độ tuổi 20-30 được công bố là 160 (cm) hay không?
 Biến được xem xét phải là biến định lượng (scale) vì trị trung bình của biến định danh
(phân loại) là vô nghĩa, ví dụ trung bình của giới tính (!?)
H0: Trung bình của mẫu không sai khác với giá trị cho trước.
Analyze
Compare Means
One-Sample T Test

Chọn biến cần kiểm định


Chọn giá trị cần so sánh
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Kết quả:

One-Sample Test

Test Value = 160


95% Confidence Interval
of the Difference
Mean
t df Sig. (2-tailed) Difference Lower Upper
Chieu cao -1.337 199 .183 -1.11 -2.75 .53

Giả thiết H0: Chiều cao trung bình của mẫu bằng 160.
Mức ý nghĩa 0.183 không cho phép ta bác bỏ H0.
Bây giờ giả sử ta so sánh với chiều cao l0 là 170.
Giả thiết H0: Chiều cao trung của mẫu bằng 170.

Kết quả:
One-Sample Test

Test Value = 170


95% Confidence Interval
of the Difference
Mean
t Df Sig. (2-tailed) Difference Lower Upper
Chieu cao -13.379 199 .000 -11.11 -12.75 -9.47

Mức ý nghĩa .000 cho phép ta kết luận chiều cao trung bình của các thanh niên mà ta khảo sát
không bằng 170.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Khoảng sai khác 95% Confidence Interval of the Difference đi từ -12.75 đến -9.47 đều dưới 0,
nên ta kết luận là chiều cao trung bình của mẫu đã khảo sát thấp hơn 170 (với mức ý nghĩa
<0.01)

XIV. So sánh trung bình của hai mẫu độc lập – Independent
Samples T-Test
Mục đích: Ta có hai nhóm độc lập. Ta kiểm định trung bình của một tính chất (biến) của hai
nhóm đó có khác nhau không,
Ví dụ hai mẫu độc lập nam và nữ, ta kiểm định

You might also like