Bs Trần Quý Phi-Trường CĐYT Quảng Nam

I.
A. B. C. D. E. F. G. H. I. J. K. L. M. N. O.

Các khái niệm và thao tác cơ bản ........................................................................... 2
Chạy SPSS và đóng SPSS File dữ liệu Các loại file chính Mở file, lưu file, đóng file Cửa sổ biến và cửa sổ dữ liệu Cách tạo một biến mới Quy định kiểu. Type Quy định độ rộng (dài). Width Số chữ số thập phân. Decimal Nhãn của biến. Label Nhãn của giá trị. Values Dữ liệu bị thiếu. Missing Độ rộng của cột. Column Canh dòng. Alignment Thang độ đo. Measure. 2 2 3 3 4 5 5 6 7 7 7 7 8 8 8

II.
A. B. C. D. E. F. G. H. I. J. K. L.

Nhập, sửa dữ liệu ..................................................................................................... 9
Nhập Sửa Hủy việc nhập hoặc sửa Chọn các ô Chọn cả cột Chọn cả hàng Xóa dữ liệu Xóa một hàng (1 trường hợp) Xóa một cột (1 biến) Copy dữ liệu Cắt dữ liệu Di chuyển vị trí các biến 9 9 9 10 10 10 10 10 10 10 11 11

III.
A. B. C. D. E.

Các thao tác chung ............................................................................................. 12
Hủy lệnh mới làm Lấy lệnh đã hủy Lưu các sửa đổi Câu hỏi Bài tập: 12 12 13 13 13

Bs Trần Quý Phi-Trường CĐYT Quảng Nam IV.
A. B. C.

Mã hóa lại (recode).............................................................................................. 15
Recode lại chính X Recode qua một biến khác Giải thích thêm về Old Value và New Value 15 18 22

V.
A.

Tính toán dữ liệu (compute) .................................................................................. 25
Ghi chú về cách gõ công thức 28

VI. VII.
A. B.

Sắp xếp ................................................................................................................ 29 Chọn các trường hợp ......................................................................................... 30
Chọn các trường hợp thỏa mãn điều kiện nào đó Hủy chọn 30 33

VIII.
A. B.

Tần suất (frequency) ........................................................................................... 33
Riêng biệt Tính tần suất của biến này trong biến kia Error! Bookmark not defined. 36

IX.
A. B.

Lặp lại lệnh đã thực hiện .................................................................................... 36
Gọi lại lệnh bằng Recall Lưu lệnh bằng file syntax 36 37

X.

Chương III: Thống kê mô tả..........................................Error! Bookmark not defined.

I. Các khái niệm và thao tác cơ bản
A. B. Chạy SPSS và đóng SPSS File dữ liệu Dữ liệu được lưu vào file có đuôi là sav.

Hình 1.

Các file dữ liệu của SPSS

Cách lưu file dữ liệu: File

Bs Trần Quý Phi-Trường CĐYT Quảng Nam Save Đặt tên file Bấm nút Save

File sẽ có đuôi là sav C. Các loại file chính 1. File dữ liệu (data) Như đã nói ở trên. 2. File kết quả (output) Là file chứa kết quả sau khi phân tích. 3. File cú pháp (syntax) Là file chứa các dòng lệnh. D. Mở file, lưu file, đóng file Mở: File Open Lưu File Save

Bs Trần Quý Phi-Trường CĐYT Quảng Nam Đóng File Close E. Cửa sổ biến và cửa sổ dữ liệu 1. Các khái niệm Variable: Biến. một tính chất của các trường hợp cần nghiên cứu: mã, tuổi, giới, tình trạng hôn nhân… Case: một trường hợp trong nghiên cứu, ví dụ : mỗi người bệnh là một trường hợp… Case còn được gọi là một quan sát (Observation).

Hình 2.

Case  Hàng ; Variable  Cột

2. Cửa sổ biến Dùng để định nghĩa các biến (tên biến, kiểu là số hay chữ…). Bấm chuột vào Variable View ở dưới

Cửa sổ biến như sau:

Name: Tên biến Type: Kiểu là số (numeric) hay chuỗi chữ (string) Width: Độ rộng của chuỗi chữ hay độ lớn của số.

Missing : Xử lý các trường hợp không có dữ liệu. Label : Nhãn của biến (để dễ hiểu hơn) và nó sẽ xuất hiện trong các phân tích Phân biệt với tên biến. Tên biến có thể dựa vào mã của bảng điều tra. Type Ban đầu biến mặc nhiên có kiểu là Numeric. Quy tắc: Không quá 8 ký tự. Label là Gioi tinh Tên biến là Cau2. chẳng cau1.  Tên biến là Cau1. Quy định kiểu. Phân biệt với giá trị thực của các biến. Đặt tên. Values : Định nghĩa nhãn cho từng giá trị (để dễ hiểu hơn). cau2… để việc nhập dữ liệu được thuận lợi. Label là Tuoi G. Cách tạo một biến mới 1.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Decimals : Số chữ số thập phân. Thông báo khi đặt tên sai: Hình 3. ví dụ 0 là DB. Name Vào cửa sổ biến Gõ tên vào cột Name. “Biến chứa ký tự đầu tiên không hợp lệ” Hình 4. “Biến chứa ký tự không hợp lệ”  Ghi chú: Nên cân nhắc khi đặt tên biến. F. 1 là MN. Không bắt đầu bằng con số. Nhất thiết phải dùng Label để tránh nhầm lẫn. . Không có dấu cách.

H. Quy định độ rộng (dài). Dia chi [diachi] là kiểu chuỗi.  Nghĩa là trong khi thu thập số liệu nên mã hóa trước bằng số  Ví dụ nghề nghiệp có thể mã hóa thành  1. .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Để đổi kiểu.Công chức  Còn để diễn giải các giá trị để dễ hiểu ta dùng tính chất Values để gán nhãn cho các giá trị. bấm vào nút chấm chấm bên cạnh: Xuất hiện cửa sổ để chọn kiểu Chọn kiểu và bấm OK. Width Gõ con số vào cột Width.  Ghi chú:  1) Kiểu số nhập nhanh hơn và không gây nhầm lẫn bằng kiểu chuỗi chữ.  2) Trong khi phân tích SPSS sẽ kèm theo một hình để ta biết đó là biến số hay biến ký tự  Trong hình trên ta biết Ma bn [id] là kiểu số.Nông 2-Buôn bán 3.

Nu nhưng khi phân tích thì xuất hiện là Nam. K. Gõ Value là 0 (sẽ là giá trị nhập vào).  Ghi chú : Phân biệt giá trị và nhãn của giá trị. Nu. Bấm vào nút Add. Dữ liệu bị thiếu. Gõ Value Label (sẽ là nhãn của giá trị 0). bấm Change. Missing 1. Label Gõ tên nhãn vào cột Label. Số chữ số thập phân. hoặc thay thế tên biến trong các thao tác. Nhãn của giá trị. L. . J. nhưng tính bằng cm thì có decimal là 0 (?). biến huyết áp tối đa nên có Decimal là 0.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Ví dụ chuỗi có giá trị là 8 thì người nhập không gõ tiếp được chữ số thứ 9 nếu số chữ đã gõ đã đến 8. bấm Remove. Nhãn của biến. System missing Nếu không nhập thì ô bị trống (có dấu chấm nếu là số). Decimal Gõ con số vào Decimal Ví dụ biến tuổi. Sửa nhãn đã có : Chọn nhãn.  Ghi chú: Nhãn sẽ xuất hiện kèm theo. Values Giả sử muốn quy ước giá trị 0 là Nam. 1 là Nữ cho biến c2 Bấm vào nút ở cột Values. đặc biệt là kết quả phân tích. … Gỡ bỏ nhãn đã có : Chọn nhãn. 1 mà không nhập Nam. Người dùng phải nhập 0. I. Cân nặng (kg) có decimal là 1 Chiều cao (m) có decimal là 2.

. Canh dòng. Hàng thứ nhất và thứ ba ở cau4 là system missing. User missing Biến nhận giá trị nhưng ta cho là missing. Các loại thang độ đo Scale: Nhận các con số liên tục (có thể xếp thứ tự. Đây là user missing.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Hình 5. Alignment O. Đây là system missing Người được phỏng vấn từ chối trả lời và lựa chọn 4 được ghi nhận. Học lực giỏi. Có hai kiểu missing xảy ra: Câu này không được ghi nhận (không nhập liệu. thu nhập trung bình. học lực kém Chú ý: Cần xác định rõ thang độ đo của biến vì các phân tích bao giờ cũng kèm theo điều kiện biến đưa vào là theo kiểu gì. Thang độ đo. Độ rộng của cột. M. Chị chương trình học là: 1. Không liên quan đến độ rộng (width) của biến. 2. thu nhập cao. Hình 6. Measure. Ví dụ: Câu 10: Theo Anh. Khi phân tích ta có thể xem 4 là giá trị missing. học lực trung bình. tức là xem như bỏ sót câu này. N.Quá nặng 2-Vừa phải 3. Column Là độ rộng để hiển thị của cột trong cửa sổ Data View.Rất nhẹ 4-Không trả lời. vì không đánh dấu vào lựa chọn nào cả). chiều cao…) Nominal: Định danh (không có thứ bậc. ví dụ huyết áp. có thể đánh giá lớn hơn. ví dụ: Thu nhập thấp. nhỏ hơn. ví dụ giới tính) Ordinal: Định danh nhưng có thứ bậc.

Nhập Nhập vào ô. ta chỉ sửa mà thôi. có gia đình hay không có gia đình)… II. B. Sửa Chọn ô muốn sửa. nếu trước đó chưa có). nam hay nữ. Nhưng biến này là kiểu Nominal (định danh không thứ bậc). C. Chẳng hạn nếu quy ước 1 là nam 2 là nữ. Bấm enter hoặc bấm nút mũi tên. . đó là các trường hợp dùng cách mã hóa. Phân biệt giữa việc sửa và nhập: Khi nhập thì giá trị cũ của ô sẽ biến mất. A.Bs Trần Quý Phi-Trường CĐYT Quảng Nam  Biến có kiểu số chưa chắc là Scale. Hủy việc nhập hoặc sửa Bấm phím Esc Dữ liệu trở về như cũ (hoặc trống. thì biến sẽ nhận giá trị 1. nói cách khác ở đây ta không thể cho là 2 lớn hơn 1 và ngược lại không thể cho là 1 nhỏ hơn 2. Loại biến này hay gặp để diễn tả một tính chất chỉ có hai giá trị (có bệnh hay không có bệnh.  Có một loại gọi là Dischotomous (nhị nguyên) chỉ nhận hai giá trị. là 0 và 1. Bấm F2 và sửa. Khi sửa thì giá trị cũ của ô còn đó. sửa dữ liệu Chuyển qua cửa sổ dữ liệu Bấm nút Data View. Nhập. 2.

G. đương nhiên dữ liệu kèm theo biến đó cũng bị mất luôn.Bs Trần Quý Phi-Trường CĐYT Quảng Nam D. Ghi chú: Xóa một cột là xóa cả một biến. Bấm phím Delete. Bấm phím Delete. Xóa các ô (đã có dữ liệu) của một cột chỉ có nghĩa là xóa dữ liệu của biến đó. Chọn các ô Nhấn phím Shift. Xóa dữ liệu Chọn ô (hoặc nhiều ô) muốn xóa. nhưng biến này vẫn còn. Chọn cả hàng Đưa chuột ra đầu hàng. Bấm phím mũi tên theo chiều thích hợp. Copy dữ liệu Chọn ô (hoặc nhiều ô) muốn copy. Xóa một hàng (1 trường hợp) Chọn hàng muốn xóa. Bấm chuột. H. E. Chọn cả cột Đưa chuột lên đầu cột Bấm chuột F. Xóa một cột (1 biến) Chọn cột muốn xóa. Bấm Ctrl + C Bấm chuột vào ô muốn chép. J. Xóa các ô (đã có dữ liệu) của một hàng chỉ có nghĩa là xóa dữ liệu của trường hợp đó. I. Bấm Ctrl + V . nhưng trường hợp này vẫn còn (vẫn còn được tính trong các phân tích). Bấm phím Delete. Ghi chú: Xóa một hàng là xóa cả một trường hợp (case).

Cắt dữ liệu Chọn ô (hoặc nhiều ô) muốn cắt. Di chuyển vị trí các biến Vào cửa sổ Variable View Bấm chọn một hàng Nhấn giữ chuột Kéo chuột lên trên hoặc xuống. Ví dụ sau chuyển biến “tuoi” lên trên biến “gioi” Ghi chú: Có thể thực hiện việc này ở cửa sổ Data View nhưng lúc này lại chọn cả cột và kéo qua trái hoặc phải. . Bấm Ctrl + X (dữ liệu sẽ biến mất). L.Bs Trần Quý Phi-Trường CĐYT Quảng Nam K. Bấm Ctrl + V Ghi chú: Động tác này được xem như chuyển chỗ. Bấm chuột vào ô muốn chép.

Bs Trần Quý Phi-Trường CĐYT Quảng Nam III. Các thao tác chung A. Nhập 9 2. Nhập 10 Undo lần đầu (hủy thao tác nhập 10) Undo lần nữa: (hủy thao tác nhập 9) . B. Lấy lệnh đã hủy Bấm chuột vào nút Redo Ví dụ: 1. Hủy lệnh mới làm Bấm chuột vào nút Undo.

Lưu các sửa đổi Nếu dữ liệu thay đổi thì phải lưu (nếu muốn) bằng cách bấm Ctrl + S Ghi chú về bài tập: Nghiên cứu 200 bệnh nhân được chẩn đoán là cao huyết áp vô căn. Bài tập: 1) Chạy SPSS . Câu hỏi E. kết quả là  Ghi chú: Không phải lệnh nào cũng undo được. số liệu được lấy từ phiếu khám (xem bảng số liệu). tức thao tác nhập 9. Mục tiêu nghiên cứu là đánh giá tỉ lệ mắc bệnh và các yếu tố liên quan. kết quả là: Redo lần nữa: lấy lại thao tác đã hủy tiếp đó tức là thao tác nhập 10.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Redo một lần: lấy lại thao tác mới hủy. D. C.

Bs Trần Quý Phi-Trường CĐYT Quảng Nam 2) Lưu file với tên là HA 3) Chọn Variables View và Tạo các biến sau Tên biến Kiểu Độ rộng ID Số 8 Cau1 Số 8 Cau2 Cau3 Cau4 Số Chữ Số 8 10 8 Số số lẻ 0 0 0 0 0 Nhãn biến Ma bn Gioi tinh Tuoi Dia chi Nghe nghiep Nhãn giá trị 0: Nam 1: Nu 0: Nong 1: Cong nhan 2: Buon ban 3: CNVC Cau5 Cau6 Cau7 Cau8 Số Số Số Số 8 8 8 8 1 1 0 0 Chieu cao CanNang HA tam thu HA tam truong 4) Vào Data View và Nhập 20 dữ liệu sau: 5) 6) 7) 8) Nhận xét về biến Cau3 (Địa chỉ) Đóng file lại Đóng SPSS Chạy lại SPSS .

Trường hợp này có thể xem Recode là thao tác thay đổi dữ liệu hàng loạt. Recode và đưa dữ liệu mới vào biến mới Y. Recode lại chính X: Thay đổi luôn dữ liệu của biến X. IV. Recode lại chính X Giả sử. - Mã hóa lại (recode) Dữ liệu nhập bị nhầm. vì các lý do sau: Khi recode một biến X thì có thể: A. Recode là công đoạn cần làm sau khi nhập dữ liệu. Duy xuye thành DX… Transform Recode Into Same Variables Bấm chọn biến Cau3 . Nhóm các dữ liệu thành các nhóm. ví dụ quy định các nhóm tuổi dựa vào tuổi cụ thể của mỗi người. ở biến Cau3 ta cần đổi T Binh thành TB.Bs Trần Quý Phi-Trường CĐYT Quảng Nam 9) Mở file HA nói trên. (X vẫn như cũ).

Gõ giá trị cũ ở khung Old Value và giá trị mới khung New Value. biến DiaChi[cau3] xuất hiện bên phải. .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bấm nút mũi tên. Bấm nút Add thì ở khung Old  New có dòng ‘Duy Xuye’  ‘DX’ cho biết giá trị cũ Duy Xuye sẽ thành giá trị mới DX. Bấm chọn Old and New Values.

Bs Trần Quý Phi-Trường CĐYT Quảng Nam Làm tương tự với các giá trị khác Nếu không muốn tiến hành đổi một giá trị nào đó thì bấm ở khung Old  New và chọn Remove. Bấm OK . Sau khi xác định các giá trị cần đổi. Bấm Continue.

Giả sử.Bs Trần Quý Phi-Trường CĐYT Quảng Nam B. Transform Recode Into Different Variables Chọn Tuoi[cau2] Bấm nút mũi tên . nhỏ nhất v. Nên sử dụng cách này vì 2 lý do : Giữ lại dữ liệu gốc. thì tuổi vẫn nên giữ lại.v…). chẳng hạn recode tuổi thành các nhóm tuổi.19 gộp thành nhóm 1 20-29 gộp thành nhóm 2 30-39 gộp thành nhóm 3 40-49 gộp thành nhóm 4 50-59 gộp thành nhóm 5 60-69 gộp thành nhóm 6 70 trở lên gộp thành nhóm 7 Ta sẽ Recode biến Cau2 và phân thành nhóm vào biến mới gọi DoTuoi. lớn nhất. để sử dụng phân tích sau này (chẳng hạn tính tuổi trung bình. Recode qua một biến khác Recode biến X thành biến Y. X vẫn như cũ. ta cần phân nhóm tuổi theo quy định sau : 1. Recode chỉ có mục đích phân nhóm. Nếu Recode nhầm X thì có nguy cơ không truy lại được dữ liệu gốc.

Bs Trần Quý Phi-Trường CĐYT Quảng Nam Trong Output Variable (biến đầu ra) gõ DoTuoi. Bấm nút Change. Lúc này dòng cau2  ? sẽ trở thành cau2  Dotuoi. nghĩa là dữ liệu (độ tuổi) sẽ được vào biến mới là Dotuoi .

đến) 19 New Value: Bấm nút Value.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bấm nút Old and New Values… a) Đổi từ 1 đến 19 vào nhóm 1: Old Value: Bấm nút Range (dãy). Gõ 1 Bấm nút Add. . Gõ 1 (through.

v… Tiếp tục làm như vậy cho các nhóm khác Riêng nhóm cuối cùng (từ 70 trở lên) thì: Old Value: Bấm chọn Range (ở through highest) và gõ 70. New Value Chọn Value gõ 7. v. được quy thành nhóm 7 trong Dotuoi .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Trong khung Old  New ta có dòng 1 thru 20  1 có nghĩa là các giá trị 1 đến 20 ở biến Cau2 sẽ được chuyển thành 1 ở biến Dotuoi. Nghĩa là dãy từ 70 đến các số lớn hơn.

Kinh nghiệm cho thấy là các lệnh Recode nên lưu lại trong file syntax để sau này chạy lại cho nhanh.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bấm Continue. ta ra lệnh recode qua biến DoTuoi là nhóm 3. Lưu ý: Khi recode xong thì hai biến không còn liên hệ gì với nhau. Giải thích thêm về Old Value và New Value 1. Xem mục Lặp lại lệnh. C. Ví dụ ban đầu tuổi bệnh nhân (biến Tuoi) là 30. Bấm OK. Đổi 1 giá trị Old Value cụ thể thành 1 giá trị New Value Recode giá trị 1 (old value) ở biến X thành 2 (new value) ở biến Y . Thì sau này nếu có sửa tuổi thành 50 (DoTuoi là 5) thì phải Recode lại.

Đổi các giá trị Old Value từ một giới hạn trở lên thành 1 giá trị New Value Recode các giá trị từ 70 (old value) trở lên ở biến X thành 9 (new value) ở biến Y . Recode các giá trị từ 10 đến 20 (old value) ở biến X thành 3 (new value) ở biến Y 3.Bs Trần Quý Phi-Trường CĐYT Quảng Nam 2. Đổi các giá trị Old Value nhỏ hơn một giới hạn thành 1 giá trị New Value Recode các giá trị nhỏ hơn hoặc bằng 30 (old value) ở biến X thành 7 (new value) ở biến Y 4. Đổi các giá trị Old Value trong một giới hạn thành 1 giá trị New Value.

và gõ độ dài của biến vào ô Width.v… ta phải chọn Output Variables are string. Biến mới (new value) là biến chuỗi Ban đầu. Ví dụ: Dưới 20 gộp thành nhóm có tên ‘Duoi 20’ thay vì là nhóm 1 20-29 gộp thành nhóm có tên là ‘20 den 29’ thay vì là nhóm 2 v. Các giá trị còn lại là DB 6. DL Ta quan tâm đến 2 vùng miền núi và đồng bằng. TK. .Bs Trần Quý Phi-Trường CĐYT Quảng Nam 5. DX. Cách nhanh nhất là Recode vào biến Vung bằng cách: Đổi TM. Ví dụ: Ta có các huyện (biến DiaChi) sau: TM. TP. Đổi tất cả các giá trị Old Value còn lại thành 1 giá trị New Value. TP thành MN. biến mới mặc định là biến số. Muốn cho ra biến chuỗi.

.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bài tập 2: 1) Chạy SPSS 2) Mở file Cao huyet ap 3) Recode lại dữ liêu của biến cau3 thành các tên tắt của Huyện cho vào biến diachi1 4) Xóa biến diachi1. Ví dụ: Cần tạo ra biến mới là BMI (chỉ số khối cơ thể) dựa trên Cân nặng và Chiều cao của mỗi đối tượng nghiên cứu. 5) Đổi tên biến diachi1 thành cau3. nhưng giá trị mới là một biểu thức phức tạp thì không dùng Recode mà phải dùng Compute. Tính toán dữ liệu (compute) Đôi khi cần phải tạo ra các biến mới. 8) Phân các nhóm tuổi thành các loại cho vào biến Tuoi2 với quy định sau: Dưới 20 gộp thành nhóm có tên ‘Duoi 20’ 20-29 gộp thành nhóm có tên là ‘20 den 29’ 30-39 gộp thành nhóm có tên là ‘30 den 39’ 40-49 gộp thành nhóm có tên là ‘40 den 49’ 50-59 gộp thành nhóm có tên là ‘50 den 59’ 60-69 gộp thành nhóm có tên là ‘60 den 69’ 70 trở lên gộp thành nhóm có tên là ’70 tro len’ 9) Lưu file và thoát SPSS V. 7) Chuyển vị trí biến Tuoi1 cho nằm bên cạnh biến cau2. dựa trên dữ liệu của một hay nhiều biến cũ. 6) Phân các nhóm tuổi thành 2 loại cho vào biến Tuoi1 với quy định dưới 50 là nhóm 0 và từ 50 trở lên là nhóm 1.

Transform Compute… Gõ tên biến mới vào Taget Variable Trong khung Numeric Expression gõ công thức để đưa vào biến BMI: .Bs Trần Quý Phi-Trường CĐYT Quảng Nam BMI = (cân nặng)/(chiều cao)2 Ta làm như sau.

Ví dụ 3: Tạo biến mới là CaoTT (chỉ cao HA tâm thu. tâm trương bình thường) với quy định CaoTT là 1 nếu HA tối đa (cau7) >140 và HA tối thiểu (cau8) <= 90 Numeric Expression cho CaoHA là Cau7>140 & Cau8>90 .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Gõ OK. Ví dụ 2: Tạo biến mới là CaoHA với quy định CaoHA là 1 nếu HA tối đa (cau7) >140 hoặc HA tối thiểu (cau8) >90 Numeric Expression cho CaoHA là Cau7>140 | Cau8>90 Biểu thức trên gọi là biểu thức logic hoặc. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó sai. Biểu thức logic hoặc này đúng khi chỉ cần 1 trong 2 phép so sánh Cau7>140 hoặc Cau8>90 đúng.

6) Tạo biến mới CaoTTr với 1 chỉ cao HA tâm trương (mà không cao tâm thu). các phép toán số học.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Biểu thức trên gọi là biểu thức logic và. . Phép và này chỉ đúng khi cả 2 phép so sánh Cau7>140 và Cau8>90 là đúng. Biểu thức này cho giá trị 1 khi nó đúng. A. các hàm. với 1 là chẩn đoán có cao HA và 0 là không. 0 là không. Ghi chú về cách gõ công thức Công thức gồm các biến. 0 là không có. + Cộng . 5) Tạo biến mới CaoTT với 1 chỉ cao HA tâm thu (mà không cao tâm trương).Trừ * Nhân / Chia ** Lũy thừa | Phép hoặc (đúng khi chỉ cần 1 cái đúng) & Phép và (đúng khi tất cả đều đúng) Bài tập 3: 1) Chạy SPSS 2) Mở file Cao huyet ap 3) Tạo biến mới BMI để tính chỉ số khối của cơ thể 4) Tạo biến mới CaoHA. 7) Tạo biến mới Cao2 với chẩn đoán là cao cả hai HA tâm thu và tâm trương. 0 khi nó sai.

Chọn Descending.Bs Trần Quý Phi-Trường CĐYT Quảng Nam VI. Data Sort Cases… Trong cửa sổ Sort Cases bấm chọn tuổi Bấm nút mũi tên để đưa qua khung Sort by: Sau đó chọn tiếp HA tam thu (cau7) bấm qua. Sắp xếp Sắp xếp theo thứ tự theo một hoặc nhiều biến. Giả sử ta muốn sắp xếp dữ liệu theo thứ tự tuổi (tăng dần: ascending). rồi đến huyết áp tâm thu (giảm dần: descending). .

Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bấm OK thì SPSS sẽ xếp theo tuổi từ nhỏ đến lớn. Ví dụ ta chọn các trường hợp có tuổi dưới 40 như sau: Data Select Cases… Ban đầu ta thấy dấu All cases được chọn. thì các lệnh phân tích sẽ chỉ tính toán trên các trường hợp đã chọn. thì chiều cao này là chiều cao của các trường hợp đó. VII. Sau khi dùng lệnh này. mà bỏ qua các trường hợp khác (có tuổi từ 40 trở lên). nghĩa là tới lúc này tất cả các trường hợp đều được tính đến. Ví dụ sau khi chọn các trường hợp có tuổi dưới 40 và tính trung bình của chiều cao. Chọn các trường hợp A. Chọn các trường hợp thỏa mãn điều kiện nào đó Trường hợp chỉ cần quan tâm tới một số trường hợp (case) thỏa mãn điều kiện nào đó để phân tích thì ta dùng lệnh Select Cases. . nếu cùng tuổi thì xếp theo HA tâm thu (từ lớn xuống).

.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Bấm chọn If condition is satisfied (nếu điều kiện được thỏa mãn) Bấm nút If… Xuất hiện khung như trong trường hợp Compute (xem lại cách ghi biểu thức).

. Bấm OK. Lúc này cửa sổ Select Cases bên cạnh nút if có ghi biểu thức trên.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Gõ biểu thức. Bấm Continue.

Hủy chọn Data Select Cases… Chọn lại All Cases. B. số thứ tự không bị gạch chéo.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Các trường hợp dưới 40 tuổi đã được chọn. VIII. Nhắc lại Là số lần xuất hiện của các giá trị Mã 01 Giới tính Nam . các trường hợp bị gạch chéo sẽ được xem như không có trong dữ liệu. Tần suất (frequency) A.

Bấm nút mũi tên qua phải . 4 Thực hiện Analyze Tables Tables of frenquency 1.Bs Trần Quý Phi-Trường CĐYT Quảng Nam 02 03 04 05 06 07 Nu Nam Nam Nu Nu Nu Frequency của Giới tính: Nam: 3 Nu: B. Tính tần suất riêng cho từng biến Chọn biến muốn tính tần suất.

Kết quả: . chọn Percents Display (để hiển thị %) Bấm Continue.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Chọn nút Layout… Chọn Count Display (để hiển thị số lượng). Bấm OK.

in each tables: (nhóm phụ trong mỗi bảng) Kết quả: IX. sau đó trong mỗi nghề nghiệp. sau đó chọn Gioi tinh để đưa qua Subgroup.Bs Trần Quý Phi-Trường CĐYT Quảng Nam  Ghi chú: Có thể tính tần suất của nhiều biến cùng một lần. tính tần suất của Nghe nghiep. chọn các thông số v.v… Có hai cách để thực hiện lại một cách nhanh chóng những lệnh đã làm là dùng nút Recall hay lưu lại lệnh trong một file syntax A. Lặp lại lệnh đã thực hiện Thường thì thực hiện một lệnh phải tốn nhiều nhiều thao tác: như bấm chọn menu. ví dụ. Gọi lại lệnh bằng Recall Chọn nút Dialog Recall. 2. . chọn các biến. Tính tần suất của biến này trong biến kia Muốn tính tần suất của biến này trong biến kia. ta tính nam bao nhiêu nữ bao nhiêu thì làm như sau: Khi xuất hiện cửa sổ Table of frequencies sau khi chọn Nghe nghiep để đưa qua Frequency for.

Lưu lệnh bằng file syntax Để lưu lại một lệnh ta làm như sau: Sau khi thực hiện việc chọn các biến. tham số… ta bấm nút Paste Xuất hiện cửa sổ syntax: . B. Chọn lệnh muốn thực hiện lại.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Hiện ra danh sách các lệnh đã dùng.

Sau này muốn chạy lại lệnh ta làm như sau: File Open Syntax… Bấm chọn file syntax đã lưu .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Ta bấm nút lưu và đặt tên file.

 Căn cứ vào Asym. 50% đạt điểm trung bình và 25% đạt điểm giỏi. Sig (p-value) nếu nhỏ hơn 0. bài kiểm tra nên có 25% học sinh đạt điểm kém.nếu lớn hơn có thể kết luận tỉ lệ các nhóm là bằng nhau Ví dụ 1 : Khảo sát 100 học sinh ta có 58 nam.  Giả thiết H0 : các nhóm trong một biến có tỉ lệ bằng nhau  Tiến hành Chi-square test. 42 nữ. X. Kiểm định tỉ lệ Mục đích: Xác định tỉ lệ của các nhóm có bằng nhau hay không hay phù hợp với các tỉ lệ đã định trước hay không.05 : bác bỏ H0. Khảo sát của chúng ta trên một bài kiểm tra cụ thể có 10 học . nhưng kết luận này có ý nghĩa thống kê hay không ? H0 : tỉ lệ nam bằng tỉ lệ nữ (hoặc tỉ lệ nam :nữ là 50 :50) Ví dụ 2 : Theo một lý thuyết.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Xuất hiện (các) dòng lệnh trong file này: Nếu muốn chạy lệnh này thì ta bấm vào nút mũi tên. Số nam lớn hơn số nữ (trong mẫu của chúng ta).

Kết quả này có phù hợp với lý thuyết hay không ? H0 : Tỉ lệ điểm trong khảo sát của ta theo cơ cấu 25 :50 : 25 A. 17 học sinh đạt điểm trung bình và 9 học sinh đạt điểm giỏi. Kiểm định các tỉ lệ có bằng nhau hay không Ví dụ : Tỉ lệ các nghề nghiệp có bằng nhau không ? Analyze Non-parametric test Chi-Square Chọn biến để đưa qua Chọn All categories equal (các nhóm bằng nhau) OK Kết quả : Nghe nghiep Observed N Expected N Residual .Bs Trần Quý Phi-Trường CĐYT Quảng Nam sinh đạt điểm kém.

Tỉ lệ là 50/150 = 30%.0 50. Sig: xác suất để giả thiết đúng là 0.368 Diễn giải: Observed N: số lượng quan sát Expected N: tần suất mong đợi (tần suất theo giả thiết H0) Chi-Square: thống kê Chi-Square. Nếu Asymp. Tỉ lệ mắc bệnh của ta có cao hơn có ý nghĩa thống kê hay không ? Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20 Giả sử biến MacBenh được mã hóa là : 0 : không có bệnh. B.05 ta kết luận là tỉ lệ nghề nghiệp khác nhau có ý nghĩa thống kê. ta thấy số mắc bệnh X là 50 người. 3. Tiến hành Chi square test như trên. Tỉ lệ của một tác giả khác là 20%.160 3 . 1 : có bệnh. Df: bậc tự do.0 50. Kiểm định tỉ lệ các nhóm có khác với cơ cấu tỉ lệ cho trước Ví dụ : Nghiên cứu trên 150 bệnh nhân. nói cách khác: có nhiều khả năng tỉ lệ các nghề nghiệp là bằng nhau hoặc: các nghề nghiệp khác nhau không có ý nghĩa thống kê.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Nong dan Cong nhan Buon ban CNVC Total 40 53 57 50 200 50.0 -10.0 50. Sig nhỏ hơn 0.05).368 khá lớn (lớn hơn 0.0 3. nhưng thay vì chọn All categories equal (tức là tỉ lệ không có bệnh :có bệnh là 50 :50) ta sẽ chỉ định SPPS tiến hành kiểm định với tỉ lệ không có bệnh : có bệnh là 80 :20) . Sig. Asymp.0 Test Statistics Nghe nghiep Chi-Square(a) Df Asymp. Sig: giá trị p-value: xác suất để giả thiết đúng Giả thiết H0 : tỉ lệ các nghề nghiệp là bằng nhau.0 7. Asymp.0 .

Thứ tự là 0 rồi mới đến 1. Lại gõ giá trị 0.8 .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Chọn Values và gõ giá trị 0.00 Total 50 150 200 Expected N 160.00 1.8 (tỉ lệ không mắc) trước 0. Do đó phải đưa giá trị 0.2 . chọn nút Add Cẩn thận : Không mắc bệnh là 0. Mắc bệnh là 1.0 110. chọn nút Add.2 (tỉ lệ mắc) Kết quả : MACBENH Observed N .0 Residual -110.0 40.0 .

Trở lại ví dụ về cơ cấu điểm bài thi.25  Cũng có thể chọn là 25 :50 :25 hoặc 2.125 1 .25. Giả thiết H0 : Giới tính độc lập với việc mắc bệnh cao huyết áp Analyze Descriptive Crosstabs Đưa hai biến vào ô Rows và Columns . Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20 Asymp Sig.000 a 0 cells (. nói cách khác tỉ lệ mắc bệnh của ta khác tác giả kia (trong trường hợp này là lớn hơn) với mức ý nghĩa nhỏ hơn 0.0. Nếu mã hóa : 1 : kém . Nghề nghiệp có ảnh hưởng đến việc mắc bệnh hay không.01.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Test Statistics MACBENH ChiSquare(a) Df Asymp.0%) have expected frequencies less than 5.0 :2. 0. Sig.5… vì vấn đề ở đây là cơ cấu tỉ lệ không phải là số lượng. nhau? Kiểm định mối liên hệ của hai biến định tính Mục đích : Xem hai biến (hai yếu tố) có liên hệ như thế nào: có độc lập hay có ảnh hưởng Ví dụ : Nhóm tuổi có ảnh hưởng đến việc mắc bệnh hay không. Ta sẽ dùng bảng cross-tab (bảng chéo) và các kiểm định Chi-square. XI. là . Giả sử ta muốn xem giới tính có độc lập với việc mắc bệnh cao huyết áp hay không. 378.50.000  bác bỏ H0. 3 : giỏi Giả thiết H0 : Cơ cấu tỉ lệ 1 :2 : 3 là 25 :50 :25 Khi tiến hành ta phải chọn các value là lần lượt là 0.5 :5. The minimum expected cell frequency is 40. 0. 2 : trung bình .

149 .568 df 1 1 1 N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (. nghĩa là có thể kết luận giới tính và bệnh cao huyết áp độc lập với nhau.076 Exact Sig. Nếu kết quả gần 0 : hai biến không có tương quan .088 2.00 47 109 156 Total 66 134 200 Chi-Square Tests Asymp.645(b) 2. (2-sided) . (2-sided) Exact Sig.109 .Bs Trần Quý Phi-Trường CĐYT Quảng Nam Kết quả : Gioi tinh * CAOHA Crosstabulation Count CAOHA . XII.104 .146 2. Tương quan giữa hai biến : hệ số Pearson Mục đích : Tính hệ số tương quan tuyến tính (Pearson) giữa hai biến định lượng.00 Gioi tinh Total Nu Nam 19 25 44 1.0%) have expected count less than 5. The minimum expected count is 14.52.105 . (1-sided) Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association Value 2. là 0.104 nên ta không bác bỏ được H0.632 1 . Sig. Diễn giải: mức ý nghĩa Asymp. Sig.

Nếu kết quả càng gần -1 : hai biến càng có tương quan tỉ lệ nghịch.179(*) .05) Hệ số tương quan dù gần -1 hoặc 1 nhưng có mức ý nghĩa thấp cũng không đủ kết luận. hệ số tương quan phải được xét với mức ý nghĩa (sig. biến này tăng thì biến kia cũng tăng.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Nếu kết quả càng gần 1 : hai biến càng có tương quan tỉ lệ thuận. Với bất kỳ kết quả nào. biến này tăng thì biến kia giảm. Ví dụ : Chiều cao và cân nặng có hệ số tương quan như thế nào ? Analyze Correlate Bivariate Chọn 2 biến cần tính OK Kết quả: Correlations Chieu cao Chieu cao Pearson 1 Can nang -. = significance) Mức ý nghĩa càng thấp thì hệ số tương quan càng có giá trị (không lớn hơn 0.

XIII.One sample T-test Mục đích: Xem giá trị trung bình của một biến có sai khác với một giá trị nào đó? Ví dụ: Ta đo chiều cao một mẫu 200 thanh niên từ 20-30 tuổi ở một địa phương và xét xem có thể kết luận chiều cao trung bình của họ có sai khác với chiều cao trung bình của thanh niên ở độ tuổi 20-30 được công bố là 160 (cm) hay không?  Biến được xem xét phải là biến định lượng (scale) vì trị trung bình của biến định danh (phân loại) là vô nghĩa. 200 . Diễn giải Pearson Correlation là 1 với mức ý nghĩa Sig. 200 -. là 0. Ta kết luận hai biến này có mối tương quan tuyến tính thuận có ý nghĩa thống kê. Analyze Compare Means One-Sample T Test Chọn biến cần kiểm định Chọn giá trị cần so sánh . (2-tailed) Can nang N Pearson Correlation Sig.179(*) .011 200 1 .011 200 * Correlation is significant at the 0. ví dụ trung bình của giới tính (!?) H0: Trung bình của mẫu không sai khác với giá trị cho trước.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Correlation Sig.011 (nhỏ). So sánh trị trung bình của một mẫu với một giá trị. (2-tailed) N .05 level (2-tailed).

183 không cho phép ta bác bỏ H0.53 Giả thiết H0: Chiều cao trung bình của mẫu bằng 160. .75 Upper .47 Mức ý nghĩa . Giả thiết H0: Chiều cao trung của mẫu bằng 170.183 Mean Difference -1. Mức ý nghĩa 0.379 Df 199 Sig.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Kết quả: One-Sample Test Test Value = 160 95% Confidence Interval of the Difference t Chieu cao -1. (2-tailed) . Bây giờ giả sử ta so sánh với chiều cao l0 là 170. (2-tailed) .11 Lower -2.000 Mean Difference -11. Kết quả: One-Sample Test Test Value = 170 95% Confidence Interval of the Difference t Chieu cao -13.337 df 199 Sig.000 cho phép ta kết luận chiều cao trung bình của các thanh niên mà ta khảo sát không bằng 170.75 Upper -9.11 Lower -12.

Ví dụ hai mẫu độc lập nam và nữ. So sánh trung bình của hai mẫu độc lập – Independent Samples T-Test Mục đích: Ta có hai nhóm độc lập. ta kiểm định .75 đến -9.47 đều dưới 0.Bs Trần Quý Phi-Trường CĐYT Quảng Nam Khoảng sai khác 95% Confidence Interval of the Difference đi từ -12.01) XIV. nên ta kết luận là chiều cao trung bình của mẫu đã khảo sát thấp hơn 170 (với mức ý nghĩa <0. Ta kiểm định trung bình của một tính chất (biến) của hai nhóm đó có khác nhau không.

Sign up to vote on this title
UsefulNot useful