You are on page 1of 22

Hướng dẫn sử dụng SPSS cho người mới bắt đầu

HƯỚNG DẪN SỬ DỤNG SPSS


CHO NGƯỜI MỚI BẮT ĐẦU
I/ Giới thiệu về SPSS

SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình
máy tính phục vụ công tác phân tích thống kê. SPSS được sử dụng rộng rãi trong công
tác thống kê kinh tế - xã hội.

Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968 và mới nhất là thế hệ 18 được giới
thiệu từ tháng 8 năm 2009, có cả phiên bản cho các hệ điều hành Windows, Mac, và
Linux / Unix.

SPSS được sử dụng bởi các nhà nghiên cứu thị trường, nghiên cứu y khoa, công ty
điều tra, chính phủ, các nhà nghiên cứu giáo dục và những lĩnh vực khác. Một số phần
mềm có chức năng thống kê khác như Microsoft Office Excel, STATA, SAS,
Eviews…

Các chức năng cơ bản:


* Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu
tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics)
* Thống kê 2 biến số (Bivariate statistics): trung bình (Means), T-test, ANOVA,
tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests)
* Dự báo (Prediction): hồi quy (regression), phân tích nhân tố (Factor analysis),
cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant).

Ưu điểm: dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng
biểu, báo cáo được trình bày đẹp, linh hoạt.
Tập tin nhập liệu SPSS có đuôi mở rộng .sav, tập tin bảng biểu chứa kết quả có đuôi
mở rộng .spv.

Lưu ý khi cài đặt SPSS đối với bản PASW Statistics 18 (crack)
1) Run Setup/setup.exe
2) Single user license

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 1


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

3) Enter no serial number and install

4) In the end uncheck "Register with spss.com"

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 2


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

5) Close License Authorization Wizard

6) Copy content of EQX to install dir

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 3


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Choose “Yes” to replace files


7) Run

II/ Thang đo, thu thập và mã hóa dữ liệu


1. Thang đo
Dữ liệu nghiên cứu có thể phân chia thành 2 loại chính là dữ liệu định tính và dữ
liệu định lượng.
Các dữ liệu này được thu thập bằng 4 thang đo cơ bản được thể hiện trên sơ đồ
như sau:

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 4


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Dữ liệu

Dữ liệu định tính Dữ liệu định lượng

Thang đo danh nghĩa Thang đo thứ bậc Thang đo khoảng cách Thang đo tỉ lệ

Dữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính
được trị trung bình của dữ liệu dạng định tính.
Dữ liệu định lượng: loại dữ liệu này phản ánh mức độ, mức độ hơn kém, tính
được trị trung bình.
Cần chú ý rằng các phép toán thống kê dùng cho dữ liệu định tính có những đặc
điểm khác với phép toán dùng cho dữ liệu định lượng.

i) Thang đo danh nghĩa (còn gọi là thang đo định danh hoặc thang đo phân
loại) – nominal scale: trong thang đo này các con số chỉ dùng để phân loại
các đối tượng, không mang ý nghĩa nào khác. Những phép toán thống kê
bạn có thể sử dụng được cho dạng thang đo danh nghĩa là: đếm, tính tần
suất của một biểu hiện nào đó, xác định giá trị mode, thực hiện một số
phép kiểm định.
ii) Thang đo thứ bậc – ordinal scale: lúc này các con số ở thang đo danh nghĩa
được sắp xếp theo một quy ước nào đó về thứ bậc hay sự hơn kém, nhưng
ta không biết được khoảng cách giữa chúng. Điều này có nghĩa là bất cứ
thang đo thứ bậc nào cũng là thang đo danh nghĩa nhưng rõ ràng bạn
không thể suy ngược lại được.
iii) Thang đo khoảng – interval scale: là một dạng đặc biệt của thang đo thứ
bậc vì nó cho biết được khoảng cách giữa các thứ bậc. Thông thường
thang đo khoảng có dạng là một dãy các chữ số liên tục và đều đặn từ 1
đến 5, hay từ 1 đến 10…
Những phép toán thống kê có thể sử dụng thêm cho loại thang đo này so
với 2 loại thang đo trước là: tính khoảng biến thiên, số trung bình, độ lệch
chuẩn… Cần chú ý là thang đo khoảng tự nó không có điểm 0 được xác
định trước, do đó bạn chỉ có thể thực hiện được phép tính cộng trừ chứ
phép chia không có ý nghĩa.
iv) Thang đo tỉ lệ - ratio scale: thang đo tỉ lệ có tất cả các đặc tính khoảng
cách và thứ tự của thang đo khoảng, ngoài ra điểm 0 trong thang đo
khoảng là một trị số “thật” nên ta có thể thực hiện được phép toán chia để
tính tỉ lệ nhằm mục đich so sánh.
Nói chung với các biến thu thập bằng thang đo khoảng và thang đo tỉ lệ ta có thể
đo lường xu hướng trung tâm bằng trung bình số học. Còn xu hướng phân tán đo
bằng độ lệch chuẩn, phương sai (khoảng và tứ trung vị ít được sử dụng đến do

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 5


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

kém hữu ích hơn). Vì vậy, SPSS gộp chung hai loại thang đo này thành một gọi là
Scale Measures.
2. Thu thập dữ liệu
* Các phương pháp thu thập số liệu
a. Phỏng vấn trực tiếp (Face to face interview)
- Phỏng vấn tại nhà (Door to door interview)
- Phỏng vấn tại một địa điểm cụ thể (Central location interview)
- Phỏng vấn chặng (Mall – Intercept interview)
b. Phỏng vấn qua điện thoại
c. Phỏng vấn qua thư
d. Phỏng vấn qua internet
e. Quan sát (Observation)

* Dạng câu hỏi


a. Câu hỏi mở
b. Câu hỏi đóng
- Câu hỏi phân đôi (Dichotomous)
Anh/chị có sử dụng điện thoại di động không?
1.  Có 2.  Không
- Câu hỏi liệt kê một lựa chọn (Single response)
Trong số các nhãn hiệu nước ngọt có gaz dưới đây bạn sử dụng thường xuyên
nhất nhãn hiệu nào?
Coca-Cola 1
Pepsi-Cola 2
7-Up 3
Fanta 4
- Câu hỏi liệt kê nhiều lựa chọn (Multiple responses)
Bạn đã từng viếng thăm địa điểm nào trong các thành phố dưới đây ở nước
Lào?
Viêng Chăn 1
Luang Prabang 2
Luang Namtha 3
Savanakhet 4
- Câu hỏi sắp hạng (Ranking)
Trong các yếu tố sau đây anh/chị hãy cho biết mức độ quan trọng nhất, nhì, ba
trong việc lựa chọn mua một máy điện thoại?
Chất lượng bắt sóng ______
Kiểu dáng thời trang ______
… ______
Nguồn gốc xuất xứ ______
- Câu hỏi phân mức (Scale)
Theo ý bạn, trong những câu nói sau đây câu nào mô tả đúng nhất về màu sắc
của bao bì sản phẩm này?
Quá tối 1
Hơi tối 2
Vừa 3
Hơi sáng 4
Quá sáng 5
- Câu hỏi chấm điểm.

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 6


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Hãy cho điểm các sản phẩm sau từ 1 đến 10 điểm theo mức độ ưa thích của
bạn
Điểm
Nhãn hiệu A ____
Nhãn hiệu B ____
Nhãn hiệu C ____
Nhãn hiệu D ____
* Lưu ý: Thông thường, đối với biến Ordinal, ta có thể định dạng thành Scale.
3. Mã hóa dữ liệu
Ví dụ:

Nguyên tắc là chúng ta cần chuyển các thông tin từ dạng “chữ” sang dạng “số” để
tiến hành nhập liệu vào SPSS.
4. Xử lý dữ liệu
Quy trình xử lý dữ liệu
- Bước 1: kiểm tra, hiệu chỉnh bảng câu hỏi
- Bước 2: mã hóa dữ liệu trên bảng câu hỏi

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 7


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

- Bước 3: nhập dữ liệu vào máy tính


- Bước 4: làm sạch dữ liệu trên máy tính

III/ Khai báo biến và nhập liệu trong SPSS


1. Giao diện

1- Thanh menu chức năng


2- Biểu tượng một số chức năng thông dụng
3- Cột hiển thị tên các biến
4- Số thứ tự các dòng
5- Data View (cửa sổ nhập liệu và thể hiện dữ liệu), Variable View (cửa sổ khai báo
biến)

2. Khai báo biến


Bảng phỏng vấn đơn giản

1. Loại điện thoại di động mà bạn sử dụng chính?


 Nokia
 Samsung
 Motorola
 Khác
2. Mức độ hài lòng chung của bạn khi sử dụng loại điện thoại trên?
Rất không hài lòng 1 2 3 4 5 Rất hài lòng
3. Chi tiêu trung bình một tháng cho việc gọi điện thoại di động ……….ngàn đ
4. Bạn theo dõi thông tin về các loại điện thoại mới như thế nào?
 Không bao giờ  Ít khi  Thỉnh thoảng  Thường xuyên
5. Bạn thường sử dụng tính năng nào

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 8


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

 Nghe - gọi  Tin nhắn  Nghe nhạc  Quay phim, chụp hình  Games  Khác
6. Giới tính: Nam Nữ

Khai báo biến

i) Name: tên biến, ký tự liên tục, không có khoảng trắng


ii) Type: kiểu dữ liệu, số (numeric), chữ (string)…
iii) Width: độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự
tối đa
iv) Decimals: lượng số thập phân
v) Label: nhãn biến (chú thích cho tên biến)
vi) Values: giá trị mã hóa dữ liệu
vii) Missing: khai báo giá trị khuyết
viii) Columns: độ rộng cột tên biến
ix) Align: vị trí dữ liệu nhập trong cột
x) Measure: loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc),
Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio).
xi) Role: vai trò của biến

Nhập liệu

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 9


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

* Lưu ý: có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ chương trình Excel
sang SPSS. Ngoài ra, SPSS cũng có thể import dữ liệu từ file .xls có sẵn bằng cách
vào File > Open > Data…> Chọn tập tin đuôi *.xls.
3. Một số xử lý trên biến
Mã hóa lại biến (Recode)
Vào Transform > Recode into Same Variables… hoặc Recode into Different
Variables…

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 10


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

1- Chọn biến cần mã hóa và đưa sang vùng lựa chọn


2- Chuyển giá trị cũ sang giá trị mới
3- Điều kiện lọc giá trị (nếu có)

Công cụ tính toán giữa các biến (Compute)


Transform > Compute Variable… được sử dụng để tính toán các giá trị mới từ các
biến đã có sẵn trong tập dữ liệu, kết quả tính toán thường chứa trong một biến mới
hoặc chồng lên một biến khác sẵn có tùy vào thao tác của bạn.

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 11


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

1- Đặt tên biến mới


2- Vùng tính toán

IV/ Phân tích dữ liệu


1. Thống kê mô tả
a. Thống kê mô tả (Descriptive Statistics): sử dụng bảng biểu, biểu đồ - đồ thị để
tóm tắt, diễn đạt dữ liệu nghiên cứu.
Tạo bảng tần số

Từ thanh Menu chọn


Analyze
Descriptive Statistics
Frequencies

Hộp thoại Frequencies xuất hiện,


Chọn các biến cần tính và đưa vào
khung Variable(s)

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 12


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Cửa sổ
hiện thị
kết quả
(đuôi .spo)

Vùng hiện
thị Bảng
tần số
Cây thư
mục bảng
biểu

* Có thể copy bảng tần số sang word hoặc xuất kết quả sang file word/excel.

Tạo bảng thống kê mô tả


Cách 1.

Từ thanh Menu chọn


Analyze
Descriptive Statistics
Descriptives

Hộp thoại Descriptive xuất hiện,


Chọn các biến cần tính và đưa
vào khung Variable(s)

Nhấp nút Option nếu muốn tính


thêm các thống kê khác

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation


chi tieu trung binh mot 92 120.00 410.00 246.6304 92.77501
thang cho viec goi dien
thoai (ngan dong)
Valid N (listwise) 92

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 13


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Cách 2.
Bạn cũng có thể tính thống kê mô tả bằng cách Chọn Analyze\ Descriptive
Statistics\ Frequencies
- Đưa biến định lượng cần tính thống kê mô tả vào khung Variable(s)
- Nhấp Statistics và đánh dấu chọn các chỉ tiêu cần tính

Đổ bảng chéo (phân tích hai biến): bảng Crosstabs

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 14


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Từ thanh Menu chọn


Analyze
Descriptive Statistics
Crosstabs

Hộp thoại Crosstabs xuất hiện,


Chọn các biến cần tính đưa vào
khung Row(s) và Column(s)

Nhấp nút Cells nếu muốn tính


theo đơn vị phần trăm. Lựa chọn
Display clustered bar charts
nếu muốn có thêm đồ thị dạng
cột

loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
Count

gioi tinh
Nu Nam Total

loai dien thoai di dong ma Nokia 0 25 25


ban su dung chinh Samsung 22 6 28

Motorola 27 0 27
khac 6 6 12
Total 55 37 92

loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
% within loai dien thoai di dong ma ban su dung chinh

gioi tinh

Nu Nam Total

loai dien thoai di dong ma Nokia 100.0% 100.0%


ban su dung chinh Samsung 78.6% 21.4% 100.0%
Motorola 100.0% 100.0%

khac 50.0% 50.0% 100.0%


Total 59.8% 40.2% 100.0%

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 15


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

* Lưu ý: biến có nhiều thuộc tính nên đưa vào khung Column(s).

Tính giá trị trung bình của 1 biến định lượng phân theo 1 biến định tính

Từ thanh Menu chọn


Analyze
Compare Means
Means

Đưa biến định lượng vào


Dependent list

Đưa biến định tính vào


Independent List

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 16


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Report
muc do hai long

loai dien thoai di dong ma


ban su dung chinh Mean N Std. Deviation
Nokia 3.92 25 1.187

Samsung 2.18 28 .476

dime nsio n 1
Motorola 1.00 27 .000
khac 2.50 12 .905
Total 2.35 92 1.330

Bảng tần số cho câu hỏi nhiều lựa chọn


Đối với biến nhiều trả lời: trước khi đổ bảng ta phải tiến hành nhóm các biến chứa
đựng các giá trị trả lời có được (multiple responses).

Bước 1. Khai báo cho biến nhiều lựa chọn

Từ thanh Menu chọn


Analyze
Multiple Response
Define Variable Sets

Đưa các biến mô tả các


thuộc tính của biến
định tính vào
Variables in Set

Chọn Dichotomies nếu


câu hỏi nhiều lựa chọn
được nhập theo cách
này, nhập giá trị 1 vào
ô Counted value (nếu 1
là có chọn)

Khai báo Name cho


biến, bấm Add

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 17


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Bước 2. Tạo bảng tần số cho biến nhiều lựa chọn

Từ thanh Menu chọn


Analyze
Multiple Response
Frequencies

Chọn biến đã được khai báo và đưa


vào khung Table(s) for

Case Summary
Cases

Valid Missing Total


N Percent N Percent N Percent
a
$tinhnang 92 98.9% 1 1.1% 93 100.0%
a. Dichotomy group tabulated at value 1.

$tinhnang Frequencies
Responses Percent of

N Percent Cases
a
tinh nang thuong su dung nghe _ goi 59 22.3% 64.1%
tin nhan 56 21.2% 60.9%
nghe nhac 64 24.2% 69.6%

quay phim, chup hinh 43 16.3% 46.7%


games 37 14.0% 40.2%
khac 5 1.9% 5.4%
Total 264 100.0% 287.0%

a. Dichotomy group tabulated at value 1.

Đổ bảng chéo đối với biến nhiều câu trả lời

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 18


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Từ thanh Menu chọn


Analyze
Multiple Response
Crosstabs

Chọn biến nhiều câu trả lời


đưa vào khung Row(s), biến
phân loại đưa vào khung
Column(s), chú ý khai báo
Define Ranges cho biến phân
loại.

$tinhnang*gioi Crosstabulation

gioi tinh

Nu Nam Total
a
tinh nang thuong su dung nghe _ goi Count 34 25 59
tin nhan Count 37 19 56
nghe nhac Count 43 21 64

quay phim, chup hinh Count 25 18 43


games Count 1 36 37
khac Count 3 2 5
Total Count 55 37 92
Percentages and totals are based on respondents.
a. Dichotomy group tabulated at value 1.

* Lưu ý: SPSS còn hỗ trợ xử lý đối với biến có nhiều câu trả lời trong menu Analyze
> Tables > Multiple Response Sets. Thủ tục khởi tạo tương tự như ở trên. Mặc dù
bạn đã khởi tạo biến có nhiều câu trả lời bằng cách này thì chức năng Multiple
Response Frequencies và Crosstabs ở trên không thể sử dụng được, thay vào đó
Analyze > Tables > Custom Tables sẽ hỗ trợ và nó được xem như một variable.

b. Mô tả dữ liệu bằng đồ thị


Đồ thị Bar dùng để thể hiện thông tin như trung bình, trung vị, tần số tích lũy, tần suất
tích lũy, số quan sát… của biến. Nó được sử dụng cho các dữ liệu thu thập bằng các
thước đo định danh, thứ tự, khoảng cách hoặc tỉ lệ với ít giá trị rời rạc.

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 19


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Để tạo đồ thị bạn vào menu Graphs > Legacy Dialogs > Bar. Ngoài ra còn nhiều
dạng đồ thị khác mà bạn có thể lựa chọn, khám phá.

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 20


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Để hiệu chỉnh đồ thị và các bảng biểu chúng ta có thể nhấp đúp chuột trên vùng đồ
thị, một cửa sổ Editor sẽ mở ra cho phép bạn thao tác chỉnh sửa, lựa chọn màu sắc,
kích thước…
Nếu bạn muốn tự mình xây dựng dạng đồ thị từ mẫu có sẵn thì có thể sử dụng chức
năng Graphs > Chart Builder

* Lưu ý: bạn có thể vẽ đồ thị trong phần tạo bảng tần số (Frequencies) với nút
Charts.

2. Thống kê suy diễn


* Thống kê suy diễn (Statistical Inference): sử dụng các thông số của mẫu để ước
lượng và kiểm nghiệm các giả thuyết về tổng thể.
Phương pháp: dùng các phương pháp kiểm định thống kê để kiểm nghiệm các giả
thuyết về tổng thể.
- Kiểm định các mối quan hệ - tương quan có ý nghĩa giữa các biến khảo sát.
- Kiểm nghiệm sự khác biệt có ý nghĩa giữa các giá trị trung bình.

+ Kiểm định trung bình tổng thể


Bài toán
Quy trình kiểm định
 B1: Ñaët hai giaû thieát H
0
vaø H
1
▪H
0
: Giaû thieát ñuùng µ = µ0
▪H
1
: µ <> µ0:

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 21


Hướng dẫn sử dụng SPSS cho người mới bắt đầu

Giaû thieáùt sai


 B2: Tìm möùc yù nghóa cuûa toång theå maãu (.sig)
 B3: tìm mieàn baùc boû H
0
(α)
 B4: Ra quyeát ñònh H
0
neáu sig > α vaø ngöôïc laïi

Hệ số ý nghĩa (P-value hay Significant level)


Thao tác
+ Kiểm định trung bình hai tổng thể
Bài toán
Kiểm định trung bình hai mẫu độc lập (1 biến định lượng, 1 biến định tính)
Thao tác
 Quy trình kieåm ñònh:
1. B1: Kieåm ñònh phöông sai choïn höôùng kieåm
ñònh (Levene’s test).
2. B2: Kieåm ñònh giaû thieát của bài toán
Kết quả

Kiểm định 2 mẫu độc lập

Kiểm định ANOVA

V/ Phụ lục

Một số video trực tuyến về SPSS tại youtube.com


1) Introduction to SPSS (part I - http://www.youtube.com/watch?v=msI7xf0tInE, part
II - http://www.youtube.com/watch?v=i3D35wMGs_Q )

Tài liệu tham khảo


1) http://en.wikipedia.org/wiki/SPSS
2)
http://www.diendantoanhoc.net/vmf/index.php?option=com_ccboard&view=postlist
&forum=17&topic=66&Itemid=474
3) Phân tích dữ liệu nghiên cứu với SPSS, Hoàng Trọng, Chu Nguyễn Mộng Ngọc,
NXB Thống kê 2005.
4) Xử lý data với SPSS, Nguyễn Duy Tâm.
Và các tài nguyên trực tuyến khác

Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật 22

You might also like