You are on page 1of 70

Phaân tích döõ lieäu baèng SPSS

CHÖÔNG 1: KHAÙI QUAÙT VEÀ QUI TRÌNH NGHIEÂN CÖÙU – XÖÕ


LYÙ THOÂNG TIN VAØ MOÄT SOÁ LYÙ THUYEÁT THOÁNG KEÂ CÔ
BAÛN SÖÛ DUÏNG TRONG PHAÂN TÍCH THOÂNG TIN

1. Qui trình cuûa moät cuoäc nghieân cöùu


Thoâng thöôøng moät qui trình nghieân cöùu bao goàm 8 böôùc:
- Böôùc 1: Xaùc ñònh vaán ñeà caàn nghieân cöùu
- Böôùc 2: Xaùc ñònh loaïi thoâng tin caàn thu thaäp vaø nguoàn cung caáp thoâng
tin
- Böôùc 3: Choïn maãu nghieân cöùu
- Böôùc 4: Thieát keá nghieân cöùu vaø xaùc ñònh phöông phaùp thu thaäp thoâng
tin.
- Böôùc 5: Thieát keá baûng caâu hoûi
- Böôùc 6: Thu thaäp döõ lieäu
- Böôùc 7: Xöû lyù, phaân tích vaø dieãn giaûi caùc döõ lieäu ñaõ ñöôïc xöõ lyù
- Böôùc 8: Trình baøy vaø baùo caùo keát quaû
2. Xöõ lyù thoâng tin trong nghieân cöùu thöïc ñòa
Coù hai daïng thoâng tin nghieân cöùu caàn thu thaäp, loaïi thöù nhaát laø thoâng tin
thöù caáp vaø vaø loaïi thöù hai laø thoâng tin sô caáp.
- Thoâng tin thöù caáp laø nhöõng thoâng tin ñaõ hieän höõu treân caùc nguoàn
taøi lieäu ñaõ ñöôïc ñaêng taûi, thoâng tin naøy ñaõ ñöôïc toå chöùc thaønh
baûng bieåu, ñoà thò. Loaïi thoâng tin naøy ngöôøi nghieân cöùu chæ vieäc söû
duïng vaø dieãn giaûi theo nhu caàu nghieân cöùu cuûa mình maø khoâng caàn
phaûi traõi qua moät quaù trình xöõ lyù phöùc taïp ñoøi hoûi söï hoã trôï cuûa
caùc phaàn meàm phaân tích vaø xöõ lyù thoâng tin chuyeân duïng.
- Thoâng tin sô caáp laø thoâng tin chöa hieän höõu, muoán coù thoâng tin naøy
ñoøi hoûi caùc nhaø nghieân cöùu phaûi thöïc hieän moät qui trình nghieân cöùu
vôùi nhieàu böôùc ñaõ trình baøy ôû treân. Trong nghieân cöùu thu thaäp thoâng
tin sô caáp toàn taïi hai daïng nghieân cöùu chính yeáu nghieân cöùu ñònh tính
vaø nghieân cöùu ñònh löôïng. Thoâng tin trong nghieân cöùu ñònh tính khoâng
coù yù nghóa veà maët thoáng keâ, quaù trình phaân tích vaø xöõ lyù chæ döøng
ôû choå taäp hôïp, phaân nhoùm nhöõng yù kieán quan ñieåm khaùc bieät vaø
khoâng ñoøi hoûi nhieàu söï hoã trôï cuûa caùc coâng cuï vaø kieán thöùc thoáng
keâ. Ngöôïc laïi vôùi thoâng tin nghieân cöùu ñònh löôïng laïi ñoøi hoûi nhieàu
kyû naêng vaø kieán thöùc phaân tích thoáng keâ ñeå toå chöùc vaø phaân tích.
Phaàn meàm SPSS laø moät coâng cuï höõu hieäu cho vieäc xöõ lyù vaø phaân
tích nhöõng thoâng tin nghieân cöùu ñònh löôïng naøy.
Trong nghieân cöùu ñònh löôïng, döõ lieäu ban ñaàu ñöôïc thu thaäp töø hieän
tröôøng laø döõ lieäu thoâ, chuùng ta chöa theå tieán haønh phaân tích vaø dieãn
giaûi nhöõng döõ lieäu daïng thoâ naøy ngay ñöôïc maø ñoøi hoûi phaûi tieán haønh

Bieân soaïn: Ñaøo Hoaøi Nam 1


Phaân tích döõ lieäu baèng SPSS

caùc böôùc xöõ lyù vaø phaân tích caàn thieát töø maõ hoùa, kieåm tra, hieäu ñính,
nhaäp lieäu ñeán taïo baûng bieåu cho döõ lieäu vaø thöïc hieän caùc phaân tích
thoáng keâ töông thích.
Nhieäm vuï toång quaùt cuûa vieäc xöõ lyù – phaân tích döõ lieäu laø chuyeån
nhöõng maãu döõ lieäu quan saùt thoâ maø ta ñaõ tieán haønh maõ hoùa vaø kieåm
tra thaønh nhöõng con soá thoáng keâ coù yù nghóa cho vieäc dieãn giaûi keát quaû
nghieân cöùu. Toaøn boä coâng vieäc xöõ lyù – phaân tích phöùc taïp naøy ñoøi
hoûi caàn phaûi coù maùy tính vaø caùc phaàn meàm chuyeân duïng hoã trôï.
3. Qui trình xöõ lyù soá lieäu
Trong moät qui trình nghieân cöùu ñònh löôïng. Vieäc xöõ lyù döõ lieäu baét ñaàu
töø khi ta nhaän ñöôïc baûng caâu hoûi ñaõ ñöôïc phoûng vaán. Qui trình xöõ lyù
soá lieäu bao goàm caùc böôùc sau:
- Böôùc 1: Kieåm tra, hieäu chænh caùc traû lôøi treân baûng caâu hoûi
- Böôùc 2: Maõ hoùa caùc caâu traû lôøi treân baûng caâu hoûi
- Böôùc 3: Nhaäp döõ lieäu ñaõ ñöôïc maõ hoùa vaøo maùy tính
- Böôùc 4: Xaùc ñònh caùc loãi trong cô sôû döõ lieäu vaø laøm saïch döõ lieäu
- Böôùc 5: Taïo baûng cho döõ lieäu vaø tieán haønh caùc phaân tích thoáng keâ
Hai giai ñoaïn ñaàu tieân laø nhöõng böôùc chuaån bò cho vieäc phaân tích baèng
maùy tính sau naøy. Giai ñoaïn 3 laø nhaäp caùc döõ lieäu ñaõ ñöôïc maõ hoùa vaøo
maùy tính. Quaù trình nhaäp lieäu naøy coù theå daãn ñeán nhöõng sai xoùt do ñoù
moät böôùc keá tieáp phaûi ñöôïc thöïc hieän tröôùc khi tieán haønh phaân tích döõ
lieäu laø phaûi laøm saïch döõ lieäu ñaõ ñöôïc nhaäp vaøo trong maùy.
4. Moät soá lyù thuyeát thoáng keâ cô baûn
4.1. Caùc tham soá thoáng keâ ño löôøng ñoä taäp trung hay hoäi tuï cuûa
döõ lieäu (central tendency measurement)
- Giaù trò trung bình (Mean): Laø giaù trò trung bình soá hoïc cuûa moät bieán,
ñöôïc tính baèng toång caùc giaù trò quan saùt chia cho soá quan saùt. Ñaây laø
daïng coâng cuï thöôøng ñöôïc duøng cho daïng ño khoaûng caùch vaø tyû leä.
Giaù trò trung bình coù ñaëc ñieåm laø chòu söï taùc ñoäng cuûa caùc giaù trò ôû
moãi quan saùt, do ñoù ñaây laø thang ño nhaïy caûm nhaát ñoái vôùi söï thay
ñoåi cuûa caùc giaù trò quan saùt. Giaù trò trung bình ñöôïc tính baèng coâng
thöùc sau:
n

x i
X  i 1

n
- Trung vò (Median): Laø soá naèm giöõa (neáu löôïng quan saùt laø soá leõ)
hoaëc laø giaù trò trung bình cuûa hai quan saùt naèm giöõa (neáu soá löôïng
quan saùt laø soá chaún) cuûa moät daõy quan saùt ñöôïc xaép xeáp theo thöù töï
töø nhoû ñeán lôùn. Ñaây laø daïng coâng cuï thoáng keâ thöôøng ñöôïc duøng
ñeå ño löôøng möùc ñoä taäp trung cuûa daïng döõ lieäu thang ño thöù töï, noù

Bieân soaïn: Ñaøo Hoaøi Nam 2


Phaân tích döõ lieäu baèng SPSS

coù ñaëc ñieåm laø khoâng bò aûnh höôûng cuûa caùc giaù trò ñaàu muùt cuûa
daõy phaân phoái, do ñoù raát thích hôïp ñeå phaân tích ñoái vôùi döõ lieäu coù
söï cheânh leäch lôùn veà giaù trò ôû hay ñaàu muùt cuûa daõy phaân phoái.
- Mode: Laø giaù trò coù taàn suaát xuaát hieän lôùn nhaát cuûa moät taäp hôïp
caùc soá ño, daïng naøy thöôøng ñöôïc duøng ñoái vôùi daïng döõ lieäu thang
bieåu danh. Gioáng nhö trung vò, mode khoâng bò aûnh höôûng bôûi giaù trò
ñaàu muùt cuûa daõy phaân phoái.
4.2. Caùc tham soá thoáng keâ ño löôøng möùc ñoä phaân taùn cuûa döõ
lieäu (Dispersion),
Khaûo saùt hai nhoùm caùc con soá sau::
Nhoùm 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Nhoùm 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
Ta thaáy soá kích thöôùt maãu cuûa hai nhoùm naøy baèng nhau, caùc giaù trò ño
löôøng möùc ñoä taäp trung cuûa döõ lieäu nhö mean, media, mode ñeàu baèng nhau
vaø baèng 6. Tuy nhieân hai döõ lieäu naøy hoaøn toaøn khaùc nhau. Nhoùm 1 caùc
döõ lieäu bieán ñoåi nhieàu hôn nhoùm 2, ñieàu naøy coù nghóa caùc giaù trò trong
nhoùm 1 phaân taùn hôn, caùc giaù trò quan saùt naèm xa giaù trò trung bình cuûa
maãu hôn laø nhoùm 2. Ño löôøng ñoä phaân taùn cho bieát ñöôïc nhöõng khaùc
bieät giöõa hai nhoùm döõ lieäu. Coù moät soá coâng cuï ño löôøng ñoä phaân taùn
cuûa döõ lieäu nhö:
- Phöông sai (Variance): Duøng ñeå ño löôøng möùc ñoä phaân taùn cuûa moät
taäp caùc giaù trò quan saùt xung quanh giaù trò trung bình cuûa taäp quan saùt
ñoù. Phöông sai baèng trung bình caùc bình phöông sai leäch giöõa caùc giaù trò
quan saùt ñoái vôùi giaù trò trung bình cuûa caùc quan saùt ñoù. Ngöôøi ta duøng
phöông sai ñeå ño löôøng tính ñaïi dieän cuûa giaù trò trung bình töông öùng,
caùc tham soá trung bình coù phöông sai töông öùng caøng lôùn thì giaù trò
thoâng tin hay tính ñaïi dieän cuûa giaù trò trung bình ñoù caøng nhoû. Phöông
sai cuûa maãu ñöôïc tính baèng coâng thöùc sau:

 (x
i 1
i  x)2
S2 
n 1
- Ñoä leäch chuaån (Standard deviation): Moät coâng cuï khaùc duøng ñeå ño
löôøng ñoä phaân taùn cuûa döõ lieäu xung quanh giaù trò trung bình cuûa noù.
Ñoä leäch chuaån chính baèng caên baät hai cuûa phöông sai. Vì phöông sai laø
trung bình cuûa caùc bình phöông sai leäch cuûa caùc giaù trò quan saùt töø giaù
trò trung bình, vieäc khaûo saùt phöông sai thöôøng cho caùc giaù trò raát lôùn,
do ñoù söû duïng phöông sai seõ gaëp khoù khaên trong vieäc dieãn giaûi keát
quaû. Söû duïng ñoä leäch chuaån seõ giuùp deã daøng cho vieäc dieãn giaûi do
caùc keát quaû sai bieät ñöa ra saùt vôùi döõ lieäu goác hôn.

Bieân soaïn: Ñaøo Hoaøi Nam 3


Phaân tích döõ lieäu baèng SPSS

- Khoaûng bieán thieân (Range): Laø khoaûng caùch giöõa giaù trò quan saùt
nhoû nhaát ñeán giaù trò quan saùt lôùn nhaát.
- Sai soá trung bình maãu (Standard Error of Mean) Ñöôïc duøng ñeå ño
löôøng söï khaùc bieät veà giaù trò trung bình cuûa maãu nghieân cöùu naøy so
vôùi maãu nghieân cöùu khaùc trong ñieàu kieän coù cuøng phaân phoái. Noù
coù theå ñöôïc duøng ñeå so saùnh giaù trò trung bình quan saùt vôùi moät giaù
trò ban ñaàu naøo ñoù (giaû thuyeát). Vaø ta coù theå keát luaän hai giaù trò
naøy laø khaùc nhau neáu tyû soá veà söï khaùc bieät ñoái vôùi standard error of
mean naèm ngoaøi khoaûng (-2,+2). Coâng thöùc tính sai soá trung bình maãu:
S
Sx 
n

4.3. Khoaûng öôùc löôïng (Confident interval)


Laø moät öôùc löôïng xaùc ñònh khoaûng giaù trò ñaëc tröng cuûa toång theå coù
theå rôi vaøo. Döïa vaøo döõ lieäu maãu, vôùi moät ñoä tin caäy cho tröôùc ta coù
theå xaùc ñònh ñöôïc giaù trò ñaïi dieän cho ñaùm ñoâng coù theå naèm trong moät
khoaûng öôùc löôïng naøo ñoù.
Ví duï goïi x laø möùc thu nhaäp trung bình cuûa ñaùm ñoâng caàn öôùc löôïng.
Vôùi ñoä tin caäy cuûa khoaûng saùt nghieân cöùu laø 95% (nghóa laø caùc öôùc
löôïng seõ luoân coù moät löôïng sai soá chaáp nhaän laø 5%). Döïa vaøo maãu quan
saùt ta coù theå xaùc ñònh ñöôïc hai giaù trò veà thu nhaäp laø a vaø b sao cho xaùc
suaát ñeå thu nhaäp trung bình ñaùm ñoâng x rôi vaøo khoaûng a vaø b (a, b) laø
95%. Luùc naøy ta coù theå dieãn giaûi raèng vôùi ñoä chính xaùc laø 95% (hay
chaáp nhaän 5% sai soá) ta bieát ñöôïc thu nhaäp trung bình cuûa ñaùm ñoâng
nghieân cöùu naèm trong khoaûng (a, b).
Coâng thöùc tính khoaûng öôùc löôïng:

SX
E  X  t , n 1
n

Hoaëc: E= p ± tα,n-1 Sp
Vôùi p laø tyû leä % taàn suaát xuaát hieän cuûa moät giaù trò quan saùt
4.4. Kieåm nghieäm giaû thuyeát (Hypothesis testing)
Beân caïnh vieäc öôùc löôïng caùc ñaëc tröng cuûa toång theå, caùc döõ lieäu maãu
thu thaäp ñöôïc coøn ñöôïc duøng ñeå ñaùnh giaù xem moät giaû thuyeát naøo ñoù
veà toång theå laø ñuùng hay sai. Ta goïi ñoù laø kieåm nghieäm giaû thuyeát. Noùi
caùch khaùc kieåm nghieäm giaû thuyeát laø döïa vaøo caùc thoâng tin maãu ñeå
ñöa ra keát luaän baùc boû hay chaáp nhaän veà giaû thuyeát cuûa toång theå
Ví duï: Sau moät thôøi gian thöïc hieän caùc chöông trình, bieän phaùp marketing
(quaûng caùo, khuyeán maõi,…) coâng ty muoán ñaùnh giaù xem thò phaàn, doanh

Bieân soaïn: Ñaøo Hoaøi Nam 4


Phaân tích döõ lieäu baèng SPSS

soá coù gì thay ñoåi so vôùi tröôùc khoâng, hay coù ñaït ñöôïc muïc tieâu ñeà ra
khoâng.
Hoaëc coâng ty muoán tìm hieåu xem sôû thích cuûa ngöôøi tieâu duøng veà kieåu
daùng, maøu saéc, muøi vò khaùc nhau veà saûn phaåm cuaû coâng ty. Hoï thích
ñaëc bieät moät kieåu daùng naøo ñoù, moät maøu saéc naøo ñoù, hay caùc kieåu
daùng, maøu saéc khaùc nhau ñeàu ñöôïc öa thích nhö nhau.
Phöông phaùp kieåm nghieäm giaû thuyeát seõ giuùp giaûi quyeát nhöng yeâu caàu
naøy
Ñeå kieåm nghieäm giaû thuyeát ta phaûi xaây döïng giaû thuyeát. Giaû thuyeát ñaõ
hình thaønh ñöôïc goïi laø giaû thuyeát H0 ñöôïc xem nhö ñuùng cho ñeán khi ta coù
ñuû caên cöù ñeå keát luaän khaùc hôn. Neáu giaû thuyeát H 0 khoâng ñuùng thì
phaûi coù moät giaû thuyeát naøo ñoù khaùc H0 goïi laø H1 laø ñuùng. Moät soá giaû
thuyeát thöôøng gaëp trong phaân tích:

_____oOo_____

Bieân soaïn: Ñaøo Hoaøi Nam 5


Phaân tích döõ lieäu baèng SPSS

CHÖÔNG 2: GIÔÙI THIEÄU VEÀ PHAÀN MEÅM SPSS


Laø phaàn meàm chuyeân duïng xöõ lyù thoâng tin sô caáp (thoâng tin ñöôïc thu
thaäp tröïc tieáp töø ñoái töôïng nghieân cöùu (ngöôøi traû lôøi baûng caâu hoûi)
thoâng qua moät baûng caâu hoûi ñöôïc thieát keá saún.
Thoâng tin ñöôïc xöõ lyù laø thoâng tin ñònh löôïng (coù yù nghóa veà maët thoáng
keâ)
Phaàn meàm SPSS coù taát caû 4 daïng maøn hình:
1. Maøn hình quaûn lyù döõ lieäu (data view):
Laø nôi löu tröõ döõ lieäu nghieân cöùu vôùi moät caáu truùc cô sôû döõ lieäu bao
goàm coät, haøng vaø caùc oâ giao nhau giöõa coät vaø haøng
- Coät (Column): Ñaïi dieän cho bieán quan saùt. Moãi coät seõ chöùa ñöïng taát
caû caùc caâu traû lôøi trong moät caâu hoûi ñöôïc thieát keá trong baûng caâu
hoûi
- Haøng (Row): Ñaïi dieän cho moät tröôøng hôïp quan saùt (ngöôøi traû lôøi), Ta
phoûng vaán bao nhieâu ngöôøi (tuøy thuoäc vaøo kích thöôùc maãu) thì ta seõ
coù baáy nhieâu haøng. Moãi haøng chöùa ñöïng taát caû nhöõng caâu traû lôøi
(thoâng tin) cuûa moät ñoái töôïng nghieân cöùu
- OÂ giao nhau giöõa coät vaø haøng (cell): Chöùa ñöïng moät keát quaû traû
lôøi töông öùng vôùi caâu hoûi caàn khaûo saùt (bieán) vaø moät ñoái töôïng traû
lôøi cuï theå (tröôøng hôïp quan saùt)
2. Maøn hình quaûn lyù bieán (variables view):
Laø nôi quaûn lyù caùc bieán cuøng vôùi caùc thoâng soá lieân quan ñeán bieán.
Trong maøn hình naøy moãi haøng treân maøn hình quaûn lyù moät bieán, vaø moãi
coät theå hieän caùc thoâng soá lieân quan ñeán bieán ñoù
- Teân bieán (name): Laø teân ñaïi dieän cho bieán, teân bieán naøy seõ ñöôïc
hieãn thò treân ñaàu moãi coät trong maøn hình döõ lieäu
- Loaïi bieán (type): Theå hieän daïng döõ lieäu theå hieän trong bieán. Daïng
soá, vaø daïng chuoãi
- Soá löôïng con soá hieãn thò cho giaù trò (Width): Giaù trò daïng soá ñöôïc
pheùp hieãn thò bao nhieâu con soá.
- Soá löôïng con soá sau daáu phaåy ñöôïc hieãn thò (Decimals)
- Nhaõn cuûa bieán (label): Teân bieán chæ ñöôïc theå hieän toùm taéc baèng
kyù hieäu, nhaõn cuûa bieán cho pheùp neâu roõ hôn veà yù nghóa cuûa bieán.
- Giaù trò trong bieán (Values): Cho pheùp khai baùo caùc giaù trò trong bieán
vôùi yù nghóa cuï theå (nhaõn giaù trò)
- Giaù trò khuyeát (Missing): Do thieát keá baûng caâu hoûi coù moät soá giaù
trò chæ mang tính chaát quaûn lyù, khoâng coù yù nghóa phaân tích, ñeå loaïi
boû caùc bieán naøy ta caàn khai baùo noù nhö laø giaù trò khuyeát (user
missing). SPSS maëc ñònh giaù trò khuyeán (system missing) laø moät daáu

Bieân soaïn: Ñaøo Hoaøi Nam 6


Phaân tích döõ lieäu baèng SPSS

chaám vaø töï ñoäng loaïi boû caùc giaù trò naøy ra khoûi caùc phaân tích thoáng
keâ.
- Kích thöôùt coät (columns): Cho pheùp khai baùo ñoä roäng cuûa coät
- Ví trí (align): Vò trí hieãn thò caùc giaù trò trong coät (phaûi, traùi, giöõa)
- Daïng thang ño (measures): Hieãn thò daïng thang ño cuûa giaù trò trong bieán
3. Maøn hình hieãn thò keát quaû (output):
Caùc pheùp phaân tích thoáng keâ seõ cho ra caùc keát quaû nhö baûng bieåu, ñoài
thò vaø caùc keát quaû kieåm nghieäm, caùc keát quaû naøy seõ ñöôïc truy xuaát ra
moät maøn hình, vaø ñöôïc löu giöõ döôùi moät taäp tin khaùc (coù ñuoâi laø .SPO).
Maøn hình naøy cho pheùp ta xem vaø löu giöõ caùc keát quaû phaân tích.
4. Maøn hình cuù phaùp (syntax):
Maøn hình naøy cho pheùp ta xem vaø löu tröõ nhöõng cuù phaùp cuûa moät leänh
phaân tích. Caùc cuù phaùp ñöôïc löu tröõ seõ ñöôïc söû duïng laïi maø khoâng caàn
thao taùc caùc leänh phaân tích laïi.
5. Khaùi quaùt veà phaân tích döõ lieäu
5.1. Kieåm tra döõ lieäu (Data Screening)
Moät thöïc teá luoân luoân gaëp phaûi ñoái vôùi nhöõng ngöôøi laøm coâng taùc
phaân tích vaø xöû lyù soá lieäu laø haàu nhö khoâng luùc naøo maø khoâng gaëp
nhöõng vaán ñeà ñoái vôùi döõ lieäu trong tay hoï, moät soá xuaát hieän do loãi
nhaäp maùy, loãi maõ hoùa, hoaëc do caùc loãi veà choïn maãu vaø chaát löôïng
phoûng vaán, taát caû nhöõng loãi naøy thöôøng daãn ñeán nhöõng khaùc thöôøng
hoaëc tính ñaïi dieän keùm cuûa döõ lieäu thu thaäp.
Trong nhöõng cuoäc nghieân cöùu qui moâ lôùn, coâng vieäc kieåm tra döõ lieäu
ñoâi khi coøn toán nhieàu coâng söùc vaø thôøi gian hôn caû vieäc phaân tích vaø
toùm taéc döõ lieäu. Do ñoù gaàn nhö laø nhieäm vuï ñaàu tieân cuûa ngöôøi phaân
tích döõ lieäu laø phaûi tieán haønh kieåm tra döõ lieäu nhaèm xaùc ñònh ra caùc
loãi trong döõ lieäu ñoàng thôøi kieåm tra xem tính töông thích cuûa döõ lieäu nhö
theá naøo so vôùi nhöõng giaû thuyeát ñöôïc yeâu caàu cho caùc phaân tích thoáng
keâ sau naøy.
 Xaùc ñònh nhöõng giaù trò vöôït troäi (Outliers) vaø caùc giaù trò loãi
(Roque values)
Coù nhieàu caùch ñeå xaùc ñònh ra caùc giaù trò vôït troäi vaø giaù trò loãi. Tuy
nhieân ñieàu quan troïng laø xaùc ñònh xem caùc giaù trò vöôït troäi ñoù coù
phaûi laø giaù trò loãi hay khoâng hay do söï baát thöôøng trong maãu nghieân
cöùu:
- Söû duïng coâng cuï baûng phaân boå taàn xuaát ngoaøi vieäc ñeå ñeám soá
laàn xuaát hieän cuûa töøng giaù trò rieâng bieät, noù coøn giuùp ta tìm ra
caùc giaù trò loãi hoaëc caùc giaù trò maõ hoùa sai soùt hoaëc khoâng mong
ñôïi (ví duï nhö bieán giôùi tính chæ coù hai giaù trò maõ hoùa 1 vaø 2 töông
öùng vôùi giôùi tính nam vaø nöõ do ñoù khi khaûo saùt ta seõ phaùt hieän ra
caùc giaù trò khaùc vôùi giaù trò maõ hoùa 1 vaø 2). Ngoaøi ra coâng cuï

Bieân soaïn: Ñaøo Hoaøi Nam 7


Phaân tích döõ lieäu baèng SPSS

naøy coøn cho pheùp ta nhaän ra ñöôïc caùc giaù trò khuyeát (Missing
values) nhöng laïi xuaát hieän nhö laø moät giaù trò hôïp leä (Valid value)
- Ñoâi khi vieäc xaùc ñònh caùc giaù trò vöôït troäi coù theå ñöôïc xaùc ñònh
moät caùch toát hôn khi ta khaûo saùt hai hay nhieàu bieán cuøng moät luùc.
Ñoái vôùi caùc bieán daïng bieåu danh (nominal) hoaëc thöù töï (ordinal) söû
duïng coâng cuï baûng cheùo ta coù theá xaùc ñònh ñöôïc nhöõng söï keát
hôïp phi lyù giöõa hai hoaëc nhieàu bieán, ví duï nhö moät ngöôøi chöa bao
giôø tieâu duøng saûn phaåm A nhöng laïi tham gia ñöa ra nhöõng yù kieán
möùc ñoä thoûa maõn trong tieâu duøng saûn phaåm A.
5.2. Thoáng keâ moâ taû (Descriptive Statistics)
Ñaây coù theå ñöôïc xem laø phaàn coát loõi vaø thöôøng gaëp nhaát trong vieäc
phaân tích vaø xöû lyù soá lieäu. Tuy nhieân tröôùc khi baét tay vaøo vieäc moâ taû
döõ lieäu (ño löôøng ñoä taäp trung hay phaân taùn, tyû leä %, moái quan heä giöõa
caùc bieán …), caàn thieát phaûi naém ñöôïc loaïi bieán ñang khaûo saùt (loaïi thang
ño cuûa bieán) hay noùi caùch khaùc ta phaûi naém ñöôïc yù nghóa cuûa caùc giaù
trò trong bieán
Ñoái vôùi bieán ñònh danh hoaëc thöù töï (nominal vaø ordinal) caùc pheùp tính
toaùn soá hoïc nhö giaù trò trung bình khoâng coù yù nghóa thoáng keâ, ñaëc bieät
ñoái vôùi bieán ñònh danh moïi söï so saùnh hôn keùm giöõa caùc giaù trò trong
bieán ñeàu voâ nghóa. Ngöôïc laïi caùc bieán ñònh löôïng nhö thang ño khoaûng
caùch vaø thang ño tyû leä (Interval vaø Ratio) thì moïi söï so saùnh hay tính toaùn
soá hoïc ñeà coù yù nghóa phaân tích thoáng keâ
5.3. Kieåm nghieäm caùc so saùnh trung bình maãu (Tests for Comparing
Means)
Trong phaân tích thoáng keâ ngöôøi ta thöôøng söû duïng caùc pheùp kieåm
nghieäm kieåm nghieäm caùc giaû thuyeát veà giaù trò trung bình cuûa caùc bieán
ñònh löôïng, vaø thoáng keâ cung caáp cho ta caùc coâng cuï nhö kieåm nghieäm t
(T-Test) hay kieåm nghieäm Z (Z-test)
 Kieåm nghieäm t cho moät maãu, caëp maãu vaø hai maãu ngaãu nhieân
ñoäc laäp
Ta coù ba daïng kieåm nghieäm t cho vieäc so saùnh caùc giaù trò trung bình
cuûa maãu. Vieäc söû duïng daïng naøo tuøy thuoäc vaøo vaán ñeà ta ñang tieán
haønh so saùnh caùi gì
- Söû duïng kieåm nghieäm t cho hai maãu ngaãu nhieân ñoäc laäp
(Independent Samples T Test) laø phöông phaùp nhaèm muïc ñích kieåm
nghieäm so saùnh giaù trò trung bình cuûa moät bieán rieâng bieät theo moät
nhoùm coù khaùc bieät hay khoâng ñoái vôùi giaù trò trung bình cuûa bieán
rieâng bieät ñoù theo moät nhoùm khaùc. Vôùi giaû thuyeát ban ñaàu H 0 cho
raèng giaù trò trung bình cuûa hai nhoùm naøy laø baèng nhau. Ví duï ta
kieåm nghieäm thu nhaäp trung bình (bieán thu nhaäp) theo hai nhoùm giôùi
tinh laø nam vaø giôùi tính laø nöõ (bieán giôùi tính söû duïng ñeå chia caùc
giaù trò quan saùt trong bieán thu nhaäp thaønh hai nhoùm)

Bieân soaïn: Ñaøo Hoaøi Nam 8


Phaân tích döõ lieäu baèng SPSS

- Coâng cuï kieåm nghieäm t cho caëp maãu (Paired-Samples T Test) ñöôïc söû
duïng ñeå kieåm nghieäm coù hay khoâng giaù trò trung bình cuûa caùc
khaùc bieät giöõa caùc caëp quan saùt laø khaùc giaù trò 0. Vôùi giaû thuyeát
ban ñaàu H0 cho raèng giaù trò trung bình caùc khaùc bieät naøy laø baèng 0.
Ví duï nhö kieåm nghieäm söï khaùc bieät veà ñieåm thi moân hoïc cuûa hai
nhoùm sinh vieân coù tham gia vaø khoâng coù tham gia chöông trình phuï
ñaïo ngoaøi giôø.
- Coâng cuï kieåm nghieäm t moät maãu (One-Sample T Test) ñeå kieåm
nghieäm coù hay khoâng giaù trò trung bình cuûa moät bieán laø khaùc bieät
vôùi moät giaù trò giaû ñònh töø tröôùc. Vôùi giaû thuyeát ban ñaàu H 0 cho
raèng giaù trò trung bình kieåm nghieäm laø baèng vôùi giaù trò giaû thuyeát
ñöa ra
 Phaân tích phöông sai moät chieàu (One-Way ANOVA)
Phaân tích phöông sai laø moät daïng môû roäng cuûa phöông phaùp kieåm
nghieäm t hai maãu ngaãu nhieân ñoäc laäp (Independent-Samples T Test), vaø
ñöôïc söû duïng ñeå kieåm nghieäm cho nhieàu hôn hai nhoùm. Phöông phaùp
phaân tích naøy khaûo saùt söï bieán thieân giöõa caùc trung bình maãu trong
moái lieân heä vôùi söï phaân taùng cuûa caùc quan saùt trong töøng moãi
nhoùm. Vôùi giaû thuyeát ban ñaàu H0 cho raèng caùc giaù trò trung bình naøy
laø baèng nhau.
5.4. Kieåm nghieäm caùc moái quan heä (Testing Relationships)
Kieåm nghieäm moái quan heä giöõa hai bieán vaø kieåm nghieäm moái töông quan
vôùi cöôøng ñoä töông quan vaø chieàu cuûa töông quan giöõa caùc bieán trong cô
sôø döõ lieäu
- Trong kieåm nghieäm moái quan heä giöõa hai bieán, ta söû duïng kieåm
nghieäm Chi-bình phöông ñeå kieåm nghieäm giaû thuyeát ban ñaàu cho
raèng hai bieán theå hieän trong baûng cheùo (bieán coät vaø bieán haøng)
laø khoâng coù moái quan heä vôùi nhau (ñoäc laäp vôùi nhau).
- Trong kieåm nghieäm töông quan giöõa caùc bieán ta söû duïng kieåm
nghieäm F kieåm nghieäm giaû thuyeát ban ñaàu cho raèng giöõa caùc bieán
ñang khaûo saùt khoâng coù töông quan vôùi nhau (heä soá töông quan R =
0)
____o0o____

Bieân soaïn: Ñaøo Hoaøi Nam 9


Phaân tích döõ lieäu baèng SPSS

CHÖÔNG 3: CHUAÅN BÒ DÖÕ LIEÄU


1. Kieåm tra vaø hieäu ñính döõ lieäu
Ñaây laø böôùc kieåm tra chaát löôïng thoâng tin trong baûng caâu hoûi nhaèm baûo
ñaûm khoâng coù baûng caâu hoûi naøo thieáu hoaëc chöùa ñöïng nhöõng thoâng tin
sai soùt theo yeâu caàu thieát keá ban ñaàu, böôùc naøy caàn thieát ñöôïc thöïc hieän
tröôùc khi tieán haønh maõ hoùa vaø nhaäp döõ lieäu vaøo maùy tính. Ngöôøi kieåm
tra phaûi baûo ñaûm tính toaøn veïn vaø tính chính xaùc cuûa töøng baûng caâu hoûi
& töøng caâu traû lôøi trong baûng caâu hoûi. Thoâng thöôøng böôùc naøy nhaøn
nghieân cöùu seõ tieán haønh kieåm tra nhöõng ñaëc tính sau cuûa baûng caâu hoûi:
- Tính logic cuûa caùc caâu traû lôøi: Ñoâi khi trong baûng caâu hoûi, do yeâu
caàu nghieân cöùu seõ coù nhöõng ñöôøng daãn, nhöõng ñieàu kieän ñeã ngöôøi
traû lôøi hoaëc coù theå traû lôøi taát caû caùc caâu hoûi hoaëc coù theå boû qua
moät vaøi caâu hoûi naøo ñoù. Kieåm tra tính logic cuûa baûng caâu hoûi cho
pheùp nhaø nghieân cöùu loaïi boû nhöõng caâu traû lôøi thöøa, cuõng nhö kòp
thôøi boå xung nhöõng phaàn thieáu trong baûng caâu hoûi. Tính logic cuûa caâu
traû lôøi coøn phuï thuoäc vaøo söï keát dính vaø lieân heä laãn nhau giöõa caùc
caâu hoûi trong moät baûng caâu hoûi (ñoâi khi moät caâu traû lôøi laø coù yù
nghóa neáu ñöùng rieâng moät mình noù nhöõng laïi voâ nghóa neáu keát hôïp so
saùnh vôùi caùc caâu traû lôøi tröôùc hoaëc sau noù).
- Tính ñaày ñuû cuûa moät caâu traû lôøi vaø cuûa moät baûng caâu hoûi:
Moät baûng caâu hoûi chæ coù giaù trò neáu nhö taát caû nhöõng caâu hoûi theo
yeâu caàu ñeàu ñöôïc traû lôøi ñaày ñuû. Moãi caâu hoûi trong baûng caâu hoûi
ñeàu coù moät yù nghóa, moät giaù trò nghieân cöùu nhaát ñònh, do ñoù thieáu
moät caâu traû lôøi naøo ñoù cho moät caâu hoûi cuï theå naøo ñoù seõ laøm
maát ñi giaù trò cuûa baûng caâu hoûi ñoù.
- Tính hôïp lyù vaø xaùc thöïc cuûa caùc caâu traû lôøi: Moät caâu traû lôøi
ñaày ñuû chöa haún laø caâu traû lôøi coù giaù trò, do ñoù tính chaân thöïc vaø
hôïp lyù cuûa caâu traû lôøi cuõng quyeát ñònh ñeán giaù trò cuûa caâu traû lôøi
vaø cuûa baûng caâu hoûi, ñaëc bieät laø caùc caâu hoûi chaám ñieåm, caâu hoûi
môû vaø caùc caâu hoûi mang tính logic.
Quaù trình kieåm tra, raø soaùt laïi baûn caâu hoûi laø nhaèm muïc ñích kieåm tra,
phaùt hieän, söûa chöûa vaø thoâng baùo kòp thôøi cho ngöôøi thu thaäp döõ lieäu
traùnh nhöõng sai soùt tieáp theo.
Ñeå xöû lyù caùc loãi trong kieåm tra vaø hieäu ñính, ta coù theå löïa choïn
caùch xöõ lyù nhö sau tuøy thuoäc vaøo möùc ñoä sai soùt cuï theå:
- Traû veà cho boä phaän thu thaäp döõ lieäu ñeå laøm saùng toû vaán ñeà
- Suy luaän töø caùc caâu traû lôøi khaùc
- Loaïi boû toaøn boä baûn caâu hoûi

Bieân soaïn: Ñaøo Hoaøi Nam 10


Phaân tích döõ lieäu baèng SPSS

2. Maõ hoaù döõ lieäu


Laø quaù trình chuyeån dòch caâu traû lôøi thöïc cuûa ngöôøi traû lôøi vaøo töøng
nhoùm, töøng maãu ñaïi dieän vôùi caùc giaù trò ñaïi dieän töông öùng nhaèm laøm
cho quaù trình toùm taéc, phaân tích vaø nhaäp lieäu ñöôïc deã daøng vaø hieäu
quaû hôn. Coù hai daïng maõ hoùa:
- Tieàn maõ hoùa: Laø vieäc maõ hoùa cho caùc caâu hoûi ñoùng. Do ñaëc ñieåm
cuûa caùc loaïi caâu hoûi naøy laø nhaø nghieân cöùu ñaõ coù saün caùc caâu
traû lôøi töø tröôùc, ngöôøi traû lôøi chæ vieäc löïa choïn caâu traû lôøi naøo
phuø hôïp nhaát vôùi yù kieán cuûa mình, do ñoù vieäc maõ hoùa cho caùc caâu
hoûi naøy thöôøng ñöôïc tieán haønh töø tröôùc, ôû giai ñoaïn thieát keá baûng
caâu hoûi.
- Maõ hoaù: Trong baûng caâu hoûi ngoaøi nhöõng caâu hoûi ñoùng neâu ôû
treân, coøn nhöõng caâu hoûi môû, laø nhöõng caâu hoûi maø ngöôøi traû lôøi
töï do ñöa ra caâu traû lôøi theo suy nghó vaø dieãn giaõi cuûa chính hoï. Caùc
baûng caâu hoûi nhaän veà thöôøng coù nhöõng caâu traû lôøi raát khaùc nhau
vaø raát ña daïng. Do ñoù coâng vieäc maõ hoùa nhöõng caâu traû lôøi naøy thì
caàn thieát cho quaù trình kieåm tra, nhaäp lieäu, toùm taéc vaø phaân tích sau
naøy.
Muïc ñích cuûa maõ hoùa laø taïo nhaõn cho caùc caâu traû lôøi, thöøông laø baèng
caùc con soá. Maõ hoùa coøn giuùp giaûm thieåu soá löôïng caùc caâu traû lôøi
baèng caùch nhoùm caùc caâu traû lôøi vaøo nhöõng nhoùm coù cuøng yù nghóa.
Tieàn trình maõ hoùa coù theå ñöôïc tieán haønh nhö sau:
- Ñaàu tieân, xaùc ñònh loaïi caâu traû lôøi cho nhöõng caâu hoûi töông öùng.
Nhöõng caâu traû lôøi naøy coù theå thu thaäp töø moät maãu caùc baûng caâu
hoûi ñaõ hoaøn taát, thöôøng laø 25% treân toång soá baûng caâu hoûi
- Böôùc tieáp theo laø xaây döïng moät danh saùch lieät keâ caùc caâu traû lôøi,
caùc caâu traû lôøi ñöôïc lieät keâ vaø tieán haønh nhoùm caùc caâu traû lôøi
theo nhöõng nhoùm ñaëc tröng (coù cuøng yù nghóa)
- Cuoái cuøng, nhöõng nhoùm caâu traû lôøi naøy ñöôïc gaùn cho moät nhaõn
hieäu, moät giaù trò, thöôøng laø moät con soá cuï theå

_____oOo_____

Bieân soaïn: Ñaøo Hoaøi Nam 11


Phaân tích döõ lieäu baèng SPSS

CHÖÔNG 4: ÑÒNH BIEÁN VAØ NHAÄP DÖÕ LIEÄU


1. Khaùi nieäm veà bieán vaø caùc giaù trò trong bieán
Bieán laø taäp hôïp nhöõng traû lôøi cho moät caâu hoûi. Coù hai loaïi bieán nhö
sau:
 Phaân loaïi bieán theo soá löôïng caâu traû lôøi:
- Bieán moät traû lôøi: Bieán daønh cho caâu hoûi coù moät traû lôøi
- Bieán nhieàu traû lôøi: Caùc bieán daønh cho nhieàu caâu traû lôøi coù
theå coù trong moät caâu hoûi nhieàu traû lôøi
Ví duï nhö trong baûng caâu hoûi coù hai caâu hoûi sau:
- Caâu hoûi 1: Haõy cho bieát baïn ôû nhoùm tuoåi naøo trong soá nhöõng
nhoùm tuoåi sau:
Nhoùm tuoåi code
Döôùi 18 1
19 ñeán 30 2
31 ñeán 40 3
41 ñeán 50 4
Treân 50 5
- Caâu hoûi 2: Noùi ñeán ñieän thoaïi di ñoäng, baïn bieát ñöôïc nhöõng
nhaõn hieäu naøo trong danh saùch lieät keâ döôùi ñaây
Nhaõn hieäu code
Ericson 1
Motorola 2
Nokia 3
Siemens 4
Panasonic 5
….V.V
Coù theå thaáy ñoái vôùi caâu hoûi 1, ngöôøi traû lôøi chæ coù theå ñöa ra moät
caâu traû lôøi duy nhaát veà tuoåi cuûa mình, do ñoù bieán chöùa ñöïng caâu traû
lôøi cuûa caâu hoûi 1 laø bieán moät traû lôøi. Trong khi xem xeùt caâu hoûi 2,
ngöôøi traû lôøi coù theå neâu ra nhieàu nhaõn hieäu maø hoï coù bieát qua, do
ñoù phaûi coù nhieàu bieán chöùa ñöïng caùc traû lôøi coù theå coù, ta goïi bieán
ñoù laø bieán nhieàu traû lôøi.
 Phaân loaïi bieán theo kieåu döõ lieäu:
Coù hai loaïi bieán chính laø bieán ñònh tính vaø bieán ñònh löôïng, ñoái vôùi
bieán ñònh tính ta khoâng theå söû duïng caùc pheùp toaùn (coäng, tröø, nhaân,
chia) ñeå tính toaùn caùc giaù trò treân bieán ñoù, ngöôïc laïi bieán ñònh löôïng

Bieân soaïn: Ñaøo Hoaøi Nam 12


Phaân tích döõ lieäu baèng SPSS

cho pheùp ta thao taùc caùc pheùp toaùn treân caùc giaù trò maø noù ñaïi dieän.
Vieäc xaùc ñònh daïng bieán theo caùch naøy cho pheùp ta löïa choïn ñöôïc tham
soá thoáng keâ töông thích ñeå phaân tích.
Ñeå xaùc ñònh ñöôïc bieán laø ñònh löôïng hay ñònh tính ñoùi hoûi phaûi xaùc
ñònh caùc giaù trò trong bieán thuoäc daïng thang ño naøo trong boán daïng
thang ñoù sau:
- Thang ño ñònh danh (Nominal Scale): Trong daïng thang ño naøy caùc con
soá ñöôïc söû duïng ñôn thuaàn nhö moät giaù trò xaùc ñònh söï khaùc bieät
cho caùc caâu traû lôøi, caùc giaù trò quan saùt coù yù nghóa khaùc bieät
nhau. Ñoái vôùi loaïi thang bieåu danh caùc giaù trò soá ñöôïc söû duïng nhö
laø kyù soá nhaän daïng vaø khoâng coù giaù trò veà moät thöù töï cao thaáp
vaø vaø ñoä lôùn giöõa caùc con soá
- Thang ño thöù töï (Ordinal Scale): Trong daïng thang ño naøy döõ lieäu
ñöôïc xaép xeáp caùc giaù trò quan saùt theo moät thöù töï cao thaáp nhaát
ñònh, nhöng khoâng dieãn taû ñöôïc ñoä lôùn giöõa vò trí cao thaáp giöõa
caùc con soá. Toùm laïi thang ñoù thöù töï bao goàm caû thoâng tin veà bieåu
danh ñoàng thôøi cung caáp luoân moái quan heä theo thöù töï giöõa caùc
giaù trò nhöng khoâng ño ñöôïc khoaûng caùch giöõa caùc giaù trò ñoù.
- Thang ñoù khoaûng caùch (Internal Scale): Gioáng nhö ñaëc tính cuûa
thang ño thöù töï, tuy nhieân ñoái vôùi thang ñoù khoaûng caùch cho pheùp ta
ño ñöôïc khoaûng caùch giöõa caùc giaù trò. Tuy nhieân do thang ño khoaûng
caùch khoâng xaùc ñònh ñöôïc ñieåm 0 chung (gioáng nhö thang ño nhieät
ñoä) do ñoù ta chæ coù theå noùi giaù trò naøy lôùn hôn giaù trò kia bao
nhieâu ñôn vò nhöng khoâng theå keát luaän giaù trò naøy lôùn hôn giaù trò
kia bao nhieâu laàn.
- Thang ño tyû leä (ratio): Ñaây laø thang ño coù ñuû caùc ñaëc tính thöù töï
vaø khoaûng caùch. Ngoaøi ra vieäc xaùc ñònh ra tyû soá cheânh leäch giöõa
caùc giaù trò laø coù theå thöùc hieän do ôû thang ño naøy ñieåm 0 ñöôïc
xaùc ñònh moät caùch coù yù nghóa.
Töø boán daïng thang ño treân ta phaân ra hai loaïi bieán. Bieán ñònh tính laø
bieán chöùa caùc giaù trò quan saùt ôû daïng thang ño bieåu danh vaø thöù töï.
Coøn bieán ñònh löôïng laø bieán chöùa caùc giaù trò coù daïng thang ño
khoaûng caùch vaø tyû leä.

Bieân soaïn: Ñaøo Hoaøi Nam 13


Phaân tích döõ lieäu baèng SPSS

2. Phöông phaùp ñònh bieán treân SPSS (Define Variable)


Ñònh bieán trong maøn hình quaûn lyù bieán (variables view). Coâng vieäc ñònh
bieán naøy coù theå ñöôïc thöïc hieän tröôùc khi tieán haønh nhaäp döõ lieäu vaøo
trong maùy
Muïc ñích cuûa vieäc ñình bieán laø gaùn nhaõn vaø caùc thoâng soá cho caùc bieán
vaø gaùn yù nghóa cho caùc giaù trò trong bieán. Sau khi ñöôïc maõ hoùa caùc döõ
lieäu seõ ñöôïc ñaïi dieän baèng nhöõng con soá vaø caùc con soá naøy coù yù
nghóa khaùc nhau tuøy theo caâu traû lôøi thu thaäp ñöôïc. Ñeå caùc con soá naøy
coù theå nhaäp vaøo maùy tính vaø coù theå quaûn lyù cuõng nhö coù yù nghóa
trong SPSS, ta phaûi tieán haønh ñònh bieán cho döõ lieäu. Qui trình ñònh bieán
naøy bao goàm caùc böôùc sau:
- Gaùn teân cho bieán (Name): Ta goõ teân bieán caàn khai baùo vaøo coät
ñaàu tieân trong maøn hình Variables view (Neáu ta khoâng goõ teân bieán
vaøo thì SPSS seõ maëc ñònh teân bieán naøy laø Var000001). Teân bieán
ñöôïc khai baùo naøy seõ hieån thò treân ñaàu caùc coät trong maøn hình
Data view. Teân bieán bò haïn cheá veà soá kyù töï hieån thò, do ñoù caàn
thieát phaûi khai baùo ngaén goïn vaø deã gôïi nhôù, thoâng thöôøng neân
ñaët theo thöù töï caâu hoûi trong baûng caâu hoûi nhö q1, q3, q4a, …Coù
moät soá qui öôùc sau ñaây phaûi tuaân theo khi khai baùo teân bieán:
 Baét ñaàu baèng moät chöû caùi vaø khoâng baét ñaàu baèng daáu
chaám(.).
 Teân bieán khoâng ñöôïc qua 8 kyù töï
 Khoâng ñöôïc chöùa khoaûng traéng vaø caùc kyù töï ñaëc bieät nhö (!),
(?), (*).
 Caùc töø khoùa sau ñaây khoâng ñöôïc duøng laøm teân bieán: ALL, NE,
EQ, TO, LE, LT, BY OR, GT, AND, NOT, GE, WITH
- Ñònh ra kieåu bieán (Type): Coù caùc daïng bieán sau coù theå ñònh daïng.
Daïng con soá (numeric); Daïng tieàn teä; daïng ngaøy (Date) hoaëc daïng chuoåi
(String). Ngoaøi ra phaàn naøy cuõng cho pheùp ta ñònh daïng caùc daïng soá
ñöôïc hieãn thò khaùc nhau (Xem hình 4-1)
Hình 4-1

Tuøy thuoäc vaøo yeâu caàu cuûa döõ lieäu, maø ta seõ ñònh loaïi bieán cho
bieán, SPSS maëc ñònh loaïi bieán laø kieåu soá (numeric); ngoaøi ra coøn coù

Bieân soaïn: Ñaøo Hoaøi Nam 14


Phaân tích döõ lieäu baèng SPSS

theå khai baùo caùc kieåu hieãn thò soá khaùc nhau nhö kieåu soá coù daáu
phaåy (Comma) hay daáu chaám (Dot) ngaên caùch giöõa caùc khoaûng caùch
haøng ngaøn cuûa con soá; caùch hieãn thò theo caùc kyù hieäu khoa hoïc
(Scientific notation); Hieãn thò ngaøy, dollar vaø caùc kieåu tieàn teä khaùc;
cuoái cuøng laø caùch hieãn thò daïng chuoåi.
- Xaùc ñònh soá löôïng con soá hieãn thò cho giaù trò (Width) vaø soá löôïng
con soá sau daáu phaåy hieån thò (Decimals): Khai baùo beà roäng cuûa con
soá (haøng ñôn vò, haøng traêm, haøng trieäu, …) trong oâ Width, Vaø khai baùo
soá con soá thaäp phaân sau daàu phaåy trong oâ Decimal.
- Gaùn nhaõn cho bieán (Variable Label): Ñaët teân nhaõn cho bieán moät
caùch ñaày ñuû hôn, teân bieán naøy seõ hieãn thò yù nghóa cuûa bieán treân
caùc keát quaû phaân tích trong maøn hình keát quaû (output), coâng cuï naøy
giuùp ta hieåu ñöôïc yù nghóa cuûa bieán ñang khaûo saùt deã daøng hôn trong
quaù trình phaân tích.
- Ñònh teân cho caùc giaù trò trong bieán (Value lables): Trong quaù trình maõ
hoùa döõ lieäu ta ñaõ gaùn caùc giaù trò trong bieán thaønh caùc con soá ñaïi
dieän, Nhöng ñeå cho quaù trình ñoïc vaø phaân tích caùc keát quaû nghieân
cöùu deã daøng hôn ta phaûi gaùn caùc con soá naøy caùc yù nghóa nhö noù maø
noù ñang ñaïi dieän, coâng cuï ñònh laïi nhaõn cho giaù trò cho pheùp ta thöïc
hieän ñieàu naøy (Xem hình 4-2):

Hình 4-2
Gaùn nhaõn cuûa giaù trò (value lables) coù ba thao taùc:
o Gaùn moät nhaõn môùi:
 Nhaäp giaù trò vaøo hoäp thoaïi Value
 Nhaäp nhaõn cuûa giaù trò vaøo hoäp thoaïi Value Label
 Aán nuùt Add ñeå xaùc ñònh nhaõn ñoù
o Söõa ñoåi moät nhaõn:
 Di veät saùng ñeán nhaõn caàn söûa ñoåi
 Nhaäp teân nhaõn môùi, aán nuùt Change ñeå thay ñoåi

Bieân soaïn: Ñaøo Hoaøi Nam 15


Phaân tích döõ lieäu baèng SPSS

o Loaïi boû moät nhaõn:


 Di veät saùng ñeán nhaõn caàn loaïi boû
 Aán nuùt Remove ñeå loaïi boû
- Ñònh nghóa caùc giaù trò khuyeát (Missing Values): Ñöôïc duøng ñeå ñònh ra
caùc giaù trò cuï theå cho caùc giaù trò maø ta muoán loaïi boû ra khoûi caùc
phaân tích vaø xöû lyù thoáng keâ sau naøy hay coøn goïi laø caùc giaù trò
khuyeát. Ví duï trong caâu hoûi veà thu nhaäp, seõ coù moät soá tröôøng hôïp töø
choái traû lôøi töông öùng vôùi giaù trò maõ hoùa laø 99. Trong quaù trình phaân
tích ñeå loaïi boû taát caû caùc tröôøng hôïp naøy ra khoûi caùc xöõ lyù thoáng
ke, ta phaûi tieán haønh khai baùo giaù trò 99 laø giaù trò khuyeát trong phaàn
giaù trò khuyeát (Missing values). (Xem hình 4-3)

Hình 4-3
SPSS maëc ñònh laø khoâng coù khai baùo giaù trò khuyeát. Coù ba caùch ñeå
khai baùo caùc giaù trò khuyeát
(1) hai baùo baèng 3 giaù trò rôøi raïc (Discrete missing values)
(2) Khai baùo moät chuoåi lieân tuïc caùc giaù trò (Range of missing values)
(3) Khai baùo moät chuoåi caùc giaù trò khuyeát vaø moät giaù trò khuyeát
rieâng bieät (Rang plus one discrete missing value)
Ñoái vôùi döõ lieäu daïng chuoåi. Toaøn boä caùc giaù trò voâ duïng hoaëc troáng
ñeàu ñöôïc xem laø coù nghóa. Ñeå ñònh nghóa caùc giaù trò voâ nghóa vaø caùc
giaù trò troáng laø giaù trò khuyeát ta phaûi nhaäp vaøo moät khoaûng troáng
vaøo troâng oâ ñònh ra caùc giaù trò khuyeát rieâng bieät
- Ñònh kích côû cho coät (Column format): Ñònh ra chieàu roäng cuûa coät
ñang khai baùo bieán
- Ñònh ra vò trí hieãn thò caùc giaù trò (align): Vò trí hieãn thò caùc giaù trò
trong coät (phaûi, traùi, giöõa)
- Ñònh ra daïng thang ño maø bieán theå hieän (measurement): Tuøy thuoäc
vaøo daïng thang ño ñöôïc söû duïng trong bieán maø ta khai baùo trong coâng

Bieân soaïn: Ñaøo Hoaøi Nam 16


Phaân tích döõ lieäu baèng SPSS

cuï measurement, chuù yù khai baùo scale ñöôïc duøng chung cho daïng thang ño
khoaûng caùch vaø thang ño tyû leä. Vieäc khaùi baùo naøy chæ mang tính chaát
quaûn lyù khoâng aûnh höôûng ñeán keát quaû phaân tích
3. Nhaäp döõ lieäu
Döõ lieäu caàn nhaäp seõ ñöôïc nhaäp vaøo trong maøn hình Data views. Maøn hình
naøy theå hieän ra moät ma traän thoâng tin bao goàm: coät vaø haøng, vaø oâ giao
nhau giöõa coät vaø haøng. (Xem hình 2-1)
Döõ lieäu ñöôïc nhaäp theo trình töï sau:
- Khai baùo teân bieán chöùa ñöïng thoâng tin caàn nhaäp vaøo thanh beân
treân moãi coät (teân maëc ñònh cuûa caùc coät naøy trong SPSS laø
var00001, …, var0000x). Phaàn naøy ñaõ ñöôïc ñeà caäp chi tieát trong phaàn
ñònh bieán.
- Choïn oâ caàn nhaäp döõ lieäu, laø phaàn giao nhau giöõa coät vaø haøng.
OÂ caàn nhaäp seõ coù khung vieàn chung quanh baùo cho ngöôøi nhaäp
bieát ñoù laø oâ ñang hoaït ñoäng, teân bieán vaø soá hieäu haøng ñöôïc hieän
ôû goùc traùi cuûa cöûa soå.
- Goõ giaù trò caàn nhaäp vaøo khung ñaõ choïn, giaù trò naøy ñöôïc hieän
trong thanh söõa ñoåi (cell editor) naèm ôû treân cöûa soå. Chuù yù khi nhaäp
döõ lieäu phaûi baûo ñaûm ñuùng vôùi kieåu bieán ñaõ ñöôïc ñònh nghóa.
Thoâng thöôøng caùc kieåu bieán ñöôïc khai baùo laø daïng chuoåi (ngaén
toái ña 8 kyù töï) hoaëc daïng soá, nhaèm baûo ñaûm tính töông thích cho
vieäc phaân tích sau naøy.
Ta cuõng coù theå nhaäp lieäu töø caùc phaàn meàm khaùc nhö Excel, Fox, … vaø
sau ñoù chuyeån vaøo trong SPSS.

_____oOo_____
CHÖÔNG 5: CAÙC PHEÙP BIEÁN ÑOÅI VAØ THAO TAÙC TREÂN
TAÄP DÖÕ LIEÄU

Bieân soaïn: Ñaøo Hoaøi Nam 17


Phaân tích döõ lieäu baèng SPSS

1. Maõ hoùa laïi (Recode)


Recode laø coâng cuï duøng ñeå maõ hoùa laïi caùc giaù trò trong moät bieán thaønh
caùc giaù trò maõ hoùa môùi phuø hôïp vôùi ñoøi hoûi cuûa quaù trình phaân tích
döõ lieäu. Ví duï ñoái vôùi caâu hoûi nguoàn goác nhaän bieát quaûng caùo cuûa
saûn phaåm X, ngöôøi traû lôøi coù theå traû lôøi cuï theå treân baùo Saøi Goøn,
Tuoåi Treû, Taïp chí Söùc Khoûe vaø Ñôøi soáng, Treân ñaøi HTV7, Treân ñaøi
VTV3, … Coù theå ban ñaàu caùc nguoàn quaûng caùo ñöôïc maõ hoùa moät caùch
rieâng bieät. Tuy nhieân do nhu caàu xöõ lyù sau naøy, ngöôøi nghieân cöùu muoán
nhoùm caùc giaù trò ñöôïc maõ hoùa rieâng bieät naøy thaønh ba loaïi nguoàn
quaûng caùo chính laø Baùo, Taïp Chí vaø Tivi. Coâng cuï Recode cho pheùp ta
ñònh laïi caùc giaù trò rieâng bieät veà nguoàn quaûng caùo ban ñaàu thaønh ba
nguoàn quaûng caùo chung laø Baùo, Tivi vaø taïp chí.
SPSS cung caáp cho ta hai loaïi Recode laø Recode treân cuøng moät bieán (Recode
into same variables) vaø recode vaøo bieán khaùc (Recode into different variable).
1.1. Maõ hoùa laïi treân cuøng moät bieán (Recode into same variables)
Recode treân cuøng moät bieán laø maõ hoùa laïi nhöõng giaù trò trong moät bieán
hieän höõu thaønh nhöõng giaù trò môùi vaø caùc giaù trò môùi naøy seõ naèm ngay
trong bieán hieän höõu vaø thay theá caùc giaù trò cuû treân bieán ñoù. Khi söû
duïng coâng cuï naøy ta seõ maát ñi caùc giaù trò ñaõ khai baùo ban ñaàu trong
bieán maø ta thöïc hieän leänh Recode. Chuù yù caùc giaù trò vöøa ñöôïc taïo ra
chöa coù nhaõn, do ñoù sau khi thöïc hieän leänh ta phaûi tieán haønh khai baùo
nhaõn cho giaù trò (ñaõ ñeà caäp trong phaàn khai baùo bieán). Phöông phaùp naøy
ñöôïc thöïc hieän qua caùc böôùc sau:
- Choïn transform/recode töø thanh menu chính. ÔÛ ñaây ta löïa choïn
Recode into same variable ñeå tieán haønh ñònh laïi giaù trò cuûa bieán
treân cuøng moät bieán. Ta coù hoäp thoaïi nhö hình 5-1:

Bieân soaïn: Ñaøo Hoaøi Nam 18


Phaân tích döõ lieäu baèng SPSS

Hình 5-1
- Chuyeån caùc bieán caàn maõ hoùa laïi sang hoäp thoaïi variables, nhaán
thanh Old and New Values ñeå chuyeån caùc giaù trò cuû caàn thay ñoåi
thaønh caùc giaù trò môùi. Ta coù hoäp thoaïi Old and New values nhö hình
5-2:

Hình 5-2
- Old value duøng ñeå khai baùo giaù trò cuû caàn chuyeån ñoåi. Giaù trò cuû
naøy coù theå laø moät giaù trò ñôn leû(Value), moät giaù trò khuyeát maëc
ñònh hay giaù trò khuyeát khai baùo (System-missing or User-missing),
moät daõy caùc giaù trò (Range), hoaëc toaøn boä caùc giaù trò naøo ñoù
trong bieán (All other values). New value duøng ñeå khai baùo giaù trò môùi
seõ thay theá cho giaù trò cuû töông öùng. Nhaán thanh Add ñeå löu söï
chuyeån ñoåi naøy. Caùc giaù trò chuyeån ñoåi coù theå söûa chöûa hoaëc
loaïi boû baèng caùch di chuyeån veät toái ñeán bieåu thöùc theå hieän söï
chuyeån ñoåi trong hoäp thoaïi Old->New vaø nhaán thanh Change cho söï
thay ñoåi hoaëc Remove ñeå loaïi boû.
- Neáu vieäc ñònh laïi giaù trò cuûa caùc giaù trò cuûa bieán coù moät soá
ñieàu kieän keøm theo, ta coù theå duøng coâng cuï if ñeå ñònh ra caùc ñieàu
kieän cho leänh recode. Hoäp thoaïi If Cases nhö hình 5-3:

Hình 5-3

Bieân soaïn: Ñaøo Hoaøi Nam 19


Phaân tích döõ lieäu baèng SPSS

- Trong hoäp thoaïi If Cases, maëc ñònh laø khoâng coù ñieàu kieän naøo caû,
pheùp ñònh laïi giaù trò cuûa bieán ñöôïc thöïc hieän cho taát caû caùc quan
saùt, ôû ñaây hieån thò laø Include all cases. Choïn leänh include if case
satisfies condition ñeå xaùc ñònh caùc ñieàu kieän trong vieäc ñònh laïi giaù
trò cuûa bieán. Chuyeån teân bieán caàn ñònh laïi caùc giaù trò vaøo hoäp
thoaïi beân phaûi. Luùc naøy pheùp ñònh laïi giaù trò cuûa bieán noùi treân
chæ ñöôïc thöïc hieän ñoái vôùi caùc quan saùt naøo thoûa maõn ñöôïc bieåu
thöùc ñieàu kieän ñöôïc theå hieän trong hoäp thoaïi ñieàu kieän naøy. Ví duï
chæ thöïc hieän leänh recode ñoái vôùi nhöõng tröôøng hôïp quan saùt ôû khu
vöïc (bieán kvuc) TP.HCM (coù giaù trò maõ hoùa laø 2) ta khai baùo bieåu
thöùc ñieàu kieän nhö sau kvuc = 2.
1.2. Maõ hoùa laïi vaøo moät bieán khaùc (Recode into different variables)
Trong tröôøng hôïp ñònh laïi caùc giaù trò hieän taïi cuûa moät bieán thaønh caùc
giaù trò môùi trong moät bieán môùi ta seõ löïa choïn transform/recode/into
different variable vaø ta coù hoäp thoaïi nhö hình 5-4:

Hình 5-4
Söû duïng phöông phaùp recode vaøo moät bieán môùi maùy tính seõ töï ñoäng taïo
ra moät bieán môùi treân cô sôû döõ lieäu ñeå chöùa caùc giaù trò môùi vöøa ñöôïc
taïo ra, ñoàng thôøi ta cuõng vaãn löu giöõ ñöôïc bieán cuû vôùi caùc giaù trò maõ
hoùa cuû treân cô sôû döõ lieäu. Chuù yù caùc giaù trò vöøa ñöôïc taïo ra chöa coù
nhaõn, do ñoù sau khi thöïc hieän leänh ta phaûi tieán haønh khai baùo nhaõn cho
giaù trò (ñaõ ñeà caäp trong phaàn khai baùo bieán). Vieäc maõ hoùa laïi caùc giaù
trò vaøo trong moät bieán môùi ñöôïc thöïc hieän qua caùc böôùc sau:
- Chuyeån teân bieán caàn ñònh laïi giaù trò vaøo trong hoäp thoaïi variables.
Khai baùo teân bieán môùi vaø nhaõn bieán môùi seõ chöùa caùc giaù trò
vöøa ñöôïc maõ hoùa laïi trong hoäp thoaïi Output variable. Nhaán thanh
change ñeå xaùc nhaän söï khaùi baùo naøy.
- Caùc coâng cuï If vaø Old and New Values cuõng coù yù nghóa vaø thao
taùc töông töï nhö tröôøng hôïp ñònh laïi giaù trò cho cuøng moät bieán, ñaõ
ñöôïc ñeà caäp ôû phaàn treân.

Bieân soaïn: Ñaøo Hoaøi Nam 20


Phaân tích döõ lieäu baèng SPSS

Coâng cuï naøy coù öa ñieåm laø ta vöøa taïo ra ñöôïc moät bieán môùi vôùi caùc
giaù trò ñöôïc maõ hoùa theo caùch môùi nhöng ñoàng thôøi vaãn giöõa ñöôïc bieán
goác vôùi caùc giaù trò maõ hoùa ban ñaàu. Trong khi vôùi phöông phaùp maõ hoùa
laïi döõ lieäu treân cuøng moät bieán, caùc giaù trò maõ hoùa môùi seõ choàng leân
caùc giaù trò cuû vaø ta ñaõ maát ñi caùc giaù trò maõ hoùa ban ñaàu treân bieán
ñoù.
2. Coâng cuï töï ñoäng maõ hoùa laïi (Automatic Recode)
Laø phöông phaùp maõ hoùa töï ñoäng caùc giaù trò daïng chuoåi sang daïng soá
vaøo trong moät bieán môùi. Bieán môùi naøy seõ chöùa caùc con soá nguyeân
lieân tuïc, moãi con soá nguyeân trong bieán môùi seõ ñaïi dieän cho caùc giaù trò
daïng chuoåi gioáng nhau .
Ví duï khi ban ñaàu ta nhaäp döõ lieäu ñòa baøn nghieân cöùu (quaän) nhö Bình
Thaïnh, Quaän 1, Quaän 2, Taân Bình, … ôû daïng chuoåi. Ta coù theå recode caùc
giaù trò naøy thaønh caùc giaù trò soá nhö 1, 2, 3 moät caùc töï ñoäng baèng coâng
cuï Automatic Recode. Vaø moãi con soá nguyeân naøy seõ ñaïi dieän cho töøng ñòa
baøn nghieân cöùu, nhö Quaän 1 ñöôïc chuyeån thaønh 1, quaän 2 laø 2, …, Quaän
Taân Bình laø 19. Ñoái vôùi caùch Recode naøy caùc giaù trò nguyeân thuûy (quaän
1, quaän 2, …) seõ ñöôïc söõ duïng nhö laø nhaõn cuûa giaù trò ñaõ ñöôïc recode
trong bieán môùi ñöôïc taïo ra töø leänh Automatic Recode. Caùc giaù trò daïng
chuoåi ñöôïc maõ hoùa theo thöù töï alphabe.
3. Löïa choïn caùc quan saùt (Select Cases)
Coâng cuï Select Cases ñöa ra moät vaøi phöông phaùp cho pheùp ta löïa choïn ra
nhöõng nhoùm nhoû caùc tröôøng hôïp quan saùt döïa treân tieâu chuaån hay ñieàu
kieän cuï theå. Ta cuõng coù theå duøng phöông phaùp naøy ñeå löïa choïn moät
maãu ngaãu nhieân caùc tröôøng hôïp quan saùt töø toång theå döõ lieäu. Ñeå thöïc
hieän leänh löïa choïn caùc quan saùt naøy ta choïn Data/select cases töø menu ta
seõ coù hoäp thoaïi nhö hình 5-5:
Trong hoäp thoaïi Select Cases caùc bieán ñöôïc lieät keâ ôû beân traùi hoäp thoaïi,
Beân phaûi hoäp thoaïi lieät keâ caùc daïng löïa choïn. Löïa choïn All Cases laø
traïng thaùi löïa choïn maëc ñònh vaø ôû traïng thaùi naøy coù yù nghóa laø toaøn
boä caùc tröôøng hôïp quan saùt ñang ñöôïc löïa choïn.
Chuù yù sau khi thöïc hieän vieäc choïn löïa caùc tröôøng hôïp. Caùc thao taùc
thoáng keâ trong SPSS luùc naøy chæ thöïc hieän treân caùc tröôøng hôïp ñöôïc löïa
choïn. Do ñoù sau khi thöïc hieän vieäc phaân tích treân caùc tröôøng hôïp ñöôïc löïa
choïn, ta caàn traû döõ lieäu laïi traïng thaùi ban ñaàu (kh6ng coù löïa choïn caùc
tröôøng hôïp) baèng caùch choïn All Cases trong phaàn Select cuûa hoäp thoaïi
Select Cases.
Trong phaàn Unselected Cases cho bieát traïng thaùi cuûa caùc tröôøng hôïp khoâng
ñöôïc löïa choïn. Filtered chæ ra caùc tröôøng hôïp khoâng ñöôïc choïn vaãn ñöôïc
giöõ laïi trong taäp tin nhöng seõ bò loaïi tröø ra moïi phaân tích thoáng keâ. Select
Cases taïo ra moät bieán loïc (FILTER_$), vôùi caùc tröôøng hôïp ñöôïc choïn coù
giaù trò 1 vaø caùc tröôøng hôïp khoâng ñöôïc choïn coù giaù trò 0. Deleted cho
pheùp loaïi boû toaøn boä caùc tröôøng hôïp khoâng ñöôïc choïn ra khoûi döõ lieäu.

Bieân soaïn: Ñaøo Hoaøi Nam 21


Phaân tích döõ lieäu baèng SPSS

Ñeå nhaän bieát ñöôïc caùc tröôøng hôïp naøo ñöôïc choïn hoaëc khoâng ñöôïc
choïn ta coù theå nhìn vaøo caùc giaù trò trong bieán FILTER_$, caùc tröôøng hôïp
ñöôïc choïn coù giaù trò 1 vaø nhöõng tröôøng hôïp khoâng ñöôïc choïn coù giaù trò
0. Hoaëc ta coù theå nhìn vaøo maøn hình Data ñeå phaân bieät caùc tröôøng hôïp.
Vôùi caùc tröôøng hôïp khoâng ñöôïc löïa choïn seõ coù moät gaïch cheùo trong
thanh soá thöù töï haøng beân traùi maøn hình (Xem hình 20). Coù theå duøng coâng
cuï Sort Cases ñeå xaép xeáp theo thöù töï caùc tröôøng hôïp ñöôïc choïn hay
khoâng ñöôïc choïn (Sort cases theo bieán FILTER_$).
Hình 5-5

Ñeå tieán haønh choïn löïa caùc tröôøng hôïp ta coù theå duøng caùc caùch sau:
- Löïa choïn coâng cuï If conditions are satisfied (xem hình 5-6) cho pheùp ta
löïa choïn caùc tröôøng hôïp döïa treân caùc bieåu thöùc ñieàu kieän. Moät
bieåu thöùc ñieàu kieän cho ta caùc giaù trò ñuùng hoaëc sai cuûa caùc
tröôøng hôïp. Neáu keát quaû cuûa bieàu thöùc ñieàu kieän laø ñuùng,
tröôøng hôïp ñoù ñöôïc löïa choïn. Neáu keát quaû naøy laø sai hoaëc thieáu
thì caùc tröôøng hôïp ñoù khoâng ñöôïc choïn. Ví duï ñoái vôùi bieán giôùi
tính (GTinh)coù hai giaù trò laø Nam: 1 vaø Nöõ: 2. Ta tieán haønh choïn
caùc tröôøng hôïp laø Nam baèng caùch choïn bieán giôùi tính trong hoäp
beân traùi vaø chuyeån sang hoäp beân phaûi. Hieãn thò bieåu thöùc ñieàu
kieän nhö sau Gtinh=1. Luùc ñoù caùc tröôøng hôïp naøo thoûa maõn ñieàu
kieän Gtinh=1 seõ ñöôïc löïa choïn. Caùc bieåu thöùc ñieàu kieän coù theå
bao goàm teân bieán, caùc haèng soá, caùc toaùn töû, caùc con soá, caùc
haøm soá, …
- Coâng cuï random sample of cases (hình 5-7) cho pheùp chuùng ta löïa
choïn moät maãu ngaãu nhieân döïa treân moät tyû leä phaàn traêm hoaëc
moät soá chính xaùc caùc tröôøng hôïp seõ löïa choïn.

Bieân soaïn: Ñaøo Hoaøi Nam 22


Phaân tích döõ lieäu baèng SPSS

- Coâng cuï Base range (hình 5-8) cho pheùp löïa choïn caùc tröoøng hôïp theo
soá thöù töï haøng hieãn thò beân traùi maøn hình döõ lieäu cuûa SPSS

Hình 5-6

Hình 5-7

Hình 5-8
4. Taùch taäp döõ lieäu (Split File)
Coâng cuï Split File cho pheùp taùch döõ lieäu trong taäp döõ lieäu ñang quan saùt
thaønh nhöõng nhoùm nhoû rieâng bieät vaø sau khi thöïc hieän leänh Split file naøy
caùc phaân tích xöõ lyù thoáng keâ seõ cho ta caùc keát quaû thoáng keâ ñaõ ñöôïc
thöïc hieän rieâng bieät theo töøng nhoùm nhoû döõ lieäu naøy.

Bieân soaïn: Ñaøo Hoaøi Nam 23


Phaân tích döõ lieäu baèng SPSS

Ñeå thöïc hieän leänh naøy ta choïn Data/Split File töø menu ta coù hoäp thoaïi nhö
hình 5-9:

Hình 5-9
Vieäc phaân taùch naøy döïa treân vieäc phaân döõ lieäu thaønh nhöõng nhoùm
töông ñöông vôùi caùc giaù trò trong bieán ñöôïc löïa choïn ñeå tieán haønh phaân
nhoùm. Ñöôïc söû duïng cho vieäc phaân tích döïa treân nhöõng giaù trò cuûa moät
hay nhieàu bieán ñaõ ñöôïc phaân nhoùm. Neáu ta löïa choïn vieäc phaân taùch döïa
treân nhieàu bieán, döõ lieäu seõ ñöôïc nhoùm theo thöù töï bieán ñöôïc khai baùo
trong hoäp thoaïi Groups Based On list.
- Choïn Compare groups: Caùc döõ lieäu phaân tích seõ ñöôïc taùch theo
caùc giaù trò cuûa bieán ñöôïc löïa choïn ñeå taùch döõ lieäu (hieãn thò trong
hoäp Groups Based On list), vaø vieäc taùch naøy mang tính chaát so saùnh
do ñoù khi tieán haønh phaân tích döõ lieäu caùc phaân tích döïa treân söï
phaân taùch naøy nhöõng vaãn ñöôïc theå hieän treân cuøng moät baûng.
- Choïn Organize output by groups: Caùc döõ lieäu phaân tích seõ ñöôïc
taùch theo caùc giaù trò cuûa bieán ñöôïc löïa choïn ñeå taùch döõ lieäu
(hieãn thò trong hoäp Groups Based On list), vaø vieäc taùch naøy mang tính
chaát toå chöùc laïi döõ lieäu thaønh nhöõng nhoùm nhoû do ñoù khi tieán
haønh phaân tích döõ lieäu caùc phaân tích döïa treân söï phaân taùch vaø
ñöôïc theå hieän moät caùc rieâng bieät giöõa caùc nhoùm phaân taùch
Chuù yù sau ki tieán haønh phaân tích treân söï phaân taùch, ñeå trôû laïi traïng thaùi
bình thöôøng cuûa döõ lieäu ñoøi hoûi phaûi boû ñi leänh taùch döõ lieäu vöøa ñöa
ra baèng caùch choïn phaàn Analyze all cases, do not create groups trong hoäp
thoaïi Slipt Files
5. Coâng cuï tính toaùn giöõa caùc bieán (Compute)
Coâng cuï compute ñöôïc duøng ñeå tính toaùn giöõa caùc giaù trò trong caùc bieán
vaø keát quaû seõ ñöôïc löu giöõ trong moät bieán môùi hoaëc laø moät bieán khaùc
saún coù hoaëc bieán chöùa ñöïng giaù trò ñang tính toaùn.

Bieân soaïn: Ñaøo Hoaøi Nam 24


Phaân tích döõ lieäu baèng SPSS

Ñeå thöïc hieän coâng cuï naøy ta truy xuaát coâng cuï compute variable töø
transform treân thanh menu ta coù hoäp thoaïi nhö hình 5-10:
Hình 5-10

- Target variable chöùa ñöïng teân bieán seõ nhaän giaù trò ñöôïc tính. Ta coù
theå khaùi baùo kieåu vaø gaùn nhaõn cho caùc giaù trò cuûa bieán baèng
caùch nhaán vaøo thanh Type&lable. OÂ Numeric Expression chöùa ñöïng
caùc bieåu thöùc soá ñöôïc duøng ñeå tính giaù trò cho bieán ñích (bieán
chöùa ñöïng giaù trò môùi), bieåu thöùc naøy coù theå duøng teân caùc bieán
saün coù, caùc haèng, caùc toaùn töû vaø caùc haøm soá. Chuùng ta co theå
soaïn caùc bieåu thöùc tính toaùn vaøo thaüng oâ Numeric Expression, vaø
coù theå söõ duïng caùc coâng cuï ñöôïc hieån thò trong hoäp thoaïi nhö caùc
phieám (+), (-), Function,…
- Coâng cuï if duøng ñeå ñònh ra nhöõng ñieàu kieän caàn thieát keøm theo
trong tính toaùn neáu coù, ñöôïc söû duïng gioáng nhöù gioáng nhö coâng cuï
if trong hoäp thoaïi recode, ñaõ ñöôïc ñeà caäp ôû phaàn treân.
6. Coâng cuï ñeám (Count)
Coâng cuï naøy ñöôïc duøng ñeå taïo ra moät bieán môùi chöùa keát quaû soá laàn
xuaát hieän (soá ñeám) cuûa moät giaù trò hay nhieàu giaù trò ñöôïc chæ ñònh ra
trong danh saùch caùc bieán ñöôïc choïn trong ô variables trong moãi tröôøng hôïp.
Töø menus ta choïn Transform/count ñeå coù ñöôïc hoäp thoaïi nhö hình 5-11

Bieân soaïn: Ñaøo Hoaøi Nam 25


Phaân tích döõ lieäu baèng SPSS

Hình 5-11
Moät bieán môùi seõ ñöôïc taïo ra khi ta thöïc hieän thuû tuïc Count goïi laø bieán
ñích (Taget variable) seõ chöùa ñöïng giaù trò coäng doàn moãi khi gaëp ñöôïc giaù
trò caàn ñeám trong moät hoaëc nhieàu bieán ñaõ ñöôïc khai baùo tröôùc trong hoäp
thoaïi Numeric variables.
Giaù trò caàn ñeám seõ ñöôïc ñònh roõ trong phaàn Define values (hình 5-12). Giaù
trò khai baùo ñeå ñeám coù theå laø nhöõng giaù trò cuï theå naøu ñoù (Value),
hoaëc nhöõng giaù trò roãng (System missing) hoaëc laø moät daõy caùc giaù trò
(range). Sau khi khai baùo giaù trò caàn ñeám ta duøng thanh Add ñeå xaùc nhaän
giaù trò caàn ñeám vaøo trong hoäp thoaïi Values to count. Söû duïng Change
hoaëc Remove ñeå thay theá hoaëc loaïi boû giaù trò caàn ñeám (giaù trò ñaõ ñöôïc
ñaùnh daáu baèng veát ñen).

Hình 5-12
Coâng cuï If duøng ñeå xaùc ñònh caùc ñieàu kieän neáu coù khi thöïc hieän leänh
Count, (gioáng nhö coâng cuï if trong phaàn recode ñaõ ñöoïc ñeà caäp ôû treân)
7. Hôïp nhaát caùc taäp döõ lieäu (Merge files)
SPSS cho pheùp ta hôïp caùc döõ lieäu quan saùt töø trong moät taäp döõ lieäu beân
ngoaøi vaøo taäp döõ lieäu ñang söû duïng. Hoaëc hôïp caùc bieán môùi trong taäp
döõ lieäu beân ngoaøi vaøo taäp döõ lieäu ñang hoaït ñoäng. Caû hai ñeàu taïo ra
moät taäp döõ lieäu môùi coù theå chöùa taát caû caùc quan saùt ñöôïc hôïp laïi
hoaëc taát caû caùc bieán ñöoïc hôïp tuøy theo ta choïn Add Cases hay Add
Variables
7.1. Theâm vaøo caùc quan saùt (Add Cases)
Coâng cuï Add Cases cho pheùp ta hôïp döõ lieäu trong taäp döõ lieäu ñang hoaït
ñoäng vôùi döõ lieäu trong moät taäp döõ lieäu beân ngoaøi, vôùi ñieàu kieän taäp
döõ lieäu ñoù phaûi chöùa caùc bieán gioáng nhö bieán trong taäp döõ lieäu ñang
hoaït ñoäng. Sau khi thao taùc, moät taäp döõ lieäu môùi (chöa ñöôïc khai baùo teân,
vaø ta phaûi tieán haønh löu vaø khai baùo teân môùi) seõ ñöôïc taïo ra chöùa caùc
döõ lieäu trong caû hai taäp döõ lieäu vöøa ñöôïc hôïp laïi vôùi nhau. Trong tröôøng
hôïp hai taäp döõ lieäu hôïp vôùi nhau nhöng coù caùc bieán khaùc nhau (khaùc
nhau veà teân bieán hoaëc loaïi bieán) thì sau khi hôïp taäp döõ lieäu môùi seõ töï

Bieân soaïn: Ñaøo Hoaøi Nam 26


Phaân tích döõ lieäu baèng SPSS

ñoäng loaïi boû caùc bieán khaùc nhau naøy, ta coù theå seõ bò maát döõ lieäu
chöùa trong caùc bieán bò loaïi boû naøy.
Coâng cuï naøy raát thích hôïp cho vieäc hôïp nhaát döõ lieäu nghieân cöùu ôû caùc
khu vöïc khaùc nhau, ví duï nhö moät cuoäc khaûo saùt ñöôïc tieán haønh ôû ba khu
vöïc Haø Noäi, Ñaø Naüng, vaø TP.HCM, döõ lieäu thu thaäp veà seõ ñöôïc nhaäp,
chænh söûa cho ba khu vöïc rieâng bieät. Tuy nhieân sau ñoù ta coù theå tieán haønh
hôïp döõ lieäu ôû ba khu vöïc naøy vaøo moät taäp döõ lieäu thoáng nhaát ñeå tieán
haønh phaân tích vaø xöõ lyù. Chuù yù phaûi thoáng nhaát veà caùc teân bieán, loaïi
bieán vaø soá löôïng bieán trong caû ba khu vöïc tröôùc khi nhaäp 3 file naøy laïi
vôùi nhau.
Choïn Data/Merge Files/Adds Cases (Xem hình 5-13)

Hình 5-13
Hoäp thoaïi Read File cho pheùp ta löïa choïn taäp döõ lieäu seõ ñöôïc hôïp vôùi
taäp döõ lieäu ñang hoaït ñoäng (working file). Nhaán Open ñeå xaùc nhaän vieäc
löïa choïn naøy
Sau khi löïa choïn xong taäp döõ seõ ñöôïc keát hôïp, ta seõ coù moät hoäp thoaïi
môùi nhö hình 5-14:

Hình 5-14

Bieân soaïn: Ñaøo Hoaøi Nam 27


Phaân tích döõ lieäu baèng SPSS

 Unpaired Variables: lieät keâ caùc bieán khoâng gioáng nhau giöõa hai taäp
döõ lieäu ñang ñöôïc tieán haønh hôïp nhaát laïi, caùc bieán khoâng gioáng
nhau naøy seõ bò loaïi ra vaø khoâng coù trong taäp döõ lieäu môùi ñöôïc taïo
ra töø vieäc hôïp nhaát hai taäp döõ lieäu ban ñaàu. Caùc bieán naøy ñöôïc
kyù hieäu khaùc nhau vôùi kyù hieäu (*) ñaïi dieän cho caùc bieán trong taäp
döõ lieäu ñang hoaït ñoäng vaø (+) ñaïi dieän cho caùc bieán trong taäp döõ
lieäu ñöôïc truy xuaát töø beân ngoaøi. Nhöõng bieán ñöôïc lieät keâ trong
hoäp thoaïi Unpaired Variables laø nhöõng bieán coù nhöõng ñaëc ñieåm
nhö sau:
- Hai bieán coù teân bieán ñöôïc khai baùo khaùc nhau
- Nhöõng bieán coù daïng döõ lieäu khaùc nhau
- Caû hai bieán bieán cuøng laø daïng chuoåi nhöng lai khoâng baèng
nhau veà soá kyù töï trong chuoåi.
Cac bieán naøy nhö ñaõ noùi seõ bò loaïi boû ra khoûi taäp döõ lieäu vöøa
hôïp nhaát, ñieàu naøy ñoàng nghóa ta bò maát döõ lieäu sau khi hôïp nhaát,
do ñoù caàn phaûi khaéc phuïc sai soùt naøy ñeå baûo ñaûm tính ñaày ñuû
cuûa döõ lieäu sau khi hôïp nhaát. Caùc bieán naøy seõ ñöôïc hôïp laïi vôùi
nhau baèng caùnh ñaùnh daáu hai bieán ñoù (trong hoäp thoaïi Unpaired
Variables) vaø nhaán thanh Pair, luùc ñoù döõ lieäu trong hai bieán naøy seõ
ñöôïc hôïp nhaát vaø ñöôïc chöùa ñöïng trong bieán laáy teân bieán gioáng
nhö teân bieán trong taäp tin ñang hoaït ñoäng. Hoaëc ta coù theå duøng
coâng cuï Rename ñeå khai baùo laïi teân bieán hoaëc kieåu bieán cho gioáng
nhau.
 Hoäp thoaïi Variables in New Working Data File lieät keâ caùc bieán seõ coù
trong taäp tin môùi ñöôïc taïo ra töø vieäc hôïp nhaát hai taäp döõ lieäu ban
ñaàu. Toaøn boä caùc bieán trong hai taäp tin ban ñaàu thoûa maõn caùc
ñieàu kieän gioáng nhau veà teân vaø loaïi döõ lieäu (soá hoaëc chuoåi) seõ
ñöôïc lieät keâ vaøo hoäp thoaïi naøy
Chuùng ta cuõng coù theå loaïi boû nhöõng bieán maø chuùng ta khoâng
muoán coù trong taäp döõ lieäu hôïp nhaát. Baèng caùch ñaùnh daáu caùc
bieán ñoù (trong oâ variables in new data working file) vaø chuyeån sang
oâ Unpaired Variables
1.2. Theâm vaøo caùc bieán (Add Variables)
Coâng cuï Add Variables cho pheùp hôïp nhaát döõ lieäu trong taäp tin ñang hoaït
ñoäng vôùi moät taäp tin beân ngoaøi vôùi ñieàu kieän taäp tin beân ngoaøi naøy
phaûi chöùa ñöïng cuøng caùc quan saùt vôùi taäp tin ñang söû duïng, nhöng khaùc
nhau veà bieán (khai baùo teân bieán khaùc vôùi taäp tin ñang ñöôïc söû duïng),
quaù trình naøy seõ taïo ra moät taäp döõ lieäu môùi chöùa cuøng caùc quan saùt
nhöng taäp hôïp taát caû caùc bieán khaùc nhau trong hai taäp döõ lieäu ban ñaàu.
Coâng cuï naøy thích hôïp vôùi caùc cuoäc nghieân cöùu ñöôïc chia laøm nhieàu giai
ñoaïn. Ví duï nhö nghieân cöùu veà möùc ñoä aûnh höôûng cuûa moät chöông trình
quaûng caùo, ngöôøi ta thöôøng nghieân cöùu moät soá ñoái töôïng ngöôøi traû lôøi
veà saûn phaåm xaép ñöôïc quaûng caùo tröôùc khi tung chöông trình quaûng caùo

Bieân soaïn: Ñaøo Hoaøi Nam 28


Phaân tích döõ lieäu baèng SPSS

ñoù ra thò tröôøng, goïi laø Pre-test. Sau ñoù seõ tieán haønh moät cuoäc nghieân
cöùu nöõa treân ñuùng caùc ñoái töôïng ñoù sau khi chöông trình quaûng caùo ñaõ
ñöôïc tung ra thò tröôøng, ta goïi laø Post-test. Phaân tích thoáng keâ ñoøi hoûi moät
soá so saùnh (nhö Paired-sample t test) caùc yù kieán cuûa nhöõng ngöôøi tieâu
duøng naøy tröôùc vaø sau khi coù chöông trình quaûng caùo. Ñeå thöïc hieän coâng
vieäc naøy caàn chuù yù nhöõng ñieåm sau:
- Caùc quan saùt (Cases) trong caû hai taäp tin caàn hôïp nhaát bieán phaûi ñöôïc
xaép xeáp theo cuøng moät thöù töï, thoâng thöôøng thöù töï naøy ñöôïc quaûn
lyù baèng moät taäp tin chöùa caùc giaù trò laø soá baûng caâu hoûi. Chuù yù
caùc baûng caâu hoûi cuûa ñoái töôïng nghieân cöùu trong laàn phoûng vaán
tröôùc phaûi gioáng vôùi soá baûng caâu hoûi duøng ñeå phoùng vaán chính ñoái
töôïng ñoù trong laàn sau. Khi loaïi boû baûng caâu hoûi naøo cuûa laàn phoûng
vaán tröôùc hoaëc sau ta phaûi loaïi boû luoân baûng caâu hoûi ñoù tröôùc khi
tieán haønh hôïp nhaát.
- Thoâng thöôøng ta duøng moät hay nhieàu bieán khoùa ñeå baûo ñaûm caùc
tröôøng hôïp khôùp vôùi nhau (thöôøng söû duïng bieán ID chöùa soá baûng
caâu hoûi). Ñieàu phaûi baûo ñaûm tröôùc khi tieán haønh hôïp nhaát bieán giöõa
hai taäp döõ lieäu naøy laø ta phaûi xaép xeáp döõ lieäu trong hai bieán khoùa
cuûa hai taäp döõ lieäu theo thöù töï töø nhoû ñeán lôùn.
- Caùc bieán coù teân gioáng nhau trong taäp tin ñang hoaït ñoäng vaøo taäp tin
beân ngoaøi seõ bò loaïi tröø khoûi taäp tin môùi ñöôïc taïo.
Töø taäp döõ lieäu ñang thao taùc ta môû coâng cuï Data/Merge Files/Adds
Variables töø menu, SPSS seõ truy suaát hoäp thoaïi Add Variables: Read File ñeå
ta löïa choïn taäp döõ lieäu seõ ñöôïc hôïp vôùi taäp döõ lieäu ñang hoaït ñoäng.
Nhaán Open ñeå xaùc nhaän vieäc löïa choïn naøy (gioáng nhö tröôøng hôïp Adds
Cases - Xem hình 5-13). Sau khi löïa choïn ñöôïc taäp döõ lieäu seõ hôïp bieán vôùi
taäp döõ lieäu ñang hoaït ñoäng. SPSS seõ truy suaát cho ta hoäp thoaïi nhö hình 5-
15:

Bieân soaïn: Ñaøo Hoaøi Nam 29


Phaân tích döõ lieäu baèng SPSS

Hình 5-15
- Excluded Variables lieät keâ caùc bieán seõ bò loaïi tröø ra khoûi bieán môùi
hôïp thaønh. Nhöõng bieán naøy laø nhöõng bieán coù teân bieán gioáng nhau.
Bieán trong taäp tin ñang hoaït ñoäng ñöôïc kyù hieäu laø (*), vaø nhöõng bieán
trong taäp tin beân ngoaøi laø (+). Neáu muoán caùc bieán gioáng teân nhau naøy
coù trong taäp döõ lieäu môùi ta phaûi tieán haønh rename noù laïi vaø chuyeån
noù sang hoäp thoaïi chöùa caùc bieán seõ coù trong taäp tin môùi (New
Working Data File)
- Key Variables. Bieán khoùa döïa vaøo ñoù caùc quan saùt gioáng nhau ñöôïc
xaùc ñònh. Chuù yù bieán khoùa naøy phaûi coù cuøng teân ôû caùc hai taäp tin
caàn hôïp nhaát. Caùc tröôøng hôïp khoâng thoûa maõn vôùi bieán khoùa thì
vaãn bao haøm trong taäp döõ lieäu môùi nhöng seõ khoâng ñöôïc hôïp vôùi caùc
tröôøng hôïp trong taäp tin khaùc. Nhöõng tröôøng hôïp naøy chæ chöùa ñöïng
giaù trò rieâng bieät cuûa taäp döõ lieäu maø noù bao haøm töø tröôùc (tröôùc
khi tieán haønh hôïp nhaát) vaø caùc tröôøng hôïp naøy seõ coù giaù trò khuyeát
trong caùc bieán chöùa ñöïng trong taäp tin thöù hai maø ta seõ hôïp nhaát.

_____o0o______

CHÖÔNG 6: XÖÕ LYÙ VAØ PHAÂN TÍCH DÖÕ LIEÄU


1. Kieåm tra döõ lieäu (Explore)
Coâng vieäc ñaàu tieân raát quan troïng vaø caàn phaûi thöïc hieän moät caùch caån
thaän tröôùc khi ñi vaøo caùc böôùc moâ taû hay caùc phaân tích thoâng keâ phöùc
taïp sau naøy laø tieán haønh xem xeùt döõ lieäu moät caùch caån thaän. SPSS cung
caáp cho coâng cuï Explore ñeå xem xeùt vaø kieåm tra döõ lieäu:
- Phaùt hieän caùc sai soùt
- Nhaän daïng döõ lieäu ñeå tìm phöông phaùp phaân tích thích hôïp vaø
chuaån bò cho vieäc kieåm tra giaû thuyeát
Ñeå nhaän daïng vaø phaùt hieän sai soùt trong döõ lieäu, ta coù ba caùch hieãn thò
döõ lieäu nhö sau
- Bieåu ñoà Histogram
- Sô ñoà caønh vaø laù Stem-and-leaf plot
- Sô ñoà hoäp Boxplot
Ñeå öôùc löôïng caùc giaõ ñònh ñöôïc duøng cho vieäc kieåm nghieäm caùc giaû
thuyeát, ta duøng caùc pheùp kieåm tra sau:
- Kieåm tra levene: Kieåm tra tính ñoàng ñeàu cuûa phöông sai
- Kieåm tra K-S Lilliefors: Kieåm tra tính chuaån taéc cuûa toång theå, xem
döõ lieäu coù ñöôïc laáy töø moät phaân boá chuaån hay khoâng

Bieân soaïn: Ñaøo Hoaøi Nam 30


Phaân tích döõ lieäu baèng SPSS

Chuùng ta thöôøng duøng giaù trò trung bình soá hoïc ñeå öôùc löôïng ñoä hoäi tuï
cuûa döõ lieäu. Tuy nhieân vì giaù trò trung bình bò aûnh höôûng bôûi taát caû caùc
giaù trò quan saùt. Ñeå giaûm thieåu nhöõng aûnh höôûng cuûa caùc giaù trò baát
thöôøng (quaù lôùn hoaëc quaù beù), ngöôøi ta thöôøng loaïi boû caùc giaù trò lôùn
nhaát vaø caùc giaù trò nhoû nhaát (Outliers) theo cuøng moät tyû leä naøo ñoù. Khi
ñoù giaù trò trung bình ñöôïc goïi laø giaù trò trung bình giaõn löôïc (Timmed-
mean).
Moät caùch laøm khaùc laø gaùn caùc troïng soá khaùc nhau cho caùc giaù trò quan
saùt tuøy theo khoaûng caùch cuûa noù ñeán giaù trò trung bình, caøng xa troïng soá
caøng nhoû. Caùc trong soá naøy goïi laø M-estimators. Coù 4 loaïi troïng soá laø
Huber, Turkey, Hampel, vaø Andrew. Döïa vaøo troïng soá naøy ta öôùc löôïng laïi
giaù trò trung bình cho döõ lieäu.

Bieân soaïn: Ñaøo Hoaøi Nam 31


Phaân tích döõ lieäu baèng SPSS

Ñeå kieåm tra döõ lieäu, choïn treân menu Statistic/Summarize/Explore… ñeå
môû hoäp thoaïi Explore nhö Hình 6-1:

Hình 6-1
Caùc bieán trong taäp döõ lieäu xuaát hieän trong hoäp beân traùi. Choïn moät hay
nhieàu bieán ñöa vaøo oâ Dependent list, caùc bieán caàn quan saùt seõ ñöôïc lieät
keâ rong oâ naøy. Chuùng ta cuõng coù theå taùch caùc quan saùt thaønh caùc
nhoùm nhoû rieâng bieät ñeå kieåm tra döïa vaøo caùc giaù trò cuûa caùc bieán
kieåm soaùt seõ ñöôïc ñöa vaøo oâ Factor List. Ví duï nhö kieåm tra bieán möùc
ñoä ñaùnh giaù noùi chung döïa vaøo bieán nhaõn hieäu ñang söû duïng. Coù theå
laàn ra caùc quan saùt naøy baèng caùch gaùn nhaõn cho noù baèng gía trò cuûa
moät bieán naøo ñoù, bieán naøy seõ ñöôïc ñöa vaøo trong oâ label cases by. Ví duï
muoán bieát nhöõng giaù trò di thöôøng trong bieán möùc ñoä ñaùnh giaù noùi
chung theo nhaõn hieäu TV ñang duøng. Ta gaùn nhaõn cho caùc quan saùt naøy
baèng caùc giaù trò trong bieán soá baûng caâu hoûi. Luùc naøy neáu coù caùc giaù
trò dò thöôøng ta deã daøng laàn ra noù baèng soá baûng caâu hoûi keøm theo
OÂ Display, cho pheùp chuùng ta choïn caùch hieãn thò keát quaû, caùc tham soâ
thoáng keâ (Statistic), hoaëc ñoà thò (Plot), SPSS maëc ñònh laø hieãn thò caû hai

Bieân soaïn: Ñaøo Hoaøi Nam 32


Phaân tích döõ lieäu baèng SPSS

Söû duïng coâng cuï Statistics cho pheùp ta löïa choïn caùc thoáng keâ hieãn thò nhö
hoäp thoaïi Hình 6-2:

Hình 6-2
- Descriptives: Cho pheùp ta hieãn thò caùc giaù trò thoáng keâ nhö giaù trò
trung bình, khoaûng tin caäy, trung vò, trung bình giaõn löôïc, giaù trò nhoû
nhaát, lôùn nhaát, khoaûng bieán thieân, caùc baùch phaân vò
- M-estimators: Hieãn thò caùc giaù trò trung bình theo 4 loaïi troïng soá
- Outliers: Hieãn thò caùc quan saùt coù 5 giaù trò nhoû nhaát vaø 5 giaù trò
lôùn nhaát, goïi laø Extreme Values
- Percentiles: Hieån thò caùc giaù trí baùch vò phaân
Söû duïng coâng cuï Plots (Hình 6-3), ñeå löïa choïn hieãn thò daïng ñoà thò
(Histogram), bieåu ñoà chænh taéc, caùc pheùp kieåm tra veà phaân phoái chuaån,
tính ñoàng ñeàu cuûa phöông sai
Hình 6-3

- Boxplots: Ñieàu kieän ñeå hieãn thò cuûa Boxplots laø ta phaûi ñang quan
saùt nhieàu hôn moät bieán phuï thuoäc (hieãn thò trong oâ dependent list).
o Factor levels together ñöa ra moät hieån thò rieâng bieät cho
moãi bieán phuï thuoäc. Trong phaïm vi moät hieån thò, Boxplots
ñöôïc hieån thò cho moãi moät nhoùm ñöôïc phaân ra theo giaù trò

Bieân soaïn: Ñaøo Hoaøi Nam 33


Phaân tích döõ lieäu baèng SPSS

cuûa bieán ñieàu khieån (factor variable). Dependents together ñöa


ra moät hieån thò rieâng bieät theo moãi nhoùm ñöôïc phaân theo
caùc giaù trò trong bieán ñieàu khieån. Trong phaïm vi cuûa hieãn
thò, boxplots ñöôïc ñöa ra laàn löôït cho moãi bieán phuï thuoäc
- Descriptive: Cho pheùp löïa choïn hieån thò daïng ñoà thò Histogram hay
daïng caønh laù (stem-and-leaf plots)
- Normality plots with tests. Ñöa ra caùc daïng ñoà thò veà phaân phoái
chuaån. Ñoàng thôøi cung caáp moät kieåm nghieäm thoáng keâ
Kolmogorov-Smirnov statistic, vôùi möùc tin caäy Lilliefors duøng ñeå
kieåm nghieän tính chuaån cuûa phaân phoái maãu ñang quan saùt. Moät
kieåm nghieäm khaùc laø thoáng keâ Shapiro-Wilk ñöôïc söû duïng cho
maãu coù kích côû nhoû hôn hoaëc baèng 50 maãu.
- Spread vs. Level with Levene Test. Cho pheùp chuùng ta kieåm tra tính
ñoàng ñeàu cuûa phöông sai giöõa caùc maãu trong döõ lieäu goác hay döõ
lieäu ñaõ ñöôïc bieán ñoåi. Ñeå thöïc hieän pheùp thoáng keâ Levene ñoøi
hoûi phaûi coù khai baùo bieán ñieàu khieån trong khuoân Factor lists,
Thoàng thöôøng ta thöôøng laøm vieäc treân döõ lieäu goác do ñoù löïa
choïn Untransformed trong khung Spread vs Level with Levene test
 Kieåm nghieäm Kolmogorov-Smirnov (Lilliefors)
Kieåm nghieäm Lilliefors laø moät daïng kieåm nghieäm Kolmogorov-Smirnov,
duøng ñeå kieåm nghieäm tính chuaån taéc cuûa moät maãu hay hai maãu. Vôùi
giaù trò sig. nhoû hôn möùc yù nghóa (0.05) laø keát quaû baùc boû giaû thuyeát
phaân phoái maãu laø phaân phoái chuaån. Pheùp kieåm nghieäp Shapiro-Wilk
chæ duøng trong nhöõng tröôøng hôïp soá maãu nhoû hôn 40.
 Kieåm nghieäm Levene
Tröôùc khi ñi vaøo caùc kieåm nghieäm trung bình ta caàn phaûi tham khaûo
moät kieåm nghieäm khaùc maø keát quaû cuûa noù laø raát quan troïng cho
caùc kieåm nghieäm trung bình sau naøy. Kieåm nghieäm Levene laø pheùp
kieåm nghieäm tính ñoàng nhaát cuûa phöông sai. ÔÛ ñaây ta kieåm nghieäm
giaû thuyeát cho raèng phöông sai cuûa giöõa caùc maãu quan saùt laø baèng
nhau. Kieåm nghieäm cho ta keát quaû Sig. nhoû hôn möùc tin caäy (5%) ta keát
luaän khoâng chaáp nhaän giaû thuyeát cho raèng phöông sai maãu thì baèng
nhau. Chuù yù trong moät soá kieåm nghieäm nhö ANOVA, kieåm nghieäm t, …
Ñoøi hoûi phaûi kieåm nghieäm thoâng keâ Levene tröôùc ñeå xaùc ñònh tinh
caân baèng hay khoâng caân baèng cuûa caùc phöông sai maãu. Keát quaû naøy
seõ aûnh höôûng ñeán vieäc löïa choïn caùc kieåm nghieäm trung bình khaùc
(Kieåm nghieäp trung bình vôùi phöông sai maãu baèng nhau hoaëc kieåm
nghieäm trung bình vôùi phöông sai maãu khoâng baèng nhau)
2. Laäp baûng phaân boá taàn suaát cho bieán moät traû lôøi (Frequencies)
Coâng cuï Frequencies söû duïng caùc tham soá thoáng keâ ñeå moâ taû cho nhieàu
loaïi bieán, ñaây cuõng laø moät coâng cuï höõu ích ñeå ta khaûo saùt döõ lieäu tìm
loãi cho döõ lieäu.

Bieân soaïn: Ñaøo Hoaøi Nam 34


Phaân tích döõ lieäu baèng SPSS

Chuùng ta coù theå khaûo saùt döõ lieäu thoâng qua caùc coâng cuï nhö: Taàn suaát
xuaát hieän, phaàn traêm, phaàn traêm tích luõy. Ngoaøi ra noù coøn cung caáp cho
ta caùc pheùp ño löôøng thoâng keâ nhö ñoä taäp trung (central tendency
measurement), ñoä phaân taùn (dispersion), töù phaân vò (Quartiles) vaø caùc baùch
phaân vò (percentiles), phaân phoái döõ lieäu (distribution).
Laäp baûng naøy ngoaøi vieäc toùm taét döõ lieäu, noù coøn giuùp ta phaùt hieän
nhöõng sai soùt trong döõ lieäu nhö, nhöõng giaù trò baát thöôøng (quaù lôùn hay
quaù nhoû) coù theå laøm sai leäch keát quaû phaân tích thoáng keâ, nhöõng giaù trò
maõ hoùa baát thöôøng do sai soùt vieäc nhaäp lieäu hay maõ hoùa
Ñeå tieán haønh laäp baûng ñôn ta choïn coâng cuï Statistic/sumarize/frequencies
ta coù hoäp thoaïi nhö Hình 6-4:

Hình 6-4

Bieân soaïn: Ñaøo Hoaøi Nam 35


Phaân tích döõ lieäu baèng SPSS

Chuyeån bieán caàn moâ taû sang hoäp thoaïi variable(s, ta coù theå löïa choïn
nhieàu bieán caàn quan saùt cuøng moät luùc.
Coâng cuï Charts ñöôïc duøng ñeå veõ ñoà thò cho döõ lieäu, vaø coâng cuï Format
ñöôïc söû duïng ñònh ra kieåu hieån thò cuûa döõ lieäu, theo thöù töï taêng daàn
hoaëc giaõm daàn.
Coâng cuï statistics ñeå truy suaát hoäp thoaïi nhö Hình 6-5. Trong hoäp thoaïi
statistics naøy seõ bao goàm caùc coâng cuï ñeå ño löôøng caùc giaù trò thoáng keâ
cuûa döõ lieäu nhö vò trí töông ñoái cuûa caùc nhoùm giaù trò hay coøn goïi laø
caùc phaân vò, maät ñoä taäp trung vaø phaân taùn cuûa döõ lieäu, nhöõng ñaëc tính
veà phaân phoái cuûa döõ lieäu (Distribution)

Hình 6-5
- Giaù trò baùch phaân vò (percentile values): Ñöôïc duøng ñeå xaùc ñònh
caùc ranh giôùi töông ñoái cuûa caùc nhoùm töø maãu quan saùt, ñieàu löu yù
laø döõ lieäu caàn quan saùt ñaõ ñöôïc xaép xeáp thep thöù töï töø thaáp ñeán
cao.
o Ta coù coâng cuï phaân nhaùnh döõ lieäu thaønh 4 phaàn baèng
nhau goïi laø töù phaân vò (quartiles).
o Hoaëc ta coù theå chia döõ lieäu theo caùc phaàn baèng nhau cuï
theå baèng caùch goõ soá phaàn muoán chia vaøo coâng cuï cuts
points for equal groups.
o Hoaëc ta coù theå xem giaù trò ôû phaân nhaùnh cuï theå naøo ñoù
töø coâng cuï percentile(s).
Söû duïng thanh Add ñeå xaùc nhaän soá thöù töï phaân vò caàn quan saùt,
söû duïng thanh Remove vaø Change ñeå loaïi boû hoaëc thay ñoåi söï xaùc
nhaän ban ñaàu.
Ví duï nhö ñoái vôùi bieán chöùa caùc caâu traû lôøi tröïc tieáp veà soá tuoåi
cuûa ngöôøi traû lôøi trong moät cuoäc khaûo saùt daân soá (tuoåi ngöôøi
traû lôøi ñöôïc ghi tröïc tieáp töø 18 – 89 tuoåi) ta coù theå duøng coâng cuï
phaân vò döõ lieäu ñeå phaân caùc ñoä tuoåi naøy thaønh caùc nhoùm nhoû,

Bieân soaïn: Ñaøo Hoaøi Nam 36


Phaân tích döõ lieäu baèng SPSS

ví duï nhö ta phaân caùc ñoä tuoåi naøy baèng phöông phaùp töù phaân vò
(quartiles). Luùc ñoù tuoåi cuûa ngöôøi traû lôøi seõ ñöôïc phaân thaønh 4
phaàn sao cho moãi nhoùm tuoåi ñöôïc phaân chieám 25% soá laàn xuaát
hieän (taàn suaát xuaát hieän).
- Ñaëc tính phaân phoái (Distribution): Coù hai ñaïi löôïng ño löôøng
nhöõng ñaëc tính cuûa söï phaân phoái döõ lieäu laø
(1) Heä soá ñoái xöùng Skewness (Cs) cho ta bieát daïng phaân phoái cuûa
caùc giaù trò quan saùt Standard Error of Skewness coù theå ñöôïc söû duïng
ñeå kieåm nghieäm tính phaân phoái chuaån. Moät phaân phoái Skewness
khoâng ñöôïc xem laø phaân phoái chuaån khi Statndard error cuûa noù nhoû
hôn –2 hoaëc lôùn hôn 2. Moät giaù trò döông lôùn cuûa Statndard error cho
thaáy nhaùnh cuûa phaân phoái naøy daøi qua beân phaûi vaø ngöôïc laïi
moät trò aâm chæ ra nhaùnh cuûa phaân phoái naøy daøi qua beân traùi
- Cs = 0: Caùc quan saùt ñöôïc phaân phoái moät caùc ñoái xöùng xung
quanh giaù trò trung bình
- Cs > 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò nhoû
nhaát
- Cs < 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò lôùn
nhaát
(2) Heä soá taäp trung Kurtosis (Cc) duøng ñeå so saùnh ñöôøng cong quan
saùt vôùi daïng ñöôøng cong phaân phoái chuaån. Standard Error of Kurtosis
coù theå ñöôïc söû duïng ñeå kieåm nghieäm tính phaân phoái chuaån. Moät
phaân phoái Kurtosis khoâng ñöôïc xem laø phaân phoái chuaån khi
Statndard error cuûa noù nhoû hôn –2 hoaëc lôùn hôn 2. Moät giaù trò döông
lôùn cuûa Statndard error cho ta bieát hai nhaùnh cuûa phaân phoái naøy daøi
hôn nhaùnh cuûa phaân phoái chuaån vaø ngöôïc laïi moät trò aâm chæ ra hai
nhaùnh cuûa phaân phoái ngaén hôn phaân phoái chuaàn
- Cc > 0: Cho thaáy xu höôùng taïp trung maïnh cuûa caùc quan saùt
xung quanh giaù trò trung bình
- Cc < 0: Cho thaáy ñöôøng cong coù daïng heïp hôn.

Bieân soaïn: Ñaøo Hoaøi Nam 37


Phaân tích döõ lieäu baèng SPSS

3. Laäp baûng moâ taû (Descriptive)


Söû duïng Statisticts\Summaries\Descriptives ñeå môû hoäp thoaïi moâ taû thoáng
keâ nhö Hình 6-6:

Hình 6-6
Ñaây laø moät daïng coâng cuï khaùc coù theå ñöôïc duøng ñeå toùm taéc döõ lieäu
vaø chæ cho pheùp thao taùc treân daïng döõ lieäu ñònh löôïng (thang ño khoaûng
caùch vaø tyû leä). Ñöôïc duøng ñeå theå hieän xu höôùng taäp trung cuûa döõ lieäu
(central tendency) thoâng qua giaù trò trung bình cuûa caùc giaù trò trong bieán
(mean), vaø moâ taû söï phaân taùn cuûa döõ lieäu thoâng qua phöông sai vaø ñoä
leäch chuaån. Chuyeån caùc bieán caàn toùm taéc vaøo hoäp thoaïi variables vaø
nhaáp thanh options ñeå löïa choïn caùc thoâng soá thoáng keâ caàn moâ taû, nhö
giaù trò trung bình–mean, giaù trò toái thieåu, giaù trò toái ña, phöông sai vaø ñoä
leäch chuaån,… (Hình 6-7)
Hình 6-7

Bieân soaïn: Ñaøo Hoaøi Nam 38


Phaân tích döõ lieäu baèng SPSS

4. Laäp baûng nhieàu chieàu cho caùc bieán moät traû lôøi (Crosstabs)
Baûng nhieàu chieàu laø daïng baûng cheùo theå hieän taàn suaát xuaát hieän cuûa
moät bieán naøy trong moái quan heä vôùi moät hay nhieàu bieán khaùc. Baûng
cheùo coøn cung caáp nhieàu loaïi kieåm nghieäm thoáng keâ vaø ño löôøng moái
quan heä vaø töông quan giöõa caùc bieán trong baûng. Caáu truùc cuûa baûng vaø
loaïi döõ lieäu (loaïi thang ñoù) seõ quyeát ñònh loaïi coâng cuï naøo ñöôïc söû
duïng ñeå ño löôøng. Ngoaøi vieäc theå hieän moái lieân heä giöõa caùc bieán.
Baûng nhieàu chieàu coøn giuùp ta phaùt hieän nhöõng sai soùt trong döõ lieäu töø
vieäc phaùt hieän ra nhöõng moái quan heä voâ lyù vaø baát thöôøng giöõa hai
bieán. Choïn treân menu Statistics/Summaries/Crosstabs ñeå môû hoäp thoaïi nhö
Hình 6-8:

Hình 6-8
Caùc bieán trong taäp döõ lieäu ñöôïc hieån thò beân hoäp beân traùi. Choïn caùc
bieán haøng ñöa vaùo hoäp Row(s) vaø caùc bieán coät ñöa vaøo hoäp Column(s).
Thoâng thöôøng bieán phuï thuoäc hay bieán caàn quan saùt thöôøng ñöôïc ñöa vaø
haøng (rows) vaø bieán ñoäc laäp hay bieán kieåm soaùt ñöôïc ñöa vaø coät
(columns). Vieäc löïa choïn caùc phaân tích theo caùc tyû leä phaàn traêm, %row
vaø %column cuõng nhö %total tuyø thuoäc vaøo yeâu caàu nghieân cöùu.
Ngoaøi ra, chuùng ta coù theå ñöa theâm vaøo baûng cheùo caùc lôùp bieán ñieàu
khieån (layer) ñeå taïo ra caùc baûng bieán cheùo nhieàu chieàu. Moãi baûng cheùo
rieâng bieät seõ ñöôïc taïo ra öùng vôùi moãi giaù trò cuûa moãi bieán ñieàu khieån.
Moãi lôùp ñieàu khieån seõ chia baûng cheùo thaønh nhieàu nhoùm nhoû hôn. Coù
theå theâm toái ña 8 bieán ñieàu khieån, duøng caùc thanh Next vaø previous ñeå di
chuyeån giöõa caùc bieán ñieàu khieån naøy. Vieäc ñöa vaøo caùc bieán ñieàu
khieån naøy cho pheùp ta xem xeùt caùc moái quan heä maø luùc ban ñaàu khoâng
theå thaáy ngay. Caùc coâng cuï thoáng keâ seõ cho ra caùc keát quaû rieâng bieát
ñoái vôùi töøng giaù trò cuûa bieán ñieàu khieån.

Bieân soaïn: Ñaøo Hoaøi Nam 39


Phaân tích döõ lieäu baèng SPSS

Coâng cuï Cells trong hoäp thoaïi cho pheùp ta tính toaùn caùc heä soá ño löôøng
moái quan heä giöõa caùc bieán ñoù nhö % haøng, % coät, % Total.
Coâng cuï Exact cung caáp cho chuùng ta hai phöông phaùp ñeå tính ra möùc ñoä tin
caäy cho caùc pheùp kieåm nghieäm söû duïng trong baûng cheùo, hoaëc caùc pheùp
thöû phi tham soá (nonparametric). Hai phöông phaùp naøy bao goàm phöông phaùp
Exact vaø phöông phaùp Monte Carlo ñöôïc söû duïng nhö coâng cuï ñeå thu ñöôïc
nhöõng keát quaû chính xaùc trong tröôøng hôïp döõ lieäu cuûa chuùng ta khoâng
ñaùp öùng ñöôïc nhöõng giaû thuyeát caàn thieát cho moät keát quaû ñaùng tin caäy
khi söû duïng phöông phaùp tieäm caän tieâu chuaån (Standard asymptonic) phöông
phaùp maø keøm theo noù döõ lieäu cuûa chuùng ta ñoøi hoûi phaûi thoaû maõn
nhöõng ñieàu kieän sau:
- Döõ lieäu söû duïng coù phaân phoái chuaån, hoaëc kích côû maãu phaûi ñuû
lôùn (n>=30)
- Khoâng toàn taïi taàn suaát mong muoán naøo cuûa baát kyø giaù trò naøo
trong baûng cheùo nhoû hôn 5.
Ñoái vôùi tröôøng hôïp döõ lieäu khoâng gaëp ñöôïc nhöõng yeâu caàu nhö treân.
Phöông phaùp exact hoaëc Monte Carlo veà ñoä tin caäy luoân luoân cho ta keát
quaû ñaùng tin caäy maø khoâng caàn quan taâm ñeán kích côû maãu, phaân phoái
cuûa caùc quan saùt cuõng nhö söï caân baèng cuûa döõ lieäu (caân baèng veà soá
löôïng caùc giaù trò khaùc nhau trong bieán). Choïn coâng cuï Exact trong hoäp
thoaïi Crosstabs ta coù hoäp thoaïi con nhö Hình 6-9.
Hình 6-9

SPSS maëc ñònh laø söû duïng phöông phaùp tieäm caän thoâng thöôøng
(Asymptotic). Neáu ta söû duïng phöông phaùp exact hoaëc mote carlo ñeå xaùc
ñònh tính ñoä tin caäy thì caàn chuù yù caùc ñieåm sau:
- Neáu ta löïa choïn phöông phaùp Monte Carlo, goû khoaûng tin caäy mong
muoán vaøo coâng cuï Confidence level, ñoàng thôøi cho bieát kích côû maãu
ñöôïc söõ duïng. Söû duïng phöông phaùp cho ta keát quaû nhanh hôn
phöông phaùp exact
- Neáu löïa choïn phöông phaùp Exact, nhaäp vaøo thôøi gian giôùi haïn toái ña
cho vieäc tính toaùn cho moãi pheùp thöû. Neáu moät pheùp kieåm nghieäm

Bieân soaïn: Ñaøo Hoaøi Nam 40


Phaân tích döõ lieäu baèng SPSS

vöôït quaù thôøi gian giôùi haïn toái ña 30 phuùt, caùch toát hôn neân söû
duïng laø Moten Carlo
Coâng cuï Statistics cho pheùp ta tính caùc kieåm nghieäm giaû thuyeát veà tính
ñoäc laäp cuûa caùc bieán, vaø moái lieân heä giöõa caùc caùc bieán, heä soá töông
quan, cuõng nhö ño löôøng caùc moái quan heä ñoù. (Xem Hình 6-10)

Hình 6-10
 Caùc kieåm nghieäm thoáng keâ – kieåm nghieäm moái quan heä vaø
töông quan giöõa caùc bieán söû duïng trong baûng cheùo
 Kieåm nghieäp Chi-square:
- Laø moät coâng cuï thoâng keâ söû duïng ñeå kieåm nghieäp giaû thuyeát cho
raèng caùc bieán trong haøng vaø coät thì ñoäc laäp vôùi nhau (H 0). Phöông
phaùp kieåm nghieäm naøy chæ cho ta bieát ñöôïc lieäu moät bieán naøy coù
quan heä hay khoâng vôùi moät bieán khaùc, tuy nhieân phöông phaùp kieåm
nghieäp naøy khoâng chæ ra cöôøng ñoä cuûa moái quan heä giöõa hai bieán
maïnh hay yeáu (neáu coù quan heä), cuõng nhö khoâng chæ ra höôùng
thuaän hay nghòch cuûa moái quan heä naøy (neáu coù quan heä).
- Ñeå kieåm nghieäp tính ñoäc laäp giöõa hai bieán coät vaø haøng, kieåm
nghieäp Chi-square seõ cho ra caùc keát quaû kieåm nghieäp nhö sau:
Pearson chi-square, likelihood-ratio chi-square, and linear-by-linear
association chi-square moãi caùi seõ ñöôïc söû duïng trong nhöõng tröôøng
hôïp cuï theå
- Theo ñònh nghóa hai bieán trong baûng laø ñoäc laäp vôùi nhau neáu nhö
xaùc suaát sao cho moät tröôøng hôïp quan saùt (case) rôi vaøo moät tröôøng
hôïp cuï theå (ví duï nhö giôùi tính laø Nam vaø ñang thaát nghieäp) laø ñöôïc
taïo ra töø caùc xaùc suaát bieân (xaùc suaát coät vaø xaùc suaát haøng). Ví
duï ta coù xaùc suaát moät ñoái töôïng quan saùt laø thaát nghieäp laø 35/923.
Vaø xaùc suaát ñeå ñoái töôïng quan saùt laø Nam giôùi laø 452/923. Do hai
bieán laø ñoäc laäp, theo lyù thuyeát xaùc suaát ñeå moät tröôøng hôïp quan
saùt vöøa laø Nam giôùi vöøa laø Thaát nghieäp thì xaùc suaát trong tröôøng
hôïp naøy phaûi laø (452/923) x (35/923) vaø baèng 0.018. Xaùc suaát naøy

Bieân soaïn: Ñaøo Hoaøi Nam 41


Phaân tích döõ lieäu baèng SPSS

seõ ñöôïc söû duïng ñeå öôùc löôïng (estimate) soá löôïng caùc tröôøng hôïp
quan saùt mong ñôïi trong töøng phaàn giao nhau giöõa hai bieán treân baûng
cheùo döôùi ñieàu kieän hai bieán laø ñoäc laäp vôùi nhau. Do ñoù ñeå tính
toaùn ñöôïc soá löôïng quan saùt mong ñôïi laø Nam giôùi vaø thaát nghieäp
ta chæ vieäc nhaân xaùc suaát vöøa tìm ñöôïc vôùi toång soá maãu quan saùt
(0.018 x 923). (Xem baûng phía cheùo phía döôùi)

Tinh trang cong viec * Gioi tinh nguoi tra loi Crosstabulation

Gioi tinh nguoi tra loi


Nam Nu Total
Tinh Lam viec toan thoi gian Count 379 308 687
trang Expected Count 336.4 350.6 687.0
cong % of Total 41.1% 33.4% 74.4%
viec
Lam viec ban thoi gian Count 32 94 126
Expected Count 61.7 64.3 126.0
% of Total 3.5% 10.2% 13.7%
Tam thoi khong di lam Count 8 22 30
Expected Count 14.7 15.3 30.0
% of Total .9% 2.4% 3.3%
That nghiep Count 25 10 35
Expected Count 17.1 17.9 35.0
% of Total 2.7% 1.1% 3.8%
Khac Count 8 37 45
Expected Count 22.0 23.0 45.0
% of Total .9% 4.0% 4.9%
Total Count 452 471 923
Expected Count 452.0 471.0 923.0
% of Total 49.0% 51.0% 100.0%

- Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán, ngöôøi ta söû duïng phaân
phoái ngaãu nhieân Chi bình phöông (2) vôùi tham soá thoáng keâ Pearson
chi bình phöông ñeå tieán haønh so saùnh soá löôïng caùc tröôøng hôïp quan
saùt ñöôïc vôùi soá löôïng caùc tröôøng hôïp mong ñôïi baèng coâng thöùc
sau:
r c (Oij  Eij ) 2
X  
2

i 1 j 1 Eij
- Khi keát quaû thoáng keâ Chi bình phöông (2) ñuû lôùn (Döïa vaøo lyù
thuyeát phaân phoái Chi bình phöông vôùi ñoä tin caäy xaùc ñònh, kích côû
maãu laø n, baät töï do-degree of freedom laø df=(r-1)(c-1)) ta coù theå keát
luaän baùc boû giaû thuyeát ñoäc laäp giöõa hai bieán (H 0). Hoaëc söû duïng
giaù trò P (P-value hay Asymtotic Significance) so saùnh vôùi möùc yù nghóa
(Significance level) thöôøng laø α = 0.05 töông öùng vôùi 95% ñoä tin caäy,
ta coù theå keát luaän baùc boû H 0 khi p-value nhoû hôn hoaëc baèng möùc
yù nghóa vaø ngöôïc laïi chaáp nhaän H 0 khi p-value lôùn hôn möùc yù
nghóa.

Bieân soaïn: Ñaøo Hoaøi Nam 42


Phaân tích döõ lieäu baèng SPSS

- Tuy nhieân ñeå vieäc kieåm nghieäm naøy laø ñaùng tin caäy thì caùc soá
lieäu trong baûng cheùo giöõa hai bieán ñang khaûo saùt phaûi thoûa maõn
moät soá ñieàu kieän nhaát ñònh sau:
o Khoâng toàn taïi ôû baát kyø oâ giao nhau giöõa hai bieán coù giaù
trò mong ñôïi nhoû hôn 1.
o Khoâng vöôït quaù 20% löôïng oâ giao nhau giöõa hai bieán ñang
khaûo saùt trong baûng cheùo coù giaù trò nhoû hôn 5 (ñoái vôùi
baûng 2x2-baûng maø moãi bieán trong baûng cheùo chæ coù hai
giaù trò, phaàn traêm giôùi haïn naøy laø 0%)
- Neáu khoâng thoûa maõn caùc ñieàu kieän treân ta phaûi tieán haønh loaïi
boû bôùt caùc giaù trò trong moät bieán maø döõ lieäu giao nhau cuûa noù
laø khoâng ñaùng keå (quaù nhoû)
- Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán coät vaø haøng trong
baûng cheùo, kieåm nghieäp Chi-square seõ cho ra caùc keát quaû kieåm
nghieäp khaùc nhau nhö sau: Pearson chi-square, likelihood-ratio chi-
square, vaø linear-by-linear association chi-square.
- Thoâng thöôøng ñeå xaùc ñònh moái quan heä giöõa hai bieán trong baûng
cheùo, vieäc söû duïng chæ soá naøo ñeå kieåm nghieäm tích ñoäc laäp giöõa
hai bieán phuï thuoäc vaøo soá löôïng coät vaø haøng trong baûng, soá maãu
nghieân cöùu, taàn suaát xuaát hieän mong muoán cuûa moät giaù trò trong
bieán trong ñieàu kieän cuûa bieán khaùc, daïng ño löôøng cuûa caùc bieán
trong baûng (daïng thang ño). Ta coù:
o Döïa vaøo caùc heä soá Pearson Chi-square vaø Likelihood Ratio ta
coù theå kieåm nghieäp moái lieân heä giöõa hai bieán maø khoâng
caàn quan taâm ñeán soá löôïng haøng vaø coät trong baûng.
o Hoaëc ta coù theå duøng chæ soá Linear-by-linear association khi
maø caùc bieán trong baûng laø bieán ñònh löôïng.
o Ñoái vôùi daïng baûng cheùo coù hai coät vaø hai doøng (2X2 tables)
– moãi bieán trong baûng chæ coù hai giaù trò, ta duøng caùc chæ soá
Yate’s corrected chi-square hay coøn goïi laø Continuity
Correction ñaùnh giaù moái töông quan giöõa hai bieán trong baûng.
o Söû duïng chæ soá Fisher’s exact test khi maø soá maãu nghieân cöùu
vaø caùc giaù trò mong ñôïi nhoû, thoâng thöôøng ta seõ söû duïng
chæ soá naøy khi maãu trong baûng nhoû hôn hoaëc baèng 20 hoaëc
taàn suaát xuaát hieän mong muoán trong moät phaàn giao nhau giöõa
hai bieán trong baûng (cell) nhoû hôn 5.
- Ñeå keát luaän moái lieân heä giöõa hai bieán laø ñoäc laäp hay phuï thuoäc
vaøo nhau (coù hay khoâng coù töông quan) ngöôøi ta döïa vaøo Asymptotic
Significance vôùi soá maãu ñuû lôùn hoaëc phaân phoái laø phaân phoái
chuaån. Ñaây laø chæ soá thoáng keâ ñeå ño löôøng vôùi möùc yù nghóa
(thöôøng laø 5%) nhaèm ñöa ra keát luaän phaûn baùt hay chaáp nhaän giaû
thuyeát ban ñaàu (Hai bieán laø ñoäc laäp vôùi nhau). Ta coù theå keát luaän

Bieân soaïn: Ñaøo Hoaøi Nam 43


Phaân tích döõ lieäu baèng SPSS

giöõa hai bieán toàn taïi moät moái quan heä vôùi nhau khi maø Asym. Sig.
nhoû hôn möùc yù nghóa vaø ngöôïc laïi.
- Ñoái vôùi kieåm nghieäm Chi-square ta chæ coù theå xaùc ñònh giöõa hai
bieán coù hay khoâng toàn taïi moät moái quan heä. Tuy nhieân ñeå ño
löôøng cöôøng ñoä cuûa caùc moái quan heä naøy ñoøi hoûi caùc coâng cuï
thoáng keâ khaùc seõ ñöôïc ñeà caäp sau ñaây.
 Correlation:
- Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tö hoaëc khoaûng
caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû
yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson
correlation coefficient. Trong ñoù:
o Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai
bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø
thaáp nhaát ñeán cao nhaát).
o Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng
heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä
tuyeán tính giöõa caùc bieán naøy.
- Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu
coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay
nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông
quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan caøng maïnh.
 Moät soá ño löôøng moái töông quan khaùc giöõa hai bieán
 Giöõa hai bieán ñònh danh:
- Ñeå ño löôøng moái quan heä giöõa hai bieán bieåu danh. Söû duïng caùc
heä soá Phi (coefficient) vaø Craémr’s V, Contingency coefficient ñeå
ño löôøng neáu döïa vaøo keát quaû kieåm nghieäm Chi-bình phöông. ÔÛ
ñaây caùc heä soá naøy seõ baèng 0 neáu vaø chæ neáu heä soá Pearson
chi bình phöông baèng 0. Do ñoù ngöôøi ta söû duïng caùc thoâng soá
naøy ñeå kieåm nghieäm giaû thuyeát cho raèng caùc heä soá naøy ñeàu
baèng 0 - ñieàu naøy töông ñöông vôùi giaû thuyeát ñoäc laäp giöõa hai
bieán, hay hai bieán khoâng coù moâí quan heä vôùi nhau. Ta seõ töø
choái giaû thuyeát naøy
- Phi: Chæ duøng cho daïng baûng 2x2 tables, heä soá phi coefficient naøy
bieán thieân töø -1 ñeán +1. Do ñoù heä soá naøy ngoaøi khaû naêng chæ
ra moái quan heä vaø cöôøng ñoä cuûa moái quan heä noù coøn chæ ra
höôùng cuûa moái quan heä ñoù
- Cramer's V vaø Contingency coefficient (heä soá ngaãu hieân): Ñöôïc
söû duïng cho baûng maø soá coät vaø haøng laø baát kyø, giaù trò kieåm
nghieäm bieán thieân töø 0 ñeán 1, vôùi giaù trò 0 chæ ra khoâng coù
moái quan heä giöõa caùc bieán

Bieân soaïn: Ñaøo Hoaøi Nam 44


Phaân tích döõ lieäu baèng SPSS

- Ngoaøi ra coøn coù caùc heä soá ño löôøng tröïc tieáp nhö Lambda
(symmetric and asymmetric lambdas and Goodman and Kruskal’s
tau), vaø Uncertainty coefficient. Laø caùc ño löôøng khoâng döïa vaøo
giaù trò Chi-square ñeå tính toaùn, vaø khoâng quan taâm ñeán tính ñoái
xöùng cuûa phaân phoái chuaån. Caùc giaù trò cuûa heä soá naøy cuõng
bieán thieân töø 0 ñeá 1 vaø ñöôïc duøng ñeå ño löôøng khaû naêng döï
baùo cuûa moät bieán (bieán ñoäc laäp) ñoái vôùi moät bieán khaùc (bieán
phuï thuoäc). Vôùi giaù trò 0 nhaän ñöôïc coù yù nghóa raèng nhöõng
kieán thöùc veà bieán ñoäc laäp khoâng giuùp ích gì cho vieäc döï baùo
nhöõng khaû naêng xaûy ra cuûa bieán phuï thuoäc, vaø giaù trò 1 cho
bieát khi ta bieát ñöôïc nhöõng thoâng tin veà bieán ñoäc laäp thì noù seõ
giuùp ta xaùc ñònh ñöôïc moät caùch hoaøn haûo caùc khaû naêng xaûy ra
cho bieán phuï thuoäc.
- Vieäc löïa choïn bieán naøo laø bieán ñoäc laäp vaø bieán naøo laø bieán
phuï thuoäc tuøy thuoäc vaøo vaán ñeà cuï theå maø ta ñang khaûo saùt
- Heä soá Asymptotic Std. Error coù theå ñöôïc duøng ñeå ñònh ra
khoaûng tin caäy (95%) cho caùc tham soá ño löôøng (Value +(-)
2*Asymptotic std. Error)
 Söû duïng Odds Ratio cho baûng hai coät hai haøng (2x2 tables)
- Ñeå ño löôøng moái töông quan giöõa hai bieán cho loaïi baûng naøy
ngöôøi ta coù theå söû duïng caùc keát quaû thoáng keâ Yates’ corrected
chi – bình phöông vaø Fisher’s exact test. Caùc keát quaû naøy ñöôïc
duøng ñeå kieåm nghieäm giaû thuyeát cho raèng caùc tyû leä giöõa caùc
giaù trò trong hai bieán naøy laø ngang baèng nhau (ví duï nhö tyû leä
ngöôøi nam ñi baûo taøng thì ngang baèng vôùi tyû leä ngöôøi nöõ ñi
baûo taøng), töông töï vôùi caùc keát quaû thoáng keâ chi – bình phöông
khaùc ta seõ töø choái giaû thuyeát H0 khi p-value nhoû hôn möùc tin
caäy.
- Ngoaøi phöông phaùp treân ta coøn coù theå söû duïng phöông phaùp
odds ratio vaø relative risk ñeå ño löôøng moái lieân heä giöõa hai ñaëc
tính. Thoâng thöôøng moät trong hai ñaëc tính ñoù xuaát hieän tröôùc (ví
duï nhö bieán chöùa ñaëc tính coù huùt thuoác hay khoâng) vaø sau ñoù
laø seõ daãn ñeán moät ñaëc tính khaùc xuaát hieän theo sau (ví duï bieán
chöùa ñaëc tính coù bò beänh lao phoåi hay khoâng). Ta goïi bieán chöùa
ñaëc tính xuaát hieän tröôùc laø bieán nhaân toá (factor) vaø bieán theo
sau laø bieán söï kieän (event). Ta coù hai phöông phaùp tính nhö sau:
(1) Relative risk:
Bieán söï kieän
Yes No Tyû leä Tyû leä
ruûi ro risk ruûi ro
töông ñoái
Relative
risk
Bieán nhaân toá Yes a b a/(a+b) a(c+d)

Bieân soaïn: Ñaøo Hoaøi Nam 45


Phaân tích döõ lieäu baèng SPSS

No c d c/(c+d) c(a+b)

Phöông phaùp naøy baét ñaàu vôùi bieán nhaân toá vaø theo sau ñoù ta
ñeám soá moãi söï kieän xuaát hieän trong moãi nhoùm nhaân toá. Tyû leä
ruûi ro ñöôïc tính rieâng bieät cho töøng nhoùm nhaân toá vaø tyû leä ruûi
ro töông öùng laø tyû soá giuõa hai tyû leä ruûi ro cuûa töøng nhoùm
nhaân toá
(2) Odds ratio:
Bieán nhaân toá
Yes No odds Tyû leä
odds
Bieán söï kieän Yes a b a/b ad
No c d c/d cb

Phöông phaùp naøy baét ñaàu vôùi bieán söï kieän. Vôùi moät söï kieän
(ví duï bò beänh lao phoåi) thì tyû leä giöõa ngöôøi huùt thuoác ñoái vôùi
ngöôøi khoâng huùt thuoác laø bao nhieâu, goïi laø odd. Sau ñoù ta laäp
tyû leä caùc odds naøy.
- Caû hai phöông phaùp naøy ñeàu coù caùch kieåm nghieäp keát quaû
gioáng nhau. Caû Tyû leä Odds vaø relative risk ñeàu nhaän giaù trò 1 khi
caùc tyû leä naøy laø gioáng nhau. Vaø ñeå kieåm nghieäm giaõ thuyeát
ban ñaàu cho raèng caùc tyû soá naøy laø nhö nhau (H 0) - töø choái hay
chaáp nhaän ta döïa vaøo khoaûng tin caäy (95%) xem xem giaù trò 1 coù
naèm trong khoaûng tin caäy ñoù hay khoâng. Neáu giaù trò 1 khoâng
naèm trong khoaûng tin caäy 95% ta töø choái giaû thuyeát H 0, vaø coù
theå xem giaù trò trong oâ (value) laø tyû soá dieãn giaûi. Neáu giaù trò 1
naèm trong khoaûng tin caäy 95%, khoâng caàn quan taâm ñeán caùc giaù
trò trong coät value, bôûi vì kieåm nghieäm cho ta keát quaû chaáp nhaän
giaû thuyeát hai tæ leä odds hoaëc relative cuûa hai giaù trò laø nhö nhau
- Chuù yù phöông phaùp Odds ratio luoân luoân laáy tyû soá odd ôû haøng
thöù nhaát chia cho haøng thöù hai, vaø söï kieän caàn quan taâm luoân
luoân naèm ôû coät thöù nhaát. Coøn ñoái vôùi phöông phaùp Relative
risk baát cöù coät naøo cuõng coù theå ñaïi dieän cho söï kieän caàn quan
taâm (SPSS seõ ñöa ra caùc keát quaû khaùc nhau ñeå öôùc löôïng cho
moãi caùi

 Duøng Kappa ñeå ño löôøng söï ñoàng yù giöõa hai bieán trong moät
baûng coù cuøng soá löôïng haøng vaø coät

- Kappa duøng ñeå ño löôøng möùc ñoä ñoàng yù giöõa nhöõng ño löôøng
cuûa hai nhoùm ñaùnh giaù ñoái vôùi cuøng moät tieâu chí naøo ñoù.
Giaù trò 1 chæ ra söï hoaøn toaøn ñoàng yù giöõa hai nhoùm, giaù trò 0
chæ ra söï ñoàng yù chæ laø moät söï ngaãu hieân.Hoaëc ta duøng p-value
ñeå kieåm nghieäm giaû thuyeát ban ñaàu H 0 cho raèng caùc giaù trò ño
löôøng naøy laø baèng khoâng. Kappa chæ thích öùng vôùi nhöõng baûng

Bieân soaïn: Ñaøo Hoaøi Nam 46


Phaân tích döõ lieäu baèng SPSS

maø caùc bieán ñöôïc söû duïng trong baûng coù cuøng soá giaù trò trong
bieán.
 Ño löôøng moái töông quan giöõa caùc bieán thöù töï vaø bieán ñònh
löôïng
(1) Nominal by Interval: Duøng ño löôøng moái töông quan giöõa bieán
bieåu danh vaø bieán ñònh löôïng trong baûng cheùo. Söû duïng heä soá
Eta.
(2) Correlation: Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù
tö hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai
bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s
correlation coefficient rho vaø Pearson correlation coefficient. Trong
ñoù Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa
hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø
thaáp nhaát ñeán cao nhaát). Khi caùc bieán trong baûng laø caùc bieán
ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño
löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy. Caùc giaù trò
cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc
tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù
trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa
hai bieán, giaù trò naøy caøng lôùn moái töông quan caøng maïnh.
(3) Ordinal: Duøng ño löôøng moái töông quan giöõa caùc bieán trong
baûng cheùo trong ñoù caùc bieán ôû coät vaø doøng laø caùc bieán thöù
töï, bao goàm caùc heä soá sau:
(1) Somers' d: Ño löôøng moái töông quan phi ñoái xöùng giöõa hai
bieán thöù töï, giaù trò bieán thieân töø –1 ñeán 1.
(2) Gamma: Ño löôøng moái töông quan ñoái xöùng giöõa hai bieán
thöù töï, giaù trò bieán thieân töø –1 ñeán 1.
(3) Kendall's tau-b vaø Kendall's tau-c: Ño löôøng caùc moái quan
heä phi tham soá giöõa hai bieán thöù töï, bieán thieân töø –1 ñeá 1
Phaàn naøy coù theå xem theâm ví duï trong phaàn phuï luïc

Bieân soaïn: Ñaøo Hoaøi Nam 47


Phaân tích döõ lieäu baèng SPSS

5. Laäp baûng cho bieán nhieàu traû lôøi:


5.1. Ñònh nghóa nhoùm bieán nhieàu traû lôøi (define multi response sets)
Trong caâu hoûi nhieàu traû lôøi seõ bao goàm nhieàu bieán chöùa ñöïng caùc traû
lôøi coù theå coù, nhöõng bieán naøy goïi laø bieán sô caáp. Do ñoù ñeå xöõ lyù,
chuùng ta phaûi goäp caùc bieán sô caáp naøy thaønh moät bieán goäp chöùa caùc
bieán sô caáp. Sau ñoù trong caùc phaân tích thoáng keâ lieân quan ñeán caâu hoûi
nhieàu traû lôøi, chuùng ta seõ duøng bieán goäp naøy thay theá cho taát caû caùc
bieán sô caáp. Bieán goäp chöùa ñöïng toaøn boä caùc giaù trò trong caùc bieán sô
caáp cuûa moät caâu hoûi nhieàu traû lôøi. Ví duï nhö caâu hoûi veà nhaän bieát
saûn phaåm, ngöôøi tra lôøi coù theå lieät keâ ra nhieàu nhaõn hieäu maø hoï bieát,
do ñoù ta phaûi khai baùo ñuû löôïng bieán ñeå chöùa ñöïng caùc nhaõn hieäu ñöôïc
lieät keâ töø ngöôøi traû lôøi, ñaây laø caùc bieán sô caáp. Tuy nhieân khi xöõ lyù ta
khoâng theå xöõ lyù rieâng bieät caùc bieán naøy, vì noù khoâng ñaïi dieän ñaày ñuû
cho taát caû caùc nhaõn hieäu ñöôïc nhaän bieát. Do ñoù khi tieán haønh phaân tích
caâu hoûi nhaän bieát saûn phaåm naøy ta phaûi tieán haønh goäp caùc bieán sô caáp
thaønh moät bieán goäp chöùa ñöïng taát caû caùc nhaõn hieäu ñöôïc lieät keâ.
Ñeå tieán haønh goäp caùc bieán sô caáp naøy ta choïn menu Statistics/Multiple
Response/Define sets… ñeå môû hoäp thoaïi Define Multiple Response Sets nhu
Hình 6-11:

Hình 6-11

Bieân soaïn: Ñaøo Hoaøi Nam 48


Phaân tích döõ lieäu baèng SPSS

Choïn taát caû nhöõng bieán sô caáp lieân quan ñeán moät caâu hoûi nhieàu traû lôøi
ôû hoäp thoaïi Set Definition beân traùi chuyeån sang hoäp thoaïi Variables in Set
beân phaûi, ví duï ta coù 10 bieán ñôn chöùa ñöïng caùc nhaõn hieäu ñöôïc nhaän
bieát, ta phaûi choïn taát caû 10 bieán naøy töø hoäp thoaïi Set Definition vaø
chuyeån sang hoäp thoaïi Variable in Set. Sau ñoù chæ ñònh caùch maõ hoùa caùc
bieán ñoù (dichotomy hay category); daõy giaù trò maõ hoùa (Range …Through)
xaùc ñònh khoaûng bieán thieân cho caùc giaù trò trong bieán goäp; xaùc ñònh teân
vaø gaùn nhaõn cho bieán goäp. Sau ñoù aán thanh Add ñeå ñöa teân nhoùm vöøa
xaùc ñònh vaøo hoäp Multi Response Sets. Sau khi tieán haønh khai baùo bieán
goäp xong moïi söû lyù phaân tích caùc bieán nhieàu traû lôøi seõ ñöôïc tieán haønh
treân caùc bieán goäp ñaõ ñöôïc khai baùo trong Multi Response Sets.
Trong khung Variable Are Code As, chuùng ta coù theå choïn moät hay hai muïc sau
ñaây tuøy theo phöông phaùp maõ hoùa:
- Dichotomies: Ñaây laø traïng thaùi maëc ñònh, vaø chuùng ta nhaäp giaù trò
caàn ñeám vaøo hoäp Counted Value. Keát quaû chæ hieãn thò duy nhaát
giaù trò ñeám vöøa khai baùo
- Category: Moãi bieán sô caáp coù nhieàu hôn hai giaù trò, vaø chuùng ta
nhaäp caùc giaù trò nhoû nhaát vaø lôùn nhaát cuûa daõy giaù trò maõ hoùa
vaøo caùc oâ Range vaø thourgh (neân khai baùo moät khoaûng caùch caøng
roäng caøng toát)
Chuùng ta ñaët teân cho nhoùm ña bieán (toái ña 7 kyù töï) vaø nhaõn (toái ña 40
kyù töï) vaøo caùc hoäp Name vaø Label. Löu yù laø teân cuûa caùc nhoùm ña bieán
chæ ñöôïc söû duïng trong caùc thuû tuïc xöõ lyù bieán nhieàu traû lôøi maø thoâi.
Ñeå loaïi boû vaø söõa ñoåi vieäc ñònh nghóa moät nhoùm bieán ña traû lôøi naøo
ñoù ta di chuyeån veät saùng ñeán teân nhoùm ñoù vaø nhaán thanh remove ñeå loaïi
boû vaø thanh Change ñeå thay ñoåi.
5.2. Laäp baûng cho bieán nhieàu traû lôøi
Ñeå tieán haønh laäp baûng cho caùc bieán nhieàu traû lôøi, ta söû duïng caùc teân
nhoùm ña bieán ñaõ ñöôïc ñònh nghóa baèng coâng cuï Define Multi Response Sets
ñaõ ñöôïc ñeà caäp ôû phaàn treân sau ñoù vaøo Statistics\Multiple response vaø
choïn Frequencies hoaëc Crosstabs tuøy theo nhu caàu laäp baûng moät chieàu hay
ña chieàu. Tuy nhieân trong caùc coâng cuï Frequencies vaø Crosstabs söû duïng cho
bieán nhieàu traû lôøi chæ moâ taû taàn suaát xuaát hieän cuûa caùc giaù trò trong
bieán goäp vaø caùc tyû leä % nhöng khoâng coù caùc phöông phaùp kieåm
nghieäm thoáng keâ keøm theo.
6. Custom Table
Ngoaøi ra khi chuùng ta tieán haønh laäp baûng moâ taû thoáng keâ cho keát quaû
cuoái cuøng cuûa vaán ñeà nghieân cöùu coù theå duøng caùc coâng cuï trong
statistics\custom table ñeå taïo ra caùc baûng bieåu, coù theå laø baûng moät
chieàu, baûng nhieàu chieàu hoaëc caùc baûng bieåu moâ taû thoáng keâ tuøy theo
yeâu caàu cuûa vaán ñeà nghieân cöùu.

Bieân soaïn: Ñaøo Hoaøi Nam 49


Phaân tích döõ lieäu baèng SPSS

Caùc loaïi baûng naøy cho pheùp ta taïo ra caùc baûng bieåu ñeïp hôn. Tuy nhieân
ngoaøi vieäc truy suaát caùc giaù trò ñeám, tyû leä phaàn traêm thì noù khoâng cung
caáp theâm cho ta phöông phaùp kieåm nghieäm thoáng keâ naøo khaùc keøm theo
- Baûng bieåu theå hieän taàn soá xuaát hieän (Tables of frequencies): Cho
pheùp chuùng ta taïo ra nhöõng baûng bieåu theå hieän taàn soá xuaát hieän
cuûa moät hay nhieàu bieán ñôn
- Daïng baûng bieåu cô baûn (Basic tables): Theå hieän caùc döõ lieäu nghieân
cöùu theo daïng baûng cheùo (cross-tabulation) giöõa hai bieán hoaëc giöõa
moät bieán vaø moät nhoùm caùc bieán.
- Daïng baûng ña bieán (Multiple response tables): Gioáng nhö basic tables
theå hieän taàn suaát xuaát hieän vaø baûng cheùo, tuy nhieân daïng baûng
bieåu naøy cho pheùp ta xaây döïng baûng bieåu cho caùc caâu traû lôøi ña
bieán
- Daïng baûng bieåu toång hôïp (General tables): Gioáng nhö baûng bieåu cô
baûn vaø ña traû lôøi. Caùc döõ lieäu ñöôïc theå hieän döôùi daïng baûng
cheùo, tuy nhieân ôû daïng baûng bieåu naøy cho pheùp ngöôøi phaân tích
theå hieän moái lieân heä giöõa moät bieán vôùi nhieàu bieán khaùc treân
cuøng moät baûng.
7. So saùnh caùc giaù trò trung bình
Coù nhieàu pheùp kieåm nghieäp ñöôïc söû duïng trong SPSS:
- Neáu so saùnh giaù trò trung bình cuûa maãu vôùi moät giaù trò coá ñònh naøo
ñoù ta söû duïng pheùp kieåm nghieäm t moät maãu (One-sample t test).
- Neáu so saùnh giaù trò trung bình cuûa moät nhoùm caùc tröôøng hôïp quan
saùt vôùi moät nhoùm quan saùt khaùc, ta söõ duïng kieåm nghieäm t maãu
ñoäc laäp (Independent-sapmles t test).
- Ñeå so saùnh giaù trò trung bình cuûa hai bieán ñöôïc khaûo saùt töø cuøng
moät maãu ta söû duïng kieåm nghieäp t theo töøng caëp maãu (Paired-samples
t test).
- Hoaëc vôùi tröôøng hôïp ta coù nhieàu hôn hai maãu ñoäc laäp caàn kieåm
nghieäm trung bình, ta coù theå duøng ANOVA moät chieàu (One-way
ANOVA).
Vôùi caùc tröôøng hôïp treân, hoaëc caùc bieán ñöôïc kieåm nghieäm trung bình
ñoøi hoûi phaûi laø caùc bieán ñònh löôïng vaø phaân phoái phaûi laø phaân phoái
ngaãu nhieân hay maãu nghieân cöùu phaûi ñuû lôùn. Tuy nhieân vôùi nhöõng
tröôøng hôïp bieán quan saùt laø bieán ñònh löôïng (nhöng laø bieán thang ñoù thöù
töï) hoaëc soá löôïng maãu khoâng ñuû lôùn hoaëc khoâng thoûa maõn ñieàu kieän
phaân phoái chuaån ta coù theå tieán haønh kieåm nghieäp baèng coâng cuï
Wilcoxon signed rank test trong kieåm nghieäm phi tham soá
7.1. Means

Bieân soaïn: Ñaøo Hoaøi Nam 50


Phaân tích döõ lieäu baèng SPSS

Coâng cuï Means duøng ñeå tính toaùn caùc giaù trò trung bình vaø ñöa caùc tham
soá thoáng keâ lieân quan cho moät bieán phuï thuoäc trong phaïm vi caùc nhoùm
cuûa moät hay nhieàu bieán ñoäc laäp. Ta coù theå löïa choïn caùc coâng cuï keøm
theo nhö phaân tích ANOVA moät chieàu, eta, vaø caùc kieåm nghieäm tuyeán tính.
Ví duï ta coù theå ño löôøng möùc ñoä ñaùnh giaù trung bình veà moät show quaûng
caùo cuûa ba nhoùm tieâu duøng khaùc nhau, coâng nhaân, sinh vieân vaø coâng
chöùc. Coâng cuï naøy seõ cho ta moät baûng cheùo theå hieän söï ñaùnh giaù cuûa
ba nhoùm ngöôøi naøy veà show quaûng caùo ñöôïc xem.
Caùc bieán phuï thuoäc trong baûng Means phaûi laø bieán ñònh löôïng vaø caùc
bieán ñoäc laäp thöôøng laø caùc bieán ñònh danh. Caùc ñaïi löôïng thoáng keâ
ñöôïc söû duïng tuøy thuoäc vaøo daïng döõ lieäu. Nhö mean vaø stadard deviation
thì döïa treân lyù thuyeát phaân phoái chuaån vaø thích hôïp cho caùc bieán ñònh
löôïng vôùi phaân phoái ñoái xöùng. Caùc ñaïi löông khaùc nhö Media, vaø range
thì thích hôïp cho caùc bieán ñònh löôïng maø ta khoâng bieát lieäu noù coù thoaû
maõn caùc ñieàu kieän veà phaân phoái chuaån hay khoâng. Ta coù theå löïa choïn
ANOVA vaø eta ñeå thöïc hieän vieäc phaân tích söï bieán thieân moät chieàu cho
moãi bieán ñoäc laäp. Eta vaø eta bình phöông cho pheùp ño löôøng caùc moái
töông quan.
Ñeå thöïc hieän coâng cu naøy ta choïn Compare Means/Means…. Töø Menus, ta
coù hoäp thoaïi nhö hình 6-12.

Hình 6-12
Coù theå choïn moät hay nhieàu bieán phuï thuoäc. Di chuyeån veät ñen ñeán bieán
chöùa ñöïng caùc giaù trò ñònh löôïng maø ta caàn quan saùt giaù trò trung ñoù
trong phaïm vi caùc nhoùm trong bieán ñoäc laäp, söû duïng muûi teân chuyeån
bieán ñaõ choïn vaøo hoäp thoaïi dependent list. Coù hai caùch ñeå löïa choïn bieán
ñoäc laäp, laø bieán maø döïa vaùo caùc giaù trò trong noù maø ta phaân chia caùc
gia tri trung bình cuûa bieán phuï thuoäc thaønh nhöõng nhoùm nhoû.
- Löïa choïn moät hoaëc nhieàu bieán ñoäc laäp. Luùc naøy caùc keát quaû
cuõng nhö caùc ñaïi löôïng thoáng keâ keøm theo seõ ñöôïc theå hieän treân
caùc baûn rieâng bieät cho moãi bieán ñoäc laäp

Bieân soaïn: Ñaøo Hoaøi Nam 51


Phaân tích döõ lieäu baèng SPSS

- Löïa choïn bieán ñoäc laäp theo lôùp, moãi bieán ñoäc laäp trong moät lôùp,
luùc naøy caùc keát quaû vaø ñaïi löôïng thoáng keâ ñöôïc theå hieän treân
chung moät baûng
Coâng cuï Options (Hình 6-13). Cho pheùp ta löïa choïn caùc ñaïi löôïng thoáng keâ
caàn khaûo saùt vaø ANOVA, Eta, vaø Eta bình phöông (seõ ñöôïc ñeà caäp chi
tieác veà yù nghóa ôû phaàn sau)

Hình 6-13

Bieân soaïn: Ñaøo Hoaøi Nam 52


Phaân tích döõ lieäu baèng SPSS

7.2. Kieåm nghieäp t-moät maãu


Phöông phaùp kieåm nghieäp moät maãu ñöôïc duøng ñeå kieåm ñònh coù hay
khoâng söï khaùc bieät cuûa giaù trò trung bình cuûa moät bieán ñôn vôùi moät giaù
trò cuï theå, vôùi giaû thuyeát ban ñaàu cho raèng giaù trò trung bình caàn kieåm
nghieäm thì baèng vôùi moät con soá cuï theå naøo ñoù. Ví duï moät nhaø nghieân
cöùu coù theå kieåm ñònh coù hay khoâng söï khaùc bieät giöõa chæ soá IQ trung
bình cuûa moät nhoùm sinh vieân vôùi chæ soá cuï theå laø 100 ôû ñoä tinh caäy laø
95%. Phöông phaùp kieåm nghieäm naøy duøng cho bieán daïng thang ño khoaûng
caùch hay tæ leä. Ta seõ loaïi boû giaû thuyeát ban ñaàu khi kieåm nghieäm choù ta
chæ soá Sig. nhoû hôn möùc tinh caäy (0.05).
Töø Menus ta choïn Compare Mean\One-Sample T Test… ta coù hoäp thoaïi nhö
hình 6-14

Hình 6-14
Löïa choïn bieán caàn so saùnh baèng caùch di chuyeån veät ñen vaø chuyeån ñeán
vaøo hoäp thoaïi Test Variable(s), nhaäp giaù trò caàn so saùnh vaøo hoäp thoaïi
Test Value.
Choïn coâng cuï Options (hình 6-15) ñeå xaùc ñònh ñoä tin caäy cho kieåm
nghieäm, maëc ñònh laø 95% vaø caùch xöõ lyù ñoái vôùi caùc giaù trò khuyeát,
Khi kieåm nghieäp caùc bieán ta seõ gaëp moät vaøi giaù trò khuyeát trong caùc
bieán ñoù, vaán ñeà ôû ñaây laø ta loaïi boû caùc giaù trò khuyeát ñoù trong kieåm
nghieäm hay bao haøm luoân taát caû.
- Exclude cases analysis by analysis. Moãi kieåm nghieäm T söû duïng toaøn
boä caùc tröôøng hôïp (cases) chöùa ñöïng giaù trò coù yù nghóa ñoái vôùi
bieán ñöôïc kieåm nghieäm. Ñaëc ñieåm laø kích thöông maãu luoân thay
ñoåi.
- Exclude cases listwise. Moãi kieåm nghieäm T söû duïng chæ nhöõng
tröôøng hôïp coù giaù trò ñoái vôùi toaøn boä taát caû caùc bieán ñöôïc söû

Bieân soaïn: Ñaøo Hoaøi Nam 53


Phaân tích döõ lieäu baèng SPSS

duïng trong baát kyø kieåm nghieäm T test naøo. Kích thöôùc maãu luoân
khoâng ñoåi
Hình 6-15
Ñieàu kieän ñeå tieán haønh moät kieåm nghieäm t moät maãu ñoøi hoûi döõ lieäu
phaûi ñaùp öùng giaû ñònh sau: döõ lieäu phaûi laø phaân phoái chuaån, hoaëc kích
thöôùc maãu phaûi ñuû lôùn ñeå ñöôïc xem laø xaáp xæ phaân phoái chuaån.
7.3. Kieåm nghieäp t hai maãu ñoäc laäp
Kieåm nghieäp naøy duøng cho hai maãu ñoäc laäp, daïng döõ lieäu laø daïng thang
ño khoaûng caùch hoaëc tyû leä
Ñoái vôùi daïng kieåm nghieäm naøy, caùc chuû theå caàn kieåm nghieäm phaûi
ñöôïc aán ñònh moät caùch ngaãu nhieân cho hai nhoùm döõ lieäu caàn nghieân
cöùu sao cho baát kyø moät khaùc bieät naøo töø keát quaû nghieân cöùu laø do söï
taùc ñoäng cuûa chính nhoùm thöû ñoù, chöù khoâng phaûi do caùc yeáu toá khaùc.
Ví duï nhö ta khoâng theå duøng phöông phaùp naøy ñeå so saùnh thu nhaäp cuûa
nam vaø nöõ bôûi vì thu nhaäp coøn bò aûnh höôùng lôùn bôøi trình ñoä hoïc vaán
vaø ngheà nghieäp. Hoaëc ñeå ñaùnh giaù taùc ñoäng cuûa moät chöông trình
quaûng caùo ta löïa choïn ra hai nhoùm khaùch haøng ñoäc laäp, nhoùm ñaõ xem
qua chöông trình quaûng caùo vaø nhoùm chöa xem qua chöông trình quaûng caùo
ñeå ñaùnh giaù möùc ñoä öa thích cuûa saûn phaåm ñaõ ñöôïc quaûng caùo. ÔÛ
ñaây ngoaøi coâng cuï thöû laø vieäc xem quaûng caùo hoaëc khoâng xem, nhaø
nghieân cöùu phaûi baûo ñaûm khoâng toàn taïi yeáu toá naøo ñaùng keå taùc ñoäng
ñeán söï ñaùnh giaù veà saûn phaåm, nhö giôùi tính, söï tieâu duøng, trình ñoä, …
Toùm laïi ñeå ñaùnh giaù giaù trò trung bình (veà ñaùnh giaù söï öa thích, thu nhaäp,
chi tieâu, …) cuûa hai nhoùm ñoäc laäp nghóa laø caùc phaûn öùng thu ñöôïc cuûa
nhoùm naøy khoâng bò aûnh höôûng bôûi nhoùm kia vaø ngoaøi caùc taùc nhaân
caàn ñaùnh giaù caàn phaûi chuù yù ñeán caùc taùc ñoäng khaùc coù theå laøm thay
ñoåi söï phaûn öùng thu nhaän ñöôïc giöõa hai nhoùm.
Caùc döõ lieäu caàn so saùnh naèm trong cuøng moät bieán ñònh löôïng. Ñeå so
saùnh ta tieán haønh nhoùm caùc giaù trò thaønh hai nhoùm ñeå tieán haønh so
saùnh. Giaû thuyeát ban ñaàu caàn kieåm nghieäm laø giaù trò trung bình cuûa moät
bieán naøo ñoù thì baèng nhau giöõa hai nhoùm maãu vaø chuùng ta seõ töø choái
giaû thuyeát naøy khi maø chæ soá Sig. nhoû hôn möùc yù nghóa (thöôøng laø 0.05)
Ñeå thöïc hieän vieäc so saùnh naøy ta vaøo Compare means\Independent sample
t-test…. Töø Menus ta ñöôïc hoäp thoaïi nhö hình 6-16:

Bieân soaïn: Ñaøo Hoaøi Nam 54


Phaân tích döõ lieäu baèng SPSS

Hình 6-16

Di chuyeån veät toái vaøo bieán ñònh löôïng maø ta caàn so saùnh giaù trò trung
bình, choïn baèng caùch nhaán nuùt muõi teân ñeå chuyeån bieán ñònh löôïng ñoù
vaøo hoäp thoaïi Test variable(s). Ta coù theå choïn nhieàu bieán ñònh löôïng ñeå
so saùnh.
Di chuyeån veät toái ñeán bieán duøng ñeå ñònh ra caùc nhoùm caàn so saùnh vôùi
nhau (thöôøng laø bieán ñònh danh) di chuyeån vaøo hoäp thoaïi Gouping variable.
Coâng cuï Define Groups… cho pheùp ta ñònh ra hai nhoùm caàn so saùnh vôùi
nhau, nhö hình 6-17.

Hình 6-17

Bieân soaïn: Ñaøo Hoaøi Nam 55


Phaân tích döõ lieäu baèng SPSS

Coù hai caùnh ñònh nhoùm so saùnh:


- Söõ duïng con soá cuï theå, nhaäp hai giaù trò ñaïi dieän cho hai nhoùm caàn
so saùnh trong bieán vaøo oâ group 1 vaø group 2, ví duï so saùnh thôøi gian
töï hoïc cuûa hai nhoùm sinh vieân naêm nhaát vaø sinh vieân naêm cuoái
naèm trong bieán loaïi sinh vieân vôùi 4 nhoùm sinh vieân ñöïôïc maõ hoùa
nhö sau sinh vieân naêm nhaát: 1, sinh vieân naêm hai: 2, sinh vieân naêm ba:
3, sinh vieân naêm cuoái: 4. Ta nhaäp giaù trò 1 vaøo Group 1 vaø nhaän giaù
trò 4 vaøo group 2. Luùc ñoù thôøi gian töï hoïc trung bình seõ ñöôïc so
saùnh giöõa hai nhoùm sinh vieân naêm nhaát vaø sinh vieân naêm cuoái.
- Caùch thöù hai laø söû duïng Cut point, nhaäp giaù tri phaân caùch caùc giaù
trò trong bieán thaønh hai nhoùm. Toaøn boä caùc tröôøng hôïp coù giaù trò
(con soá maõ hoùa) nhoû hôn giaù trò ñöôïc nhaäp vaøo trong cut point seõ
ñònh ra moät nhoùm, vaø toaøn boä caùc tröôøng hôïp coù giaù trò maõ hoùa
lôùn hôn hoaëc baèng giaù trò trong Cut point seõ taïo ra moät nhoùm khaùc.
Ví duï ta muoán so saùnh thôøi gian töï hoïc cuûa sinh vieân hai naêm ñaàu
vaø sinh vieân hai naêm cuoái, ta nhaäp giaù trò 3 (laø giaù trò maõ hoùa
cuûa nhoùm sinh vieân naêm thöù ba) vaø cut point luùc ñoù ta taïo ñöôïc hai
nhoùm sinh vieân bao goàm, sinh vieân hai naêm ñaàu (sinh vieân naêm thöù
nhaát vaø sinh vieân naêm thöù hai) vaø nhoùm sinh vieân hai naêm cuoái
(sinh vieân naêm ba vaø sinh vieân naêm cuoái) vaø seõ tieán haønh so saùnh
soá thôøi gian töï hoïc trung bình treân hai nhoùm sinh vieân naøy.
Ñoái vôùi coâng cuï Options coù thao taùc vaø yù nghóa gioáng coâng cuï Options
ñaõ ñeà caäp trong phaàn Kieåm nghieäp t moät maãu ñaõ ñeà caäp ôû phaàn tröôùc.
Caùc giaû ñònh phaûi ñöôïc thoûa maõn khi duøng kieåm nghieäm t cho hai maãu
ñoäc laäp:
- Ñoái vôùi kieåm nghieäm t cho hai maãu coù phöông sai baèng nhau (coù
theå kieåm ñònh giaû ñònh naøy baèng thoáng keâ Levene), caùc quan saùt
phaûi ñoäc laäp, ñöôïc laáy ngaãu nhieân töø toång theå coù phaân phoái
chuaån vôùi phöông sai ñaùm ñoâng baèng nhau
- Ñoái vôùi kieåm nghieäm t cho hai maãu coù phöông sai khoâng baèng nhau,
caùc quan saùt phaûi ñoäc laäp, ñöôïc laáy ngaãu nhieân töø toång theå coù
phaân phoái chuaån.

Bieân soaïn: Ñaøo Hoaøi Nam 56


Phaân tích döõ lieäu baèng SPSS

Coâng thöùc tính t:

Vôùi phöông sai hôïp nhaát Vôùi phöông sai rieâng bieät
x1  x 2 x1  x2
t t
1 1   S12 S 22 
S p2      
 n1 n 2   n1 n2 

Vôùi:
( n  1) S 2
 ( n  1) S 2
S P2  1 1 2 2

n1  n 2  2
Vôùi xi: Giaù trò trung bình cuûa nhoùm i
ni: Soá caùc quan saùt trong nhoùm i
Si: Phöông sai maãu trong nhoùm i
Baät töï do trong kieåmnghieäm phöông sai hôïp nhaát baèng
df= (n1 + n2 – 2)
Baät töï do trong kieåmnghieäm phöông sai rieâng bieät baèng:
2 2
S S
( 1  2 )2
n1 n2
df 
( S12 ( S 22
n1 ) 2 n2 ) 2

n1  1 n2 1
7.4. Kieåm nghieäm t theo töøng caëp maãu
Ñaây laø daïng kieåm nghieäp duøng cho hai bieán trong cuøng moät maãu coù lieân
heä vôùi nhau, döõ lieäu daïng thang ñoù khoaûng caùch hoaëc tyû leä. Noù tính
toaùn söï khaùc bieät giöõa caùc giaù trò cuûa hai bieán cho moãi tröôøng hôïp vaø
kieåm nghieäm xem giaù trò trung bình caùc khaùc bieät coù khaùc 0 hay khoâng.
Giaû thuyeát ban ñaàu ñöôïc ñöa ra laø giaù trò trung bình cuûa caùc khaùc bieät laø
baèng 0. Vaø ta seõ loaïi boû giaû thuyeát naøy trong tröôøng hôïp kieåm nghieäm
cho keát quaû Sig. nhoû hôn möùc yù nghóa (0.05)
Lôïi ñieåm cuûa vieäc söû duïng kieåm nghieäm T theo töøng caëp laø ta loaïi tröø
ñöôïc nhöõng yeáu toá taùc ñoäng beân ngoaøi vaøo nhoùm thöû. Ví duï ta khaûo
saùt söï öa thích cuûa hai loaïi nöôùc hoa chuaån bò tung ra thò tröôøng. Keát quaû
kieåm nghieäp treân cuøng moät nhoùm maãu seõ cho nhöõng thoâng tin xaùc thöïc
hôn veà söï öa thích cuûa muøi vò hai loaïi nöôùc hoa naøy, ñoàng thôøi taäp trung
vaøo söï khaùc bieät tö nhieân cuûa hai loaïi nöôùc hoa naøy. Neáu ta tieán haønh so
saùnh giöõa hai nhoùm maãu ñoäc laäp vôùi nhau seõ cho ra nhöõng keát quaû

Bieân soaïn: Ñaøo Hoaøi Nam 57


Phaân tích döõ lieäu baèng SPSS

khaùc bieät do nhöõng taùc nhaân khaùc vôùi baûn thaân söï khaùc bieät cuûa hai
loaïi nöôùc hoa naøy nhö söï khaùc bieät veà con ngöôøi, veà nhaän thöùc, veà kinh
nghieäm cuõng nhö caùc yeáu toâ beân ngoaøi khaùc. Phöông phaùp naøy thích
öùng cho vieäc kieåm nghieäm saûn phaåm. Phöông phaùp naøy kieåm nghieäm
giaû thuyeát cho raèng söï khaùc bieät giöõa hai trung bình maãu laø baèng khoâng.
Ta töø choái giaû thuyeát naøy khi möùc yù nghóa cuûa ta (significante) laø nhoû
hôn möùc yù nghóa (thöôøng laø 5%).
Ñieàu kieän yeâu caàu cho loaïi kieåm nghieäm naøy laø kích côû hai maãu so saùnh
phaûi baèng nhau. Caùc quang saùt cho moãi beân so saùnh phaûi ñöôïc thöïc hieän
trong cuøng nhöõng ñieàu kieän gioáng nhau. Caùc khaùc bieät töø giaù trò trung
bình cuûa hai maãu phaûi laø phaân phoái chuaån hoaëc soá löôïng maãu ñuû lôùn
ñeå xaáp xæ laø phaân phoái chuaån. Phöông sai cuûa moãi bieán laø ngang baèng
hoaëc khoâng ngang baèng (coù theå kieåm nghieäm qua pheùp kieåm nghieäm
phöông sai Levene).
Ñeå thöïc hieän vieäc so saùnh naøy ta vaøo Compare means\Paired-samples t-
test…. Töø Menus ta ñöôïc hoäp thoaïi nhö hình 6-17:

Hình 6-17
Choïn hai bieán ta caàn so saùnh baèng caùch di chuyeån veät ñen ñeán laàn löôïc
hai bieán caàn quan saùt, di chuyeån bieán caàn quan saùt vaøo hoäp thoaïi Paired
Variables baèng nuùt muõi teân. Paired-samples t test coøn cho ta keát quaû veà
moái töông quan giöõa hai bieán ñang quan saùt. Cho bieát lieäu hai bieán naøy coù
töông quan vôùi nhau hay khoâng, ñoä töông quan vaø chieàu töông quan (theå
hieän ôû baûng Paired samples correlation).
Caùc giaû ñònh phaûi ñöôïc thoûa maõn khi duøng kieåm nghieäm caëp maãu laø
caùc quan saùt ôû moãi caëp phaûi ñöôïc thöïc hieän trong cuøng moät ñieàu kieän.
Nhöõng khaùc bieät giaù trò trung bình phaûi coù phaân phoái chuaån. Phöông sai
cuûa moãi bieán coù theå ngang baèng hoaëc khoâng.

Bieân soaïn: Ñaøo Hoaøi Nam 58


Phaân tích döõ lieäu baèng SPSS

Ñoái vôùi kieåm nghieäm t caùc caëp maãu, SPSS seõ tính toaùn giaù trò khaùc
bieät giöõa hai beán trong töøng quan saùt vaø tieán haønh kieåm nghieäm giaù trò
trung bình caùc khaùc bieät ñoù coù baèng 0 hay khoâng
Trong kieåm nghieäm hai maãu ñoäc laäp ñaõ ñeà caäp ôû phaàn tröôùc SPSS chia
caùc giaù trò cuûa moät bieán ñôn thaønh hai nhoùm döïa treân moät bieán kieåm
soaùt vaø sau ñoù tieán haønh so saùnh trung bình trong bieán ñôn giöõa hai nhoùm
ñoù vôùi nhau. Ñoái vôùi kieåm nghieäm caëp, giaù trò trung bình caùc giaù trò
trong hai bieán ñöôïc so saùnh vôùi nhau. Kieåm nghieäm loaïi naøy ñöôïc söû duïng
ñeå kieåm nghieäm xem trung bình cuûa hai ño löôøng laø khaùc bieät hay ngang
baèng nhau, hay noùi caùch khaùc kieåm nghieäm xem coù hay khoâng trung bình
cuûa caùc giaù trò khaùc bieät giöõa hai bieán treân moãi tröôøng hôïp quan saùt laø
khaùc 0
Ñeå tieán haønh kieåm nghieäm t theo caëp ñoøi hoûi hai bieán trong kieåm nghieäm
phaûi baèng nhau veà soá löôïng maãu quan saùt vaø coù cuøng kieåu ño löôøng vaø
ñôn vò ño löôøng
Coâng thöùc tin giaù trò kieåm nghieäm t theo caëp ñöôïc tính nhö sau:
Trung bình caùc sai bieät giöõa hai bieán kieåm nghieäm
t =
SD
n
Vôùi SD: Ñoä leäch tieâu chuaån cuûa caùc sai bieät
n : Soá löôïng caùc quan saùt (maãu)
8.5. Phaân tích phöông sai moät chieàu (One way ANOVA)
Caùc pheùp so saùnh ñeà caäp ôû phaàn treân chæ cho pheùp ta so saùnh trung bình
hai toång theå döïa treân maãu töøng caëp phoái hôïp hoaëc hai maãu ñoäc laäp.
Trong phaàn naøy phöông phaùp kieåm ñònh seõ môû roäng cho tröôøng hôïp so
saùnh trung bình cuûa nhieàu toång theå ñöôïc xaây döïng treân vieäc xem xeùt caùc
bieán thieân (phöông sai) cuûa caùc giaù trò quan saùt trong noäi boä töøng nhoùm
(maãu) vaø giöõa caùc nhoùm (maãu) vôùi nhau. ÔÛ ñaây ta ñeà caäp ñeán phaân
tích phöông sai moät yeáu toá laø tröôøng hôïp chæ coù moät yeáu toá (bieán kieåm
soaùt) ñöôïc xem xeùt nhaèm xaùc ñònh aûnh höôûng cuûa noù ñeán moät yeáu toá
khaùc. Yeáu toá ñöôïc xem xeùt aûnh höôûng ñöôïc duøng ñeå phaân loaïi caùc quan
saùt thaønh caùc nhoùm nhoû khaùc nhau.
Moät caùch toång quaùt, giaû söû ta coù k nhoùm (maãu) n 1, n2, …, nk quan saùt
ñöôïc choïn ngaãu nhieân ñoäc laäo töø k toång theå (n 1, n2, …, nk coù theå khaùc
nhau veà kích thöôùc). Goïi 1, 2, …, k laø caùc trung bình cuûa k toång theå, x ij
laø quan saùt thöù j cuûa nhoùm thöù i. Ta coù theå moâ taû caùc quan saùt cuûa k
nhoùm nhö sau:

Nhoùm
1 2 … K

Bieân soaïn: Ñaøo Hoaøi Nam 59


Phaân tích döõ lieäu baèng SPSS

X11 X21 … XK1


X12 X22 … XK2
… … … …
X1n1 X2n2 … XKnK
Vôùi giaû ñònh caùc toång theå coù phaân phoái chuaån, coù phöông sai baèng
nhau, caùc sai soá laø ñoäc laäp vôùi nhau, phaân tích phöông sai moät yeáu toá
kieåm nghieäm giaû thuyeát ban ñaàu nhö sau: H 0: 1 = 2 = … = k. Ta thaáy ôû
ñaây laø vieäc so saùnh giöõa caùc giaù trò trung bình, vaäy phaân tích phöông sai
nghe nhö laø moät sai soùt. Tuy nhieân vieäc phaân tích phöông sai ôû ñaây döïa
treân thoâng soá thoáng keâ F, vôùi F laø tyû soá giöõa bieán thieân giöõa trung bình
caùc nhoùm treân bieán thieân giöõa caùc quan saùt trong noäi boä nhoùm:
Bieán thieân giöõa trung bình caùc nhoùm
F=
Bieán thieân giöõa caùc giaù trò quan saùt trong noäi boä nhoùm
Neáu caùc giaù trò trung bình cuûa caùc nhoùm khaùc bieät nhau nhieàu, ñaëc bieät
trong moái quan heä vôùi söï bieán thieân cuûa noäi boä töøng nhoùm, giaù trò F thu
ñöôïc seõ lôùn vaø khi ñoù giaû thuyeát H 0: 1 = 2 = … = k. seõ bò töø choái. Vaø
neáu ta quan saùt vieäc phaân tích phöông sai moät yeáu toá cho hai nhoùm thì keát
quaû thoáng keâ F tính ñöôïc seõ chính baèng bình phöông keát quaû thoáng keâ t
trong kieåm nghieäm t cho hai maãu ñoäc laäp

 Caùc böôùc phaân tích phöông sai moät yeáu toá ñeå kieåm nghieäm söï
ngang baèng giöõa caùc giaù trò trung bình cuûa k toång theå
Phaân tích phöông sai moät yeáu toá ñeå kieåm nghieäm giaû thuyeát H 0: 1 = 2 =
… = k ñöôïc tieán haønh thoâng qua caùc böôùc sau:
Böôùc 1: Tính giaù trò trung bình xi cho töøng nhoùm vaø x chung cho taát caû caùc
nhoùm

ni

x ij
xi  i 1
(i  1,2,..., k )
ni

k ni

 x
i 1 j 1
ij

x
n
Hoaëc
k

 n x i i k
x i 1
( n   ni )
n i 1

Bieân soaïn: Ñaøo Hoaøi Nam 60


Phaân tích döõ lieäu baèng SPSS

Böôùc 2: Tính caùc ñaïi löôïng theå hieän söï bieán thieân trong noäi boä töøng
nhoùm (SSW) vaø giöõa caùc nhoùm (SSG)
Goïi SS laø ñaïi löôïng theå hieän söï bieán thieân trong noäi boä töøng nhoùm, ta
coù:
ni
SS i   ( xij  xi ) 2
j 1

Ta co ùtoång coäng caùc bieán thieân trong noäi boä töøng nhoùm laø:
Noùi moät caùch ñôn giaûn SSW laø toång bình phöông caùc cheânh leäch giöõa
töøng quan saùt vôùi trung bình cuûa nhoùm maø quan saùt ñoù thuoäc veà (within-
k ni
SSW  SS1  SS 2  ...  SS k   ( xij  xi ) 2
i 1 j 1

groups sum of squares). SSW laø nhöõng bieán thieân khoâng do yeáu toá kieåm
soaùt (yeáu toá duøng ñeå phaân chia caùc nhoùm) gaây ra.
Ñaïi löôïng theå hieän söï bieán thieân giöõa caùc nhoùm (between-groups sum of
squares) ñöôïc tính baèng coâng thöùc:

ni
SSG   ni ( xi  x ) 2
i 1

SSG theå hieän söï bieán thieân do söï khaùc nhau giöõa caùc nhoùm, töùc laø bieán
thieân do yeáu toá kieåm soaùt gaây ra
Goïi STT laø toång bình phöông caùc cheânh leäch giöõa töøng quan saùt vôùi trung
bình cuûa taát caû caùc quan saùt ta coù:
k ni
SST   ( xij  x ) 2
i 1 j 1

Ñaõ chöùng mính ñöôïc raèng SST = SSW + SSG vaø coâng thöùc naøy chính laø
cô sôû cuûa phöông phaùp phaân tích phöông sai moät yeáu toá vôùi bieán thieân
cuûa caùc quan saùt so vôùi giaù trò trung bình laø toång coäng cuûa bieán thieân
ñöôïc giaûi thích bôûi yeáu toá kieåm soaùt (SSG) vaø bieán thieân do caùc yeáu toá
khaùc ngoaøi yeáu toá kieåm soaùt laø SSW
Böôùc 3: Tính caùc öôùc löôïng cho phöông sai chung cuûa k toång theå, MSW vaø
MSG, baèng caùch cia SSW vaø SSG cho soá baät töï do töông öùng, ta coù:

SSW
MSW= (Within-groups mean square)
n-k

SSG
MSG= (Between-groups mean square)

Bieân soaïn: Ñaøo Hoaøi Nam 61


Phaân tích döõ lieäu baèng SPSS

k-1

Tyû soá naøy ñöôïc duøng ñeå kieåm nghieäm giaû thuyeát H 0. Neáu H0 ñuùng,
nghóa laø trung bình cuûa k toång theå baèng nhau thì tyû soá MSG/MSW seõ gaàn
vôùi giaù trò 1. Ngöôïc laïi, khi caùc trung bình cuûa k toång theå khoâng baèng
nhau, thì MSG lôùn hôn MSW, do vaäy tyû soá MSG/MSW seõ lôùn hôn 1. Möùc
ñoä lôùn hôn bao nhieâu thì ñöôïc xem laø “ñuû lôùn” (tuyø thuoäc vaøo ñoä tin
caäy) ñeå ta coù theå baùc boû H0. Böôùc 4 vôùi vieäc tính ra gia trò kieåm ñònh F
seõ lyù giaûi ñieàu naøy

Bieân soaïn: Ñaøo Hoaøi Nam 62


Phaân tích döõ lieäu baèng SPSS

Böôùc 4: Tính giaù trò kieåm ñònh F:


MSG
F=
MSW

Ta seõ baùc boû H0 ôû möùc yù nghóa  (thöôøng laø 0.05), neáu giaù trò p-value
nhoû hôn möùc yù nghóa, töông öùng vôùi tyû soá F=MSG/MSW lôùn hôn F k-1, n-k, ,
vôùi Fk-1, n-k,  coù phaân phoái F vôùi k-1 vaø n-k baät töï do töông öùng ôû töû vaø
maãu soá.
Keát quaû phaân tích phöông sai moät yeáu toá thöôøng ñöôïc theå hieän döôùi
daïng baûng sau:

Bieán thieân Toång Baät töï Trung bình caùc Giaù trò P-
(Variance) caùc do cheânh leäch kieåm value
cheänh (df) bình phöông- ñònh Sig.
leäch bình Phöông sai
phöông (Mean square)
(Sum of
squares)
Giöõa caùc SSG k-1 MSG=SSG/k-1 F=MSG/
nhoùm MSW
(Between
Groups)
Trong noäi SSW n-k MSW=SSW/n-k
boä nhoùm
(Within
Groups)
Toång coâng SST n-1
(Total)

 So saùnh töøng caëp trung bình toång theå


Moät khi ñaõ quyeát ñònh ñöôïc söï khaùc bieät toàn taïi giöõa caùc giaù trò trung
bình-baùc boû H0, hieãn nhieân naûy sinh caâu hoûi tieáp theo laø trung bình nhöõng
toång theå naøo laø khaùc nhau, toång theå naøo coù trung bình lôn hôn hoaëc nhoû
hôn. Ñeå traû lôøi caùc caâu hoûi naøy SPSS cung caáp caùc kieåm nghieäm post
hoc range vaø pairwise multiple comparisons coù theå quyeát ñònh ñöôïc nhöõng
giaù trò trung bình naøo laø khaùc bieät. Range tests xaùc ñònh ra nhöõng nhoùm
giaù trò trung bình ñoàng nhaát khoâng toàn taïi söï khaùc bieät giöõa caùc giaù trò
trung bình naøy. Kieåm nghieäm Pairwise multiple comparisons kieåm nghieäm

Bieân soaïn: Ñaøo Hoaøi Nam 63


Phaân tích döõ lieäu baèng SPSS

söï khaùc bieät giöõa caùc caëp giaù trò trung bình vaø ñöa ra moät ma traän ñaùnh
daáu hoa thò chæ nhöõng nhoùm giaù trò trung bình coù khaùc bieät ñaùng keå ôû
möùc ñoä tin caäy laø 5%
Ñoái vôùi giaû thuyeát caân baèng veà phöông sai ñöôïc chaáp nhaän (thoâng qua
kieåm nghieäm Levene) ta coù caùc phöông phaùp kieåm nghieäm thoáng keâ sau
ñeå so saùnh caùc trung bình maãu:
- The least significant difference (LSD) laø pheùp kieåm nghieäm töông ñöông
vôùi vieäc söû duïng phöông phaùp kieåm nghieäm t rieâng bieät cho toaøn boä
caùc caëp trong bieán. Yeáu ñieåm cuûa phöông phaùp naøy laø noù khoâng
chænh lyù ñoä tin caäy cho töông thich vôùi vieäc kieåm nghieäm cho nhieàu so
saùnh cuøng moät luùc. Do ñoù daãn ñeán ñoä tin caäy khoâng cao. Caùc kieåm
nghieäm khaùc seõ ñöôïc tham khaûo sau ñaây loaïi boû ñöôïc yeáu ñieåm naøy
baèng caùch ñieàu chænh ñoä tin caäy cho moät so saùnh nhieàu thaønh phaàn.
- Phöông phaùp kieåm nghieäp Bonferroni vaø Tukey’s honestly significant
difference thì ñöôïc söû duïng cho haàu heát caùc kieåm nghieäm so saùnh ña
boäi. Kieåm nghieäm Sidak’s t test cuõng ñöôïc söû duïng töông tö nhö phöông
phaùp Bonferroni tuy nhieân noù cung caáp nhöõng giôùi haïn chaët cheû hôn.
Khi tieán haønh kieåm nghieäm moät soá löôïng lôùn caùc caëp trung bình
Tukey’s honestly significant difference test seõ coù taùc ñoäng maïnh hôn laø
Bonferroni test. Vaø ngöôïc laïi Bonferroni thì thích hôïp hôn cho caùc kieåm
nghieäm coù soá löôïng caëp so saùnh ít.
- Hochberg’s GT2 thì gioáng nhö Tukey’s honestly significant difference test
nhöng thoâng thöôøng Tukey’s test coù taùc duïng toát hôn. Gabriel’s pairwise
comparisons test thì gioáng nhö Hochberg’s GT2 nhöng noù thöôøng ñöôïc söû
duïng hôn khi kích côû giöõa caùc maãu kieåm nghieäm coù söï sai bieät lôùn
- Phöông phaùp kieåm nghieäm Dunnett’s pairwise thì ñöôïc duøng ñeå so saùnh
caùc giaù trò trung bình cuûa caùc maãu vôùi moät gía trò trung bình cuï theå
ñöôïc laáy töø trong taäp caùc maãu so saùnh. Thoâng thöôøng maëc ñònh nhoùm
maãu cuoái cuøng laøm nhoùm kieån soaùt, hoaëc ta coù theå löïa choïn nhoùm
ñaâu tieâu laøm nhoùm kieåm soaùt, luùc ñoù caùc giaù trò trung bình cuûa caùc
nhoùm tong bieán ñoäc laäp seõ ñöôïc so saùnh vôùi giaù trò trung bình cuûa
nhoùm ñaàu tieân hoaëc nhoùm sau cuøng cuûa bieán ñoäc laäp
- Ryan, Einot, Gabriel, and Welsch (R-E-G-W) ñöa ra hai böôùc kieåm
nghieäm. Ñaàu tieân tieán haønh kieåm nghieäm coù hay khoâng toaøn boä caùc
giaù trò trung bình laø ngang baèng nhau hay khoâng. Neáu toaøn boä caùc giaù
trò trung bình laø khoâng ngang baèng nhau sau ñoù böôùc thöù hai seõ kieåm
nghieäm söï khaùc bieät giöõa caùc nhoùm nhoû vôùi nhau, ñeå tìm ra nhöõng
nhoùm naøo thaät söï khaùc bieät vaø khoâng khaùc bieät veà giaù trò trung bình.
Tuy nhieân vieäc kieåm nghieäm naøy khoâng neân thöïc hieän ñoái vôùi tröôøng
hôïp kích côû maãu trong caùc nhoùm khoâng ngang baèng nhau
- Thoâng thöôøng khi kích thöôùc maãu khoâng ngang baèng giöõa caùc nhoùm.
Bonferroni vaø Scheffeù laø hai phöông phaùp kieåm nghieäm ñöôïc löïa choïn
hôn laø phöông phaùp Tukey

Bieân soaïn: Ñaøo Hoaøi Nam 64


Phaân tích döõ lieäu baèng SPSS

- Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and


Tukey’s b cuõng töông töï tuy nhieân noù ít khi ñöôïc söû duïng nhö caùc
phöông phaùp treân.
- Kieåm nghieäm Waller-Duncan t ñöôïc söû duïng khi kích thöôùc maãu laø
khoâng baèng nhau
- Phöông phaùp kieåm nghieäm Scheffeù cho pheùp söï keát hôïp tuyeán tính
cuûa nhöõng giaù trò trung bình seõ ñöôïc kieåm nghieäm, khoâng chæ laø so
saùnh giöõa caùc caëp. Chính vì vaäy keát quaû cuûa kieåm nghieäm
Scheffeù thì thöôøng thaän troïng hôn caùc phöông phaùp kieåm nghieäm
khaùc , noù ñoøi hoûi moät söï khaùc bieät lôùn giöõa caùc giaù trò trung
bình quan saùt ñöôïc ñeå baûo ñaûm tính thaät söï khaùc bieät cuûa pheùp
kieåm nghieäm
Ñoái vôùi tröôøng hôïp giaû thuyeát veà söï caân baèng phöông sai giöõa caùc maãu
khoâng ñöôïc chaáp nhaän ta seõ söû duïng caùc phöông phaùp kieåm nghieäm sau
ñeå tieán haønh so saùnh giaù trò trung bình giöõa caùc nhoùm:Tamhane’s T2,
Dunnett’s T3, Games-Howell, Dunnett’s C
Ví duï nhö trong noâng nghieäp ngöôøi ta muoán bieát nguõ coác seõ phaùt trieån
nhö theá naøo khi söû duïng caùc loaïi phaân boùn khaùc nhau. Nhaø nghieân cöùu
muoán bieát lieäu taát caû caùc loaïi phaân boùn treân thì coù aûnh höôûng ngang
baèng ñeán söï phaùt trieån cuûa ngu coác hay moät vaøi loaïi phaân boùn seõ coù
taùc duïng toát hôn moät vaøi loaïi khaùc. Ñeå kieåm nghieäm ñieàu naøy ngöôøi ta
duøng ANOVA ñeà kieåm nghieäm toác ñoä phaùt trieån trung bình (coù theå laø
trong löôïng nguõ coác thu hoaïch, chieàu cao cuûa caây, soá löôïng traùi trung bình
thu hoaïch ñöôïc, …) ñaây chính laø caùc giaù trò trung bình ñöôïc söû duïng trong
thoáng keâ.
ANOVA thoâng thöôøng kieåm nghieäm treân moät soá löôïng maãu lôùn hôn hai,
neáu soá löôïng maãu baèng 2 ta coù theå duøng moät phöông phaùp töông ñoái ñôn
giaõn hôn laø kieåm nghieäm t hai maãu nhö ñaõ ñeà caäp ôû phaàn treân. ANOVA
ñöôïc söû duïng roäng raõi trong thöïc teá bôûi vì ta seõ gaëp raát nhieàu tröôøng
hôïp ñoøi hoûi ta phaûi kieåm nghieäm nhieàu maãu trong cuøng moät luùc. Chuù
yù neáu ta kieåm nghieäp theo töøng caëp laàn löôït baèng phöông phaùp kieåm
nghieäm t hai maãu moãi laàn kieåm nghieäm ñoä sai leäch seõ laø 5% (tuyø thuoäc
vaøo möùc tin caäy maø ta mong muoán). Do ñoù khi kieåm nghieäm taát caû caùc
caëp maãu laàn löôït tyû leä sai soùt seõ taêng leân theo moãi laàn. Do ñoù ANOVA
seõ cho phep1 ta kieåm nghieäm taát caû caùc maãu trong cuøng moät möùc ñoä sai
soùt laø 5% vaø kieåm nghieäm trong moät laàn
Ñeå thöïc hieän kieåm nghieäm ANOVA, döõ lieäu ñoøi hoûi phaûi thoûa maõn
moät soá giaû thuyeát sau:
- Caùc maãu kieåm nghieäm phaûi ñoäc laäp vaø mang tính ngaãu nhieân
- Caùc maãu söû duïng trong kieåm nghieäm phaûi coù phaân phoái chuaån
hoaëc kích thöôùc maãu ñuû lôùn ñeå ñöôïc xem laø gaàn nhö phaân phoái
chuaån.

Bieân soaïn: Ñaøo Hoaøi Nam 65


Phaân tích döõ lieäu baèng SPSS

- Phöông sai cuûa caùc maãu thì phaûi ngang baêng nhau (coù theå kieåm
nghieäp ñieàu naøy baèng pheùp kieåm nghieäm phöông sai Levene.
Neáu nhö caùc maãu nghieân cöùu cuûa ta khoâng thoûa maõn ñieàu kieän treân ta
coø theå duøng pheùp kieåm nghieän phi tham soá (nonparametric) nhö nhö pheùp
kieåm nghieäm Kruskal-Wallis
Ví duï minh hoïa:
Caùc nhaø cheá bieán vaø phaân phoâí Coffee ôû thò tröôøng Hoa Kyø ñang ñoái
maët vôùi moät tình hình baát oån veà giaù cuûa haït Coffee. Trong moät naêm giaù
cuûa haït coffee troäi xuït töø $1.40 moät pound (0.373 kg) leân $2.50/pound roài
sau ñoù laïi tuït xuoáng $2.03/pound. Ngöôøi ta xaùc ñònh söï baát oån veà giaù
coffee naøy laø do tình hình hoaït ñoäng cuûa baûn thaân caùc nhaø cheá bieán vaø
phaân phoái coffee vaø moät yeáu toá khaùc raát quan troïng laø vaán ñeà haïn haùn
ôû Brazil, bôûi vì Brazil saûn xuaát ra 30% saûn löôïng coffee treân theá giôùi, do
ñoù thò tröôøng coffee raát nhaïy caûm vôùi nhöõng bieán chuyeån veà thôøi tieát
(nguy cô haïn haùn) ôû Brazil.
Ñeå taïo ra moät söï oån ñònh cho hoaït ñoäng cuûa mình moät nhaø phaân phoái
Coffee muoán loaïi boû maët haøng Coffee Brazil ra khoûi cô caáu haøng hoùa cuûa
mình. Tuy hieân tröôùc khi thöïc hieän quyeát ñònh naøy coøn coù moät caân nhaéc
laø lieäu loaïi boû maët haøng Coffee Brazil thì coù laøm giaûm doanh soá cuûa
coâng ty hay khoâng. Vì vaäy coâng ty thueâ moät coâng ty nghieân cöùu Marketing
tieán haønh kieåm nghieäm thoâng keâ veà söï öa thích muøi vò coffee cuûa khaùch
haønh tieâu duøng Coffee treân thò tröôøng. Coâng ty tieán haønh khaûo saùt döïa
treân ba nhoùm khaùch haøng ñöôïc löïa choïn ngaãu nhieân bao goàm nhoùm
khaùch haøng chuyeân tieâu duøng Coffee Brazil, Nhoùm khaùch haøng chuyeân
tieâu duøng Coffee Colombia vaø nhoùm khaùch haøng tieâu duøng Coffee Chaâu
Phi (ñaây laø 3 loaïi Coffee ñöôïc tieâu duøng chuû yeáu cuûa coâng ty). Chuù yù
coâng ty loaïi tröø nhöõng nhoùm khaùch haønh vöøa tieâu duøng nhieàu loaïi
coffee khaùc nhau, ñeå baûo ñaûm tính ñoäc laäp cuûa caùc maãu ñöôïc choïn, vaø
do nghieân cöùu veà muøi vò neân ñoøi hoûi choïn nhöõng khaùch haøng coù gu
tieâu duøng rieâng bieät. ÔÛ ñaây coâng ty muoán xaùc ñònh xem lieäâu coù söï
khaùc bieät veà söï möùc ñoä öa thích ñoái vôùi ba loaïi coffee (Seõ cho khaùch
haønh thöû ba loaïi coffee vaø khaûo saùt söï ñaùnh giaù veà möùc ñoä öa thích cuûa
ba loaïi Coffee) hay coù söï khaùc nhau vaø khaùc nhau naøy nhö theá naøo ôû bao
loaïi Coffe vaø ôû ba nhoùm khaùch haøng.
Döïa vaøo keát quaû phaân tích ANOVA seõ cho ta bieát lieäu möùc ñoä öa thích
trung bình cuûa ba nhoùm khaùch haøng treân laø gioáng nhau hay khaùc nhau ñoái
vôùi töøng loaïi coffee. Sau ñoù duøng phöông phaùp kieåm nghieäp Post Hoc ñeå
xaùc ñònh nhöõng khaùc bieät cuûa töøng nhoùm khaùch haøng veà loaïi coffee ñaõ
thöû.
Sau khi duøng ANOVA khaûo saùt söï khaùc bieät giöõa caùc maãu. Neáu ta coù
ñuû cô sôû ñeå keát luaän laø khoâng coù söï khaùc bieät giöõa caùc maãu. Ta coù
theå keát thuùc coâng vieäc (vieäc loaïi boû coffee brazil khoâng gaây aûnh höôûng

Bieân soaïn: Ñaøo Hoaøi Nam 66


Phaân tích döõ lieäu baèng SPSS

ñeán doanh soá, ngöôøi tieâu duøng coù theå chuyeån sang coffee comlobia hoaëc
chaâu Phi moät caùch deã daøng). Tuy nhieân khi ta loaïi boû giaõ thuyeát veà söï
ngang baèng giöõa caùc nhoùm. Ta phaûi xaùc ñònh tieáp söï khaùc bieät nhö theá
naøo giöõa caùc maãu kieåm nghieäm. Chuùng ta caàn phaûi xaùc ñònh höôùng vaø
ñoä lôùn cuûa caùc khaùc bieät naøy baèng caùch laàn löôït so saùnh söï khaùc bieät
giöõa caùc maãu vôùi nhau (ngöôøi tieâu duøng coffee brazil coù theå thích coffee
comlombia hôn coffe chaâu Phi, hoaëc ngöôøi tieâu duøng coffee brazil ñaùnh giaù
coffee brazil ngang baèng vôùi coffee colombia, trong khi möùc ñoä öa thích coffee
chaâu Phi thì thaáp hôn do ñoù ñeå giaûm thieåu söï maát doanh soá baùn coffee
brazil khi loaïi boû maët haøng coâng ty neân taêng löôïng coffee comlombia tieâu
thuï treân thò tröôøng) caùc coâng cuï thoáng keâ trong kieåm nghieäp Post Hoc cho
pheùp ta thöïc hieän coâng vieäc naøy.
Phaân tích phöông sai moät chieàu laø tieán trình phaân tích phöông sai moät chieàu
cho moät bieán ñònh löôïng phuï thuoäc vôùi moät yeáu toà ñôn leû hay coøn goïi
laø bieán ñoäc laäp. Phaân tích phöông sai (ANOVA) ñöôïc duøng ñeå kieåm
nghieäm giaû thuyeát cho raèng taát caû caùc giaù trò trung bình ñeàu ngang baèng
nhau. Kyû thuaät naøy laø moät daïng môû roäng cuûa kieåm nghieäm T hai maãu.
Ñeå xaùc ñònh söï khaùc bieät giöõa caùc giaù trò trung bình chuùng ta coù theå
muoán bieát nhöõng giaù trò trung bình naøo laø khaùc bieät. Moät khi ñaõ quyeát
ñònh ñöôïc söï khaùc bieät toàn taïi giöõa caùc giaù trò trung bình, caùc kieåm
nghieäm post hoc range vaø pairwise multiple comparisons coù theå quyeát ñònh
ñöôïc nhöõng giaù trò trung bình naøo laø khaùc bieät. Range tests xaùc ñònh ra
nhöõng nhoùm giaù trò trung bình ñoàng nhaát khoâng toàn taïi söï khaùc bieät
giöõa caùc giaù trò trung bình naøy. Kieåm nghieäm Pairwise multiple
comparisons kieåm nghieäm söï khaùc bieät giöõa caùc caëp giaù trò trung bình vaø
ñöa ra moät ma traän ñaùnh daáu hoa thò chæ nhöõng nhoùm giaù trò trung bình coù
khaùc bieät ñaùng keå ôû möùc ñoä tin caäy laø 5%
Ñoái vôùi giaû thuyeát caân baèng veà phöông sai ñöôïc chaáp nhaän (thoâng qua
kieåm nghieäm Levene) ta coù caùc phöông phaùp kieåm nghieäm thoáng keâ sau
ñeå so saùnh caùc trung bình maãu:
- The least significant difference (LSD) laø pheùp kieåm nghieäm töông ñöông
vôùi vieäc söû duïng phöông phaùp kieåm nghieäm t rieâng bieät cho toaøn boä
caùc caëp trong bieán. Yeáu ñieåm cuûa phöông phaùp naøy laø noù khoâng
chænh lyù ñoä tin caäy cho töông thich vôùi vieäc kieåm nghieäm cho nhieàu so
saùnh cuøng moät luùc. Do ñoù daãn ñeán ñoä tin caäy khoâng cao. Caùc kieåm
nghieäm khaùc seõ ñöôïc tham khaûo sau ñaây loaïi boû ñöôïc yeáu ñieåm naøy
baèng caùch ñieàu chænh ñoä tin caäy cho moät so saùnh nhieàu thaønh phaàn.
- Phöông phaùp kieåm nghieäp Bonferroni vaø Tukey’s honestly significant
difference thì ñöôïc söû duïng cho haàu heát caùc kieåm nghieäm so saùnh ña
boäi. Kieåm nghieäm Sidak’s t test cuõng ñöôïc söû duïng töông tö nhö phöông
phaùp Bonferroni tuy nhieân noù cung caáp nhöõng giôùi haïn chaët cheû hôn.
Khi tieán haønh kieåm nghieäm moät soá löôïng lôùn caùc caëp trung bình
Tukey’s honestly significant difference test seõ coù taùc ñoäng maïnh hôn laø

Bieân soaïn: Ñaøo Hoaøi Nam 67


Phaân tích döõ lieäu baèng SPSS

Bonferroni test. Vaø ngöôïc laïi Bonferroni thì thích hôïp hôn cho caùc kieåm
nghieäm coù soá löôïng caëp so saùnh ít.
- Hochberg’s GT2 thì gioáng nhö Tukey’s honestly significant difference test
nhöng thoâng thöôøng Tukey’s test coù taùc duïng toát hôn. Gabriel’s pairwise
comparisons test thì gioáng nhö Hochberg’s GT2 nhöng noù thöôøng ñöôïc söû
duïng hôn khi kích côû giöõa caùc maãu kieåm nghieäm coù söï sai bieät lôùn
- Phöông phaùp kieåm nghieäm Dunnett’s pairwise thì ñöôïc duøng ñeå so saùnh
caùc giaù trò trung bình cuûa caùc maãu vôùi moät gía trò trung bình cuï theå
ñöôïc laáy töø trong taäp caùc maãu so saùnh. Thoâng thöôøng maëc ñònh
nhoùm maãu cuoái cuøng laøm nhoùm kieån soaùt, hoaëc ta coù theå löïa choïn
nhoùm ñaâu tieâu laøm nhoùm kieåm soaùt, luùc ñoù caùc giaù trò trung bình
cuûa caùc nhoùm tong bieán ñoäc laäp seõ ñöôïc so saùnh vôùi giaù trò trung
bình cuûa nhoùm ñaàu tieân hoaëc nhoùm sau cuøng cuûa bieán ñoäc laäp
- Ryan, Einot, Gabriel, and Welsch (R-E-G-W) ñöa ra hai böôùc kieåm
nghieäm. Ñaàu tieân tieán haønh kieåm nghieäm coù hay khoâng toaøn boä caùc
giaù trò trung bình laø ngang baèng nhau hay khoâng. Neáu toaøn boä caùc giaù
trò trung bình laø khoâng ngang baèng nhau sau ñoù böôùc thöù hai seõ kieåm
nghieäm söï khaùc bieät giöõa caùc nhoùm nhoû vôùi nhau, ñeå tìm ra nhöõng
nhoùm naøo thaät söï khaùc bieät vaø khoâng khaùc bieät veà giaù trò trung bình.
Tuy nhieân vieäc kieåm nghieäm naøy khoâng neân thöïc hieän ñoái vôùi
tröôøng hôïp kích côû maãu trong caùc nhoùm khoâng ngang baèng nhau
- Thoâng thöôøng khi kích thöôùc maãu khoâng ngang baèng giöõa caùc nhoùm.
Bonferroni vaø Scheffeù laø hai phöông phaùp kieåm nghieäm ñöôïc löïa choïn
hôn laø phöông phaùp Tukey
- Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s
b cuõng töông töï tuy nhieân noù ít khi ñöôïc söû duïng nhö caùc phöông phaùp
treân.
- Kieåm nghieäm Waller-Duncan t ñöôïc söû duïng khi kích thöôùc maãu laø
khoâng baèng nhau
- Phöông phaùp kieåm nghieäm Scheffeù cho pheùp söï keát hôïp tuyeán tính cuûa
nhöõng giaù trò trung bình seõ ñöôïc kieåm nghieäm, khoâng chæ laø so saùnh
giöõa caùc caëp. Chính vì vaäy keát quaû cuûa kieåm nghieäm Scheffeù thì
thöôøng thaän troïng hôn caùc phöông phaùp kieåm nghieäm khaùc , noù ñoøi
hoûi moät söï khaùc bieät lôùn giöõa caùc giaù trò trung bình quan saùt ñöôïc ñeå
baûo ñaûm tính thaät söï khaùc bieät cuûa pheùp kieåm nghieäm
Ñoái vôùi tröôøng hôïp giaû thuyeát veà söï caân baèng phöông sai giöõa caùc maãu
khoâng ñöôïc chaáp nhaän ta seõ söû duïng caùc phöông phaùp kieåm nghieäm sau
ñeå tieán haønh so saùnh giaù trò trung bình giöõa caùc nhoùm:Tamhane’s T2,
Dunnett’s T3, Games-Howell, Dunnett’s C

Bieân soaïn: Ñaøo Hoaøi Nam 68


Phaân tích döõ lieäu baèng SPSS

Ñeå thöïc hieän pheùp kieåm nghieäm ANOVA ta vaøo Comapre means\One-Way
ANOVA… töø thanh menus ñeå truy xuaát ra hoäp thoaïi nhö hình 6-18. Di chuyeån
veät toái ñeán caùc bieán ñònh löôïng caàn so saùnh, chuyeån sang hoäp thoaïi
Dependent List. Löïa bieán kieåm soaùt töùc laø bieán ñoäc laäp (yeâu caàu phaûi
coù ba giaù trò trôû leân trong bieán kieåm soaùt naøy) chuyeån bieán kieåm soaùt
vaøo hoäp thoaïi Factor, Bieán kieåm soaùt naøy cho pheùp ta phaân caùc giaù trò
trung bình theo töøng nhoùm ñeå kieåm nghieäm. Thao taùc ñeán ñaây cho pheùp ta
ñöa ra keát luaän lieäu caùc trung bình cuûa caùc nhoùm coù baèng nhau hay
khoâng.
Hình 6-18

Ñeå tieán haønh kieåm nghieäp so saùnh söï khaùc bieät giöõa caùc nhoùm vôùi
nhau ta löïa choïn coâng cuï Post Hoc ta coù ñöôïc hoäp thoaïi nhö hình 6-19 vaø
löïa choïn caùc phöông phaùp kieåm nghieäm thích hôïp
Hinh 6-19
Löïa choïn coâng cuï Options cho ta hoäp thoaïi nhö hình 6-20. Ñeå xaùc ñònh loaïi
loaïi thoâng keâ moââ taû (Descriptive) vaø tính ñoàng nhaát cuûa phöông sai,
coâng cuï ñeå tính heä soá thoáng keâ Levene ñeå kieåm nghieäm söï ngang baèng
veà phöông sai giöõa caùc nhoùm (vieäc tính toaùn naøy quyeát ñònh ñeán söï löa
chon phöông phaùp kieåm nghieäp trong phaàn Post Hoc. Coâng cuï Means Plot

Bieân soaïn: Ñaøo Hoaøi Nam 69


Phaân tích döõ lieäu baèng SPSS

duøng ñeå hieån thò ñoà thò veà giaù tri trung bình cuûa caùc nhoùm. Coâng cuï
Missing Values duøng ñeå kieåm soaùt giaù trò khuyeát.
Hình 6-20
- Exclude cases analysis by analysis: Nhöõng tröôøng hôïp coù giaù trò
khuyeát ôû trong bieán phuï thuoäc vaø caû bieán kieåm soaùt seõ khoâng
ñöôïc ñöa vaøo trong kieåm nghieäm. Ngoaøi ra nhöõng tröôøng hôïp coù
giaù trò quan saùt naèm beân ngoaøi chuoåi ñaõ xaùc ñònh cho bieán kieåm
soaùt cuõng khoâng ñöôïc söû duïng
- Exclude cases listwise. Nhöõng tröôøng hôïp coù giaù trò khuyeát Cases
trong bieán ñieàu khieån hoaëc baát kyø bieán phuï thuoäc naøo ñöôïc ñöa ra
hoaëc khoâng ñöa ra kieåm nghieäm ñeàu bò loaïi tröø ra khoûi quaù trình
kieåm nghieäm phaân tích .
Caùc giaû ñònh phaûi ñöôïc thoûa maõn khi duøng phaân tích ANOVA moät chieàu
- Caùc maãu döõ lieäu phaûi ñoäc laäp, ngaãu nhieân vaø ñöôïc laáy ra töø
moät toång theå phaân phoái chuaån
- Trong toång theå caùc phöông sai cuûa caùc maãu döõ lieäu phaûi baèng
nhau (ñieàu naøy seõ ñöôïc kieåm nghieäm qua thoâng keâ Levene’s
homogeneity-of-variance.
Xem theâm vò duï trong phaàn phu luïc

Bieân soaïn: Ñaøo Hoaøi Nam 70

You might also like