You are on page 1of 16

Bài 1 : ( Đề bài )

Loại bài :
Đây là bài toán nằm trong dạng “So sánh các phân bố”.
Bài toán tổng quát có dạng: Cho một bộ A gồm ‘r’ tính trạng A ={A 1, A2,
…, Ar}. Xét ‘k’ tập chính H1, H2, …,Hk có phân bố của A trên đó lần lượt là
(p11, p11,…, pr1), (p12, p22, …,pr2)…, (p1k, p2k, …,prk). Chúng ta đi kiểm định
giả thuyết H0 rằng A có phân số phân bố các mức tính trạng như nhau trên
X1, X2,…, Xk dựa trên các mẫu ngẫu nhiên rút ra từ X1, X2, …,Xk.
H0 tương đương với đẳng thức:

P11 = p12 = …= p1k


P21 = p22 = …= p2k

Pr1 = pr2= …= prk

Để giải dạng toán này, ta tiến hành các bước sau:

Bước 1: Sắp xếp các số liệu thành bảng:


Mẫu 1 2 j k Tổng số
Tính trạng
A1 n11 n12 … n1j … n1k n10
A2 n21 n22 … n2j … n2k n20
… … … … … … … …
Ai ni1 n+i2 … nij … nik ni0
… … … … … … … …
Ar nr1 nr2 … nrj … nrk nr0
Tổng số n01 n02 … n0j … n0k n
Trong đó mẫu ngẫu nhiên thứ j sẽ có nij cá thể mang tính trạng Ai.

Bước 2: tính các giá trị:


k
ni0 = ∑ nij : Tổng số cá thể mang tính trạng Ai.
j=1

n0j = ∑ nij : Tổng số cá thể thuộc mẫu thứ j.


i=1

k r
n=∑ noj = ∑ ni0 : Tổng số cá thể được xét.
j=1 i=1

nij$ = : Số cá thể mang tính trạng Ai trong


mẫu thứ j.
Nếu tất cả các nij đều >= 5, ta tiến hành bước thứ 3, ngược lại chuyển sang
bước thứ 4.

Bước 3: Tìm test thống kê:


r ,k
n2ij
T = i∑
, j=1 nio n ¿
-1
oj
¿

Bước 4: Gộp hàng hoặc cột có chứa cá thể nij < 5 với hàng hoặc cột kế
cận(căn cứ vào tính logic của phép gộp), sau đó tiến hành lại từ bước 1.

2 ((r-1)(k-1))
Bước 5: So sánh T với c = χα , nếu T< =c, chấp nhận giả thuyết H0,
ngược lại bác bỏ H0. Hoặc, nếu dùng MS Excel thì tính xác suất P(X>2) với bậc tự
do DF = (r-1)(c-1), nếu P > α thì công nhận H0, ngược lại sẽ bác bỏ H0.

Bài giải :

H0: Mức độ thỏa mãn cuộc sống phân bố giống nhau trong 5 thành phố trên.

** Lưu ý: cách trình bày dưới đây ngược lại so với phần lý thuyết, tính trạng liệt kê
theo hàng ngang, còn tập thực nghiệm theo hàng dọc, do đó vai trò của i, j trong
các công thức lý thuyết sẽ đổi chỗ cho nhau(ví dụ: nij thành nji).

Bước 1 : Nhập số liệu vào bảng Exel:

Bước 2: Tính các tổng, sử dụng hàm SUM của Excel:


(cú pháp hàm SUM: SUM(number1, number2,…) )

n10 : E2 = SUM (B2:D2)


n20 : E3 = SUM (B3:D3)
n30 : E4 = SUM (B4:D4)
n40 : E5 = SUM (B5:D5)
n50 : E6 = SUM (B6:D6)

n01 : B7 = SUM (B2:B6)


n02 : C7 = SUM (C2:C6)
n03 : D7 = SUM (D2:D6)

n : E7 = SUM (E2:E6)

Kết quả thu được bảng số liệu sau:


Bước 3: Tính các tần số lý thuyết, tần số lý thuyết = tổng hàng* tổng cột/ n.

Kết quả thu được bảng số liệu sau:


Bước 5: Tính xác suất P(X>2) với bậc tự do DF = (r-1)(c-1) bằng hàm
CHITEST(actual_range,expected_range). Với actual range l tần số thực tế,
expected range l tần số lý thuyết.
B11= CHITEST(B2:D6,B10:D14)

Kết quả P thu được là :


Giá trị P 3.5299E-13

Vì P < α=0.05, ta bác bỏ H0, tức mức độ thỏa mãn cuộc sống phân bố khác nhau
trong 5 thành phố đã cho.

Bài 2:

Ở một bệnh viện lớn, số ca cấp cứu trong 5 ngày chọn ngẫu nhiên được
ghi lại như sau:

Buổi sang: 44 53 56 49 38 Buổi chiều; 33 42 15 30 45

Buổi tối: 39 24 30 27 30

Với mức ý nghĩa 5%, có thể cho rằng số ca cấp cứu trung bình trong ba
buổi sáng, chiều, tối la như nhau không?

Bài làm:

Đây là bài toán phân tích phương sai một yếu tố.
Mục đích của bài toán là đánh giá sự ảnh hưởng của số ca cấp cứu trung
bình vào một ngày.

Ta dùng MS-EXCEL để giải.

Nhập dữ liệu vào bảng tính:

Áp dụng “Anova:Single Factor”.

1) Nhấp lần lượt đơn lệnh Tools và lệnh Data Analysis.


2) Chọn chương trình Anova: single Factor trong hộp thoại Data
analysis rồi nhấp nút ok.
3) Trong hộp thoại Anova: single factor lần lượt ấn định:
- Phạm vi đầu vào(Input Range)
- Cách sắp xếp theo hàng hay cột(group by)
- Nhấn dữ liệu( labels in fisrt row?column).

Ta được kết quả:

Anova: Single
Factor
SUMMARY
Cou Averag Varian
Groups nt Sum e ce
buổi sáng 5 240 48 51.5
Buổi
chiều 5 165 33 139.5
buổi tối 5 150 30 31.5

ANOVA
Source of P-
Variation SS df MS F value F crit
Between 6.2696 0.0136 3.8852
Groups 930 2 465 63 75 94
Within 74.166
Groups 890 12 67

182
Total 0 14        

Hộp thoại Anova:single factor.

Kết quả và biện luận:

F=6.269663> F0.05=3.88529
 Bác bỏ giả thiết H0.

Vậy với mức ý nghĩa 5%, ta chưa thể kết luận số ca cấp cứu trung bình
trong ba buổi sáng, chiều, tối là như nhau.

Baøi 3:

I.Ñeà baøi:

Moät nghieân cöùu ñöôïc tieán haønh ôû Myõ ñeå xaùc ñònh moái quan heä giöõa
chieàu cao cuûa moät ngöôøi vaø côõ giaày cuûa hoï.Nhaø nghieân cöùu ñaõ thu
ñöôïc baûng soá lieäu sau:

Trong ñoù X laø chieàu cao (ñôn vò laø inches) coøn Y laø côõ giaày .Tính tyû soá
töông Quan,heä soá töông quan vaø heä soá xaùc ñònh cuûa Y ñoái vôùi X.Vôùi
möùc yù nghóa α=5%,coù keát luaän gì veà moái töông quan giöõa X vaø Y(phi
tuyeán hay tuyeán tính)?.Tìm ñöôøng hoài quy cuûa Y ñoái vôùi X.Tính sai soá
tieâu chuaån cuûa ñöôøng hoài quy.

II.Dạng bài toán :

PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY.

II.Chöông trình hoã trôï giaûi:

-Excel 2007.

III.Baøi giaûi:
Laäp laïi baûng:

Môû Excel 2007,nhaäp vaøo baûng soá lieäu nhö sau :

_Baûng 1_

Sau ñoù môû hoäp coâng cuï Data Analysis choïn chöông trình Regression ,nhaäp
vaøo(ñaùnh daáu) caùc giaù trò nhö sau :
_baûng 2_

Nhaáp OK,ta ñöôïc baûng sau:

_baûng 3_
a>Tyû soá töông quan cuûa Y ñoái vôùi X:

Ta coù : =SSF/SST

Vôùi : SST=C.14 ôû baûng 3 = 46,4

SSF= ∑(Ti²/Ni) - T²/N =(15²+15²+13²+22²+11²)/2-76²/10 =106,4

Vaäy : = 106,4/46,4 = 2,2931

b>Heä soá töông quan :

r = B.4 ôû baûng 3(Mutilple R) = 0,7166

c>Heä soá xaùc ñònh:

r² = B.5 ôû baûng 3 = 0,5135

d>α = 0,05 ,ñaùnh giaù moái töông quan giöõa X vaø Y:

Ta coù heä soá töông quan giöõa X vaø Y:

0< r = 0,7166 <1 :vaäy X vaø Y coù khuynh höôùng tuyeán tính vôùi möùc

ñoä lieân quan khaù.

*Xeùt moái töông quan phi tuyeán giöõa X vaø Y,ta duøng test thoáng keâ “
F = [( -r²)(n-k)]/ [(1- - )(k-2)]

= [(2,2931-0,5135)(10-5)]/[1-2,2931)(5-2)]=-2,2937

Tra baûng phaân boá Fisher coù α =0,05 vaø coù baäc töï do laø (3,5) ta

ñöôïc haèng soá c :

c =5,41

Vì | F| = 2,2937 < c=5,41 :chaáp nhaän giaû thieát Ho :khoâng coù töông

quan phi tuyeán giöõa X vaø Y.

e>Tìm ñöôøng hoài quy cuûa Y ñoái vôùi X:

*Phöông trình hoài quy : y = ax+b

Trong ñoù:

a = B.18 ôû baûng 3 = 0,4843

b = B.17 ôû baûng 3 = -24,2638

Vaäy pt hoài quy: y = 0,4843x – 24,2638

*Traéc nghieäm thoáng keâ: (α= 0,05)

+Traéc nghieäm t:

Tra baûng phaân boá Student ¥ = N-2= 8


t(0,05) = 2,306

t0 =| D.17 baûng 3| = 2,21 < t(0,05) = 2,306

=>chấp nhận giả thiết Ho.

t1=| D.18 baûng 3| = 2,91 > t(0,05)

=>baùc boû giaû thuyeát Ho.

+Traéc nghieäm F:

Tra baûng F vôùi baäc töï do :v1=1,v2=N-2=8 : Fo=5,32

F = E.12 baûng 3 = 8,44 > F(0,05)

=>baùc boû giaû thieát Ho.

Vaäy heä soá -24,2638 của pt hồi quy không có ý nghĩa thống kê , heä soá 0,4843

cuûa phöông trình hoài quy y = 0,4843x – 24,2638 coù yù nghóa thoáng keâ. Và

pt hồi quy thích hợp.

f>Sai soá tieâu chuaån cuûa ñöôøng hoài quy :

s = B.7 baûng 3 = 1,6798 .

4. Một cuộc thăm dò đư ợc tiến hành ở Mỹ bởi viện nghiên cứu xã hội nổi tiếng
Gallup để nghiên cứu mối quan hệ giữa nghề nghiệp của một người với quan
niệm của anh ta về tiêu chuẩn đạo đức và tính trung thực . Kết quả của việc khảo
sát một ngẫu nghiên gồm 380 người cho ta số liệu sao đây :
Với mức ý nghĩa 5% , hãy xác định xem có mối quan hệ hay không ? Bài làm

a)

Dạng bài toán : so sánh nhiều tỉ số.

Thuật toán :

 Mở chương trình MS-Excel


 Nhập bảng dữ liệu
Tính tổng hàng tổng cột

Tính tần số lý thuyết=(tổng hang x tổng cột)/tổng cộng

Gọi hàm CHITEST, nhập dữ liệu vào chọn đầu ra cho dữ liệu.

 Kết quả
Thu được giá trị P(Tqs<20,01)

Nếu P(Tqs<20,01)>α chấp nhận giả thuyết H0

Nếu ngược lại thì bác bỏ giả thuyết H0


b)Quá trình giải thuật :

Nhập dữ liệu vào bảng tính :

Tính các giá trị :

-Chọn ô E2 và nhập biểu thức =SUM(B2 :D2). Dùng con trỏ kéo để nút tự động
điền từ ô E2 đến ô E5.

-Tổng các cột :chọn ô B6 và nhập biểu thức =SUM(B2 :B5).Dùng con trỏ trỏ kéo để
nút tự động điền từ ô B6 đến ô D6.

-Tổng cộng chọn ô E6 và nhập biểu thức =SUM(E2 : E5)

Tính bảng tần số lí thuyết

-Chọn ô B9 và nhập biểu thức =SUM($B$6*E2)/$E$6 . Dùng con trỏ kéo để nút tự
động điền từ ô B9 đến ô B12.

-Chọn ô C9 và nhập biểu thức=SUM($C$6*E2)/$E$6. Dùng con trỏ kéo để nút tự


động điền từ ô C9 đến ô C12.

-Chọn ô D9 và nhập biểu thức=SUM($D$6*E2)/$E$6. Dùng con trỏ kéo để nút tự


động điền từ ô D9 đến ô D12.
Ta được bảng sau :

Gọi hàm CHITEST tính giá trị P

Nhấp vào Insert chọn Insert Fuction sau đó chọn Chitest rồi nhấn OK

Xuất hiện hộp thoại Fuction Agruments :

-Nhập các giá trị tần số quan sát vào mục Actual_range

- Nhập các giá trị tần số vào mục Expected_ range.Nhấp OK

Giá trị của “P” được tính bằng hàm số Chitest:=chitest(B2:D5,B9:D12).


Kết quả: P(X> X^2) =3,7.10^(-10) < α=0,05.=> Loại giả thiết H o.

Vậy sẽ không có mối quan hệ về tiêu chuẩn đạo đức và trung thực giữa bác sĩ ,
luật sư , nhà kinh doanh và nhà chính trị .

You might also like