You are on page 1of 25

Bài tập: Xác suất thống kê

Đề tài: So sánh kết quả học tập học kì 5 - lớp sư phạm hóa 3 - ĐHSP Huế và ĐHSP
Đà Nẵng, và mối tương quan giữa điểm thi đại học và điểm học tập.

A. MỞ ĐẦU :

I. Lý do chọn đề tài:

II.Cách tiến hành:


1. Cách lấy mẫu: Lấy ngẫu nhiên 20 SV trong lớp 08SHH (sư phạm
Hoá)_ĐHSP Đà Nẵng, và 20 SV trong 2 lớp hoá 3A, 3B trường ĐHSP Huế.
2. Các biến chọn để thống kê:
Trong đó, ta xác định
+ Biến định lượng: điểm thi đại học, điểm trung bình HK5
+ Biến định tính : thứ tự, phái, khu vực
III. Bảng số liệu : 2 bảng

Lớp 08SHH (sư phạm Hoá)_ĐHSP Đà Nẵng

TT Phái Khu vực Điểm thi Điểm TB


đại học Học kì 5
1 0 3 20.5 8.3
2 0 2 17.0 7.8
3 0 2 18.0 7.8
4 1 2 17.5 8.3
5 1 1 16.5 7.9
6 0 2 18.0 8.0
7 0 3 18.5 8.2
8 1 2 17.0 7.9
9 1 2 21.0 8.2
10 0 2 20.0 7.5
11 0 1 16.5 7.8
12 1 1 16.5 7.4
13 0 2 18.5 7.9
14 0 2 20.0 7.4
15 1 2 17.5 7.1
16 1 2 19.0 8.0
17 1 3 21.5 8.3
18 0 2 19.5 7.9
19 0 1 16.5 7.2
1
Bài tập: Xác suất thống kê

20 1 2 18.5 8.1

Lớp Hoá 3A,3B _ ĐHSP Huế

TT Phái Khu vực ĐTĐH ĐHK5


1 0 2 17.0 7.0
2 0 2 18.5 7.7
3 1 1 16.0 7.2
4 0 2 24.0 8.4
5 1 1 16.5 7.3
6 0 2 17.5 7.2
7 1 2 19.0 7.8
8 1 3 23.5 8.3
9 0 2 18.5 7.1
10 0 3 22.0 8.2
11 0 1 16.5 6.9
12 1 1 17.0 6.8
13 0 3 20.0 8.1
14 0 2 18.5 7.4
15 0 1 17.0 7.0
16 1 2 18.0 7.0
17 1 2 19.5 7.1
18 0 2 20.0 7.4
19 0 3 21.0 8.0
20 0 2 20.5 7.7

2
Bài tập: Xác suất thống kê

B. NỘI DUNG :

Phần I: Thống kê – Mô tả:


I. Phân bố đơn biến:
1. Biến định lượng : chọn biến điểm trung bình học kỳ 5 (TBHK5)
a, Lớp 08SHH (sư phạm Hoá)_ĐHSP Đà Nẵng
* Bảng phân bố tần số đơn :( phần mềm SPSS)

TBHK5
Cumulative
Frequency Percent(% Percent (%tích
(tần số) tần suất) Valid Percent luỹ)
Valid 7.1 1 5.0 5.0 5.0
7.2 1 5.0 5.0 10.0
7.4 2 10.0 10.0 20.0
7.5 1 5.0 5.0 25.0
7.8 3 15.0 15.0 40.0
7.9 4 20.0 20.0 60.0
8 2 10.0 10.0 70.0
8.1 1 5.0 5.0 75.0
8.2 2 10.0 10.0 85.0
8.3 3 15.0 15.0 100.0
Total 20 100.0 100.0

* Bảng phân bố tần số theo nhóm :


Đẳng loại F tần số F tích luỹ % tần suất % tích luỹ
6.6 – 7.0 0 0 0 0
7.0 – 7.4 2 2 10 10
7.4 – 7.8 3 5 15 25
7.8 – 8.2 10 15 50 75
8.2 – 8.6 5 20 25 100

3
Bài tập: Xác suất thống kê

khoangTBHK5

Cumulative
Frequency Percent (% Percent (% tích
( tần số) tần suất) Valid Percent luỹ)

Valid 7.0 – 7.4 2 10.0 10.0 10.0

7.4 – 7.8 3 15.0 15.0 25.0

7.8 – 8.2 10 50.0 50.0 75.0

8.2 – 8.6 5 25.0 25.0 100.0

Total 20 100.0 100.0

* Các đo lường khuynh hướng định tâm:


* Xử lý bằng phần mềm SPSS:
+ Trung vị: Statistics
N TBHK5
− S e−1
Me = xo + he 2
fe N Valid 20
20 Missing 0
−5
= 7.8 + 0.4 2 =8 Mean ( trung bình cộng) 7.850
10
Median ( trung vị ) 7.900
+ Trung bình cộng:
1 Mode (yếu vị ) 7.9
X = N
∑X = 7,85 i
Std. Deviation ( độ lệch chuẩn
.3620
mẫu)
* Các đo lường tính biến thiên: Variance ( phương sai mẫu) .131
+ Phương sai mẫu: Minimum 7.1
S = ∑
2 (X 2
− X )2
i
= 0,131 Maximum 8.3
n −1
+ Độ lệch chuẩn mẫu: Percentiles 25 7.575
(tứ phân vị)
S= ∑( X i
2
− X )2
=0,362
50 7.900
n −1 75 8.175

Biểu đồ (SPSS)
4
Bài tập: Xác suất thống kê

b, Lớp Hoá 3A,3B _ ĐHSP Huế:


* Bảng phân bố tần số đơn ( phần mềm SPSS)
TBHK5
Valid Cumulative
Frequency Percent Percent Percent
Valid 6.8 1 5.0 5.0 5.0
6.9 1 5.0 5.0 10.0
7 3 15.0 15.0 25.0
7.1 2 10.0 10.0 35.0
7.2 2 10.0 10.0 45.0
7.3 1 5.0 5.0 50.0
7.4 2 10.0 10.0 60.0
7.7 2 10.0 10.0 70.0
7.8 1 5.0 5.0 75.0
8 1 5.0 5.0 80.0
8.1 1 5.0 5.0 85.0
8.2 1 5.0 5.0 90.0
8.3 1 5.0 5.0 95.0
8.4 1 5.0 5.0 100.0
Total 20 100.0 100.0

5
Bài tập: Xác suất thống kê

* Bảng phân bố tần số theo nhóm:


Đẳng loại F tần số F tích luỹ % tần suất % tích luỹ
6.6 – 7.0 2 2 10 10
7.0 – 7.4 8 10 40 50
7.4 – 7.8 4 14 20 70
7.8 – 8.2 3 17 15 85
8.2 – 8.6 3 20 15 100

SPSS:
khoangTBHK5
Valid Cumulative
Frequency Percent Percent Percent
Valid 6.6 – 7.0 2 10.0 10.0 10.0
7.0 – 7.4 8 40.0 40.0 50.0
7.4 – 7.8 4 20.0 20.0 70.0
7.8 – 8.2 3 15.0 15.0 85.0
8.2 – 8.6 3 15.0 15.0 100.0
Total 20 100.0 100.0
Statistics
TBHK5
* Các đo lường khuynh hướng định N Valid 20
tâm: SPSS
Missing 0
+ Yếu vị : 7.0
+ Trung vị: Mean ( trung bình cộng 7.480
N Median (trung vị) 7.350
− S e−1
Me = xo + he 2 Mode (yếu vị ) 7.0
fe
Std. Deviation (độ lệch chuẩn
20 .5064
−2 mẫu)
= 7.0 + 0.4 2 = 7.4
8 Variance ( phương sai mẫu ) .256
+ Trung bình cộng: Minimum 6.8
1
X = N
∑X = 7,48
i
Maximum 8.4
Percentile 25 7.025
6
s (tứ phân 50 7.350
vị )
75 7.950
Bài tập: Xác suất thống kê

* Các đo lường tính biến thiên:


+ Phương sai mẫu:
S2 = ∑( X i
2
− X )2
= 0,256
n −1
+ Độ lệch chuẩn mẫu:
S= ∑( X i
2
− X)
=0,5064
n −1

Biểu đồ:(SPSS)

Bảng so sánh
Đẳng loại ĐN Huế
6.6 – 7.0 0 2
7.0 – 7.4 2 8
7.4 – 7.8 3 4
7.8 – 8.2 10 3
8.2 – 8.6 5 3

7
Bài tập: Xác suất thống kê

12
tần số

10

ĐN
6
Huế

0
khoảng
6.6 – 7.0 7.0 – 7.4 7.4 – 7.8 7.8 – 8.2 8.2 – 8.6

Nhận xét: biểu đồ cho thấy: điểm TBHK5 của 20 SV lớp sư phạm hoá ĐN cao hơn 20
SV của ĐHSP Huế.

2. Biến định tính : Chọn biến phái


Đà Nẵng:

Phai
Valid Cumulative
Frequency Percent Percent Percent
Valid 0 11 55.0 55.0 55.0
1 9 45.0 45.0 100.0
Total 20 100.0 100.0

Statistics
phai
N Valid 20
Huế:
Missing 0
Mode 0

8
Bài tập: Xác suất thống kê

Phai

Frequen Valid Cumulative


cy Percent Percent Percent
Vali 0 13 65.0 65.0 65.0
d
1 7 35.0 35.0 100.0

Total 20 100.0 100.0

Statistics
Phai
N Valid 20
Missing 0
Mode 0

II.Phân bố nhị biến: (20 SV ĐHSP Huế)


1.Phân bố với 2 biến định tính: chọn biến phái và khu vực

khuvuc * Phai Crosstabulation khuvuc * Phai Crosstabulation

Count % of Total

Phai Phai

0 1 Total 0 1 Total

khuvuc 1 2 3 5 khuvuc 1 10.0% 15.0% 25.0%

2 8 3 11 2 40.0% 15.0% 55.0%

3 3 1 4 3 15.0% 5.0% 20.0%

Total 13 7 20 Total 65.0% 35.0% 100.0%

9
Bài tập: Xác suất thống kê

2. Phân bố nhị biến biến định lượng và định tính: chọn biến khu vực và điểm TBHK5
khoangTBHK5 * khuvuc Crosstabulation
Count
khuvuc
1 2 3 Total
Khoang 6.6 – 7.0 2 0 0 2
TBHK5 7.0 – 7.4 3 5 0 8
7.4 – 7.8 0 4 0 4
7.8 – 8.2 0 1 2 3
8.2 – 8.6 0 1 2 3
Total 5 11 4 20

khoangTBHK5 * khuvuc Crosstabulation


% of Total
khuvuc
1 2 3 Total
khoangTBHK 6.6 – 7.0 10.0% 10.0%
5 7.0 – 7.4 15.0% 25.0% 40.0%
7.4 – 7.8 20.0% 20.0%
7.8 – 8.2 5.0% 10.0% 15.0%
8.2 – 8.6 5.0% 10.0% 15.0%
Total 25.0% 55.0% 20.0% 100.0%

10
Bài tập: Xác suất thống kê

3. Phân bố nhị biến với 2 biến định lượng: chọn biến điểm thi đại học và biến
điểm TBHK5:
khoangDTDH * khoangDTBHK5 Crosstabulation
Count
khoangDTBHK5
6.6 – 7.0 7.0 – 7.4 7.4 – 7.8 7.8 – 8.2 8.2 – 8.6 Total
khoangDTD 15-17 1 2 0 0 0 3
H 17-19 1 5 2 0 0 8
19-21 0 1 2 2 0 5
21-23 0 0 0 1 1 2
23-25 0 0 0 0 2 2
Total 2 8 4 3 3 20

khoangDTDH * khoangTBHK5 Crosstabulation


% of Total
khoangTBHK5
6.6 – 7.0 7.0 – 7.4 7.4 – 7.8 7.8 – 8.2 8.2 – 8.6 Total
khoangDTD 15-17 5.0% 10.0% 15.0%
H 17-19 5.0% 25.0% 10.0% 40.0%
19-21 5.0% 10.0% 10.0% 25.0%
21-23 5.0% 5.0% 10.0%
23-25 10.0% 10.0%
Total 10.0% 40.0% 20.0% 15.0% 15.0% 100.0%

11
Bài tập: Xác suất thống kê

Phần 2: ước lượng:


1. Ứớc lượng cho giá trị trung bình.
Bài toán : Giả sử điểm trung bình của sinh viên tuân theo phân phối chuẩn. Hãy
tìm khoảng ước lượng với độ tin cậy 99% của điểm trung bình học kỳ 5 của sinh viên
Khoa Hoá – Trường ĐHSP Huế và dựa vào mẫu điểm trung bình của 20 sinh viên 2
lớp hoá 3A,3B như sau:

Đẳng loại F tần số


6.6 – 7.0 2
7.0 – 7.4 8
7.4 – 7.8 4
7.8 – 8.2 3
8.2 – 8.6 3

Giải :
Gọi X là “điểm trung bình của sinh viên”, theo giả thiết X tuân theo phân phối
chuẩn, n < 30, DX = σ 2 chưa biết.
EX = µ chưa biết, ta cần ước lượng.
Ta có : X = 7,48 S = 0,5064
α
1- α = 0.99 ⇔ = 0,005 ⇒ t α, n −1 = t 0 , 005 ;19 = 2,861
2 2

Khoảng tin cậy:


S S
X - tα
2
, n −1
n
<µ< X + tα
2
, n −1
n
0,5064 0,5064
⇔ 7,48 – 2,861 20
<µ < 7,48 + 2,861 20
⇔ 7,156 < µ < 7,804

Vậy khoảng tin cậy là (7,156 ; 7,804 )

Xử lý bằng phần mềm SPSS:

One-Sample Statistics
Std. Std. Error 12
N Mean Deviation Mean
TBHK5 20 7.480 .5064 .1132
Bài tập: Xác suất thống kê

One-Sample Test
Test Value = 0
99% Confidence Interval of
Sig. (2- Mean the Difference
T Df tailed) Difference Lower Upper
TBHK5 66.060 19 .000 7.4800 7.156 7.804

2.Ước lượng khoảng cho tỷ lệ (xác suất )

Bài toán: Điều tra điểm thi đại học của 20 sinh viên lớp 08SHH_ĐHSP ĐN
thì thấy có 5 sinh viên có điểm thi đại học >= 20 điểm. Hãy ước lượng tỷ lệ sinh viên
có điểm thi đại học >= 20 điểm của khoa Hoá ĐHSP ĐN với độ tin cậy 1 - α = 95%.
Giải:
Gọi tỷ lệ sinh viên có điểm thi đại hoc >=20 là p. Ta cần ước lượng p.
Theo giả thiết bài toán, tỷ lệ SV có điểm thi đại học >=20 trong mẫu cụ thể là:
f = 5 : 20 = 0,25
Ta có :
α
1 - α = 0,95 ⇔ 1- = 0,975 ⇒ u0,975 = 1,96
2
Khoảng tin cậy:
f (1 − f ) f (1 − f )
f- u0 , 975
n
<p< f+ u0 , 975
n
0,25 (1 − 0,25 ) 0,25 (1 − 0,25 )
⇔ 0,25 – 1,96 < p < 0,25 + 1,96
20 20

⇔ 0,0602 < p <0,4398

Vậy khoảng tin cậy là : (0,0602 ; 0,4398 )

PHẦN 3: KIỂM ĐỊNH;

1.Kiểm định giả thiết về trung bình:


13
Bài tập: Xác suất thống kê

Bài toán: Điều tra điểm học tập học kì 5 của 20 sinh viên lớp 08_SHH thì
thấy điểm trung bình là 7,85. Có người cho rằng điểm không cao như vậy mà chỉ
khoảng 7,5. Với mức ý nghĩa α = 0,05; hãy kết luận điều nghi ngờ nói trên có đúng
hay không?
Giải:
Gọi X là điểm trung bình học kì 4 của lớp 08_SHH, gọi điểm trung bình học kỳ
5 là m ( m chưa biết)
Đặt giả thiết: H : m = 7,5 ; H : m ≠ 7,5
Với α = 0,05 thì uα = 1,645
Với α = 0,05 MBB là: Wα = W0,05 = ( - ∞ , - 1,645 )  ( 1,645; + ∞ )
( X − mo ). n (7,85 −7,5). 20
Tính uqs = = 0,362
= 4,324 ∈ MBB
S
uqs ∈ MBB : bác bỏ H. Vậy điểm trung bình HK5 của 20 SV khác 7,5.

Sử dụng phần mềm SPSS:

One-Sample Statistics
Std. Std. Error
N Mean Deviation Mean
TBHK
20 7.850 .3620 .0809
5

One-Sample Test
Test Value = 7.5
95% Confidence Interval
Sig. (2- Mean of the Difference
T Df tailed) Difference Lower Upper
TBHK
4.324 19 .000 .3500 .181 .519
5
t = 4,324 và và p-value (giá trị kiểm định) = 0.000<0.05 nên ta bác bỏ H

2.Kiểm định giả thiết về tỉ lệ.


Bài toán: Tỉ lệ sinh viên có điểm trung bình thấp hơn 7,0 của hai lớp 3A,
3B_ĐHSPH ở học kì 4 là 27%. Sau khi tổ chức hội nghị học tốt, điều tra điểm trung
bình ở học kì 5 của 20 sinh viên ở hai lớp 3A, 3B_ĐHSPH thì thấy có 2 sinh viên

14
Bài tập: Xác suất thống kê

điểm trung bình thấp hơn 7,0. Với mức ý nghĩa α = 0,05, hãy kết luận việc tổ chức hội
nghị học tốt trên là có hiệu quả không?
Giải:
Gọi p là tỉ lệ sinh viên có điểm trung bình học kì 5 thấp hơn 7.0
Giả thiết H : p = 0,27 ; H : p < 0,27
Với α = 0,05 thì uα = 1,645
Miền bác bỏ với mức ý nghĩa α = 0,05 là: Wα = W0,05 = ( - ∞ , - 1,645 )
Từ mẫu cụ thể ta có f = 2:20 =0,1
( f − p0 ) n (0,1 −0,27 ) 20
Uqs = p0 (1 − p0 )
= 0,27 (1 −0,27 )
= - 1,712 € MBB

Bác bỏ giả thiết H


Vậy việc tổ chức hội nghị học tốt có hiệu quả.

3.So sánh giá trị trung bình


Bài toán 1: Khi điều tra kết quả học tập của 20 SV lớp Hoá 3A,3B trường
ĐHSP Huế, người ta thu được kết quả sau:

TT Phái ĐTĐH
1 0 17.0
2 0 18.5
3 1 16.0
4 0 24.0
5 1 16.5
6 0 17.5
7 1 19.0
8 1 23.5
9 0 18.5
10 0 22.0
11 0 16.5
12 1 17.0
13 0 20.0
14 0 18.5
15 0 17.0
16 1 18.0
17 1 19.5
18 0 20.0
19 0 21.0

15
Bài tập: Xác suất thống kê
khoangDTDH * Phai Crosstabulation

Count
TT Phái ĐTĐH
Phai
1 0 17.0
0 1 Total
2 0 18.5
3 1 16.0 khoang 15-17 1 2 3

4 0 24.0 DTDH 17-19 6 2 8


5 1 16.5 19-21 3 2 5
6 0 17.5
21-23 2 0 2
7 1 19.0
23-25 1 1 2
8 1 23.5
20 0 20.5 Total 13 7 20

Với mức ý nghĩa α = 0,05; với số liệu trên thì có thể chứng minh được kết quả
thi đại học của nam sinh viên và nữ sinh viên là như nhau không?

Giải:
Gọi m1, m2 lần lượt là điểm thi đại học của SV nam và SV nữ.
Bài toán: H: m1 = m2; H : m1 ≠ m2

Kiểm định bằng phần mềm SPSS:

Group Statistics
Mean (trung Std.
Phai N bình) Deviation(S) Std. Error Mean
DTDH 0 13 19.308 2.2036 .6112
1 7 18.500 2.5495 .9636

16
Bài tập: Xác suất thống kê

Independent Samples Test

Levene's Test for


Equality of
Variances t-test for Equality of Means

Std. 95% Confidence


Mean Error Interval of the
Sig. (2- Differen Differen Difference
F Sig. T Df tailed) ce ce Lower Upper
DTD Equal
H variance
.011 .918 .741 18 .468 .8077 1.0898 -1.4819 3.0973
s
assumed
Equal
variance
.708 10.915 .494 .8077 1.1411 -1.7062 3.3216
s not
assumed
Vì p-value = 0,918 >> 0.05 -> chấp nhận H, điểm trung bình của nam SV và nữ
SV gần như nhau.
Kiểm ta bằng công thức:
Ta có:
α = 0,05 ⇒ t α = t 0, 025 ;18 = 2,101
;n1+n 2 −2
2

Miềm bác bỏ: wα = ( −


∞ ;−2,1010 ) ∪( 2,101 ;+∞)
x−y ( n1 + n2 − 2)n1n2
t qs = .
n1 S + n2 S
1
2 2
2 n1 + n2
19 ,308 −18 ,5 (13 + 7 − 2) * 13 * 7
= . = 0,702 ∉ MBB
13 * 2,2036 2
+ 7 * 2,5495 2
13 + 7
Vậy chưa đủ cơ sở để bác bỏ H
Kết luận: Điểm trung bình của nam và nữ là gần như nhau.

Bài toán2:Để đánh giá chất lượng đầu vào của sinh viên ngành sư phạm
Hóa_ĐHSP Huế và ĐHSP Đà Nẵng khóa 2008_2012, người ta lấy 2 mẫu từ kết quả
thì:
ĐHSP Huế: n1 = 20 x = 19,03 S12 = 5,28

17
Bài tập: Xác suất thống kê

ĐHSP Đà Nẵng: n2 = 20 y = 18,40 S 22 = 2,52


Giả sử điểm thi của hai trường đều có phân phói chuẩn và hai phương sai bằng nhau (
σ12 = σ 22 )
Với mức ý nghĩa α = 0,05 có thể kết luận trường ĐHSP Huế có chất lượng đầu vào
cao hơn ĐHSP Đà Nẵng hay không?
Giải:
Gọi điểm trung bình của 2 tổng thể m1, m2 chưa biết, giả thiết các ĐLNN tuân
theo qui luật chuẩn với σ12 = σ22
Đây là bài toán kiểm định: H : m1 = m2; H : m1 > m2
Với mức ý nghĩa α = 0.05 tra bảng t0.05(38) = 1,645 ta có miền bác bỏ
Wα = W0,05 = (1,645; + ∞ )
x−y ( n1 + n2 − 2) n1n2
tqs = n1 S + n2 S
2 2 . n1 + n2
1 2

19 ,03 −18 ,4 ( 20 + 20 − 2) * 20 * 20
= 20 * 5,28 + 20 * 2,52 . = 0,98 ∉ Wα
20 + 20
Vậy chưa có cơ sở kết luận rằng chất lượng đầu vào của ĐHSP Huế cao hơn
ĐHSP Đà Nẵng.

4.So sánh hai tỉ lệ :


Bài toán: Để so sánh kết quả học tập của sinh viên khoa Hóa trường ĐHSP Đà
Nẵng và ĐHSP Huế người ta chọn ra 2 mẫu của sinh viên khoa Hóa trường ĐHSP Đà
Nẵng và ĐHSP Huế.
ĐHSP Huế: n1 = 20 có 5 sinh viên điểm trung bình >= 8,0
ĐHSP Đà Nẵng: n2 = 20 có 8 sinh viên điểm trung bình >= 8,0
Với mức α = 0,05 có thể kết luận sinh viên ĐHSP Đà nẵng có lực học cao hơn
ĐHSP Huế hay không?
Giải:
Gọi p1, p2 là tỉ lệ sinh viên có điểm trung bình >= 8,0 của trường ĐHSP Đà
Nẵng và ĐHSP Huế.
Bài toán kiểm định giả thiết: H: p1 = p2 H : p1 < p2
Với α = 0,05 tra bảng u0,05 = 1,645
Miền bác bỏ: Wα = W0.05 = ( - ∞ , - 1,645 )

18
Bài tập: Xác suất thống kê

p1 − p2 5 8

20 20
Tính uqs = 1 1
p * (1 − p * )( + ) = 13 13 1 1
= -1,013 ∉Wα
n1 n2 .(1 − )( + )
40 40 20 20
Vậy chưa đủ để kết luận sinh viên ĐHSP Đà nẵng có lực học cao hơn ĐHSP
Huế.

5.Kiểm tra tính độc lập


Bài toán: Nghiên cứu sự phụ thuộc giữa học lực và giới tính của sinh viên khoa
Hóa ĐHSP Huế. Điều tra mẫu 20 người như sau

khoangTBHK5 * Phai Crosstabulation

Phai

0 1 Total

khoangTBHK5 6.6 – 7.0 1 1 2

7.0 – 7.4 4 4 8

7.4 – 7.8 4 0 4

7.8 – 8.2 2 1 3

8.2 – 8.6 2 1 3

Total 13 7 20

Với mức ý nghĩa α = 0.1 có thể kết luận học lực phụ thuộc giới tính hay không?

Giải:
Bài toán kiểm định:
H: học lực và giới tính là độc lập
H : học lực phụ thuộc vào giới tính
χ02,1 (4) = 7,78
Miền bác bỏ Wα = { χ2 >= 7,78 }
2
χq2s = 20.( 1 12 42 42 02 42 12 22 12
+ + + + + + + +
2.7 2.13 8.7 13 .8 4.7 4.13 3 .7 13 .3 3 .7
22
+ – 1)
13 .3
= 3,15 ∉ Wα
Kết luận học lực không phụ thuộc giới tính .

19
Bài tập: Xác suất thống kê

Kiểm tra bằng phần mềm SPSS:

Case Processing Summary


Cases
Valid Missing Total
N Percent N Percent N Percent
khoangTBHK5 *
20 100.0% 0 .0% 20 100.0%
Phai

Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 3.150a 4 .533
Likelihood Ratio 4.397 4 .355
N of Valid Cases 20
a. 9 cells (90.0%) have expected count less than 5. The
minimum expected count is .70.

Symmetric Measures
Asymp. Std. Approx.
Value Errora Approx. Tb Sig.
Nominal by Contingency
.369 .533
Nominal Coefficient
Ordinal by Ordinal Kendall's tau-b -.189 .209 -.903 .366
Gamma -.314 .344 -.903 .366
N of Valid Cases 20
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null
hypothesis.
P-value = 0,533>>0,1: chấp nhận H
Vậy học lực và giới tính là độc lập

20
Bài tập: Xác suất thống kê

Phần 5: tương quan hồi quy:


Mối quan hệ giữa điểm thi đại học và điểm trung bình học kỳ 5
I, Tương quan:
Từ bảng số liệu thống kê đã thu được, sử dụng MS Excel ta tính được bảng sau:

N X Y ∑X ∑Y ∑X 2
∑Y 2
∑X Y
SPĐN(1) 2 18,4 7,85 1234.9
0 368 157 6819 4 2893.3
SPHuế(2) 2 19,025 7,48 1123.8
0 380.5 149.6 7339.25 8 2865.35

Trong đó:
X = điểm HL12
Y = điểm TBDH
N = số cặp điểm số
∑X = tổng các điểm X
∑Y = tổng các điểm Y
∑X Y = tổng các tích số mỗi cặp X và Y
∑X 2 = tổng các X2
∑Y 2 = tổng các Y2
Tính hệ số tương quan :
N ∑XY − ∑X .∑Y
rp = [ N ∑X 2 − (∑X ) 2 ][ N ∑Y 2 − (∑Y ) 2
Ta có:
20 * 2893 ,3 − 368 * 157
rp (1) = [20 * 6819 − 368 2 ][ 20 * 1234 ,94 −157 2 ]
= 0,412
20 * 2865 ,35 − 380 ,5 * 149 ,6
rp (2) = [ 20 * 7339 ,25 − 380 ,5 2 ][ 20 * 1123 ,88 −149 ,6 2 ]
= 0,869
Nhận xét:
rp (1) = 0,412 : điểm thi đại học và điểm TBHK5 của sinh viên ĐHSP ĐN có
mối tương quan “tạm được”, tức là điểm thi đại học thấp không có nghĩa là điểm học
ở đại học thấp và ngược lại.
rp (2) = 0,869 : điểm thi đại học và điểm TBHK5 của sinh viên ĐHSP Huế có
mối tương quan cao, những sinh viên có điểm thi đại học cao thì điểm học ở đại học
có xu hướng cao hơn những sinh viên có điểm thi đại học thấp hơn.

21
Bài tập: Xác suất thống kê

Xử lý bẳng phần mềm SPSS


Đà Nẵng

Model Summary

Adjusted R Std. Error of the


Model R R Square Square Estimate

1 .412a .170 .124 .3388

a. Predictors: (Constant), DTDH

ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression .424 1 .424 3.690 .071a

Residual 2.066 18 .115

Total 2.490 19

a. Predictors: (Constant), DTDH

b. Dependent Variable: TBHK5

Vì F= 3,69 và sig.=0.071 nên ta có thể khẳng định mối quan hệ giữa ĐTĐH và
ĐTBHK5 của sinh viên lớp SP Hoá ĐHSP ĐN là không lớn lắm
- R= 0.412 nên ta có thể kết luận 2 biến này có tương quan “tạm được”
- R square = 0.170 có nghĩa là ĐTĐH sẽ giải thích 17% ĐTBHK5

ĐHSP Huế

Model Summary

Adjusted R Std. Error of the


Model R R Square Square Estimate

1 .869a .756 .742 .2572

a. Predictors: (Constant), DTDH

22
Bài tập: Xác suất thống kê

ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 3.681 1 3.681 55.663 .000a

Residual 1.191 18 .066

Total 4.872 19

a. Predictors: (Constant), DTDH

b. Dependent Variable: TBHK5

Vì F= 55,663 và sig.=0.000 nên ta có thể khẳng định mối quan hệ giữa ĐTĐH
và ĐTBHK5 của sinh viên lớp SP Hoá ĐHSP Huế cao
- R= 0.869 nên ta có thể kết luận 2 biến này có tương quan cao
- R square = 0,756 có nghĩa là ĐTĐH sẽ giải thích 75,6 % ĐTBHK5

II. Hồi quy:


ĐHSP Đà Nẵng
* Tính hệ số a, b của phương trình hồi quy:
N ∑ XY − ∑ X ∑Y 20 * 2893 ,3 − 368 * 157
b= = = 0,0941
N ∑ X − (∑ X )
2 2
20 * 6819 − 368 2
a =Y −b. X =7,85 −0.094 * 18 , 4 =6,118

Vậy phương trình hồi quy tuyến tính là:


yi= 0,094xi + 6,118

Kiểm tra bằng phần mềm SPSS


Coefficients

Standardized
Unstandardized Coefficients Coefficients

B Std. Error Beta t Sig.

DTDH .094 .049 .412 1.921 .071

(Constant) 6.118 .905 6.761 .000

Ta có t=1,921 và sig.=0.071 nên ta khẳng định tồn tại mối quan hệ giữa 2 biến
với hệ số góc b=0,094

23
Bài tập: Xác suất thống kê

Ta lập được phương trình hồi quy sau:


yi= 0,094xi + 6,118

Đường hồi quy tuyến tính

ĐHSP Huế:
* Tính hệ số a, b của phương trình hồi quy:
N ∑ XY − ∑ X ∑Y 20 * 2865 ,35 − 380 ,5 * 149 ,6
b= = = 0,1916
N ∑ X − (∑ X )
2 2
20 * 7339 ,25 − 380 ,5 2
a =Y −b. X =7,48 −0.1916 * 19 ,025 =3,8348

Vậy phương trình hồi quy tuyến tính là:


yi= 0,1916xi +3,8348

Coefficients

Standardized
Unstandardized Coefficients Coefficients

B Std. Error Beta t Sig.

DTDH .192 .026 .869 7.461 .000

(Constant) 3.834 .492 7.792 .000

Ta có t=7,461 và sig.=0.000 nên ta khẳng định tồn tại mối quan hệ giữa 2 biến
với hệ số góc b=0,192
Ta lập được phương trình hồi quy sau:
yi= 0,192xi +3,834
24
Bài tập: Xác suất thống kê

Đường hồi quy tuyến tính

25

You might also like