Professional Documents
Culture Documents
1
5/12/2009 Nguyễn Duy Tâm _ IDR
1
5/12/2009
2
5/12/2009
3
5/12/2009
Bản ghi cho ngƣời thứ nhất Con người –Tầm nhìn mới
Từ Form nhập liệu, click New để nhập một bản ghi (record)
hay quan sát (observation) mới.
Bảng số liệu điều tra của người thứ hai như sau
OBS =2 Người thứ hai
Y-PT =1 Đã ngoại tình
Z1_MALE =1 Nam
Z2_AGE = 22 22 tuổi
Z3_NOYM = 0.125 Kết hôn được 1.5 tháng
(1.5/12)
Z4_CHILD =0 Chưa có con
Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn
nhân của mình
4
5/12/2009
5
5/12/2009
OBS Z2_AGE
3 18
1 22
2 22
4 22
8 27
9 27
10 27
6 Kết quả37
5 42
7 52
Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc
tính và thuộc lượng.
Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)
6
5/12/2009
Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần
ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím
[ctrl+shift+enter]
Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]
5/12/2009 Nguyễn Duy Tâm _ IDR 13
Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ
kết hôn.
Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc
không đều
5/12/2009 Nguyễn Duy Tâm _ IDR 14
7
5/12/2009
8
5/12/2009
Cumulative Cumulative
BIN Frequency % BIN Frequency %
20 1 10.00% 30 6 60.00%
30 6 70.00% 20 1 70.00%
40 1 80.00% 40 1 80.00%
50 1 90.00% 50 1 90.00%
60 1 100.00% 60 1 100.00%
More 0 100.00% More 0 100.00%
Bảng tần số, tần suất tích lũy và phân phối Pareto
9
5/12/2009
7 120.00%
6
100.00%
5
80.00%
4
Frequency
Frequency
60.00%
Cumulative %
3
40.00%
2
20.00%
1
0 0.00%
30 20 40 50 60 More
BIN
Biểu đồ Pareto
5/12/2009 Nguyễn Duy Tâm _ IDR 19
10
5/12/2009
Rấthài lòng
11
5/12/2009
ĐỒ THỊ ĐƯỜNG
GẤP KHÚC _ LINE
5/12/2009 Nguyễn Duy Tâm _ IDR 23
Jan-96
Jan-02
Jan-03
Jan-04
Jan-05
Jan-97
Jan-98
Jan-99
Jan-00
Jan-01
12
5/12/2009
13
5/12/2009
14
5/12/2009
Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới
Count of
Z8_SATISFACTION Z1_MALE
Grand
Z8_SATISFACTION 0 1 Total
1 11 5 16
2 35 31 66
3 46 47 93
4 93 101 194
5 130 102 232
Grand Total 315 286 601
Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới
15
5/12/2009
Pivot Table với 3 biến phân loại Con người –Tầm nhìn mới
16
5/12/2009
17
5/12/2009
18
5/12/2009
Mean 1.46 0.48 32.49 8.18 0.72 3.93 3.12 16.17 4.19
Standard Error 0.13 0.02 0.38 0.23 0.02 0.04 0.05 0.10 0.07
Median 0.00 0.00 32.00 7.00 1.00 4.00 3.00 16.00 5.00
Mode 0.00 0.00 27.00 15.00 1.00 5.00 4.00 14.00 5.00
Standard Deviation 3.30 0.50 9.29 5.57 0.45 1.10 1.17 2.40 1.82
Sample Variance 10.88 0.25 86.28 31.04 0.20 1.22 1.36 5.77 3.31
Kurtosis 4.26 -2.00 0.23 -1.57 -1.09 -0.20 -1.01 -0.30 -0.78
Skewness 2.35 0.10 0.89 0.08 -0.96 -0.84 -0.09 -0.25 -0.74
Range 12 1 39.5 14.875 1 4 4 11 6
Minimum 0 0 17.5 0.125 0 1 1 9 1
Maximum 12 1 57 15 1 5 5 20 7
Sum 875 286 19525 4914.795 430 2363 1873 9716 2521
Count 601 601 601 601 601 601 601 601 601
19
5/12/2009
Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng
(interval).
Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê.
Công thức lệnh: tính rxy =correl(data_X, data_Y)
Ý nghĩa:
Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy < 0 : X và Y nghịch biến
0< rxy <=1 : X và Y đồng biến
tƣơng quan
20
5/12/2009
Kết quả.
BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận
xét về mối quan hệ giữa các biến
21
5/12/2009
Nhập số liệu
5/12/2009 Nguyễn Duy Tâm _ IDR 43
22
5/12/2009
23
5/12/2009
Nhập số liệu
5/12/2009 Nguyễn Duy Tâm _ IDR 47
24
5/12/2009
25
5/12/2009
26
5/12/2009
STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10
1 27 37 42 32 52 27 42 22 32 32
2 22 32 27 57 32 27 32 47 42 27
3 22 22 52 32 22 42 42 27 37 37
4 42 27 22 22 37 52 27 32 22 22
5 42 47 32 27 32 27 37 27 27 27
6 32 37 22 37 27 37 27 22 42 52
7 27 37 32 42 22 37 32 27 32 32
8 27 57 27 27 37 27 27 22 22 22
9 27 42 52 22 47 32 32 27 27 27
TRUNG BÌNH 29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44 30.89
27
5/12/2009
X Za / 2 X Za / 2
n n
Chọn a = 0.05 =>P(1-a/2)= 0.975
Tra Za/2 = 1.96
Tính trung bình = 32.49
Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21)
S S
X ta / 2,n1 X ta / 2,n1
n n
Chọn a = 0.05 =>P(1-a/2)= 0.975
Tra ta/2 = 1.964
Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29
Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)
28
5/12/2009
S S
X ta / 2,n1 X ta / 2,n1
n n
29
5/12/2009
Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…
30
5/12/2009
Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm
Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra
ứng với 2a.
31
5/12/2009
Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm
Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho.
Vậy số năm học trung bình của người Mỹ cao hơn 16.
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
32
5/12/2009
Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.
Kiểm định 2 đuôi (Chƣa biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
33
5/12/2009
Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.
1. Có giả thiết cho rằng, 1. Có giả thiết cho rằng, độ tuổi (age) bình
độ tuổi (age) bình quân quân của những người được khảo sát là
của những người được dưới 40. Bạn hãy kiểm định giả thiết
khảo sát là dưới 30. nàyα=5%.
Bạn hãy kiểm định giả 2. Có giả thiết cho rằng, độ tuổi (age) bình
thiết này với mức ý quân của những người được khảo sát là
nghĩa α=5%. 46. Theo bạn, đúng hay sai α=3%?
2. Có giả thiết cho rằng, 3. Có giả thiết cho rằng, độ tuổi (agewed)
độ tuổi (age) bình quân bình quân của những người được khảo
của những người được sát là dưới 40. Bạn hãy kiểm định giả
khảo sát là 33. Theo thiết này α=4%.
bạn, giả thiết này đúng
hay sai? (α=10%)
5/12/2009 Nguyễn Duy Tâm _ IDR 68
34
5/12/2009
35
5/12/2009
36
5/12/2009
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
37
5/12/2009
Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Kết quả: Bác bỏ Ho
1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau. Với số liệu của bài tập Tien luong
khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả
thiết trên.
2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua
software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới
và cũ.
38
5/12/2009
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Tools | Data Analysis | F-Test: Two-Sample for Variances
Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Kết quả: Bác bỏ Ho
39
5/12/2009
40
5/12/2009
Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang
cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên
41
5/12/2009
SUMMARY
Groups Count Sum Average Variance
WIFE 250 999 4.00 1.30
HUSBAND 250 984 3.94 1.06
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.45 1.00 0.45 0.38 0.54 3.86
Within Groups 586 498 1.18
42
5/12/2009
Chapter8(V)
SUMMARY
Groups Count Sum Average Variance
Machine 1 5 124.65 24.93 1.06
Machine 2 5 113.05 22.61 0.78
Machine 3 5 102.95 20.59 0.92
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 47.16 2 23.58 25.60 0.00 3.89
Within Groups 11.05 12 0.92
Total 58.22 14
Ho: Năng suất của 3 máy là như nhau
Kết quả kiểm định: Bác bỏ Ho
5/12/2009 Nguyễn Duy Tâm _ IDR 86
43
5/12/2009
44
5/12/2009
Critical
v k Value Q MS within
9 3 3.948 0.921
MSD Values
Meani-Meanj
Stack Machine 1 Machine 2 Machine 3
Machine 1 1.695 1.695
Machine 2 2.320 1.695
Machine 3 4.340 2.020
If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed)
Significant pair values are in bold and underlined in above Table
45
5/12/2009
46
5/12/2009
Type: Linear
Options: Display Equation on chart
5/12/2009 Nguyễn Duy Tâm _ IDR 93
y = 1.5x + 1636.4
10,000 R2 = 0.9
8,000
Sales
Sales
6,000
Linear (Sales)
4,000
2,000
0
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage
Kết quả
47
5/12/2009
Regression Statistics
Multiple R 0.97
R Square 0.94
Adjusted R Square 0.93
Standard Error 611.75
Observations 7
ANOVA
df SS MS F Significance F
Regression 1 30,380,456 30380456 81.18 0.00
Residual 5 1,871,200 374240
Total 6 32,251,656
48
5/12/2009
Từ bảng kết xuất của Excel Con người –Tầm nhìn mới
Residuals
12000
Predicted Sales and Residuals
10000
8000
6000
Predicted Sales
4000 Residuals
2000
0 2 4 6 8
-2000
Observations
Phần dƣ theo biến độc lập Con người –Tầm nhìn mới
1000
800
600
400
Residuals
200
0
-200 0 1,000 2,000 3,000 4,000 5,000 6,000
-400
-600
-800
Footage
49
5/12/2009
12,000
y = 1.4866x + 1636.4
10,000 2
R =1
8,000
Sales
6,000
Sales
4,000
Predicted Sales
2,000
Linear (Predicted
0 Sales)
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage
50
5/12/2009
Regression Statistics
Multiple R 0.87
R Square 0.76
Adjusted R Square 0.74
Standard Error 66.51
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 178624 178624 40 0.00
Residual 13 57511 4424
Total 14 236135
Hồi quy đơn: Oil theo Insulation Con người –Tầm nhìn mới
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.47
R Square 0.22
Adjusted R Square 0.16
Standard Error 119
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 51,076 51,076 3.59 0.08
Residual 13 185,059 14,235
Total 14 236,135
51
5/12/2009
Regression Statistics
Multiple R 0.98
R Square 0.97
Adjusted R Square 0.96
Standard Error 26.01
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 228015 114007 168 0.00
Residual 12 8121 677
Total 14 236135
52
5/12/2009
Tra giá trị tới hạn của F: FINV Con người –Tầm nhìn mới
Temp2=Tem^2
Oil (Gal) Temp Temp2
275.30 40 1600
363.80 27 729
164.30 40 1600
40.80 73 5329
94.30 64 4096
230.90 34 1156
366.70 9 81
300.60 8 64
237.80 23 529
121.40 63 3969
31.40 65 4225
203.50 41 1681
441.10 21 441
323.00 38 1444
52.50 58 3364
5/12/2009 Lê Tấn Luật 106
53
5/12/2009
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.88
R Square 0.78
Adjusted R Square 0.74
Standard Error 65.71
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 184,324 92,162 21 0.00
Residual 12 51,811 4,318
Total 14 236,135
Hồi quy với biến giả Con người –Tầm nhìn mới
54
5/12/2009
Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.78
Standard Error 56.65
Observations 16
ANOVA
df SS MS F Significance F
Regression 3 291,681 97,227 45 0.00
Residual 13 41,727 3,210
Total 16 333,408
Hồi quy với biến giả Con người –Tầm nhìn mới
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.86
Standard Error 56.65
Observations 16
ANOVA
df SS MS F Significance F
Regression 2 291,681 145,841 45.44 1.36E-06
Residual 13 41,727 3,210
Total 15 333,408
55
5/12/2009
Hồi quy với biến tƣơng tác Con người –Tầm nhìn mới
SUMMARY OUTPUT
CNQ = CN*Q
Regression Statistics
Multiple R 0.98
R Square 0.96
Adjusted R Square0.95
Standard Error 33.19
Observations 16
ANOVA
df SS MS F Significance F
Regression 3 320190 106730 96.90 1.11913E-08
Residual 12 13218 1102
Total 15 333408
56
5/12/2009
Regression Statistics
Multiple R 0.99
R Square 0.99
Adjusted R Square 0.99
Standard Error 1,570.36
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 2686989117 1.34E+09 545 1.67092E-12
Residual 12 29592539.09 2466045
Total 14 2716581656
57
5/12/2009
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.98
Adjusted R Square 0.97
Standard Error 0.09
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 4 2 267 1.13248E-10
Residual 12 0 0
Total 14 5
58