You are on page 1of 58

5/12/2009

NGUYỄN DUY TÂM

1
5/12/2009 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới


NỘI DUNG

1. Nhập dữ liệu vào excel


2. Thống kê dữ liệu dạng bảng
3. Thống kê dữ liệu dạng đồ thị
4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả
5. Ước lượng và kiểm định giả thiết
6. Phân tích phương sai ANOVA
7. Hồi quy tương quan
8. Kiểm định phi tham số
9. Lý thuyết quyết định

5/12/2009 Nguyễn Duy Tâm _ IDR 2

1
5/12/2009

Nhập số liệu vào Excel Con người –Tầm nhìn mới

OBS Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION


1 0 0 22 4 1 4
2 1 1 22 0.125 0 5
3 0 0 18 10 0 5
4 0 1 22 0.75 0 3
5 12 0 42 15 1 2
6 0 0 37 15 1 4
7 0 1 52 15 1 4
8 7 0 27 1.5 0 5
9 0 1 27 4 0 4
10 0 0 27 1.5 1 2
Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls
OBS = Số thứ tự của người được phỏng vấn
Y-PT = Số lần quan hệ tình dục ngoài hôn nhân trong năm
Z1_MALE = 1 nếu là nam, 0 nếu là nữ
Z2_AGE = Tuổi
Z3_NOYM = Số năm kết hôn
Z4_CHILD = 1 nếu có con, 0 nếu chưa có con
Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5
Ghi chú : Biến số theo cột, quan sát ghi theo hàng
5/12/2009 Nguyễn Duy Tâm _ IDR 3

Con người –Tầm nhìn mới


Tạo biểu nhập liệu (Form)

 Trên một trang bảng tính mới (New worksheet)


 Tạo dòng tiêu đề (biến số) ở dòng 1.
 Quét khối dòng tiêu đề, rồi vào
 Data/ Form

5/12/2009 Nguyễn Duy Tâm _ IDR 4

2
5/12/2009

Con người –Tầm nhìn mới


Tạo biểu nhập liệu (Form)

 Vì chúng ta không định nghĩa chính xác số dòng của


bảng tính, nên Excel có hỏi như bảng giao diện ở
trên. Đơn giản là chọn OK.

5/12/2009 Nguyễn Duy Tâm _ IDR 5

Con người –Tầm nhìn mới


Bản ghi cho ngƣời thứ nhất

 Nhập cho người thứ nhất


 Bảng số liệu điều tra của người này như sau
 OBS =1 Người thứ nhất
 Y-PT =0 Chưa ngoại tình
 Z1_MALE =0 Nữ
 Z2_AGE = 22 22 tuổi
 Z3_NOYM =4 Kết hôn được 4 năm
 Z4_CHILD =1 Đã có con
 Z8_SATISFACTION = 4 Hài lòng về cuộc hôn
nhân của mình

5/12/2009 Nguyễn Duy Tâm _ IDR 6

3
5/12/2009

Bản ghi cho ngƣời thứ nhất Con người –Tầm nhìn mới

5/12/2009 Nguyễn Duy Tâm _ IDR 7

Con người –Tầm nhìn mới


Bản ghi cho ngƣời thứ hai

 Từ Form nhập liệu, click New để nhập một bản ghi (record)
hay quan sát (observation) mới.
 Bảng số liệu điều tra của người thứ hai như sau
 OBS =2 Người thứ hai
 Y-PT =1 Đã ngoại tình
 Z1_MALE =1 Nam
 Z2_AGE = 22 22 tuổi
 Z3_NOYM = 0.125 Kết hôn được 1.5 tháng
(1.5/12)
 Z4_CHILD =0 Chưa có con
 Z8_SATISFACTION = 5 Rất hài lòng về cuộc hôn
nhân của mình

5/12/2009 Nguyễn Duy Tâm _ IDR 8

4
5/12/2009

Con người –Tầm nhìn mới


Bản ghi cho ngƣời thứ hai

Làm tương tự cho đến người thứ 10 ở slide 3.

5/12/2009 Nguyễn Duy Tâm _ IDR 9

Con người –Tầm nhìn mới


Mảng thứ tự

 Chọn biến Z2_AGE


 Sắp xếp thành mảng thứ
tự từ nhỏ đến lớn
 Quét khối toàn bộ số
liệu, kể cả dòng tên
biến.
 Data/ Sort

5/12/2009 Nguyễn Duy Tâm _ IDR 10

5
5/12/2009

Giao diện Sort Con người –Tầm nhìn mới

OBS Z2_AGE
3 18
1 22
2 22
4 22
8 27
9 27
10 27
6 Kết quả37
5 42
7 52

 Chọn Sort by: Z2_AGE


 Chọn Asending: Sắp xếp theo thứ tự tăng dần

5/12/2009 Nguyễn Duy Tâm _ IDR 11

Con người –Tầm nhìn mới


1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

 Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc
tính và thuộc lượng.
 Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ
 Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)

 Công cụ trên excel:


 Dùng lệnh =FREQUENCY[ (data_array, bins_array)]

5/12/2009 Nguyễn Duy Tâm _ IDR 12

6
5/12/2009

Con người –Tầm nhìn mới


1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

 Quy trình dùng lệnh FREQUENCY


 Đối với biến có ít biểu hiện
 B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện
 B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency
Cú pháp: = FREQUENCY(data_array, bins_array)
 Data_array: Dữ liệu cần lập bảng
 Bins_array: các biểu hiện

 Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần
ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím
[ctrl+shift+enter]
 Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]
5/12/2009 Nguyễn Duy Tâm _ IDR 13

Con người –Tầm nhìn mới


1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

Quy trình dùng lệnh FREQUENCY


Đối với biến có nhiều biểu hiện:
 B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi
phân tổ.
 B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ.
Ví dụ biến [trình độ học vấn]_edu
 B3: dùng lệnh FREQUENCY để lập bảng.

 Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ
kết hôn.
 Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc
không đều
5/12/2009 Nguyễn Duy Tâm _ IDR 14

7
5/12/2009

Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis


 Dùng thủ tục Data
Analysis trong thư viện
hàm Add-Ins của Excel
 Kiểm tra xem có thủ tục
Data Analysis trong
Tools hay chưa?
 Tools/ Add-Ins/ Check
vào Analysis ToolPak/
OK

5/12/2009 Nguyễn Duy Tâm _ IDR 15

Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Tools/ Data Analysis/ Histogram

5/12/2009 Nguyễn Duy Tâm _ IDR 16

8
5/12/2009

Biểu đồ tần số-Thủ tục Data Analysis


Con người –Tầm nhìn mới

 Input Range: Quét khối số liệu, nhớ có cả tên biến


 Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên
 Labels: Khai báo có dòng đầu tiên là tên biến
 Chọn Output range: ô đầu tiên chứa kết quả
 Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart
Output
5/12/2009 Nguyễn Duy Tâm _ IDR 17

Biểu đồ tần số-Thủ tục Data Analysis


Con người –Tầm nhìn mới

Cumulative Cumulative
BIN Frequency % BIN Frequency %
20 1 10.00% 30 6 60.00%
30 6 70.00% 20 1 70.00%
40 1 80.00% 40 1 80.00%
50 1 90.00% 50 1 90.00%
60 1 100.00% 60 1 100.00%
More 0 100.00% More 0 100.00%

 Bảng tần số, tần suất tích lũy và phân phối Pareto

5/12/2009 Nguyễn Duy Tâm _ IDR 18

9
5/12/2009

Biểu đồ tần số-Thủ tục Data Analysis


Con người –Tầm nhìn mới
Histogram

7 120.00%

6
100.00%

5
80.00%

4
Frequency

Frequency
60.00%
Cumulative %
3

40.00%
2

20.00%
1

0 0.00%
30 20 40 50 60 More
BIN

 Biểu đồ Pareto
5/12/2009 Nguyễn Duy Tâm _ IDR 19

Con người –Tầm nhìn mới


2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

Các dạng đồ thị:


1. Hình thanh : Column, Bar,
2. Hình tròn, (bánh) : Pie
3. Đường gấp khúc : Line
4. Phân tán : Scatter

5/12/2009 Nguyễn Duy Tâm _ IDR 20

10
5/12/2009

Con người –Tầm nhìn mới


2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

QUY TRÌNH VẼ ĐỒ THỊ ĐỒ THỊ HÌNH TRÕN

 B1: chọn vùng dữ liệu Tầnsố

 B2: chọn biểu tượng đồ thị Rấtkhông hài


[chart wizart] hoặc lòng
1% 5% Khônghài
insert/chart 49%
12% lòng
Bình thường
 B3: Chọn các hiệu chỉnh 33%

tương ứng Hàilòng

Rấthài lòng

Đồ thị hình tròn


thường dùng tần
suất (%) để hiển thị
5/12/2009 Nguyễn Duy Tâm _ IDR 21

Con người –Tầm nhìn mới


2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

ĐỒ THỊ HÌNH THANH ĐỒ THỊ HÌNH THANH


[COLUMN] [BAR]
Tên thuộc
tính dài

Tên thuộc tính ngắn


5/12/2009 Nguyễn Duy Tâm _ IDR 22

11
5/12/2009

ĐỒ THỊ ĐƯỜNG
GẤP KHÚC _ LINE
5/12/2009 Nguyễn Duy Tâm _ IDR 23

Đồ thị Line: thường


chỉ số CPI
dùng cho trường hợp dữ
liệu theo dõi qua thời
gian 180
160
140
120
100
80
60
40
20
0
Jan-95

Jan-96

Jan-02

Jan-03

Jan-04

Jan-05
Jan-97

Jan-98

Jan-99

Jan-00

Jan-01

Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới

 Data/ Pivot Table


5/12/2009 Nguyễn Duy Tâm _ IDR 24

12
5/12/2009

Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới

 Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ


được xem là tên trường(Field)

5/12/2009 Nguyễn Duy Tâm _ IDR 25

Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới

 Nên chọn trang bảng tính mới

5/12/2009 Nguyễn Duy Tâm _ IDR 26

13
5/12/2009

Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới

 Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row


Fields và Data Items

5/12/2009 Nguyễn Duy Tâm _ IDR 27

Bảng tóm tắt-Pivot Table Con người –Tầm nhìn mới

 Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields)


và chọn Count of Z8_SATISFACTION.
Ưu điểm: có thể tính Tổng, tần số và
nhiều lệnh khác
5/12/2009 Nguyễn Duy Tâm _ IDR 28

14
5/12/2009

Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới

Count of
Z8_SATISFACTION Z1_MALE
Grand
Z8_SATISFACTION 0 1 Total
1 11 5 16
2 35 31 66
3 46 47 93
4 93 101 194
5 130 102 232
Grand Total 315 286 601

5/12/2009 Nguyễn Duy Tâm _ IDR 29

Pivot Table với 2 biến phân loại Con người –Tầm nhìn mới

 Click vào A3, kéo và thả trường Z1_MALE vào Column


Fields.
Ưu điểm: lập bảng tần số chéo cho
nhiều biến.
5/12/2009 Nguyễn Duy Tâm _ IDR 30

15
5/12/2009

Pivot Table với 3 biến phân loại Con người –Tầm nhìn mới

 Kéo và thả Z4_Child vào Page Fields

5/12/2009 Nguyễn Duy Tâm _ IDR 31

Con người –Tầm nhìn mới


Một số yêu cầu

Dùng công cụ Pivot table:


1. Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể.
2. Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể.
3. Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng
hôn nhân nào chiếm đa số
4. Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ
và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ
biểu đồ tương ứng.
5. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row).
6. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) <chỉ
thống kê cho giới tính nữ> và <chỉ thống kê cho giới tính nam>.

5/12/2009 Nguyễn Duy Tâm _ IDR 32

16
5/12/2009

Con người –Tầm nhìn mới


Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

CHỈ TIÊU TẬP TRUNG CHỈ TIÊU PHÂN TÁN

 Trung bình : average  Phương sai : var


 =average(data)  =var(data)
 Trung vị : Median  Độ lệch chuẩn : stdev
 =median(data)  =stdev(data)
 Mode : Mode
 =mode(data)
 Tứ phân vị : quartile
 =quartile(data,số phân vị)
(1: Q1; 2:Q2; 3:Q3)

5/12/2009 Nguyễn Duy Tâm _ IDR 33

Con người –Tầm nhìn mới


Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

MỘT SỐ LỆNH CÓ TRONG


MỘT SỐ LỆNH KHÁC
EXCEL 2007
 Tính tổng thỏa điều kiện
 Tính tổng thoả điều kiện
 =sumif(vùng ĐK, ĐK, nâng cao.
 =sumifs(vùng tính tổng,
Vùng tính tổng)
 Đếm thỏa điều kiện vùng ĐK1, ĐK1, vùng
 =countif(vùng ĐK,ĐK) ĐK2, ĐK2)
 Đếm thỏa điều kiện nâng
cao.
 =countifs(vùng ĐK1,
ĐK1,vùng ĐK2, ĐK2,…)

Nguyễn Duy Tâm _ IDR


5/12/2009 34

17
5/12/2009

Con người –Tầm nhìn mới


Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

MỘT SỐ LỆNH CÓ TRONG


BÀI TẬP (AFFAIR)
EXCEL 2007
 Trung bình thỏa điều kiện 1. Tính giá trị trung bình, trung vị,
 =averageif(vùng ĐK, ĐK, mode, tứ phân vị, phương sai,
độ lệch chuẩn cho các biến:
Vùng tính mean) Z2_age, Z4_child, Z6_edu. Nêu
 =averageifs(vùng tính ý nghĩa của các số trên.
mean,vùng ĐK1, ĐK1, 2. Tính tổng số con của những
Vùng ĐK2, ĐK2) người có độ tuổi dưới 30. hoặc
của những người hài lòng về
tình trạng hôn nhân.
3. Đếm những người có 1 con

5/12/2009 Nguyễn Duy Tâm _ IDR 35

Con người –Tầm nhìn mới


Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

BÀI TẬP (THUC HANH BÀI TẬP (THUC HANH


EXCEL) EXCEL)
1. Đếm những người làm 1. Tính tổng số anh/chị/em
việc toàn thời gian trong của những người lý dị, ly
mẫu khảo sát thân.
2. Đếm những người đã lập 2. Tính tổng số con của
gia đình, chưa lập gia đình những người là nữ giới.

5/12/2009 Nguyễn Duy Tâm _ IDR 36

18
5/12/2009

Con người –Tầm nhìn mới


Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics

 Nhập số liệu và các tùy chọn vào giao diện

5/12/2009 Nguyễn Duy Tâm _ IDR 37

Con người –Tầm nhìn mới


Tính trị thống kê bằng thủ tục Data Analysis
Tools/ Data Analysis/ Descriptive Statistics

Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD Z8_SATISFACTION


Z5_RELIGIOUS Z6_EDU Z7_OCCUPATION

Mean 1.46 0.48 32.49 8.18 0.72 3.93 3.12 16.17 4.19
Standard Error 0.13 0.02 0.38 0.23 0.02 0.04 0.05 0.10 0.07
Median 0.00 0.00 32.00 7.00 1.00 4.00 3.00 16.00 5.00
Mode 0.00 0.00 27.00 15.00 1.00 5.00 4.00 14.00 5.00
Standard Deviation 3.30 0.50 9.29 5.57 0.45 1.10 1.17 2.40 1.82
Sample Variance 10.88 0.25 86.28 31.04 0.20 1.22 1.36 5.77 3.31
Kurtosis 4.26 -2.00 0.23 -1.57 -1.09 -0.20 -1.01 -0.30 -0.78
Skewness 2.35 0.10 0.89 0.08 -0.96 -0.84 -0.09 -0.25 -0.74
Range 12 1 39.5 14.875 1 4 4 11 6
Minimum 0 0 17.5 0.125 0 1 1 9 1
Maximum 12 1 57 15 1 5 5 20 7
Sum 875 286 19525 4914.795 430 2363 1873 9716 2521
Count 601 601 601 601 601 601 601 601 601

 Kết quả sau khi đã hiệu chỉnh.


 Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công
cụ DATA ANALYSIS cho các biến: agewed sibs
childs age educ trong bài tập thực hành excel
5/12/2009 Nguyễn Duy Tâm _ IDR 38

19
5/12/2009

Con người –Tầm nhìn mới


HỆ SỐ TƢƠNG QUAN

 Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến
thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng
(interval).
 Chú ý: Đối với thang đo định danh (norminal): những chỉ số
tính toán không có ý nghĩa thống kê.
 Công thức lệnh: tính rxy =correl(data_X, data_Y)
 Ý nghĩa:
 Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y
-1 < = rxy < 0 : X và Y nghịch biến
0< rxy <=1 : X và Y đồng biến

5/12/2009 Nguyễn Duy Tâm _ IDR 39

Dùng thủ tục Data Analysis đểContính


người ma trận
–Tầm nhìn mới

tƣơng quan

 Tools/ Data Analysis/ Correlation


5/12/2009 Nguyễn Duy Tâm _ IDR 40

20
5/12/2009

Con người –Tầm nhìn mới


Dùng thủ tục Data Analysis để tính ma trận
tƣơng quan
Y_PT Z1_MALE Z2_AGE Z3_NOYM Z4_CHILD
Z8_SATISFACTION
Z5_RELIGIOUS
Z6_EDU
Z7_OCCUPATION
Y_PT 1
Z1_MALE 0.011736 1
Z2_AGE 0.095237 0.190641 1
Z3_NOYM 0.186842 0.030283 0.777546 1
Z4_CHILD 0.10401 0.069222 0.421931 0.572857 1
Z8_SATISFACTION
-0.27951 -0.00752 -0.199 -0.24312 -0.19628 1
Z5_RELIGIOUS-0.1445 0.007679 0.193777 0.218261 0.129351 0.024296 1
Z6_EDU -0.00244 0.397505 0.134596 0.040003 -0.00699 0.109303 -0.04257 1
Z7_OCCUPATION
0.049612 0.467923 0.166413 0.044592 -0.09273 0.017422 -0.03972 0.533605 1

 Kết quả.
 BT thực hành excel: Tính matrận hệ số tương quan
cho các biến agewed sibs childs age educ và nhận
xét về mối quan hệ giữa các biến

5/12/2009 Nguyễn Duy Tâm _ IDR 41

Con người –Tầm nhìn mới


Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Chọn loại đồ thị là Scatter


5/12/2009 Nguyễn Duy Tâm _ IDR 42

21
5/12/2009

Con người –Tầm nhìn mới


Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Nhập số liệu
5/12/2009 Nguyễn Duy Tâm _ IDR 43

Con người –Tầm nhìn mới


Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn

 Các tùy chọn


5/12/2009 Nguyễn Duy Tâm _ IDR 44

22
5/12/2009

Con người –Tầm nhìn mới


Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Xuất ra trang riêng


5/12/2009 Nguyễn Duy Tâm _ IDR 45

Đồ thị phân tán: Con người –Tầm nhìn mới

Hài lòng phụ thuộc vào học vấn

 Chọn loại đồ thị là Scatter


5/12/2009 Nguyễn Duy Tâm _ IDR 46

23
5/12/2009

Đồ thị phân tán: Con người –Tầm nhìn mới

Hài lòng phụ thuộc vào học vấn

 Nhập số liệu
5/12/2009 Nguyễn Duy Tâm _ IDR 47

Đồ thị phân tán: Con người –Tầm nhìn mới

Hài lòng phụ thuộc vào học vấn

 Các tùy chọn


5/12/2009 Nguyễn Duy Tâm _ IDR 48

24
5/12/2009

Đồ thị phân tán: Con người –Tầm nhìn mới

Hài lòng phụ thuộc vào học vấn

 Xuất ra trang riêng


5/12/2009 Nguyễn Duy Tâm _ IDR 49

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới


CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 Số thứ tự trong tổng thể: Hàm Randbetween

5/12/2009 Nguyễn Duy Tâm _ IDR 50

25
5/12/2009

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới


CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 Điền kết quả lấy mẫu: Hàm Vlookup


5/12/2009 Nguyễn Duy Tâm _ IDR 51

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới


CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 MÔ PHỎNG BẰNG THỦ TỤC SAMPLING


 Tools/ Data Analysis/ Sampling

5/12/2009 Nguyễn Duy Tâm _ IDR 52

26
5/12/2009

MÔ PHỎNG LẤY MẪU LẶP LẠICon người –Tầm nhìn mới


CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

STT MẪU MẪU 1 MẪU 2 MẪU 3 MẪU 4 MẪU 5 MẪU 6 MẪU 7 MẪU 8 MẪU 9 MẪU 10
1 27 37 42 32 52 27 42 22 32 32
2 22 32 27 57 32 27 32 47 42 27
3 22 22 52 32 22 42 42 27 37 37
4 42 27 22 22 37 52 27 32 22 22
5 42 47 32 27 32 27 37 27 27 27
6 32 37 22 37 27 37 27 22 42 52
7 27 37 32 42 22 37 32 27 32 32
8 27 57 27 27 37 27 27 22 22 22
9 27 42 52 22 47 32 32 27 27 27
TRUNG BÌNH 29.78 37.56 34.22 33.11 34.22 34.22 33.11 28.11 31.44 30.89

 KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU


 LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN
Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9)

5/12/2009 Nguyễn Duy Tâm _ IDR 53

MÔ PHỎNG LẤY MẪU LẶP LẠI


Con người –Tầm nhìn mới

CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

TRUNG BÌNH CỦA TRUNG BÌNH MẪU 32.46


TRUNG BÌNH CỦA TỔNG THỂ 32.488

ĐỘ LỆCH CHUẨN CỦA TRUNG BÌNH MẪU 2.4237


ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ 9.2888
ĐỘ LỆCH CHUẨN CỦA TỔNG THỂ/3 3.0963

 TRUNG BÌNH: HÀM AVERAGE 


 ĐỘ LỆCH CHUẨN: HÀM STDEV
LƢU Ý: THEO LÝ THUYẾT THÌ X
 VÀ
 
X 
 n
 CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU

5/12/2009 Nguyễn Duy Tâm _ IDR 54

27
5/12/2009

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon


GIÁ TRỊ
người TRUNG
–Tầm nhìn mới
BÌNH (BiẾT )

 
X  Za / 2    X  Za / 2
n n
 Chọn a = 0.05 =>P(1-a/2)= 0.975
 Tra Za/2 = 1.96
 Tính trung bình = 32.49
 Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21)

5/12/2009 Nguyễn Duy Tâm _ IDR 55

ƢỚC LƢỢNG KHOẢNG TÌN Con


CẬY
ngườiCHO
–Tầm nhìn mới

GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )

S S
X  ta / 2,n1    X  ta / 2,n1
n n
 Chọn a = 0.05 =>P(1-a/2)= 0.975
 Tra ta/2 = 1.964
 Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29
 Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)

5/12/2009 Nguyễn Duy Tâm _ IDR 56

28
5/12/2009

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHOCon GIÁ TRỊ


người TRUNG
–Tầm nhìn mới
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS

 Tools/ Data Analysis/ Descriptive Statistics


 Chọn Summary Statistics và Confidence Level for Mean
5/12/2009 Nguyễn Duy Tâm _ IDR 57

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG


Con người –Tầm nhìn mới
BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS

S S
X  ta / 2,n1    X  ta / 2,n1
n n

 Cận dƣới = Mean – Confidence Level (95%)


 Cận trên = Mean + Confidence Level (95%)

5/12/2009 Nguyễn Duy Tâm _ IDR 58

29
5/12/2009

Con người –Tầm nhìn mới


Bài tập ƣớc lƣợng

BÀI TẬP “THUC HANH


BÀI TẬP AFFAIR
EXCEL
1. Ước lượng độ tuổi bình 1. Ước lượng độ tuổi bình
quân (age) của những quân (age) của những
người được khảo sát. người được khảo sát
2. Ước lượng độ tuổi bình
quân kết hôn (agewed).
3. Ước lượng trình độ học
vấn (educ) bình quân của
những người được khảo
sát.

5/12/2009 Nguyễn Duy Tâm _ IDR 59

Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới


Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm

 Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…

5/12/2009 Nguyễn Duy Tâm _ IDR 60

30
5/12/2009

Kiểm định 1 đuôi (Biết s) Con người –Tầm nhìn mới


Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm

 Giá trị Z = 11.44 nằm ở miền bác bỏ


 =>Có bằng chứng thống kê cho thấy số năm học trung bình của
người Mỹ lớn hơn 15 năm.
5/12/2009 Nguyễn Duy Tâm _ IDR 61

Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra
ứng với 2a.

5/12/2009 Nguyễn Duy Tâm _ IDR 62

31
5/12/2009

Kiểm định 1 đuôi (Không biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho.
Vậy số năm học trung bình của người Mỹ cao hơn 16.

5/12/2009 Nguyễn Duy Tâm _ IDR 63

Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới


Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)

5/12/2009 Nguyễn Duy Tâm _ IDR 64

32
5/12/2009

Kiểm định 2 đuôi (Biết s) Con người –Tầm nhìn mới


Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải
nhập tham số là (1-a/2)
Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.

5/12/2009 Nguyễn Duy Tâm _ IDR 65

Kiểm định 2 đuôi (Chƣa biết s) Con người –Tầm nhìn mới
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm TINV(a, n-1)


5/12/2009 Nguyễn Duy Tâm _ IDR 66

33
5/12/2009

Con người –Tầm nhìn mới


Kiểm định 2 đuôi (Chƣa biết s)
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm
Z6_EDU Trung bình 16.17
9 Độ lệch chuẩn = 2.40
16 Cỡ mẫu n= 601
14 Sai số chuẩn = 0.10
17 a= 0.05
14 t a/ 2 = 1.964
14
18 Ho:  = 16
17 H1  <> 16
20
17 Trị thống kê t= 1.70

Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể
bác bỏ Ho.

5/12/2009 Nguyễn Duy Tâm _ IDR 67

Con người –Tầm nhìn mới


Bài tập kiểm định

BÀI TẬP AFFAIR BTẬP THỰC HÀNH EXCEL

1. Có giả thiết cho rằng, 1. Có giả thiết cho rằng, độ tuổi (age) bình
độ tuổi (age) bình quân quân của những người được khảo sát là
của những người được dưới 40. Bạn hãy kiểm định giả thiết
khảo sát là dưới 30. nàyα=5%.
Bạn hãy kiểm định giả 2. Có giả thiết cho rằng, độ tuổi (age) bình
thiết này với mức ý quân của những người được khảo sát là
nghĩa α=5%. 46. Theo bạn, đúng hay sai α=3%?
2. Có giả thiết cho rằng, 3. Có giả thiết cho rằng, độ tuổi (agewed)
độ tuổi (age) bình quân bình quân của những người được khảo
của những người được sát là dưới 40. Bạn hãy kiểm định giả
khảo sát là 33. Theo thiết này α=4%.
bạn, giả thiết này đúng
hay sai? (α=10%)
5/12/2009 Nguyễn Duy Tâm _ IDR 68

34
5/12/2009

Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá


Con người trịmới
–Tầm nhìn p
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định


x: Giá trị của phát biểu Ho, Sigma: Nhập  nếu biết hoặc để trống
nếu không biết.
5/12/2009 Nguyễn Duy Tâm _ IDR 69

Con người –Tầm nhìn mới


Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p
Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

P_Value = 2*Min(ZTEST, 1-ZTEST)


P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho.

5/12/2009 Nguyễn Duy Tâm _ IDR 70

35
5/12/2009

Con người –Tầm nhìn mới


Kiểm định sự khác biệt về trung bình của hai tổng
thể-Biết độ lệch chuẩn Affair.xls trang Edu
OBS MALE EDU(FEMALE) OBS MALE EDU(MALE) EDU(FEMALE) EDU(MALE)
1 0 9 1 1 9 Trung bình 15.26 17.17
2 0 9 2 1 9 Độ lệch chuẩn 2.02 2.39
3 0 9 3 1 9 Số quan sát 315 286
4 0 9 4 1 12
5 0 12 5 1 12

 Ho: Không có sự khác biệt về học vấn trung bình của


hai giới
 Kết quả khảo sát cho thấy học vấn trung bình của
nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.
 Kiểm định Ho bằng thủ tục
 Tools | Data Analysis | z-test: Two Sample for Means

5/12/2009 Nguyễn Duy Tâm _ IDR 71

Kiểm định sự khác biệt về trungConbình củanhìn


người –Tầm hai mới

tổng thể-Biết độ lệch chuẩn

Tools | Data Analysis | z-test: Two Sample for Means


5/12/2009 Nguyễn Duy Tâm _ IDR 72

36
5/12/2009

Kiểm định sự khác biệt về trung bình của


Con người hai
–Tầm nhìntổng
mới

thể-Biết độ lệch chuẩn

Kết quả kiểm định: Bác bỏ Ho


5/12/2009 Nguyễn Duy Tâm _ IDR 73

Kiểm định sự khác biệt về trung bình của


Con người hai
–Tầm nhìntổng
mới

thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances

5/12/2009 Nguyễn Duy Tâm _ IDR 74

37
5/12/2009

Kiểm định sự khác biệt về trung bình của


Con người hai
–Tầm nhìntổng
mới

thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới
Tools | Data Analysis | t-Test: Two Sample Assuming Equal
Variances
Kết quả: Bác bỏ Ho

5/12/2009 Nguyễn Duy Tâm _ IDR 75

Con người –Tầm nhìn mới


Bài tập kiểm định mức lƣơng trung bình theo giới tính

1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa
nam và nữ là như nhau. Với số liệu của bài tập Tien luong
khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả
thiết trên.
2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện
tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua
software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới
và cũ.

5/12/2009 Nguyễn Duy Tâm _ IDR 76

38
5/12/2009

Kiểm định F cho sự khác biệt về phƣơng sainhìn


Con người –Tầm củamới

hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Tools | Data Analysis | F-Test: Two-Sample for Variances

5/12/2009 Nguyễn Duy Tâm _ IDR 77

Kiểm định F cho sự khác biệt về phƣơng sainhìn


Con người –Tầm củamới

hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới
Kết quả: Bác bỏ Ho

5/12/2009 Nguyễn Duy Tâm _ IDR 78

39
5/12/2009

Con người –Tầm nhìn mới


Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt
về hạnh phúc không? Affair.xls/ Satisfaction

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.


 Tools | Data Analysis… | t-test: Paired Two Sample for Means

5/12/2009 Nguyễn Duy Tâm _ IDR 79

Kiểm định mẫu cặp: Vợ và chồng Con


cóngười
cảm–Tầm
nhận
nhìn mới

khác biệt về hạnh phúc không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.


 Kết quả: Chấp nhận Ho.

5/12/2009 Nguyễn Duy Tâm _ IDR 80

40
5/12/2009

Con người –Tầm nhìn mới


Bài tập kiểm định cặp

 Có giả định cho rằng, hiệu quả của một phương pháp quảng
cáo được tiến hành cho nhiều công ty khác nhau hiện tại
không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang
cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên

5/12/2009 Nguyễn Duy Tâm _ IDR 81

HÀM TTEST-Kiểm định sựConkhác biệt


người –Tầm nhìn mới

 fx/ Statistical/ TTEST


 Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho
phƣơng sai khác nhau

5/12/2009 Nguyễn Duy Tâm _ IDR 82

41
5/12/2009

ANOVA: Vợ và chồng có có mức độConhài


ngườilòng vềmới
–Tầm nhìn hôn
nhân trung bình khác nhau không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.


 Tools/ Data Analysis/ ANOVA-Single Factor

5/12/2009 Nguyễn Duy Tâm _ IDR 83

ANOVA: Nam và nữ có có mức độ hài


Con người –Tầm nhìn mới

lòng về hôn nhân khác nhau không?


Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
WIFE 250 999 4.00 1.30
HUSBAND 250 984 3.94 1.06

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.45 1.00 0.45 0.38 0.54 3.86
Within Groups 586 498 1.18

Total 586 499


Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau.
 Kết quả: Chấp nhận Ho

5/12/2009 Nguyễn Duy Tâm _ IDR 84

42
5/12/2009

ANOVA một nhân tố-Ví dụ chƣơng 8 Worksheet


Con người –Tầmin
nhìn mới

Chapter8(V)

 So sánh năng suất của 3 máy


 Ho: Năng suất của 3 máy là như nhau

5/12/2009 Nguyễn Duy Tâm _ IDR 85

ANOVA một nhân tố-Ví dụConchƣơng


Anova: Single Factor
8mới
người –Tầm nhìn

SUMMARY
Groups Count Sum Average Variance
Machine 1 5 124.65 24.93 1.06
Machine 2 5 113.05 22.61 0.78
Machine 3 5 102.95 20.59 0.92

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 47.16 2 23.58 25.60 0.00 3.89
Within Groups 11.05 12 0.92

Total 58.22 14
Ho: Năng suất của 3 máy là như nhau
Kết quả kiểm định: Bác bỏ Ho
5/12/2009 Nguyễn Duy Tâm _ IDR 86

43
5/12/2009

Con người –Tầm nhìn mới


Thủ tục Tukey-Kramer

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test


 Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel.

5/12/2009 Nguyễn Duy Tâm _ IDR 87

Con người –Tầm nhìn mới


Thủ tục Tukey-Kramer

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test

5/12/2009 Nguyễn Duy Tâm _ IDR 88

44
5/12/2009

Thủ tục Tukey-Kramer Con người –Tầm nhìn mới


Tukey-Kramer Test

Critical
v k Value Q MS within
9 3 3.948 0.921

MSD Values

Meani-Meanj
Stack Machine 1 Machine 2 Machine 3
Machine 1 1.695 1.695
Machine 2 2.320 1.695
Machine 3 4.340 2.020

If Meani-Meanj > MSD value then pair is significantly different at the 5% level (1 Tailed)
Significant pair values are in bold and underlined in above Table

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test


5/12/2009 Nguyễn Duy Tâm _ IDR 89

Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới

 Hệ số chặn: fx/ Statistical/ INTERCEPT


 Độ dốc: fx/ Statistical/ SLOPE

5/12/2009 Nguyễn Duy Tâm _ IDR 90

45
5/12/2009

Tìm hệ số chặn và độ dốc Con người –Tầm nhìn mới

 Hệ số chặn: fx/ Statistical/ INTERCEPT


 Độ dốc: fx/ Statistical/ SLOPE

5/12/2009 Nguyễn Duy Tâm _ IDR 91

Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới

 Click phải/ Add Trendline/

5/12/2009 Nguyễn Duy Tâm _ IDR 92

46
5/12/2009

Vẽ đƣờng xu hƣớng trong Chart Con người –Tầm nhìn mới

 Type: Linear
 Options: Display Equation on chart
5/12/2009 Nguyễn Duy Tâm _ IDR 93

Con người –Tầm nhìn mới


Vẽ đƣờng xu hƣớng trong Chart
12,000

y = 1.5x + 1636.4
10,000 R2 = 0.9

8,000
Sales

Sales
6,000
Linear (Sales)

4,000

2,000

0
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage

 Kết quả

5/12/2009 Nguyễn Duy Tâm _ IDR 94

47
5/12/2009

Thủ tục REGRESSION Con người –Tầm nhìn mới

 Tools/ Data Analysis/ REGRESSION


5/12/2009 Nguyễn Duy Tâm _ IDR 95

Con người –Tầm nhìn mới


KẾT QUẢ
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.97
R Square 0.94
Adjusted R Square 0.93
Standard Error 611.75
Observations 7

ANOVA
df SS MS F Significance F
Regression 1 30,380,456 30380456 81.18 0.00
Residual 5 1,871,200 374240
Total 6 32,251,656

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 1,636.41 451.50 3.62 0.02 475.81 2,797.02
Footage 1.49 0.16 9.01 0.00 1.06 1.91

5/12/2009 Nguyễn Duy Tâm _ IDR 96

48
5/12/2009

Từ bảng kết xuất của Excel Con người –Tầm nhìn mới

Residuals

12000
Predicted Sales and Residuals

10000

8000

6000
Predicted Sales
4000 Residuals

2000

0 2 4 6 8
-2000

Observations

5/12/2009 Nguyễn Duy Tâm _ IDR 97

Phần dƣ theo biến độc lập Con người –Tầm nhìn mới

Footage Residual Plot

1000
800
600
400
Residuals

200
0
-200 0 1,000 2,000 3,000 4,000 5,000 6,000
-400
-600
-800
Footage

5/12/2009 Nguyễn Duy Tâm _ IDR 98

49
5/12/2009

Con người –Tầm nhìn mới


Real and Fitted Values

Footage Line Fit Plot

12,000
y = 1.4866x + 1636.4
10,000 2
R =1

8,000
Sales

6,000
Sales
4,000
Predicted Sales
2,000
Linear (Predicted
0 Sales)
0 1,000 2,000 3,000 4,000 5,000 6,000
Footage

5/12/2009 Nguyễn Duy Tâm _ IDR 99

Tools/ Data Analysis/ Regression


Con người –Tầm nhìn mới

 Hồi quy đơn: Oil theo Temp

5/12/2009 Lê Tấn Luật 100

50
5/12/2009

Con người –Tầm nhìn mới


Hồi quy đơn: Oil theo Temp
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.87
R Square 0.76
Adjusted R Square 0.74
Standard Error 66.51
Observations 15

ANOVA
df SS MS F Significance F
Regression 1 178624 178624 40 0.00
Residual 13 57511 4424
Total 14 236135

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 436.43823 38.63970893 11.29507 4.3E-08 352.962214 519.914246
Temp -5.4622077 0.859608768 -6.3543 2.52E-05 -7.3192795 -3.6051359

5/12/2009 Lê Tấn Luật 101

Hồi quy đơn: Oil theo Insulation Con người –Tầm nhìn mới

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.47
R Square 0.22
Adjusted R Square 0.16
Standard Error 119
Observations 15

ANOVA
df SS MS F Significance F
Regression 1 51,076 51,076 3.59 0.08
Residual 13 185,059 14,235
Total 14 236,135

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 345.38 74.69 4.62 0.00 184.02 506.74
Insulation -20.35 10.74 -1.89 0.08 -43.56 2.86

5/12/2009 Lê Tấn Luật 102

51
5/12/2009

Con người –Tầm nhìn mới


Hồi quy bội: Oil theo Temp và Insulation
Quét Known’s X: cả Temp và Insulation
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.98
R Square 0.97
Adjusted R Square 0.96
Standard Error 26.01
Observations 15

ANOVA
df SS MS F Significance F
Regression 2 228015 114007 168 0.00
Residual 12 8121 677
Total 14 236135

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 562.15 21.09 26.65 0.00 516.19 608.11
Temp -5.44 0.34 -16.17 0.00 -6.17 -4.70
Insulation -20.01 2.34 -8.54 0.00 -25.12 -14.91

5/12/2009 Lê Tấn Luật 103

Con người –Tầm nhìn mới


Biến Insulation có cải thiện mô hình từ Oil
= f(Temp) không?

 Kết quả tính toán cho Fc = 73

5/12/2009 Lê Tấn Luật 104

52
5/12/2009

Tra giá trị tới hạn của F: FINV Con người –Tầm nhìn mới

 Kết quả tính toán F* = 4.75


 F =73 > F*: 4.75 Kết luận: Insulation làm
tăng mức độ giải thích của mô hình.
5/12/2009 Lê Tấn Luật 105

Hồi quy bậc hai: Chuẩn bị số


Con liệu
người –Tầm nhìn mới

Temp2=Tem^2
Oil (Gal) Temp Temp2
275.30 40 1600
363.80 27 729
164.30 40 1600
40.80 73 5329
94.30 64 4096
230.90 34 1156
366.70 9 81
300.60 8 64
237.80 23 529
121.40 63 3969
31.40 65 4225
203.50 41 1681
441.10 21 441
323.00 38 1444
52.50 58 3364
5/12/2009 Lê Tấn Luật 106

53
5/12/2009

Kết quả hồi quy Con người –Tầm nhìn mới

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.88
R Square 0.78
Adjusted R Square 0.74
Standard Error 65.71
Observations 15

ANOVA
df SS MS F Significance F
Regression 2 184,324 92,162 21 0.00
Residual 12 51,811 4,318
Total 14 236,135

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 372.33 67.60 5.51 0.00 225.04 519.62
Temp -1.26 3.75 -0.34 0.74 -9.44 6.91
Temp2 -0.05 0.05 -1.15 0.27 -0.15 0.05

5/12/2009 Lê Tấn Luật 107

Hồi quy với biến giả Con người –Tầm nhìn mới

 TC = Tổng chi phí sản xuất


 Q = Tổng sản lượng
 CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý
trước khi thay đổi công nghệ.
 TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý
trước khi thay đổi công nghệ.

5/12/2009 Lê Tấn Luật 108

54
5/12/2009

Sai lầm -> Đa cộng tuyếnConhoàn hảo


người –Tầm nhìn mới
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.78
Standard Error 56.65
Observations 16

ANOVA
df SS MS F Significance F
Regression 3 291,681 97,227 45 0.00
Residual 13 41,727 3,210
Total 16 333,408

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 521.80 122.46 4.26 0.00 257.24 786.35
Q 0.81 0.10 8.04 0.00 0.59 1.03
CN 0.00 0.00 65,535.00 #NUM! 0.00 0.00
TCN 210.63 52.80 3.99 0.00 96.55 324.70

5/12/2009 Lê Tấn Luật 109

Hồi quy với biến giả Con người –Tầm nhìn mới

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.94
R Square 0.87
Adjusted R Square 0.86
Standard Error 56.65
Observations 16

ANOVA
df SS MS F Significance F
Regression 2 291,681 145,841 45.44 1.36E-06
Residual 13 41,727 3,210
Total 15 333,408

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 732.42 79.51 9.21 0.00 560.65 904.20
Q 0.81 0.10 8.04 0.00 0.59 1.03
CN -210.63 52.80 -3.99 0.00 -324.70 -96.55

5/12/2009 Lê Tấn Luật 110

55
5/12/2009

Hồi quy với biến tƣơng tác Con người –Tầm nhìn mới
SUMMARY OUTPUT
CNQ = CN*Q
Regression Statistics
Multiple R 0.98
R Square 0.96
Adjusted R Square0.95
Standard Error 33.19
Observations 16

ANOVA
df SS MS F Significance F
Regression 3 320190 106730 96.90 1.11913E-08
Residual 12 13218 1102
Total 15 333408

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 401.52 80.00 5.02 0.00 227.21 575.83
Q 1.24 0.10 11.98 0.00 1.02 1.47
CN 368.96 118.05 3.13 0.01 111.75 626.17
CNQ -0.64 0.13 -5.09 0.00 -0.92 -0.37

5/12/2009 Lê Tấn Luật 111

Ý nghĩa của biến giả và biếnContƣơng tác


người –Tầm nhìn mới

TC = 401 + 1.24*Q + 368*CN – 0.64CNQ


P (0.00) (0.00) (0.01) (0.00)
2
R = 0.96
Adjusted R2= 0.95
n= 16
Trước thay đổi công nghệ: CN=CNQ=0
TC = 401 + 1.24*Q
Sau thay đổi công nghệ: CN=1, CNQ=Q
TC = (401+368) + (1.24-0.68)*Q
TC = 769 + 0.56*Q
Vậy thay đổi công nghệ làm định phí tăng nhưng biến
phí đơn vị giảm.

5/12/2009 Lê Tấn Luật 112

56
5/12/2009

Hồi quy với biến chuyển dạng log-log


Con người –Tầm nhìn mới

Mô hình tuyến tính: Q=b1+b2*L+b3*K


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.99
R Square 0.99
Adjusted R Square 0.99
Standard Error 1,570.36
Observations 15

ANOVA
df SS MS F Significance F
Regression 2 2686989117 1.34E+09 545 1.67092E-12
Residual 12 29592539.09 2466045
Total 14 2716581656

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept -32,375.93 3,140.85 -10.31 0.00 -39,219.24 -25,532.61
L 2.62 6.43 0.41 0.69 -11.39 16.62
K 344.47 40.87 8.43 0.00 255.43 433.51

5/12/2009 Lê Tấn Luật 113

Con người –Tầm nhìn mới


Chuyển dạng log-log

Hàm sản xuất Cobb-Douglas


Q = A*La*Kb (1)
Không thể ước lượng trực tiếp hàm (1)
ln(Q) = ln(A) + a*ln(L) + b*ln(K)
Y = b0 + b1*X1 + b2*X2
Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K)
Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông
thường

5/12/2009 Lê Tấn Luật 114

57
5/12/2009

Chuẩn bị số liệu log-log: Hàm Con


ln(Number)
người –Tầm nhìn mới

lnQ lnL lnK


9.10 5.64 4.79
9.29 5.65 4.81
9.32 5.67 4.83
9.31 5.93 4.86
9.45 5.93 4.88
9.70 6.00 4.90
9.88 6.17 4.93
9.96 6.32 4.99
10.05 6.42 5.04
10.17 6.54 5.10
10.29 6.67 5.18
10.42 6.70 5.24
10.55 6.74 5.33
10.76 6.77 5.40
10.90 6.91 5.48

5/12/2009 Lê Tấn Luật 115

Kết quả hồi quy Con người –Tầm nhìn mới

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.99
R Square 0.98
Adjusted R Square 0.97
Standard Error 0.09
Observations 15

ANOVA
df SS MS F Significance F
Regression 2 4 2 267 1.13248E-10
Residual 12 0 0
Total 14 5

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept -0.38 0.78 -0.49 0.63 -2.07 1.31
lnL 0.67 0.17 3.85 0.00 0.29 1.04
lnK 1.22 0.34 3.56 0.00 0.47 1.96

5/12/2009 Lê Tấn Luật 116

58

You might also like