Professional Documents
Culture Documents
TỔNG SỐ 30 TIẾT
1
Thống kê trong giáo dục
Chương I- Một số khái niệm cơ bản
1. Thống kê là gì
Là khoa học nghiên cứu các hệ thống - Làphương phápthập
hoạt độngThu thuphiếu.
thập, xử lý
và phân tích các con số (mặt lượng)- của hiện
Là hoạt tượng
động kiểmsốkê lớn để tìm
- Là hoạt
hiểu bản chất, tính quy luật vốn có của động
chúng thu thập,
(mặt chất)xửtrong
lý, phân
tích các con số...
điều kiện, địa điểm và thời gian cụ thể.
Khái niệm Thống kê trong giáo dục: Là hoạt động thu thập, xử lý
và phân tích các con số (mặt lượng) các hiện tượng Giáo dục
2
Một sô khái niệm
2.5 Tổng thể không đồng chất: bao gồm các đơn vị có nhiều đặc điểm
chủ yếu khác nhau (VD: Tầng lớp Sinh viên và Công nhân; nông dân...).
2.6 Tổng thể chung: bao gồm tất cả các đơn vị thuộc phạm vi nghiên
cúu (VD: các mặt hoạt động trong một cơ sở GD nào đó).
2.7 Tổng thể bộ phận: bao gồm một số bộ phận đơn vị trong tổng thể
chung đưa ra nghiên cúu (VD: vấn đề chuyên môn trong một cơ sở GD).
3 Tiêu thức thống kê:
3.1: Khái niệm: Chỉ đặc điểm của đơn vị tổng thể. Vậy đơn vị tổng thể
có bao nhiêu đặc điểm thì có bấy nhiêu tiêu thức
VD: Người Việt Nam (tổng thể). Màu da: vàng (tiêu thức1); giới tính
(tiêu thức2); trình độ học vấn (tiêu thức3)...
3.2: Tiêu thức thuộc tính: Phản ánh các tính chất của tổng thể không
biểu hiện trực tiếp bằng con số (VD tình trạng hôn nhân; nhân cách; sở
thích học vấn ..)
3.3: Tiêu thức số lượng: Có biểu hiện trực tiếp bằng con số (VD Chiều
4
cao, cân nặng)
4. Biến
Mộtngẫu
số khái nhiên (biến lượng, biến định tính, định hạng...).
niệm (tiếp)
Một đại lượng mà giá trị của nó là ngẫu nhiên, không dự đóan trước được
gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên (VD: kết quả nhận được sẽ
là 1 trong 6 mặt của con súc xắc: X1=1; hoặc 2; hoặc 3...)
(3 phần tử xếp hạng sau 3 thì số xếp hạng của mỗi phần tử là (4+5+6)/3=5)
4.1. Biến định lượng: Biến mà giá trị của nó có thể xác định bằng việc
đo lường được (gồm biến định lượng liên tục, biến định lượng rời rạc).
+/ Biến rời rạc: Là lượng biến chỉ biểu hiện bằng số nguyên, giữa
lượng biến này và lượng biến kia cách nhau ít nhất 1 số nguyên.
VD: Số xe bán ra fải là 1 hoặc 2 hoặc 3
+/ Biến liên tục: Là lượng biến biểu hiện bằng con số bất kỳ có thể là
số nguyên hay thập phân .
VD: Thời gian hoàn thành 1 bài tập từ 30 - 60 phut
4.2. Biến định tính: Biến mà giá trị của nó được gán để phân lọai hay
phân biệt (VD : Gioi tính, tình trạng hôn nhân, kết quả học tập...) 5
Bài tập về khái niệm
Bài mẫu: (biến định lượng) xác định tổng thể chung; tiêu thức trong ví dụ
sau: trong lớp học gồm n Học sinh. Tốc độ làm 1 công việc A của các HS:
HS1 mất 7 phut; HS2 mất 9,5 phut; HS3 mất 11 phut;
Tổng thể chung tổng thể bộ phận Tiêu thức Biến X(định lượng)
Bài mẫu: (biến định tính) xác định tổng thể chung; tiêu thức: Kiểm tra n lời
giải môn tóan. Chất lượng lời giải 1 đúng ; lời giải 2 sai; lời giải 3 sai...
Tổng thể chung tổng thể bộ phận Tiêu thức Biến X(định tính)
n lời giải lời giải 1 Chất lượng lời giả x1=đúng
lời giải 2 x2= sai
lời giải 3 x3 = sai
....... 6
bài tạp biến
Bài mẫu: Biến định hạng: Trong tập thể n GV: Uy tín của GV1 đứng thứ 5;
GV 2 đứng thứ 1 ; GV3 đứng thứ 7
Tổng thể chung tổng thể bộ phận Tiêu thức Biến X(định hạng)
n GV GV1 Uy tin trong tập x1=5 (thứ5)
GV2 thể x2=1 (thứ 1)
GV3 x3 =7 (thứ 7)
.......
+/ Đối tượng nghiên cứu là quy luật đào tạo con người nên rất phức
tạp. luôn biến động. Ảnh hưởng nhiều nhân tố khách quan và chủ
quan khó lường hết được. Khó dự đoán được kết quả từng thí nghiệm
riêng lẻ.
+/ Hàng loạt thí nghiệm mang tính ngẫu nhiên liên tiếp không theo
quy luật nhưng kết quả trung bình của một dãy khá nhiều thí nghiệm
lại có tính ổn định.
+/ Xử lý số lượng lớn các số liệu: Thống kê giúp đúc kết được các số
liệu đánh giá chất lượng. So sánh hiệu quả của 2 phương pháp giáo
dục, phân tích mối liên hệ giữa các hiện tượng giáo dục, phân tích
được tác động các nhân tố đối với một hiện tượng Giáo dục. 9
5 - Vị trí và tầm quan trọng của Thống kê trong QLGD
5.1 Vị trí: Thống kê xuyên suốt quá trình Quản lý.
ChØ
®¹o
Thống kê : Ở khâu đầu của QL; ở khâu cuối của QL
hay trong suốt quá trình QL ? 10
5.2. Tầm quan trọng: Giúp người cán bộ quản lý nắm bắt thông tin một
cách tổng thể
Mục 5; 6: HV tự nghiên cứu thêm tài liệu phát tay Thống kê trong QLGD. 11
7. Cấu trúc của Thống kê
TK= F(O,M,P)
Định
tính
Định
lượng
12
8. Mô hình nghiên cứu thống kê (7 bước)
Xác định mục tiêu nghiên cứu. Phân tích đối 1
tượng, xác định nội dung vấn đề nghiên cứu
Lựa chọn các phương pháp Chọn các chương trình nhập và
5 5
thống kê thích ứng. xử lý số liệu trên máy vi tính
Cáchxử
Cách xửlý
lý
sốliệu
số liệu
Lưutrữ
Lưu trữ
14
Ví dụ
Nhóm 1: điều tra Sĩ số Hs vào đầu lop 1 trong địa bàn xã , phường nơi trường đóng.
Nhằm xay dựng kế hoạch năm học và phổ cập GD trong dịa bàn
Nhóm 2. Thống kê HS yếu kém trong năm học 07-08, nhằm đề xuất cách khắc
phục
Nhóm 3 - điều tra tre 5 tuổi trong địa ban xa Yên Ninh, nhằm xác định đầu vào
Nhóm 4 - điều tra tre 5 tuổi trong địa ban xa Thọ xuân, lên kế hoạch trang bị cơ sở
vật chất đón đầu vào
Nhóm 5 - Thống kê trẻ độ tuổi 6 - 14 tuổi tại địa Thạch Thành, Phổ cập đúng độ
tuổi
Nhóm 6 - Trẻ 5 tuôi ở địa bàn Dân lực. Nhằm phổ cập dự án QG 2007-2008
Nhóm 7 - Kiểm tra sức khoẻ trẻ 07-08 nhằm có biên pháp chăm sóc trẻ
Nhóm 8 - Điều tra số trẻ trong độ tuổi từ 3- 5 tuổi để huy động ra lớp
15
Chương 2: Các phương pháp chọn mẫu
1. Khái niệm mẫu:
Mẫu là loại điều tra không toàn bộ, trong đó chỉ chọn một số đơn vị trong
tòan bộ các đơn vị của hiện tượng nghiên cứu để điều tra thực tế . Các đơn
vị này được chọn theo những nguyên tắc nhất định để đảm bảo tính đại
diện . Kết quả điều tra thường để đánh giá cho toàn bộ hiện tượng nghiên
cứu.
2. Các yêu cầu của chọn mẫu:
+/ Mang tính ngẫu nhiên: Đảm bảo tính khách quan. không phụ thuộc vào ý
muốn chủ quan (bốc thăm; dùng bảng số ngẫu nhiên...)
+/ Đảm bảo tính đại diện: Mẫu được chọn mang nhiều đặc tính với tổng thể
+/ Phải mang tính đồng nhất:Mẫu phải cùng chủng loại, hoặc có đặc tính
gần chủng loại.
Mẫu là bộ phận đặc trưng cho đối tượng hoặc mang đặc tính gần đối tượng.16
3. Các phương pháp chọn mẫu
phương pháp
chọn mẫu
- Mẫu ngẫu nhiên đơn giản: hoàn lại và không hoàn lại.
- Mẫu ngẫu nhiên phân tổ: Phân thành m tổ theo một tiêu thức nào đó
(VD phân các điểm từ 0 đến 10 thành 5 tổ. (0-2; 3-4; 5-6; 7-8; 9-10)
vậy 4,5 dưới thuộc tổ 5-6) và 6.5 là giới hạn trên Không thuộc tổ 5-6).
Tổ giói hạn trên hoặc dưới không được xác định gọi là tổ mở (VD: Tổ HS
từ 10 tuổi trở lên...)
- Mẫu cả cum: Điều tra theo từng nhóm (khối đơn vị). Mỗi nhóm đuợc
đièu tra hết không bỏ sót (VD: nghiên cứu toàn bộ GV của 1 số trường )
Ưu điểm điều tra chọn mẫu Nhược điểm điều tra chọn mẫu
- Nhanh
Đôi khi bị nhiễu Thông tin
- Tiết kiệm chi phí
- Bao giờ số liệu thống kê cũng
-Mở rộng nội dung
-Đi sâu hơn có sai lệnh ( sai số chọn mẫu)
17
-Số liệu chính xác.
4. Sai số chọn mẫu
4.1. Khái niệm. Là sự chênh lệch về trị số giữa các chỉ tiêu tính ra được
trong điều tra chọn mẫu và các chỉ tiêu tương ứng của tổng thể chung.
VD: Chênh lệch giữa các số bình quân (x-X) hoặc tỷ lê (P-w).
4.2 . Phương pháp xác định sai lệch mẫu:
- Sai lệch mẫu phụ thuộc vào n (số đơn vị của tổng thể mẫu), n càng lớn
thì sai lệch càng thấp . n=N thì thành cuộc điều ra toàn bộ
- Phụ thuộc vào tính chất đồng đều của tổng thể nghiên cứu. Phương sai
càng lớn thì sai số càng lớn . Nếu phương sai=0 thì không còn sai lệch
- Phụ thuộc vào chọn hoàn lại hoặc không hoàn lại, chọn ngẫu nhiên,
chọn máy móc hay chọn điển hình
Thông thường tính sai số ta cần tính sai số bình quân (độ tin cậy)
- Ký hiệu sai số bình quân : µ
18
Sai lệch mẫu là điều không tránh khỏi Dù mẫu có đúng quy cách đến bao nhiêu
4.3. Nguyên nhân sai số
- Sai số do tính chất đại biểu: Do điều tra chỉ thực hiện ngay trên một số
ít đơn vị nhưng kết quả lại suy rộng thành đặc điểm của tổng thể
- Sai số do ghi chép: (hiểu chưa đúng, Ghi nhầm; dụng cụ đo sai; tỷ lệ
không trả lời quá cao).
1 - Xác định số đơn vị mẫu điều tra (kích cỡ mẫu đủ khả năng đại diện cho
tổng thể).
2 - Quy định phạm sai số cho phép; Mức độ tin cậy (thường dưới 100%).
3- Ước tính độ lệch tiêu chuẩn
4 - Suy rộng các kết quả điều tra (ví dụ điều tra dân số khu vực thường kèm
với Điều tra sinh tử nhà ở)
5 - Chọn thời điểm (Ví dụ thời gian làm việc của 1 GV tại thời điểm trong
năm học hoặc trước kỳ thi…)
6 - Kiểm định mẫu ( giả thiết về quy luật phân phối xác xuất của mẫu, kiểm
định số liệu nghi ngờ (Số liệu quả lớn hay quá nhỏ so với số đông)
7. Huấn luyện người tham gia điều tra (có kinh nghiệm, nhiệt tình, trách
nhiệm)
20
6. Các phương pháp thống kê
Điều
Điềutra
tra hoàn
hoànlại
lại
1. Điều tra
( thường xuyên và Điều
HV đưa ra VD
Điềutra
trakhông
khônghoàn
hoàn
không thường xuyên) lại
lại
21
Bài tap2 (phân tổ)
Hãy phân nhóm các trường quy mô trường lớn, trung bình, nhỏ theo số HS
22
so tuyet doi
7.7.Số
Sốtuyệt
tuyệtđối
đối
Biểu
Biểuhiện
hiệnquy
quymômôkhối
khốilượng
lượngvàvàhiện
hiệntượng
tượngtrong
trong điều
điềukiện
kiệnthời
thờigian
gian
vàvàkhông
khônggian
giancụ
cụthể
thể(thời
(thờikỳ;
kỳ;thời
thờiđiểm)
điểm)
Ví dụ:Thời kỳ: Doanh thu chè Phú Thọ quý 4/2007 là 30 tỷ đồng )
Thời điểm: Tính đến ngày 20/2. sĩ số lớp QLX. là 56. người
- Có thể cộng số tuyệt thời kỳ của cùng một chỉ tiêu với nhau không?
Co
- Có thể cộng số tuyệt thời điểm của cùng một chỉ tiêu với nhau
không? Không
Không vì sao?
23
8. Số tương đối:
8.1.
8.1.Khái
Kháiniệm:
niệm:Biểu
Biểuhiện
hiệnquan
quanhệ
hệso
sosánh
sánhgiữa
giữa22mức
mứcđộđộcủa
củacác
cáchiện
hiện
tượng
tượngnghiên
nghiêncứu
cứucùng
cùngloại
loạinhưng
nhưngkhác
khácnhau
nhauvề
vềthời
thờigian
gianhoặc
hoặccó
cóliên
liên
quan
quanđến
đếnnhau
nhau
Đặc điểm của số tương đối : Hình thức biểu hiện: Lần; % ; ‰ hoặc đơn
vị kép khi nói lên mức độ tập trung : Kg/người; người/km2
Ví dụ: Tính đến 8/5/2006 đã có 1709,9 nghìn lượt thí sinh đăng ký dự thi
ĐH - CĐ, bằng 136,9% so với kỳ thi tuyển sinh năm 2005 là 1249,1 nghìn
8.2. Phân loại sô tương đối:
+/ Số tương đối động thái (biểu hiện sự biến động về mức độ hiện tượng
NC theo thời gian VD Tốc độ phát triển, chỉ số phát triển GDP)
+/ Số tương đối hoàn thành kế hoach: Biểu hiện tỷ lê giữa mức độ thực
tế đạt được trong kỳ so với mức độ kế hoạch đã đặt ra của chỉ tiêu nào
đó
24
số tương đối (tiếp)
+/ Số tương đối nhiệm vụ kế hoạch : Biểu hiện tỷ lệ giữa mức độ cần đạt
được trong thời kỳ so với mức độ chỉ tiêu của thời kỳ gốc
+/ Số tương đối kết cấu: Phản ánh tỷ trọng của mỗi bô phận cấu thành trong
tổng thể. Được xác định bằng cách so sánh trị số tuyệt đối của chỉ tiêu từng bộ
phận với trị số tuyệt đối chỉ tiêu của cả tổng thể. (VD: sản lượng ngô năm 2006
Miền Bắc là 1543,8 nghìn tấn ; cả nước là 1825,4 nghin tân. Vậy số tương đối
kết cấu = 1543,8/1825,4=84,57%
+/ Số tương đối so sánh: Biểu hiện quan hệ so sánh giữa các hiện tượng
cùng loại nhưng khác nhau về không gian hoặc so sánh giữa các bộ phận
trong cùng một tổng thể (Nam/Nữ trong một lớp).
+/ Số tương đối cường độ : Biểu hiện trình độ phổ biến của hiện tượng NC
trong điều kiện nhất định, được xác định bằng cách so sánh chỉ tiêu của 2
hiện tượng khác nhau nhưng có liên quan đến nhau (số người sử dụng
Internet/số dân). 25
Kết luận chung: Số tương đối phải tính từ 2 con số có mối quan hệ với
nhau, so sánh có ý nghĩa: số tương đối được tính bằng cách so sánh 2
mức độ khác nhau của cùng 1 chỉ tiêu trong điều kiện thời gian và không
gian khác nhau. Riêng số tương đối cường độ tính bằng cách so sánh 2
chỉ tiêu khác nhau có mối quan hệ với nhau để phản ánh 1 nội dung nhất
định vậy nói chung đều có ý nghĩa so sánh
Phải vận dụng kết hợp các số tương đối và tuyệt đối . Bởi có số tương đối rất
lớn nhưng ý nghĩa không đáng kể (1/2=50%) hoặc ngược lại (50/1000=5%)
làm 3Bài
bàitập
tập trên lớp: (mỗi bài SV tự làm 10 phút)
Bài 1: Một doanh nghiệp dự kiến đạt chỉ tiêu doanh thu ở kỳ kế hoạch tăng
3% so với kỳ gốc. Nhưng thực tế doanh nghiệp chỉ (tăng) hoặc (đạt )1% so
với kỳ gốc. Hỏi trong kỳ kế hoạch tỷ lệ % hoàn thành kế hoạch về chỉ tiêu là
bao nhiêu?
26
bai tap 2:
Bài 2: Tinh tỷ lệ % hoàn thành kế hoạch bình quân về chỉ tiêu giá trị tổng sản lượng
của quý 1, quý 2 , 6 tháng đầu năm biết:
loại sản quý 1 quý 2
phẩm
Giá trị TSL kế hoạch tỷ lệ % hoàn Giá trị TSL thực Tỷ lệ % hoàn
(triêu đồng) thành kế hoạch tế (triệu đồng) thành kế hoạch
bài 3: Tính tỷ lệ % sản phẩm đạt chất lượng bình quân trong Quý I; Quý 2; và 6
tháng
loại sản quý 1 quý 2
phẩm
tổng số SP sản suất ra tỷ lệ % phế Tổng số phế phẩm Tỷ lệ % phế
(nghìn cái) phẩm (cái) phẩm
A 1030 0,05 10 0,015
B 900 0,02 9 0,012
C 800 0,02 11 0,03
27
New Ex bài tập về nhà: Làm bài tập 8,9 tailiệu TK
Chương 3: Xử lý số liệu thống kê
Nhắc lại một số kiến thức có liên quan đến Thống kê
1 . Tần số: Số lần xuất hiện của một giá trị trong dãy giá trị
bài tập 1 : Lập bảng tần số và tần suất Số điểm của một HS như sau:
8 9 10 9 9 10 8 7 9 8 10 7 10 9 8 10 8 9 8 8 8 9 10 10
10 10 9 9 9 8 7
bài tập 2 : Lập bảng tần số và tần suất thời gian giải bài tập của 35 em
HS
3 10 7 8 10 9 6 4 8 7 8 10 9 5 8 8 6 6 8 8 8 7 6 10 5 8 7
8 8 4 10 5 4 7 9
fi
di =
Tần xuất: Là tỷ số giữa tần số và tất cả các giá trị ∑f i
28
Các đại lượng đặc trưng
1 n
1. Trung bình cộng:
X = ∑X
Là đặc trưng điển hình của toàn bộ tập hợp n i =1 i
Tên Điêm TB
Ưu: Rõ ràng dễ hiểu
An 2 6 8 8 10 6.8
Nhược: San bằng mọi chênh
Bình 5 6 7 7 9 6.8 lệch về lượng biến
12
An
R (An)= 10-2=8
Binh
10
R(Bình)=9-5=4 6
0
0 1 2 3 4 5 6
3. Trung bình gia quyền: Khi các lượng biến xuất hiện nhiều hơn
1 lần , tức là có tần số f(i) khác nhau, lúc đó x(i).f(i) gọi là gia
quyền n
∑f
i =1
i
4. Trung bình điều hòa: Được sử dụng trong trường hợp khi không
có sô liệu thống kê về số đơn vị tổng thể nhưng có số liệu thống kê về
n
tổng các lượng biến của tiêu thức
∑M
X =
i
i =1
Mn
∑ i
x
i =1
i
31
Trung vị
5. Khái niệm Trung vị: Là lượng biến của tiêu thức của đơn vị đứng ở
vị trí giữa trong dãy số lượng biến, chia dãy số lượng biến thành 2
phần (phần trên và phần dưới số trung vị) mỗi phần cùng có một số
đơn vị tổng thể bằng nhau
Cách tính:
* Nếu dãy lượng biến không có khoảng cách tổ
+/ Đơn vị tổng thể lẻ: n=2k+1 thì số trung vị đứng ở vị trí k+1
M(e)=X(k+1)
+/Đơn vị có tổng thể chẵn: n=2k thì số trung vị đứng ở vị trí giữa nhất
Me = [X(k)+X(k+1)]/2.
32
trung vị (tiep)
* Nếu dãy lượng biến có khoảng cách tổ (đều nhau hoặc không đều nhau)
+/ Xác định tổ chứa trung vị (tổ có chứa lượng biến của đơn vị ở vị trí
giữa trong tổng số các đơn vị) .
f
∑ −s i
. 2
M e−1
M =X +h
f
e M e min M e
Me
* Cách xác định tổ chứa trung vị (cộng tần số của tổ đầu tiên
có tổng tần số >=tổng tần số của dãy phân phối)
33
6. Mốt
6.1. Khái niệm: Là biểu hiện của tiêu thức gặp nhiều nhất trong tổng
thể hay trong một dãy số phân phối . Như vậy trong dãy số lượng biến
Mốt là lượng biến có tần số lớn nhất Cỡ giày tần số
6.2. Phương pháp xác định mốt:
40 32
- Đối với dãy số không có khoảng cách tổ :
41 37
Mốt là lượng biến có tần số lớn nhất 42 33
- Đối với dãy số có khoảng cách tổ: 43 25
Là lượng biến mà trên đó chứa mật độ phân phối lớn nhất .45 11
Nghĩa là xung quanh lượng biến ấy tập trung tần số nhiều nhất.
( f − f ) +( f ff− : tan
) so cua to thu i
0 M 0 m in i M
Mi
Mi i −M
1 iM iM
1 +
khoang cach
d − d to không đều
M = X + h. Mi M
i −1
nhau
(d − d ) + (d −d )
0 M 0 min iM
Mi M
i −1 M
i M
i 1 +
h M0 : khoang cach to chua Mot
fi
di = (Mat do tan so)
hi
la ty so cua tan so va do cao to thu i
6.3. Ý nghĩa của mốt: Biểu hiện mức độ phổ biến nhất của hiện tượng NC,
đồng thời nó không san bằng, bù trừ chênh lệch giữa các lượng biến, dùng
để thay thế tính số trung bình khi số trung bình gặp khó khăn. Nếu Số trung
bình, Trung vị và Mốt có giá trị bằng nhau thì dãy số đó có phân phối chuẩn35
bai tap Mot -Trung vi
mức điểm tần số Mật Độ trường hợp khoảng cách tổ
Tuyển sinh (d)
Tính theo công thức
30-40 12 12/10
40-50 37 37/10 M e=55+5*(100-71)/35=59,143
50-55 22 22/5
55-60 trung vi 35 35/5
60-65 (MOT) 37 37/5
65-72 16 16/7
72-80 10 10/8
80-90 21 21/10
90-110 10 10/20 Mot: có khoảng cách tổ không đều nhau
(có mật độ lớn nhất)
M(o)=60+5*(37/5-35/5)/(37/5-
35/5)+(37/5-16/7)= 60,363
36
ý nghĩa NC độ phân tán
∑ (x − x ) ∑ ( x − x ). f
d =
i i
i =1
d=
i
i =1 m
∑f
n i =1
i
Khi lượng biến xuất hiện 1 lần Khi lượng biến xuất hiện nhiều lần
Độ lệch trung bình tuyệt đối càng nhỏ thì tính chất đồng
đều của tổng thể càng lớn, tính chất đại biểu của số
trung bình số học càng cao và ngược lại
Dùng để tính chi tiết hơn độ phân tán của các lượng biến so với
38
trung bình
8 . Phương sai (δ 2 den ta binh
phương)
8.1. Khái niêm: Là trung bình cộng của bình phương các độ lệch
giữa lượng biến với số trung bình các luợng biến đó
m
∑ f (x −x )
n 2
∑ ( x −x)
2
δ = 2 i i
i =1
δ =
2 i
i =1
m
n ∑f
1
i
m ( ∑ f x) 2
phương sai càng nhỏ thì
∑x f −
2 i i
i =1
m
tính chất đồng đều của
i i
i =1
∑f tổng thể càng cao, tính
δ = 2 i
1
m chất đại biểu của số trung
∑f
i =1
i
bình số học càng cao và
ngược lại
39
9.9.Độ
Độlệch
lệchchuẩn
do lech chuan
chuẩn::
Cho
Chophép
phépxác
xácđịnh
địnhvị
vịtrí
trítrong
trongmối
mốiquan
quanhệ
hệvới
vớisố
sốtrung
trungbình
bình
∑ (x − x ) i
2
Ưu: Tính được độ lệch của lượng
δ= i =1
biến so với số trung bình
n Nhược: Tính toán phức tap
m Chịu ảnh hưởng giá trị đầu mút nên
∑ (x − x ) . f
i
2
i
dễ bị sai lệch kết quả
δ= i =1
m
∑f
1
i
Độ lệch chuẩn càng lớn thì độ phân
tán càng cao
Phương sai và độ lệch chuẩn là các sô đo độ phân tán của sự phân phối 40
Vi dụ Phương sai và Độ lệch chuẩn
Tên Điêm TB Độ lệch chuẩn
δAn = 1,6
An 4 6 7 8 9 6.8
Bình 5 6 7 7 9 6.8 δBình = 1,3
An Binh
xi |xi - x| (xi - x)2 xJ |xJ - x| (xJ - x)2
4 2,8 7,84 5 1,8 3,24
6 0,8 0,64 6 0,8 0,64
7 0,2 0,04 7 0,2 0,04
8 1,2 1,44 7 0,2 0,04
9 2,2 4,84 9 2,2 0,84
6,8 Σ 14,8 6.8 Σ 8,8
δ 2 = 14.8/5 = 2,96 δ 2 = 8.8/5 = 1,76 VD EX
41
Chương 4: Ước luợng Sai số
1. Nhiệm vụ:
+/ Từ số bình quân mẫu suy ra số bình quân tổng thể (x suy ra µ )
Tính năng suất lúa bình quân của các điểm điều tra→ tính sai số chọn
mẫu →suy ra năng suất lúa bình quân trên toàn bộ diện tích).
xε− x μ≤ x≤ ε+ x ε : phạm vi sai số
+/ Từ tỷ lệ mẫu suy ra tỷ lệ tổng thể (w suy ra P)
Bằng p.pháp chọn mẫu, Tính tỷ lệ sản phẩm hỏng → tính sai số chọn mẫu →
suy ra tỷ lệ sản phẩm hỏng của tổng số sản phẩm đã sản xuất ra.
Trong một nhà máy sản xuất được 50000 sản phẩm. trong đó 500 sản
phẩm không đúng quy cách. Vậy tỷ lệ p= 500/50000= 1% là tỷ lệ chung(p)
Nếu lấy ra 200 sản phẩm có 2 sản phẩm không đúng quy cách thì tỷ lệ
w= 2/200 = 1% là tỷ lệ mẫu (w) w − ε ≤ P≤ w+ ε
p p 42
2. Độ tin cậy (φ ) Phi
10.2.1. Là khái niệm cho biết mức độ ổn định, vững chãi của kết quả
đo được khi tiến hành đo đối tượng nhiều lần
φ = 0,80 trở lên đươc coi là độ tin cậy cao
φ =0,4 đến 0,79 : Tương đối tin cậy
φ =0,4 trở xuống : Tin cậy thấp.
Nếu độ tin cậy φ =0,95 (95%) nghĩa là: Nếu tiến hành chọn 1000 lần
thì có 950 lần có sai số không quá giói hạn ε . ước lương có sác xuất
sai lầm là α =1-φ = 1-0,95 = 0,05=5%)
3. Phạm vi sai số ε (epxilon)
ε =U σ
- Uα/2 hệ số tin cậy, (tra bảng)
σ= = =
n n n −1
(không hoàn lại)
δ n 2
s′ n 2 2
s n
σ= .(1 − ) = .(1 − ) = (1. )−
n N n N n− 1 N
δ 2: phương sai tổng thể
n 2
S,2 : phương sai điều chỉnh mẫu S′ = 2
S
S2: Phương sai mẫu. n −1
Trường hợp sử dụng Phương sai mẫu hoặc mẫu nhỏ ta thay n = n-144
Để Suy rộng tỷ lệ theo tiêu thức nào đó.
(hoàn lại)
p (1 − p) w (1-w )
σ= =
n n
(không hoàn lại)
p.(1-p) n w.(1-w) n
σ= .(1 −) = .(1− )
n N n N
w: là tỷ lê của tổng thể mẫu
Trường hợp sử dụng Phương sai mẫu hoặc mẫu nhỏ ta thay n = n-1 45
bảng phân phối chuẩn Lia-Pu-nop (theo φ rut gon).
σ=
Bài 1- Một trường học hàng năm điều tra chọn mẫu về năng lực n
thể chất của HS. Độ tin cậy là 0,9973; Phạm vi sai lệch là 0,05 .
Hãy tính số HS điều tra Biết độ lệch tiêu chuẩn là 0,25.
Bài 2- Một trường học tiến hành chọn mẫu xác định suy rộng Tỷ lệ:
tỷ lệ HS yếu kém. Độ tin cậy 0,9545 và phạm vi sai
w(1 − w)
số không quá 4%. Tỷ lê điều tra lần trước Hs yếu
σ =
kém của trường là 2%. Tính số HS yếu kém cho lần n
điều tra này
47
bai tap không hoàn lại suy rộng TB:
δ 2
n
bai1- có 5000 em HS khối lớp 6. mỗi lần chọn σ= −
.(1 )
ra 100 em để điều tra mức độ giải bài tập . Kết n N
quả mỗi đọt trung bình 65 em giải đúng. Biết
độ tin cậy =0,95. phương sai tổng thể =5. Hãy
tính tốc độ trung bình cho toàn thể khối 6.
bài 2- Trong 10000 linh kiện có Phương sai là 49. Chọn ra 1000 chiếc
(ngẫu nhiên không lặp lại). Trong lượng trung bình 50gam. . Tỷ lệ phế
phẩm 2%. Tính trọng lượng bình quân của toàn bộ linh kiện và sai
số tỷ lệ phế phẩm.
48
bai tap khong hoan lai suy rộng tỷ lệ
Bài 3: Theo kết quả điều tra 10% nhân khẩu của TP A bằng PP chọn mẫu ngẫu nhiên
không hoàn lại: Có 8% nhân khẩu là người già;14% nhân khẩu <16 tuổi; 18% là CN.
Tổng số nhân khẩu của TPA là 300.000 người với độ tin cậy 0,9545. (Uα/2 =2)
EX do tin cay Bài tập về nhà: 22; 23; 24 Tài liệu TK51
Tra bảng Student
Người ta đã chứng minh được rằng trường hợp mẫu nhỏ (n<30) thì
sử dụng bảng giá trị tới hạn Student
Cách tra như sau:
- Ví dụ: Độ tin cậy 0,9 (90%) với n=29
α =1-0,9=0,1 → α /2 = 0,05 .
Lấy ô giao giữa hàng trên cùng 0,05 và cột bên trái 28. Kết quả
tra bảng với α /2=0,05 và bậc n-1=28 ta có kết quả: 1,701
S ′ 2
S 2
′ S2 S2
X − Uμα X U ≤ ≤ α+ X − Uμα X U ≤ ≤ +α
2 n 2 n 2 n −1 2 n
− Voi n<30 mẫu nhỏ Tra bảng Student
S ′2 S 2
′ S 2
S 2
X − tμαn −1 X t ≤ ≤ +αn 1 − X − tμαn −1 X t ≤ ≤ +αn 1 −
2 n 2 n 2 n −1 2 n
53
Nếu chọn mẫu không hoàn ta nhân thêm với biểu thức trong căn (1-n/N)
Tổng hợp Suy rộng tỷ lệ
w -ε p ≤ P≤ w+ε p.
w(1-w)
ε = Uα (hoan) ε = Uα w(1-w) (1- n ) (khong hoan)
2 n 2 n N
n −1 w(1-w) w(1-w) n
ε=t α (hoan) ε=t n −1
α (1- ) (khong hoan)
2 n-1 2 n-1 N 54
bai tap uoc luong sai số
bài tập 1: Để dịnh mức thời gian cho một thao tác. người thời gian Số thao
(phut) tác
ta đã theo dõi thời gian như bảng bên. Độ tin cậy 95%
15-17 1
.Hãy xác định ước lượng thời gian gia công 1 thao tác
17-19 3
bài tập 2: Lãi suất cổ phiếu của 1 công ty trong 5 năm là 19-21 4
15%; 10%; 29%; 7%; 14% . Độ tin cậy 90% . Hãy ước 21-23 12
lượng độ phân tán của lãi suất cổ phiếu 23-25 3
bai tập 3: Chọn 100 người thăm dò bầu hiệu trưởng cho 25-27 2
ông A. Có 60 người nói rằng sẽ bỏ phiếu cho ông A. Tính
khoảng số người bỏ phiếu cho ông A với tin cậy 90%
δ2 δ2
X −U μα X ≤ U≤ + α
2 n 2 n
Chưa biết δ 2
với n≥ 30 n≥ 30
S2 S2 w(1-w) w(1-w
X − Uμα X U≤ ≤ + α
w − Uα ≤P ≤w +U α
2 n −1 2 n −1 2 n 2 n
Chưa biết δ 2
với n<30 n<30
S2 S2 n −1 w(1-w) n 1− w(1-w
n −1
X − tμ X t ≤ ≤ +α n 1−
w − t α ≤P ≤w +
tα
α/2
n −1 2 n −1 2 n −1 2 n −1
Truờng hợp không hoàn chỉ cần nhân thêm biểu thức trong căn với (1-n/N)
56
trường hợp nếu cho phương sai điều chỉnh mẫu thì chia cho n)
chương 5. Kiểm định giả thiết thống kê
1. Khái niệm chung kiểm định giả thiết thống kê:
Là giả thiết về dạng phân phối xác suất của biến ngẫu nhiên, về các tham số
đặc trưng của biến ngẫu nhiên hoặc về tính độc lập các biến. Trong đó H(o)
gọi là giả thiết gốc khi đó kèm theo một mệnh đề mâu thuẫn với nó gọi là
đối thiết H(1) để khi H(o) bị bác bỏ thì thừa nhận đối thiết H(1) tạo thành
một cặp giả thiết thống kê.
VD: So sánh 2 PP GD cũ và mới: Giả thiết H(o) là "không có sự khác nhau
giữa 2 PPGD". Vậy phải tiến hành kiểm định H(o) để chấp nhận hay bác bỏ
nó Việc tìm ra kết luận để chấp nhận hay bác bỏ một giả thiết TK gọi
là kiểm định TK.
Giả thiết H(0) đúng Giả thiết H(0) sai
Chấp nhận giả thiết Ho Xác suất quyết định đúng là Xác xuất mắc sai lầm loại 2
1-α là β
Bác bỏ giả thiết Ho Xác xuất mắc sai lầm loại 1 Xác xuất quyết định đúng là
là α 1- β 57
Gọi giả thiết là H(o) kiem dinh 2 ben
Hμ: μ ≠
1 0
Hμ: ≥μ Hμ: μ≤
0 0
0 0
Kiểm định 1 bên phải
trái
Hμ: <μ
1 0 Hμ: μ>
1 0
1.2 Kiểm định giả thiết về trung bình tổng thể chung
* Trường hợp đã biết phương sai tổng thể δ 2 với μ0 VD1
đa biết ta tính U theo công thức và so sánh với Uα /2 (2bên) trang 93
hoặc Uα (1bên) trong bảng giá trị tới hạn.
xμ−
- Kiểm định 2 bên: Tra bảng Uα /2 U = 0
kd
δ
- Kiểm định 1 bên : Tra bảng U n58
bảng trang 92
Giả thiết Bác bỏ giả thiết H0 Chấp nhận giả thiết H0
n −1
- và so sánh U với Uα hoặc Uα /2 tra bảng giá trị tới hạn.
59
kiem dịnh chưa biết P.sai tổng thể δ 2
với n<30
- Tính phương sai mẫu S. nếu chưa cho xμ−
T = 0
z
-1.96 0 1.96
61
bài tập kiểm định làm bai tập 28.30,31 SGK và các bài tập sau:
bài 10.5_1 ( đã biết phương sai tong the)
Người ta tuyên bố chiều cao của HS khối 6 là 130cm, với độ lệch tiêu
chuẩn δ =40. Người ta chọn ngẫu nhiên 64 em để quan sát chiều cao
và đã tính được trung bình cao 136,5 cm. với mức ý nghĩa α = 0,01. hãy
kiểm định giả thiết trên.
bai 10.5_2 (chưa biết p.sai tong the và n>=30)
Một công quảng cáo tuổi thọ trung bình của một bóng đèn hình là
30000 giờ . Qua kiểm định 100 chiếc bóng thấy trung bình la 29000giờ.
độ lệch tiêu chuẩn trong kiểm định là 5000giờ
Với mức ý nghĩa α = 0,05 và α = 0,02 có bác bỏ quảng cáo trên không?
bai 10.5_3 (chua biết Psai tong thể và n<30).
Một nghiên cứu thông báo rằng mức tiêu dùng hàng tháng của SV là
420 nghin đồng. Người ta chọn 16 SV thấy mức trung bình là 442 nghin
đồng. với độ lệch tiêu chuản 60 nghin dồng. kiểm định thông báo với
múc y nghĩa 5%. thông báo có thấp hơn sự thật không EX62
chương 6- Trình bày và lưu trữ số liệu thống kê
1 - Dạng bảng:
1.1. Khái niệm: Là hình thức biểu hiện các tài liệu tổng hợp thống kê trình
bày hệ thống, hợp lý, rõ ràng, sinh động nói lên đặc trưng về mặt lượng của
hiện tượng nghiên cứu
1.2. Y/C : - Quy mô không quá lớn
- Các mục tiêu rõ ràng
- Chỉ tiêu sắp xếp phù hợp với mục đích
*1.3. Phân loại bảng TK: Bảng TK đơn giản: là bảng thóng kê chỉ liệt kê
các chủ thể: Ví dụ DS HS giỏi của thành phố Thanh hóa...
- Bảng thống kê phân tổ : có phần chủ đề phân tổ theo tiêu thức nào đó (VD
Số Giáo viên theo thâm niên giảng dạy
- Bảng thống kê kết hợp : Là bảng thống kê có phần chủ đề phân tổ theo 2
tiêu thức trên ( VD: Xếp các nhóm thảo luận theo tỉnh; theo chuyên môn
63
bài tập: Hãy lập bảng cho 2 ví dụ trên
2 - Dạng sơ đồ, đồ thị
2.1. Khaí niệm: Đồ thị TK là những hình vẽ, đường nét hình học dùng để
miêu tả có tính chất quy ước các tài kiệu TK
2.2.Ưu điểm: Là hình thưc trình bày có tính trực quan cao, mang sắc thái
tổng thể, dễ dàng nhận biết được những đặc điểm cơ bản.
2.3. Y/C: Xác định rõ quy mô đồ thị - Lựa chọn thể loại
- Các thang đo theo chuẩn nhất định
2.4.Phân loại - Đồ thị so sánh : So sánh giữa Mục tiêu và kế hoạch; So
sánh giữa 2 thời điểm cho cùng một chỉ tiêu
- Đồ thị phát triển: Biểu diễn sự phát triển của một chỉ tiêu TK
- Đồ thị kết cấu: Biểu diễn kết cấu bên trong tổng thể (các phòng ban.khoa.
- Đồ thị liên hệ: Dùng để biểu diễn mối liên quan giữa các tiêu tức (VD:
thâm niên giảng dạy và chất lượng bài giảng
bài tập : Tự ra ví dụ và Vẽ đồ thị biẻu diễn các ví dụ đó 64
Kết quả cần đạt sau học phần
65
Áp dụng CNTT trong thống kê giáo dục
(10 tiết)
Buổi 1 : Ôn tập về các hàm thống kê: Sắp xếp DL; Tính
% ;countif; sumif; dsum; dcount
Buổi 2: Vẽ đồ thị thống kê; thay đổi đồ thị theo yêu cầu
bài toán
Buổi 3: Phân tích dữ liệu bằng các tham số (các số
Trung bình; Trung vị; Khoảng biến thiên, phương sai,
độ lệch chuẩn); tra U ) tra Student
Buổi 4: Giới thiệu phần mềm SPSS; Bài tập tổng hợp-
ôn tập giải đáp thắc mắc.
66
phan tich phuong sai