You are on page 1of 47

1

Chương 2. Đánh giá độ tin cậy của những số liệu


phân tích

Lâm Ngọc Thụ

Cơ sở hóa học phân tích. NXB Đại học quốc gia Hà Nội 2005.

Từ khoá: Đánh giá độ tin cậy, Trung bình, trung vị, Sai số hệ thống, Sai số ngẫu
nhiên, Phép đo song song, Biểu đồ kiểm tra.

Tài liệu trong Thư viện điện tử ĐH Khoa học Tự nhiên có thể được sử dụng cho mục
đích học tập và nghiên cứu cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục
vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả.

Mục lục

Chương 2 Đánh giá độ tin cậy của những số liệu phân tích ................................... 3
2.1 Một số định nghĩa .............................................................................................. 3
2.1.1 Trung bình và trung vị................................................................................... 3
2.1.2 Độ lặp lại ....................................................................................................... 4
2.1.3 Độ đúng ......................................................................................................... 5
2.1.4 Độ lặp lại và độ đúng của những dữ kiện thực nghiệm ................................ 6
2.2 Phân loại sai số .................................................................................................. 7
2.2.1 Sai số hệ thống và sai số ngẫu nhiên............................................................. 7
2.2.2 Các loại sai số hệ thống................................................................................. 7
2.2.3 Ảnh hưởng của sai số hệ thống đến kết quả phân tích .................................. 8
2.3 Biểu hiện của sai số hệ thống ............................................................................ 9
2.3.1 Phát hiện sai số dụng cụ và sai số cá biệt...................................................... 9
2.3.2 Phát hiện sai số phương pháp........................................................................ 9
2.4 Ảnh hưởng của sai số ngẫu nhiên .................................................................... 11
2
2.4.1 Xem xét ảnh hưởng của sai số ngẫu nhiên lên động tác chuẩn hoá
pipet............................................................................................................. 12
2.4.2 Sự phân bố số liệu của những phép đo song song....................................... 13
2.4.3 Những khái niệm cơ bản của thống kê cổ điển ........................................... 16
2.4.4 Ứng dụng những phương pháp thống kê..................................................... 18
2.4.5 Sử dụng những phương pháp thống kê ....................................................... 20
2.4.6 Khoảng tin cậy ............................................................................................ 20
2.4.7 Những phương pháp thống kê kiểm tra giả thuyết...................................... 27
2.4.8 Loại trừ số liệu mang sai số thô bạo............................................................ 31
2.1 Sự lan truyền sai số trên các phép tính ............................................................ 33
2.7.2 Phép cộng sai số hệ thống ........................................................................... 33
2.7.2 Cộng sai số ngẫu nhiên................................................................................ 36
2.7.2 Sự lan truyền sai số ở phép tính luỹ thừa .................................................... 38
2.7.2 Sự lan truyền sai số ở phép LOGARIT và ANTI LOGARIT ..................... 40
2.2 Điều kiện có nghĩa của chữ số ......................................................................... 41
2.3 Bảo hiểm chất lượng (QA) và biểu đồ kiểm tra............................................... 43
2.7.2 Sự cần thiết của bảo hiểm chất lượng ......................................................... 44
2.7.2 Ứng dụng biểu đồ kiểm tra.......................................................................... 45
3

Chương 2

Đánh giá độ tin cậy của những số liệu phân tích

Mỗi phép đo đều có sai số, xác định giá trị sai số này thường phức tạp, đòi hỏi nhiều nỗ
lực, sáng tạo và cả trực giác. Những kết quả phân tích được hoàn thành với độ tin cậy chưa
biết sẽ không có giá trị khoa học. Ngược lại, những kết quả phân tích không chính xác cũng
có thể rất quan trọng nếu có thể xác định được giới hạn sai số với độ tin cậy cao.

Không có một phương pháp tổng quát, đơn giản và chính xác nào để đánh giá, cho dù chỉ
là định tính, những kết quả thực nghiệm. Vì vậy, xử lý kết quả thường là một nhiệm vụ không
kém phần phức tạp so với việc thu được những kết quả đó. Công việc đó bao gồm nghiên cứu
tài liệu, chuẩn hoá thiết bị, những thực nghiệm phụ được tiến hành một cách đặc biệt để tìm
những nguyên nhân của những sai số có thể có và phân tích thống kê những dữ kiện thu được.

Muốn tăng độ nhạy lên mười lần có thể phải thêm một công tác phụ trong nhiều giờ,
nhiều ngày, thậm chí nhiều tuần. Do đó, cần phải xác định yêu cầu về độ tin cậy cho mỗi kết
quả phân tích, không nên tiêu phí nhiều thời gian để đạt độ nhạy cao cho những công việc
không cần độ nhạy đó.

Trong chương này sẽ đề cập đến những loại sai số nảy sinh khi thực hành phân tích,
phương pháp phát hiện, phương pháp đánh giá và cách biểu diễn giá trị đó.

2.1 Một số định nghĩa

Thông thường, nhà phân tích phải lặp lại phép phân tích mẫu từ hai đến năm lần. Những
kết quả riêng biệt trong dãy đo song song đó ít khi phù hợp với nhau nên cần phải chọn giá trị
trung tâm “tốt nhất” của dãy. Sự cần thiết của những phép đo song song là do hai nguyên
nhân. Một là, giá trị trung tâm được lựa chọn đáng tin cậy hơn so với mỗi kết quả riêng biệt
khác. Hai là, sự khác nhau về giá trị của những kết quả riêng biệt khác đủ đảm bảo cho sự
đánh giá định tính về độ tin cậy của giá trị “tốt nhất” đã được lựa chọn.

Có thể dùng một trong hai điểm xuất phát từ hai đại lượng, trung bình và trung vị làm
điểm trung tâm của dãy.

2.1.1 Trung bình và trung vị

Trung bình, trung bình cộng và trung bình mẫu, x , là những từ đồng nghĩa và là thương
số của phép chia tổng kết quả của những phép đo riêng biệt cho số lần đo mẫu.
4
Trung vị của dãy là kết quả ở giữa, có số kết quả có giá trị lớn hơn và số kết quả
có giá trị nhỏ thua bằng nhau. Nếu mẫu có số phép đo không chẵn, có thể lấy điểm trung tâm
là trung vị còn đối với mẫu có số phép đo chẵn, có thể lấy trung bình của cặp phép đo trung
tâm làm trung vị.

Ví dụ, hãy tính trung bình và trung vị của dãy số: 10,06; 10,20; 10,08; 10,10.

10,06 + 10,20 + 10,08 + 10,10


Trung bình = x = = 10,11
4

Vì mẫu có số phép đo chẵn nên trung vị là trung bình của cặp số trung tâm:

10,08 + 10,10
Trung vị = x = = 10,09
2

Trong trường hợp lý tưởng, trung vị và trung bình phải trùng nhau nhưng thường điều đó
không xảy ra, đặc biệt là nếu số lần đo không lớn.

2.1.2 Độ lặp lại

Thuật ngữ độ lặp lại được dùng để đánh giá định lượng sự tản mạn của kết quả. Đại
lượng này đặc trưng cho sự gần nhau theo giá trị tuyệt đối của hai hoặc một số phép đo lớn
hơn được thực hiện trong cùng điều kiện. Độ lặp lại được diễn tả bằng một số cách:

Các cách biểu diễn độ lặp lại tuyệt đối: cách diễn tả độ lặp lại đơn giản nhất là bằng độ
lệch khỏi giá trị trung bình xi – x , không kể dấu. Để minh họa, chúng tôi dẫn ra những kết
quả phân tích clorua của một mẫu ở bảng 2.1 dưới đây.

Bảng 2.1. Kết quả phân tích clorua một mẫu

Các Độ lệch khỏi giá trị trung bình


Thông số
kết quả x−x Độ lệch khỏi trung vị
đo mẫu
[%]

x1 24,39 0,077 0,03

x2 24,19 0,123 0,17

x3 24,36 0,047 0,00

3 [72,94] 3 [0,247] 3 [0,20]

Độ lệch trung bình


Độ lệch trung bình khỏi giá trị
x = 24,313 = 24,31 khỏi trung vị 0,067 ≈
trung bình 0,082 ≈ 0,08
0,07

ω = xmax – xmin = 24,39 – 24,19 =0,20.


5
Giá trị trung bình của các kết quả là 24,31%; độ lệch của kết quả thứ hai khỏi giá trị trung
bình là 0,12%; độ lệch trung bình của các kết quả khỏi giá trị trung bình là 0,08%. Phép tính
độ lệch trung bình được tiến hành đến chữ số thứ ba sau dấu phẩy mặc dù mỗi kết quả thu
dược chỉ với độ chính xác đến chữ số thứ hai sau dấu phẩy. Sự làm tròn giá trị trung bình và
độ lệch trung bình đến lượng con số hợp lý sau dấu phẩy được thực hiện sau khi phép tính đã
kết thúc. Biện pháp đó cho phép làm giảm sai số khi làm tròn.

Cũng có thể diễn tả độ lặp lại bằng độ lệch khỏi trung vị, 24,36% (xem bảng trên). Số đo
độ lặp lại cũng chính là biên độ biến đổi hoặc biên độ dãy số liệu, ω, nghĩa là hiệu số giữa kết
quả lớn và nhỏ nhất (0,20%).

Độ lệch tiêu chuẩn và độ phân tán được dùng làm hai tiêu chuẩn cho độ lặp lại. Cách xác
định các đại lượng này sẽ được đề cập đến trong các mục tiếp theo của chương này.

Độ lặp lại tương đối

Ngoài độ lặp lại tuyệt đối, để thuận tiện hơn, người ta còn đề nghị khái niệm độ lặp lại
tương đối theo số trung bình hoặc theo trung vị, biểu diễn bằng phần trăm. Ví dụ, đối với
phép đo x3:

0,08 × 100
Độ lệch tương đối khỏi giá trị trung bình = = 0,32 ≈ 0,3%
24,31

0,067 × 100
Độ lệch trung bình tương đối khỏi trung vị = = 0,3%
24,36

2.1.3 Độ đúng

Độ đúng biểu thị sự gần đúng của giá trị thu được với giá trị được chấp nhận là thật. Độ
đúng thường được diễn tả bằng sai số tuyệt đối và có thể định nghĩa sai số này như sau: E = xi
– xt.

Sai số tuyệt đối E là hiệu số giữa giá trị quan sát được, xi và xt là giá trị được chấp nhận là
thật. Giá trị được chấp nhận là thật cũng có thể không đáng tin cậy. Do đó việc đánh giá sai số
thực sự của phép đo thường là công việc khá khó khăn.

Trở lại ví dụ đã dẫn ra trên đây, chúng ta giả thiết rằng, kết quả thật của mẫu là 24,36%.
Khi đó sai số tuyệt đối của số trung bình sẽ là:

24,31% – 24,36% = –0,05%.

Trong những trường hợp như thế này người ta thường đặt dấu cho sai số để chỉ rõ kết quả
được nâng cao lên hay bị hạ thấp xuống.

Thường đại lượng có lợi hơn, không phải là sai số tuyệt đối mà là sai số tương đối, biểu
diễn độ lệch khỏi giá trị thật bằng phần trăm. Đối với phép phân tích đã xét trên:
6
−0,05 × 100
Sai số tương đối = = −0,21 ≈ −0,2%
24,36

2.1.4 Độ lặp lại và độ đúng của những dữ kiện thực nghiệm

Độ lặp lại của phép đo có thể dễ dàng xác định bằng cách lặp lại thực nghiệm trong
những điều kiện đồng nhất để đánh giá độ đúng thì không đơn giản như vậy bởi vì để làm
việc đó cần phải biết giá trị thật. Theo dõi mối quan hệ trực tiếp giữa độ đúng và độ lặp lại là
công việc rất hấp dẫn. Sự thận trọng trong xem xét mối quan hệ đó được minh hoạ trên hình
2.1. Trên hình này người ta dẫn ra những kết quả xác định nitơ trong hai hợp chất tinh khiết
của bốn nhà phân tích khác nhau. Những điểm phân bố trên đồ thị xác nhận sai số tuyệt đối
của những phép đo song song trong mỗi mẫu mà mỗi nhà phân tích đã mắc phải.

Hình 2.1

Sai số tuyệt đối của phép xác định vi lượng ni tơ theo phương pháp Ken-đan

Trên mỗi vạch thẳng đứng với dòng ( xi - xt) là độ lệch tuyệt đối của giá trị trung bình
khỏi giá trị thật

Đáng chú ý là nhà phân tích thứ nhất đạt được độ lặp lại tương đối cao và độ đúng cao.
Ngược lại, nhà phân tích thứ hai đạt độ lặp lại xấu nhưng độ đúng khá. Nhà phân tích thứ ba
đạt độ lặp lại rất cao nhưng giá trị trung bình của các kết quả mắc sai số rất đáng kể. Còn nhà
phân tích thứ 4 đạt độ lặp lại và độ đúng đều tồi.

Các kết quả phân tích và phân bố như trên hình 2.1 là do nhà phân tích đã mắc phải hai
loại sai số cơ bản.
7
2.2 Phân loại sai số

2.2.1 Sai số hệ thống và sai số ngẫu nhiên

Có thể phân chia những sai số sinh ra trong quá trình phân tích hoá học thành hai nhóm
lớn không phụ thuộc vào nguồn gốc của chúng.

Sai số hệ thống là sai số mà giá trị của nó, nếu như không phải trong thực tế thì cũng là
về nguyên tắc, có thể đo được và tính toán được.

Sai số ngẫu nhiên là sai số xuất hiện trong kết quả của những phép đo lặp lại nhiều lần.
Nguồn gốc của sai số này không rõ, còn giá trị thì dao động tùy ý và không thể đo được. Sự
tản mạn của những kết quả gần giá trị trung bình (hình 2.1) là hệ quả trực tiếp của sai số ngẫu
nhiên. Ngược lại, hiệu số giữa giá trị thật và giá trị trung bình thu được của các nhà phân tích
thứ 3 và thứ 4 ( xi – xt) là do một hoặc một số sai số hệ thống gây nên.

2.2.2 Các loại sai số hệ thống

Không thể kể tất cả mọi nguồn gốc có thể có của sai số hệ thống nhưng có thể coi sai số
cá biệt của người thực nghiệm, sai số của thiết bị đo, sai số của phương pháp phân tích và cả
những tổ hợp bất kỳ của chúng là cơ sở của loại sai số này.

Sai số cá biệt: Sai số này xuất hiện do không hiểu biết, do cẩu thả, do định kiến hoặc do
khuyết tật về sức khoẻ của người thực nghiệm. Ví dụ, chúng có thể xuất hiện do vận chuyển
mẫu không đúng cách, do bỏ qua bổ chính nhiệt độ đối với thiết bị đo, do rửa kết tủa hoặc do
ghi không chính xác chỉ số của thiết bị

Sai số cá biệt còn thường gặp ở những người mù màu ở các mức độ khác nhau nên khó
thấy sự chuyển màu. Điều này rất quan trọng trong phân tích.

Sự định kiến cá nhân cũng là nguồn sai số quan trọng phải luôn luôn đề phòng. Người
thực nghiệm vô tình cố gắng có được những chỉ số của thiết bị nhằm nâng cao độ lặp lại của
dãy kết quả hoặc là cố gắng đạt kết quả cao cho càng gần càng tốt với một giá trị định kiến
trước được coi là giá trị thật của phép đo. Để tránh sai số hệ thống loại đó cần luôn nhớ những
khuyết tật của cơ thể con người và cố gắng khách quan hơn khi quan sát.

Sai số thiết bị: Sai số thiết bị do sự không hoàn thiện của thiết bị mà nhà phân tích sử
dụng gây nên hoặc là do ảnh hưởng của những yếu tố bên ngoài lên thiết bị. Ví dụ, thể tích
của những dụng cụ định mức (buret, pipet, bình định mức) thường khác một chút so với thể
tích được xác định khi chuẩn hoá chúng, đặc biệt là nhiệt độ của các dụng cụ này khi sử dụng
khác nhiều với nhiệt độ khi chuẩn hoá. Có thể loại trừ sai số hệ thống loại này bằng cách
chuẩn hóa dụng cụ định mức ở nhiệt độ tương ứng

Sai số phương pháp: Sai số hệ thống thường xuất hiện do sự sai lệch của tính chất thuốc
thử hoặc phản ứng dùng làm cơ sở cho phép xác định khỏi tiêu chuẩn lý tưởng. Nguyên nhân
8
của những sai lệch này có thể là: tốc độ phản ứng nhỏ, phản ứng xảy ra không hoàn
toàn, sự không bền của các chất nào đó, sự không đặc trưng của thuốc thử và sự không xảy ra
các phản ứng phụ cản trở quá trình xác định. Ví dụ, trong phân tích trọng lượng, nhiệm vụ đặt
ra đối với nhà phân tích là tách nguyên tố cần xác định vào dạng kết tủa càng tinh khiết càng
tốt.

Nếu không rửa kết tủa tốt thì kết tủa sẽ bị bẩn bởi các chất lạ và trọng lượng của nó sẽ
tăng lên. Mặt khác, sự rửa cần thiết để tách các chất bẩn có thể dẫn tới sự mất đi một lượng
đáng kể kết tủa do độ tan và do đó xuất hiện sai số hệ thống âm. Trong bất kể trường hợp nào,
sự cẩn thận thực hiện các động tác sẽ làm mất đi sai số hệ thống do phương pháp phân tích
gây nên.

Trong phân tích chuẩn độ thường gặp sai số phương pháp gắn liền với việc thêm dư thuốc
thử so với lượng lý thuyết cần thiết để làm chuyển màu của chỉ thị là dấu hiệu đánh giá điểm
cuối của phản ứng. Kết cục, độ đúng của toàn bộ phép phân tích được xác định bằng chính
hiện tượng đặc trưng đó.

Còn một loại sai số phương pháp nữa được minh hoạ trên hình 2.1, phép xác định nitơ
trong hợp chất hữu cơ, theo Ken-đan, dựa trên cơ sở oxi hoá mẫu bằng axit sunfuric đặc, nitơ
thường chuyển thành amoni sunfat. Những hợp chất chứa vòng piriđin, ví dụ, axit nicotinic,
có thể không bị oxi hoá hoàn toàn trong những điều kiện phân tích. Sai số âm trong những kết
quả của các nhà phân tích thứ 3 và thứ 4 chắc là gắn liền với sự oxi hoá không hoàn toàn.

Sai số phương pháp là nhóm sai số hệ thống nghiêm trọng nhất bởi vì thông thường
chúng không bị phát hiện.

2.2.3 Ảnh hưởng của sai số hệ thống đến kết quả phân tích

Sai số hệ thống thường được chia thành hai loại: loại hằng định và loại biến đổi. Giá trị
sai số hằng định không phụ thuộc vào lượng được đo. Ngược lại, sai số biến đổi tuyến tính
giảm hoặc tăng theo giá trị tuyệt đối, tỷ lệ với lượng mẫu lấy để phân tích.

Sai số hằng định: Trong một phép phân tích cụ thể bất kỳ, sai số hằng định càng lớn nếu
lượng chất được đo càng nhỏ, có thể dùng hiện tượng mất khi rửa kết tủa do độ tan của nó
làm ví dụ.

Ví dụ, chúng ta giả thiết rằng theo phương pháp cần rửa kết tủa bằng 200 ml nước và khi
đó mất đi 0,50 mg kết tủa. Nếu trọng lượng kết tủa là 500 mg thì sai số tương đối do độ tan là
–(0,05.100/500) = –0,1%. Mất một lượng chất như vậy khi rửa 50 mg kết tủa tương ứng với
sai số tương đối –1,0%

Thể tích thuốc thử dùng dư so với lượng cần thiết để làm đổi màu trong phân tích chuẩn
độ là một ví dụ khác về sai số hằng định. Thể tích đó thường nhỏ và không phụ thuộc vào thể
tích chung của thuốc thử tiêu tốn cho phép chuẩn độ và một lần nữa sai số tương đối sẽ càng
lớn nếu thể tích chung càng nhỏ. Rõ ràng là, một trong các cách hạ thấp sai số hằng định là
lựa chọn một lượng mẫu hợp lý, tất nhiên là tương ứng với phương pháp phân tích.
9
Sai số biến đổi: Những hỗn hợp lạ, nếu ảnh hưởng của chúng không bị loại trừ bằng một
phương pháp nào đó, sẽ có thể dẫn tới một trong các dạng của sai số biến đổi tuyến tính. Ví
dụ, một phương pháp xác định đồng đã được biết rộng rãi bao gồm phản ứng của ion đồng (II)
với kali iođua và tiếp sau đó là phép đo lượng iot tách ra. Nếu khi đó có mặt sắt (III) thì nó
cũng đẩy được iot ra từ kali iođua. Nếu không thực hiện biện pháp ngăn ngừa ảnh hưởng của
sắt (III), phép phân tích sẽ cho hàm lượng phần trăm của đồng cao bởi vì iot tách ra tương ứng
với hàm lượng tổng cộng của đồng và sắt trong mẫu. Giá trị của sai số được xác định bằng độ
nhiễm bẩn sắt của mẫu và hiệu ứng tương đối không phụ thuộc vào lượng mẫu phân tích.
Nếu, ví dụ, tăng gấp đôi lượng mẫu thì lượng iot tách ra do đồng cũng như do hỗn hợp sắt
cũng tăng gấp đôi. Sai số tuyệt đối khi đó tăng gấp đôi trong khi đó sai số tương đối vẫn giữ
nguyên

2.3 Biểu hiện của sai số hệ thống

Sai số hệ thống thường khá lớn. Hơn nữa, việc phát hiện chúng cũng khó khăn bởi vì
không có một phương pháp đơn giản và tin cậy nào cho phép phát hiện, có hay không có loại
sai số này.

2.3.1 Phát hiện sai số dụng cụ và sai số cá biệt

Người ta thường phát hiện sai số dụng cụ và bổ chính khi chuẩn hoá thiết bị. Tốt nhất là
chuẩn hoá định kỳ thiết bị bởi vì với thời gian, chỉ số của phần lớn thiết bị sai lệch do bị hao
mòn, ăn mòn hoặc do sự sử dụng cẩu thả.

Có thể giảm phần lớn sai số cá biệt đến cực tiểu bằng sự cẩn thận trong công tác và tự
kiểm tra. Nhiều nhà nghiên cứu đã tự rèn luyện cho mình thói quen kiểm tra các loại chỉ số
của thiết bị, sự ghi chép trong nhật ký và sự tính toán. Sai số liên quan với những khuyết tật
về thể lực của con người có thể tránh được bằng cách lựa chọn đúng phương pháp, tất nhiên là
trong điều kiện đã biết trước.

2.3.2 Phát hiện sai số phương pháp

Phát hiện sai số phương pháp đặc biệt khó khăn. Ngoài ra việc bổ chính ảnh hưởng của
chúng thường cũng rất khó. Có thể phát hiện sai số loại này nhờ các biện pháp dưới đây:

Phân tích các mẫu tiêu chuẩn. Để phát hiện sai số hệ thống của phương pháp người ta
phân tích những mẫu nhân tạo, có thành phần biết trước và gần với thành phần vật liệu cần
phân tích. Mẫu tiêu chuẩn cần phải được chuẩn bị rất cẩn thận để nồng độ của hợp phần cần
xác định được biết trước với độ tin cậy cao. Đáng tiếc là, việc chuẩn bị mẫu có thành phần
đúng hệt như một chất tự nhiên phức tạp, thường khó khăn hoặc nói chung không thể làm
được.

Phân tích bằng những phương pháp độc lập. Hoàn thành việc phân tích bằng một phương
pháp độc lập với độ chính xác đã biết trước song song với phương pháp được sử dụng trong
10
nghiên cứu là đặc biệt quan trọng nếu không có mẫu với độ sạch biết trước. Phương
pháp độc lập không cần gần với phương pháp sử dụng nhằm làm giảm xác suất ảnh hưởng
đồng nhất của một yếu tố nào đó lên cả hai phương pháp.

Bảng 2.2

Ảnh hưởng của sai số cố định, bằng 2 mg đến kết quả xác định bạc trong hợp kim

Lượng bạc tìm được


Lượng cân, g
g %

0,2000 0,0378 18,90

0,5000 0,0979 19,58

1,0000 0,1981 19,81

2,0000 0,3982 19,91

5,0000 0,9980 19,96

Thí nghiệm trắng. Thường có thể loại trừ sai số cố định trong các phép đo vật lý bằng
cách tiến hành thí nghiệm trắng, trong đó tất cả các giai đoạn phân tích đều được thực hiện
khi không có chất nghiên cứu. Kết quả thí nghiệm dùng để bổ chính phép đo thật. Thí nghiệm
trắng đặc biệt có lợi khi đánh giá sai số gắn liền với sự lẫn trong mẫu thử những tạp chất cản
trở từ thuốc thử và bình.

Biến đổi lượng mẫu. Có thể phát hiện sai số cố định bằng cách phân tích những lượng
chất khác nhau. Những kết quả phân tích với giả thiết, những lượng mẫu hợp kim khác nhau
chứa chính xác 20% bạc đưọc dẫn ra ở bảng 2.2. Mỗi phép xác định có kèm theo sai số cố
định bằng 2 mg và dẫn tới sự hạ thấp kết quả. Ảnh hưởng của sai số đó giảm dần khi tăng
lượng mẫu.

Bảng 2.3

Ảnh hưởng của sai số biến đổi tuyến tính, bằng 0,5%, đến kết quả xác định trong hợp kim

Lượng cân, g Tìm được


11

g %

0,2000 0,0402 20,10

0,5000 0,1006 20,12

1,0000 0,2009 20,09

2,0000 0,4021 20,11

5,0000 1,0051 20,10

Rõ ràng là, từ hình 2.2 ta thấy lượng mẫu càng lớn kết quả càng gần với giá trị thật.

Ngược lại, sự biến đổi sẽ không cho phép phát hiện sai số biến đổi tuyến tính. Hình 2.2
cũng minh hoạ những kết quả phân tích những mẫu khác nhau của cùng một hợp kim bằng
một phương pháp với sai số biến đổi tuyến tính bằng 0,5%. Những kết quả cũng được dẫn ra
ở bảng 2.2. Đồ thị là đường thẳng. Rõ ràng là, không biết được hàm lượng thật của bạc trong
hợp kim có tồn tại loại sai số như vậy hay không? Có thể là không nhận biết được.

H µ m l− î n g A g %
S a i s è b iÕ n ® æ i
2 0 ,3


• • •
2 0 ,1 G i¸ trÞ th Ë t

1 9 ,9 •

S a i s è c è ® Þn h


1 2 3 4 5 L − î n g c © n (g )

Hình 2.2

Ảnh hưởng của sai số cố định và sai số biến đổi tuyến tính đến kết quả xác định bạc (xem bảng 2.2 và 2.3)

2.4 Ảnh hưởng của sai số ngẫu nhiên

Rõ ràng là xuất phát từ cái tên của nó, sai số ngẫu nhiên xuất hiện là do những sai số
không biết được và không kiểm tra được của phép đo, những sai số đó là nguyên nhân của sự
tản mạn kết quả khi đo lặp lại, như đã được chỉ rõ trên hình 2.1 ở ví dụ dãy thí nghiệm thứ 4.
12
2.4.1 Xem xét ảnh hưởng của sai số ngẫu nhiên lên động tác chuẩn
hoá pipet
Ảnh hưởng của sai số ngẫu nhiên lên động tác chuẩn hoá pipet tương đối đơn giản, bao
gồm việc xác định trọng lượng nước (với độ chính xác đến miligam) chảy ra từ pipet được
minh họa ở bảng 2.4.

Bảng 2.4 Những kết quả đo song song khi chuẩn hoá pipet thể tích 10 ml

Số thí Thể tích nước Số thí Thể tích nước Số thí Thể tích nước
nghiệm chảy ra, ml nghiệm chảy ra, ml nghiệm chảy ra, ml

1 9,991 9 9,988 17 9,978

2 9,986 10 9,976 18 9,980

3 9,973 11 9,980 19 9,976

4 9,983 12 9,973 20 9,986

5 9,980 13 9,970b 21 9,986

6 9,988 14 9,988 22 9,983

7 9,993a 15 9,980 23 9,978

8 9,970b 16 9,986 24 9,988

Thể tích trung bình = 9,9816 = 9,982 ml

Độ lệch trung bình khỏi giá trị trung bình = 0,0054 ml

Biên độ dao động = 9,993 – 9,970 = 0,023 ml

Độ lệch tiêu chuẩn = 0,0065 ml ?


a
Giá trị lớn nhất.
b
Giá trị nhỏ nhất.

Cần đo nhiệt độ của nước để xác định trọng lượng riêng của nó. Trọng lượng được xác
định bằng thực nghiệm, sau đó tính ra thể tích nước chảy ra từ pipet. Nếu những sai số được
phát hiện và loại trừ, những kết quả đo của cộng tác viên có kinh nghiệm sành sỏi trên cân
phân tích chuẩn với độ chính xác 1 mg (tương ứng với khoảng 0,001 ml) có thể được thấy
trên hình 2.3.

Tuy vậy, độ lệch trung bình khỏi trung bình số học của 24 lần đo là ± 0,0054 ml và biên độ
dao động là 0,023 ml. Sự tản mạn kết quả là hệ quả trực tiếp của sai số ngẫu nhiên.
13
Có thể giải thích được sự không trùng lặp kết quả của những phép đo lặp lại (bảng 2.4)
khi giả thiết rằng mỗi phép đo có kèm theo nhiều sai số không biết được, gây ra do sự không
trùng lặp những điều kiện không được kiểm tra thực nghiệm. Hiệu ứng tổng cộng của những
sai số đó cũng là một đại lượng ngẫu nhiên. Thường sai số bù trừ nhau nên tác dụng của
chúng là cực tiểu. Nhưng đôi khi cũng cộng hợp với nhau cho sai số dương hoặc âm cao hơn.
Nguồn sai số khi chuẩn hoá pipet có thể là những sai số gắn liền với sai số kiểm tra bằng mắt
mức chất lỏng ở vạch, mức thủy ngân trong nhiệt kế và chỉ số của cân: những nguồn sai số
khác bao gồm sự dao động trong thời gian dốc hết nước từ pipet, sự biến đổi của góc nghiêng
khi nước chảy, sự dao động của nhiệt độ phụ thuộc vào cách cầm pipet. Chắc chắn rằng, ngoài
những sai số kể trên còn tồn tại nhiều sai số khác. Rõ ràng là, ngay cả một động tác giản đơn
như chuẩn hoá pipet cũng kèm theo nhiều biến đổi không lớn không kiểm tra được. Mặc dù
chúng ta không vạch rõ ảnh hưởng của mỗi sai số trong số những sai số đó nhưng cũng có thể
diễn tả hiệu ứng tổng cộng của chúng dưới dạng sai số ngẫu nhiên phản ánh qua sự phân tán
số liệu quanh giá trị trung bình.

2.4.2 Sự phân bố số liệu của những phép đo song song

Khác với sai số hệ thống, không thể loại trừ sai số ngẫu nhiên khỏi phép đo. Ngoài ra,
nhà nghiên cứu không có quyền bỏ qua chúng, coi chúng là nhỏ. Chắc chắn là có thể công
nhận rằng, giá trị trung bình của 24 lần đo thể tích được dẫn ra ở bảng 2.4 gần với thể tích thật
hơn so với bất kỳ giá trị riêng biệt nào. Nhưng chúng tôi giả thiết rằng, người ta tiến hành
chuẩn hoá chỉ hai lần và một cách ngẫu nhiên hai lần đo phù hợp với kết quả của thí nghiệm 1
và 7. Giá trị trung bình từ hai giá trị đó bằng 9,992, khác với giá trị trung bình của 24 phép đo
là 0,010 ml. Chúng ta cũng nhận thấy rằng độ lệch trung bình của hai phép đo đó khỏi giá trị
trung bình riêng của chúng chỉ là 0,0010 ml. Trên cơ sở giá trị độ lệch khỏi giá trị trung bình
nhỏ như vậy có thể xuất hiện sự lạc quan quá đáng về sai số ngẫu nhiên. Kết cục nếu xuất
hiện sự cần thiết gửi kiểm tra giá trị thể tích chảy ra từ pipet với độ chính xác ± 0,002 ml có
thể người ta sẽ bỏ qua sự thiếu chính xác nghiêm trọng. Trong trường hợp này, sự không biết
giá trị thật của sai số ngẫu nhiên đã tạo ra cảm giác giả về độ tin cậy vào chất lượng tốt của
pipet. Thực tế có thể chỉ ra rằng nếu sử dụng pipet 1000 lần thì chắc chắn trong 2 – 3 trường
hợp thể tích chất lỏng chảy ra sẽ khác giá trị trung bình bằng 9,982 ml, là 0,002 ml, và hơn
100 trường hợp là 0,01 ml và lớn hơn, bất chấp tất cả mọi biện pháp phòng ngừa của nhà phân
tích.

Để phân tích những sai số nhỏ ảnh hưởng như thế nào đến kết quả của những phép đo
song song, chúng ta xét một tình hình tưởng tượng trong đó sai số ngẫu nhiên được hình thành
từ 4 sai số như vậy. Chúng ta quy ước rằng mỗi loại sai số đó được đặc trưng bằng xác suất
xuất hiện như nhau và có thể ảnh hưởng đến kết quả cuối cùng gây nên sai số dương hoặc âm
được xác định bằng đại lượng U là đồng nhất đối với tất cả 4 loại sai số.

Bảng 2.5 Những phương pháp tổ hợp có thể có 4 loại sai số khác nhau U1; U2; U3 và U4

Tổ hợp sai số Đại lượng sai số ngẫu nhiên Tần số tương đối của sai số

+ U1 + U2 + U3 + U4 + 4U 1
14

– U1 + U2 + U3 + U4

+ U1 – U2 + U3 + U4
4
+ U1 + U2 – U3 + U4 + 2U
+ U1 + U2 + U3 – U4

– U1 – U2 + U3 + U4

+ U1 + U2 – U3 – U4

+ U1 – U2 + U3 –U4

– U1 + U2 – U3 + U4

– U1 + U2 + U3 – U4 0 6

+ U1 – U2 – U3 + U4

+ U1 – U2 – U3 – U4

– U1 + U2 – U3 – U4

– U1 – U2 + U3 – U4 4
–2U
– U1 – U2 – U3 +U4

– U1 – U2 – U3 – U4 –4U 1

Tất cả các tổ hợp có thể có của 4 loại sai số có thể dẫn tới sai số ngẫu nhiên đã nói trên
được dẫn ra ở bảng 2.5. Chú ý rằng chỉ có một tổ hợp có thể dẫn tới sai số dương cực đại 4U,
bốn tổ hợp dẫn tới sai số dương 2U và 6 tổ hợp dẫn tới sai số không, quan hệ tương tự như
vậy cũng xảy ra đối với sai số ngẫu nhiên âm. Đó là tỷ số 6 : 4 : 1. Tỷ số này phản ảnh xác
suất sai số của mỗi vùng. Khi số phép đo đủ lớn có thể hy vọng sự xuất hiện sai số được phân
bố theo tần số tương tự như đã được mô tả trên hình 2.3a. Sự phân bố 10 sai số bằng giá trị số
được chỉ rõ ở hình 2.3b. Một lần nữa chúng ta thấy rằng sự xuất hiện "sai số không" với xác
suất lớn nhất trong khi đó sai số cực đại bằng 10U rất hiếm hoi xuất hiện (khoảng 1 lần cho
500 phép đo).

Nếu chúng ta phát triển tiếp theo những bàn luận trên đây cho số rất lớn sai số ở quy mô
ngày càng nhỏ, số đường cong phân bố nhận được được dẫn ra trên hình 2.3c. Đường cong
hình quả chuông đó được gọi là sự phân bố Gauss hay phân bố chuẩn của sai số (khi xây dựng
đường cong Gauss không cần thiết phải giả thiết sự đồng nhất của những sai số riêng biệt.
Đường cong có những đặc trưng:

1. Tần số xuất hiện “sai số ngẫu nhiên không” là cực đại.

2. Đối xứng qua cực đại, nghĩa là xác suất hiện sai số âm và sai số dương bằng nhau.
15
3. Xác suất xuất hiện giảm dần giá trị sai số ngẫu nhiên của phép phân tích hoá học tiến
tới rất gần với đường cong phân bố Gauss. Ví dụ, nếu xây dựng đồ thị biểu diễn sự phụ thuộc
tần số xuất hiện mỗi độ lệch khỏi giá trị trung bình của hàng trăm phép đo pH của một mẫu
vào giá trị độ lệch thì thu được đường cong tiến gần tới đường cong được diễn tả trên hình
2.3d.

(b)
TÇn sè y

-10U -8U -6U -4U -2U 0 2U 4U 6U 8U 10U


Sai sè ngÉu nhiªn

TÇn sè y Sè lÇn ®o pH
8
20
(d)
(c)

10

-0,03 -0,02 -0,01 0 0,01 0,02 0,03


Sai sè ngÉu nhiªn hoÆc ®é lÖch khái gi¸ trÞ trung b×nh

Hình 2.3

Sự phân bố lý thuyết sai số ngẫu nhiên xuất hiện khi tính

a) 4 sai số; b) 10 sai số; c) Số rất lớn sai số

Những quan sát thực nghiệm khẳng định giả thiết cho rằng, có thể hình dung sai số ngẫu
nhiên của phép đo phân tích dưới dạng tích lũy số lớn những sai số nhỏ độc lập và không
kiểm tra được. Điều quan trọng là sự phân bố phần lớn những dữ kiện phân tích theo đường
cong Gauss cho phép ứng dụng phương pháp thống kê để đánh giá giới hạn sai số ngẫu nhiên
theo độ lặp lại.

Đường c là đường cong phân bố chuẩn hoặc phân bố Gauss. Đường d là đường phân bố
thực nghiệm có thể thu được khi đặt độ lệch khỏi giá trị trung bình của khoảng 250 phép đo
16
pH song song trên trục hoành và số phép đo pH tương ứng với mỗi độ lệch quan sát
được trên trục tung.

2.4.3 Những khái niệm cơ bản của thống kê cổ điển

Thống kê cho phép mô tả toán học những quá trình ngẫu nhiên, Ví dụ, ảnh hưởng của sai
số ngẫu nhiên đến kết quả phân tích hoá học. Nhưng điều quan trọng là nhận thức rằng, chỉ có
thể mô tả chính xác bằng các phương pháp thống kê cổ điển khi số quan sát lớn vô hạn.

Hình 2.4

Những đường chuẩn phân bố sai số được xây dựng đối với một và chỉ một đại lượng được đo bằng hai phương pháp.
Phương pháp 1 tin cậy hơn do đó đại lượng σ nhỏ hơn.

Cần chú ý đến ba loại trục hoành:

a) Đại lượng đo được x với cực đại ở μ.


17
b) Đại lượng Z từ phương trình (2.2).

Trục hoành c hợp nhất hai đường cong làm một (phương pháp 1 và 2 cho những đường
cong đồng nhất khi sử dụng Z làm trục hoành).

Phương pháp đó cho 2 – 5 phép phân tích song song được một nhà phân tích hoàn thành
thì những kết luận về sai số ngẫu nhiên có thể có, có thể mắc sai lầm nghiêm trọng và quá lạc
quan. Trong những trường hợp này cần thiết phải biến dạng các phương pháp cổ điển. Trước
hết phải xem xét các loại thực tế đó và vì vậy xuất hiện ý nghĩ dừng lại một chút ở một số quy
luật quan trọng của thống kê cổ điển.

Tính chất của đường cong phân bố chuẩn: Hai đường cong trên của hình 2.4 là những
đường cong phân bố sai số chuẩn của hai phương pháp phân tích khác nhau. Đường cong trên
cùng phản ảnh những dữ kiện của phương pháp chính xác hơn bởi vì những kết quả được tập
hợp lại gần với giá trị trung tâm hơn.

Như đã chỉ rõ trên hình 2.4, có thể diễn tả đường cong phân bố chuẩn bằng ba phương
pháp khác nhau. Trong mỗi phương pháp đó, trên trục tung đặt tần số xuất hiện y của mỗi giá
trị đặt trên trục hoành. Trên trục hoành a đặt những kết quả đo x tìm được bằng thực nghiệm;
trong trường hợp này giá trị trung bình là giá trị trung tâm được ký hiệu là μ. Trên trục hoành b
là những độ lệch khỏi giá trị trung bình, x – μ. Rõ ràng là xác suất xuất hiện "độ lệch không" là
lớn nhất. Chúng ta sẽ phân tích ba loại khái niệm được dẫn ra trên trục hoành c.

Cần nhấn mạnh rằng, những đường cong đang xét là lý tưởng bởi vì chúng là sự phân bố
lý thuyết kỳ vọng những kết quả thực nghiệm khi số lần phân tích tiến dần tới vô hạn. Đối với
mẫu thực hiện trong thực tế, sự phân bố rời rạc như được mô tả trên hình 2.3d là có xác suất
lớn. Thống kê cổ điển dựa trên những đường cong được dẫn ra trên hình 2.4, chứ không phải
dựa trên những đường cong được diễn tả trên hình 2.3d.

Có thể mô tả một cách toán học sự phân bố những dữ kiện được dẫn ra trên hình 2.4 nhờ
ba thông số của phương trình sau:

−( x −μ )
2
− Z2
e 2σ2 e 2
y= =
−σ 2π −σ 2π

(2.2)

Độ lệch tiêu chuẩn: Từ phương trình 2.2 ta thấy rằng, mỗi giá trị độ lệch tiêu chuẩn phải
tương ứng với đường cong phân bố của mình. Tuy vậy, có thể nói rằng, không phụ thuộc vào
đại lượng σ, 86,30% diện tích nằm dưới đường cong trong giới hạn một độ lệch tiêu chuẩn
(±1σ) khỏi giá trị trung bình μ. Do đó 86,30% tất cả mọi giá trị nằm trong giới hạn đó.
Khoảng 95,50% tất cả mọi giá trị sẽ ≤ ±2σ ; 99,70% giá trị ≤ ±3σ. Những giá trị (x – μ),
tương ứng ± 1σ, ± 2σ và ± 3σ được biểu thị bằng những đường thẳng đứng đứt đoạn trên
18
những đường cong phía trên của hình 2.4. Trên đường cong ở phía dưới những giá
trị Z mang đơn vị ± σ được đặt trên trục hoành.

Những tính chất đó của đường cong phân bố chuẩn rất quý giá, vì nó cho phép rút ra
những kết luận về giá trị xác suất của những sai số ngẫu nhiên của một phép đo nếu biết được
độ lệch tiêu chuẩn của phương pháp đo. Vì nếu biết đại lượng σ thì có thể khẳng định được
rằng trong 68,30 trường hợp trong số 100 trường hợp sai số ngẫu nhiên của một phép đo duy
nhất bất kỳ đã cho sẽ < ±σ, 95,5 trường hợp trong số 100 trường hợp sai số ngẫu nhiên đó sẽ
< ± 2σ,... Rõ ràng rằng độ lệch tiêu chuẩn của một phương pháp đo là một thông số rất quý để
đánh giá và hình dung giá trị sai số ngẫu nhiên có thể có .

Độ lệch tiêu chuẩn của một số rất lớn lần đo (n) được diễn tả như sau :

N
∑ (xi − μ )2
σ= i =1 (2.4)
n

Độ phân tán: σ2 là một đặc trưng khác của độ lặp lại thường được sử dụng rộng rãi trong
thống kê. Phần lớn các nhà nghiên cứu ưa thích dùng đại lượng σ chứ không phải là σ2 bởi vì
độ chênh lệch tiêu chuẩn được diễn tả chính bằng đơn vị của đại lượng được đo.

2.4.4 Ứng dụng những phương pháp thống kê

Người ta phát hiện rằng, ứng dụng trực tiếp những phương pháp thống kê cổ điển cho
một số không lớn những phép đo song song (từ 2 đến 20) thường dẫn tới kết luận sai lầm về
giá trị sai số ngẫu nhiên có thể có. Rất may là người ta đã nghiên cứu được những phương
pháp cho phép rút ra những kết luận tin cậy về sai số ngẫu nhiên mà chỉ cần hai hoặc ba phép
đo là đủ.

Đối với một số không lớn phép đo lặp lại không thể dùng trực tiếp các phương trình (2.2)
và (2.4) bởi giá trị trung bình của một số lớn vô cùng phép đo, μ (nó là giá trị thật không chứa
sai số hệ thống) không bao giờ biết được. Để thay thế chúng ta phải dùng giá trị trung bình
của số nhỏ phép đo x . Trong phần lớn trường hợp x khác μ một chút. Hiệu số này tất nhiên
là do sai số ngẫu nhiên gây nên và giá trị có thể có của đại lượng này chúng ta đang thử xác
định. Điều quan trọng là cần nhấn mạnh rằng, một sai số bất kỳ nào trong xác định x cũng gây
nên một sai số tương ứng trong đại lượng σ (phương trình (2.4)). Do đó đối với số nhỏ phép
đo thì không chỉ giá trị trung bình x khác với μ mà còn một điều rất quan trọng khác là sự
đánh giá độ lệch tiêu chuẩn cũng có thể không đáng tin cậy. Như vậy là, chúng ta phải đụng
chạm tới hai sai số, một sai số bao hàm trong giá trị trung bình và một sai số khác bao hàm
trong giá trị độ lệch tiêu chuẩn. Sai số trong đánh giá σ. Sự giảm số biểu lộ ảnh hưởng kép
đến độ lệch tiêu chuẩn. Thứ nhất là số giá trị σ rất lớn và rất nhỏ tăng lên nghĩa là độ lặp lại
của σ bị xấu đi. Thứ hai là độ lệch tiêu chuẩn trở thành sự đánh giá độ lặp lại bị dịch chuyển
về phía âm hơn. Sự dịch chuyển diễn tả sự xuất hiện vói tần số lớn những giá trị σ nhỏ so với
những giá trị σ lớn và sự giảm giá trị σ trung bình khi giảm số phép đo lặp lại.
19
Sự dịch chuyển âm giá trị σ đối với số lần đo nhỏ là do giá tri trung bình và độ lệch tiêu
chuẩn nhận được từ một và chỉ một dãy nhỏ dữ kiện. Có thể chỉ ra rằng, sự dịch chuyển đó ở
một mức độ đáng kể được loại trừ khi đưa vào phương trình (2.4) số bậc tự do n – 1 thay thế
cho n. Như vậy, đối với số lần đo nhỏ, độ lệch tiêu chuẩn được xác định theo công thức:

N
∑ (xi − x)2
S= i =1 (2.5)
n −1

Cần chú ý tới hai điều khác nhau của phương trình (2.5) so với phương trình (2.4). Thứ
nhất là, ở mẫu số bây giờ là n – 1. Thứ hai là, thay thế cho đại lượng thật nhưng không biết, μ,
là giá trị trung bình của số nhỏ các phép đo, x . Để nhấn mạnh rằng độ lệch tiêu chuẩn thu
được chỉ là gần đúng với giá trị thật và được chấp nhận ký hiệu bằng chữ số S chứ không phải
là σ. Ví dụ, tính độ lệch tiêu chuẩn S đối với dãy gồm 5 giá trị, Xi được dẫn ra ở bảng sau:

xi xi − x (x i − x)2

9,990 7,6.10–3 57,8.10–6

9,986 3,6.10–3 13,0.10–6

9,973 9,4.10–3 88,4.10–6

9,983 0,6.10–3 0,4.10–6

9,980 2,4.10–3 5,8.10–6

5
x =9,9824; (5 [49,992]) ∑ (xi − x)2 = 165,4.10−6
i =1

Từ phương trình (2.5) ta có:

165,4.10−6
S= = 6,4.10−3 = ±0,006
5 −1

Sự hợp lý của sự thay thế (n – 1) vào phương trình (2.5) được giải thích như sau. Vì
không biết μ, chúng ta phải sử dụng cách tính cho dãy có số ít kết quả để thu được hai giá trị
x và S. Sự cần thiết xác định giá trị trung bình x dẫn đến sự loại trừ một bậc tự do, nghĩa là
khi giữ nguyên dấu, tổng của những độ lệch riêng biệt khỏi x cần phải bằng 0. Nếu giá trị (n –
1) độ lệch được xác định thì độ lệch cuối cùng tất nhiên là cũng biết. Do đó, khi đánh giá độ
lặp lại của mẫu chỉ (n – 1) độ lệch người ta đưa vào những đại lượng độc lập.

Đánh giá đại lượng S theo ω. Đối với dãy có số ít các kết quả (đến 15) cũng có thể tính S,
xuất phát từ biên độ dao động ω theo công thức:
20
ω
S= (2.6)
d

Ở đây d là hệ số thống kê, phụ thuộc vào số phép đo (xem bảng 2.5). Đánh giá S theo phương
trình (2.6) đơn giản hơn nhưng kém tin cậy hơn so với phương trình (2.5).

Bảng 2.6 Hệ số d để tính độ lệch tiêu chuẩn S theo giá trị biên độ dao động ω

n d n d n d

2 1,128 7 2,704 3,528


12
3 1,693 8 2,847 3,336
13
4 2,059 9 2,970 3,047
14
5 2,326 10 3,078 3,472
15
6 2,534 11 3,173

2.4.5 Sử dụng những phương pháp thống kê

Nhà thực nghiệm sử dụng những phép tính thống kê để hoàn thiện sự đánh giá của mình về
ảnh hưởng của sai số ngẫu nhiên. Sự đánh giá đó trong giáo trình này bao gồm:

1. Khoảng xung quanh mẫu trung bình, mà trong khoảng đó với một xác suất xác định có
giá trị trung bình thật.

2. Số phép đo song song cần thiết để trung bình thực nghiệm với một xác suất nhất định
rơi vào khoảng dự đoán xung quanh giá trị trung bình thật.

3. Giải quyết vấn đề, trong tính toán mẫu trung bình có nên giữ lại hay loại trừ những giá
trị rơi ra ngoài dãy kết quả song song.

4. Xác suất về việc hai mẫu được phân tích bằng phương pháp tương tự nhưng do kết quả
khác nhau về thành phần, nghĩa là sự khác nhau về kết quả thực nghiệm gây nên bởi sai số
ngẫu nhiên hay bởi sự khác nhau thật sự trong thành phần.

Tiếp theo chúng ta sẽ xét bốn điểm trên.

2.4.6 Khoảng tin cậy

Trung bình thật μ - một hằng số mà giá trị của nó luôn luôn không biết được nhưng nhờ
thống kê có thể xác định giới hạn của vùng xung quanh giá trị trung bình x tìm được bằng
thực nghiệm mà trong vùng đó hy vọng với một xác suất đã cho tìm được giá trị trung bình
thật. Như vậy, những giới hạn thu được được gọi là giới hạn tin cậy. Khoảng giới hạn bởi
21
những giới hạn đó được gọi là khoảng tin cậy. Cần chú ý một số tính chất của khoảng tin cậy.
Đối với một mẫu đã cho, giá trị của khoảng này một phần được xác định bằng độ hy vọng đã
cho trước. Rõ ràng là để dự đoán đúng đắn tuyệt đối, chúng ta cần phải chọn một khoảng đủ
lớn và bao gồm trong nó các giá trị có thể chấp nhận là xi có thể có được. Ngược lại, nếu
chúng ta chấp nhận rằng, xác suất rơi vào vùng là 99 kết quả đúng so với 100 thì khoảng đó
không cần phải lớn đến như thế và có thể làm cho nó nhỏ hơn nếu chấp nhận xác suất là 95%.
Nói một cách gọn hơn, xác suất dự đoán độ đúng đắn càng nhỏ thì khoảng giới hạn tin cậy
càng nhỏ.

Khoảng tin cậy là đại lượng xuất phát từ độ lệch tiêu chuẩn S của phương pháp đo, phụ
thuộc vào độ tin cậy của các giá trị đo được vì từ các giá trị này S được xác định. Thường nhà
hoá học có quyền khẳng định rằng giá trị thực nghiệm S mà họ tìm được là gần nhất với σ.
Nhưng trong một số trường hợp đại lượng S có thể chứa sai số đáng kể. Trong những trường
hợp đó khoảng tin cậy cần phải mở rộng.

Những phương pháp để thu được giá trị gần với σ. Sự thăng giáng khi tính toán đại
lượng S theo phương trình (2.5) bị giảm đi cùng với sự tăng số lần đo n. Sự thật, có thể chấp
nhận rằng, đối với mục đích thực tế S và s là đồng nhất nếu n lớn hơn 20. Điều đó cho phép
nhà hoá học thu được giá trị gần đúng tốt nhất đối với S nếu phương pháp đó không quá khó
và có được lượng mẫu tương ứng. Ví dụ, nếu trong quá trình nghiên cứu cần phải đo pH của
một số rất lớn dung dịch thì một cách hợp lý, có thể xác định S trong dãy thí nghiệm đầu. Kỹ
thuật thực hiện phép đo đó rất đơn giản, chỉ là nhúng cặp điện cực đã rửa và làm khô vào
dung dịch nghiên cứu; hiệu thế giữa các điện cực được dùng làm số đo pH. Để xác định S có
thể đo pH trong 20 – 30 phần của dung dịch với giá trị pH đã cố định và xác định tuân theo
trình tự đo. Thường có thể chấp nhận rằng, sai số ngẫu nhiên của dãy đó cũng chính là sai số
ngẫu nhiên của các phép đo tiếp theo và đại lượng S được tính toán theo phương trình (2.5) là
đáng tin cậy và là số đo chính xác của đại lượng σ lý thuyết.

Đối với những phép phân tích tốn nhiều công sức, cách làm mô tả trên đây không thể
dùng được trong thực tế. Nhưng trong trường hợp đó những dữ kiện của những mẫu khác
nhau có thể liên kết lại để thu được giá trị đáng tin cậy hơn so với giá trị S của mẫu riêng lẻ.
Và một lần nữa phải chấp nhận rằng những nguyên nhân của sai số ngẫu nhiên trong phân
tích tất cả các mẫu là như nhau. Sự chấp nhận đó thường đúng đắn trong điều kiện là các mẫu
gần nhau về thành phần và mỗi mẫu đều được phân tích trong những điều kiện gần giống
nhau. Để thu được sự đánh giá thống nhất người ta bình phương độ lệch khỏi giá trị trung
bình của mỗi mẫu sau đó cộng các bình phương độ lệch của tất cả các mẫu và chia cho số bậc
tự do tương ứng. Lấy căn bậc hai thương số ta thu được đại lượng thống nhất S. Trong mỗi
mẫu mất đi một đại lượng tự do. Do đó, số bậc tự do để tính đại lượng S thống nhất bằng số
phép đo tổng quát trừ đi số mẫu. Dưới đây dẫn ra ví dụ về cách tính toán đó.

Ví dụ: người ta đã xác định thuỷ ngân bằng phương pháp hấp thụ nguyên tử trong các
mẫu từ bảy con cá câu được ở hồ ERI. Những kết quả được dẫn ra dưới đây. Hãy tính độ lệch
tiêu chuẩn của phương pháp theo kết quả thống nhất.

Số Số phép Giá trị Tổng số các


Kết quả
mẫu đo song trung bình phương độ
22
song bình lệch khỏi giá trị
(hàm lượng Hg) n.10–4 %
n.10–4% trung bình

1,80; 1,58; 1,64


1 3 1,673 0,0259
0,96; 0,98; 1,02; 1,10
2 4 1,015 0,0115
3,13; 3,35
3 2 3,240 0,0242
2,06; 1,93; 2,12; 2,16; 1,98;
4 6 2,018 0,0611
1,95
5 4 0,570 0,0114
0,57; 0,58; 0,64; 0,49
6 5 2,482 0,0685
2,35; 2,44; 2,70; 2,48; 2,44
7 4 1,130 0,0170
1,11; 1,15; 1,22; 1,04

Số phép đo: 28 Tổng bình phương = 0,2196

Giá trị tổng các bình phương độ lệch khỏi giá trị trung bình đối với mẫu 1 được dẫn ra ở
cột 5 thu được như sau:

xi xi − x (x i − x)2

1,80 0,0161
0,127
1,58 0,0087
0,093
1,64 0,0011
0,033
3 [5,02] Tổng các bình phương = 0,0259

x i = 1,673

Một cách tương tự thu được những dữ kiện còn lại đã được dẫn ra ở cột 5 bảng trên.

0,0259 + 0,0115 + 0,0242 + 0,0611 + 0,0114 + 0,0685 + 0,0170


S= = 0,10.10−4%Hg
28 − 7

Khi số bậc tự do lớn hơn 20 sự đánh giá S có thể được xem như rất gần với σ.

Khoảng tin cậy khi S rất gần với σ. Như đã nói trước đây, chiều rộng của đường cong
phân bố chuẩn sai số được xác định bởi đại lượng σ. Z cũng đóng vai trò tương tự σ trong các
phương trình (2.2) và (2.3). Theo phương trình (2.2) có thể tính diện tích dưới đường cong
phân bố chuẩn sai số theo diện tích chung đối với mỗi giá trị Z.
23
Bảng 2.7 Xác suất tin cậy đối với những giá trị Z khác nhau

Xác suất tin cậy,% Z Xác suất tin cậy,% Z

50 ± 0,67 ± 2,00
96
68 ± 1,00 ± 2,58
99
80 ± 1,29 ± 3,00
99,7
90 ± 1,64 ± 3,29
99,9
95 ± 1,96

Tỷ số đó (thường được diễn tả bằng phần trăm) được gọi là xác suất tin cậy và là số đo
xác suất của Z σ, nhỏ hơn độ lệch tuyệt đối (x – μ). Ví dụ diện tích dưới đường cong ở Z = ±
1,96σ là 95% diện tích, và chúng ta có thể khẳng định rằng đối với số lớn phép đo giá trị (x –
μ) tính toán được sẽ bằng hoặc nhỏ hơn ± 1,96σ trong 95 trường hợp trong số 100. Ở bảng 2.7
dẫn ra những khoảng tin cậy đối với những giá trị Z khác nhau. Giới hạn tin cậy đối với một
phép đo duy nhất có thể thu được bằng cách biến đổi phương trình (2.3) và nhớ rằng Z có thể
có dấu cộng hoặc trừ.

Như vậy, giới hạn tin cậy:

μ = x ± Zσ (2.7)

Dưới đây dẫn ra ví dụ về cách sử dụng phương trình (2.7).

Ví dụ: Hãy tính giới hạn tin cậy ở xác suất tin cậy 50% và 90% đối với kết quả đầu tiên
(1,80.10–4% Hg) trong ví dụ trước đây.

Chúng ta đã biết rằng S = 0,10.10–4% Hg và các dữ kiện với giả thiết S ≈ σ là đủ. Từ bảng
2.7 ta thấy rằng Z = ± 0,67 và ± 1,96 tương ứng với hai xác suất tin cậy 50 và 95. Do đó theo
phương trình (2.8):

Giới hạn tin cậy với xác suất tin cậy 50%:

μ = 1,80 ± 0,67.0,10 = (0,80 ± 0,07).10–4%

Giới hạn tin cậy với xác suất tin cậy 95%:

μ = 1,80 ± 1,96.0,10 = (1,80 ± 0,20).10–4%

Trong 50 trường hợp trong số 100, trung bình thật (hoặc giá trị thật không có sai số hệ
thống) μ nằm trong khoảng(1,73 – 1,87).10–4% Hg. Trong 95 trường hợp trong số 100, giá trị
thật rơi vào khoảng (1,60 – 2,00).10–4% Hg.
24
Phương trình (2.7) được ứng dụng để đánh giá kết quả của một phép đo duy
nhất. Có thể nói rằng, khoảng tin cậy giảm n lần đối với giá trị trung bình từ n phép đo song
song. Như vậy, ở dạng tổng quát hơn phương trình (2.78) có dạng:

Giới hạn tin cậy:


μ=x± (2.8)
n

Ví dụ: Hãy tính giới hạn tin cậy của giá trị trung bình (1,67.10–4% Hg) của mẫu 1 trong ví
dụ thứ nhất của chương này với xác suất tin cậy 50% và 95%.

Một lần nữa S ≈ σ = 0,10.

Đối với 3 phép đo:

Giới hạn tin cậy với xác suất 50%.

0,67 × 0,10
μ = 0,67 ± = (1,67 ± 0,04).10−4%
3

Giới hạn tin cậy với xác suất 95%

1,96 × 0,10
μ = 1,96 ± = (1,67 ± 0,11).10−4%
3

Như vậy: Trong 50 trường hợp trong số 100, giá trị trung bình thật sẽ nằm trong khoảng:
(1,63 – 1,71).10–4% Hg và trong 95 trường hợp trong số 100 nó sẽ nằm trong khoảng (1,56 –
1,78).10–4% Hg.

Ví dụ: Hãy tính số phép đo song song cần thiết để làm giảm khoảng tin cậy với xác suất
tin cậy 95% đến 0,005 ml khi hiệu chuẩn pipet thể tích 10 ml. Kỹ thuật hiệu chuẩn đã được
nói rõ khi thu được những số liệu ở bảng 2.4.

Độ lệch tiêu chuẩn của phép đo bằng 0,0065 ml. Vì giá trị S thu được từ 24 phép đo nên
có thể giả thiết rằng S ≈ σ =0,0065. Khoảng tin cậy được tính toán như sau:


Khoảng tin cậy =± ;
n

1,96 × 0,0065
0,005 ml = ± ; n= 6,5
n

Như vậy, sử dụng giá trị trung bình từ bảy phép đo, chúng ta có thể thu được thể tích
trung bình tin cậy chảy ra từ pipet với độ chính xác đến ± 0,005 ml với xác suất tin cậy 95%.
25
Phương trình (2.8) chỉ ra rằng, để làm giảm khoảng tin cậy đi hai lần cần làm 4 phép đo.
Để thu hẹp giới hạn của nó thêm hai lần nữa đòi hỏi 16 phép đo. Rõ ràng là khi thu được
những số liệu bổ sung, giới hạn khoảng tin cậy giảm đi.

Giới hạn tin cậy khi chưa biết σ. Thường nhà hoá học bắt buộc phải sử dụng những
phương pháp phân tích không được nghiên cứu trước. Ngoài ra sự thiếu thốn thời gian và sự
giới hạn lượng mẫu được giao làm khó khăn cho việc xác định chính xác đại lượng σ.

Bảng 2.8 Giá trị t ở những xác suất tin cậy khác nhau

Số bậc Xác suất tin cậy, %


tự do
80 90 95 99 99,9

1 3,08 6,31 12,7 63,7 637

2 1,89 2,92 4,30 9,92 31,6

3 1,64 2,35 3,18 5,84 12,9

4 1,53 2,13 2,78 4,60 8,60

5 1,48 2,02 2,57 4,03 6,86

6 1,44 1,94 2,45 3,71 5,96

7 1,42 1,90 2,36 3,50 5,40

8 1,40 1,86 2,31 3,36 5,04

9 1,38 1,83 2,26 3,25 4,78

10 1,37 1,81 2,23 3,17 4,59

11 1,36 1,80 2,20 3,11 4,44

12 1,36 1,78 2,18 3,06 4,32

13 1,35 1,77 2,16 3,01 4,22

14 1,34 1,64 1,96 2,58 3,29

Trong trường hợp này, theo một dãy phép đo song song, không chỉ cần xác định giá trị
trung bình mà còn cần đánh giá độ lặp lại. Như đã nói trước đây, sự tính toán S theo một số có
hạn những dữ kiện có thể dẫn tới sai số đáng kể. Trong trường hợp này giới hạn tin cậy sẽ
rộng ra.
26
Để tính toán những giá trị S có thể có, người ta đưa vào tiêu chuẩn t được xác
định như sau:

x−μ
t= (2.9)
S

Khác với Z trong phương trình (2.3), t không chỉ phụ thuộc vào xác suất tin cậy đã cho
mà còn phụ thuộc số bậc tự do trong công thức để tính S. Chú ý là khi số bậc tự do là vô hạn,
giá trị t tiến tới giá trị Z được dẫn ra ở bảng 2.7.

Có thể tính giới hạn tin cậy theo giá trị t khi sử dụng phương trình tương tự (2.8). Như
vậy:

Giới hạn tin cậy:

tS
μ=x± (2.10)
n

Ví dụ: Nhà phân tích nhận được các số liệu sau về hàm lượng rượu trong máu: etanol
(tính bằng phần trăm) = 0,084; 0,089; 0,079. Hãy tính khoảng tin cậy đối với giá trị trung bình
ở xác suất tin cậy 95%. Giả sử rằng:

1. Người ta không biết gì về độ lặp lại và

2. Trên cơ sở của những thí nghiệm sơ bộ biết được giá trị S ≈ s = 0,005% etanol.

Giải :

0,084 + 0,089 + 0,079


1. x = = 0,0840
3

(0,00)2 + (0,0050)2 + (0,0050)2


S= = 0,0050
3 −1

Từ bảng 2.7, rõ ràng là ở hai bậc tự do, t = ± 4,30 với xác suất tin cậy 95%.

4,3 × 0,0050
Khoảng tin cậy ở xác suất 95% = 0,084 ± = 0,084 ± 0,012
3

2. Vì có giá trị tin cậy σ với xác suất 95%

1,96 × 0,0050
Khoảng tin cậy ở xác suất ở 95% = 0,084 ± = 0,084 ± 0,006
3

Rõ ràng là, biết giá trị σ sẽ thu hẹp khoảng tin cậy đi một nửa.
27
2.4.7 Những phương pháp thống kê kiểm tra giả thuyết

Nhiều nghiên cứu khoa học và kỹ thuật được thực hiện để kiểm tra giả thuyết. Để hiểu rõ
bản chất những quan sát mà từ đó mô hình lý thuyết được hình thành cần thực hiện những
thực nghiệm để kiểm tra độ đúng đắn của nó.

Nếu kết quả của những thực nghiệm không khẳng định mô hình thì người ta bỏ nó đi và
tìm kiếm mô hình mới.

Ngược lại, nếu quan sát thấy sự phù hợp giữa thực nghiệm và những kết quả mong đợi thì
mô hình giả thiết có thể được dùng làm cơ sở cho những thực nghiệm tiếp theo. Nếu giả thiết
được khẳng định bằng một lượng đủ lớn những dữ kiện thực nghiệm thì giả thiết được chấp
nhận là lý thuyết cho tới khi những dữ kiện thực nghiệm khác không bác bỏ nó.

Ít khi những dữ kiện thực nghiệm phù hợp với những dữ kiện chính xác của mô hình. Do
đó, người nghiên cứu cần thường xuyên quan sát khi giải quyết vấn đề, sự bất đồng đó là dấu
hiệu sai lầm của giả thuyết hay chỉ là kết quả của sai số ngẫu nhiên không thể tránh khỏi của
phép đo. Khi đó một số phương pháp kiểm tra thống kê tỏ ra có ích.

Thuộc các phương pháp kiểm tra loại đó có phương pháp “giả thuyết không” dựa trên sự
so sánh những giá trị bằng số của hai đại lượng thực tế bằng nhau. Sau đó người ta đánh giá
xác suất xuất hiện sự khác nhau quan sát được do sai số ngẫu nhiên theo những quy luật của
thống kê. Nếu sự khác nhau bằng hoặc lớn hơn sự khác nhau có thể xuất hiện 5 lần trong số
100, tuỳ thuộc vào độ tin cậy đòi hỏi của kết luận.

Những nhà hoá học rất hay dùng các phương pháp kiểm tra, như so sánh hai giá trị trung
bình của hai mẫu (x1 và x2); so sánh giá trị trung bình của phép phân tích x1 và đại lượng μ
được chấp nhận là thật; so sánh những độ lệch tiêu chuẩn S1 và S2, hoặc σ1 và σ2 của hai dãy
đo và cả độ lệch tiêu chuẩn S của mẫu nhỏ và độ lệch tiêu chuẩn σ của mẫu lớn. Trong các
mục tiếp theo chúng ta sẽ xét tới những phương pháp thực hiện những phép so sánh như vậy.

So sánh giá trị trung bình tìm được bằng thực nghiệm với giá trị thật, ứng dụng một
phương pháp phân tích đã biết cho một mẫu đã biết chính xác thành phần là phương pháp
thường dùng để phát hiện sai số ngẫu nhiên. Theo tất cả mọi xác suất, giá trị trung bình tìm
được bằng thực nghiệm x sẽ khác với giá trị thật μ.

Vấn đề cần giải quyết là, sự khác nhau đó do sai số hệ thống của phương pháp.

Giải thống kê bài toán này bao hàm sự so sánh hàm số (x – μ) với hiệu số cần phải có
trong những điều kiện bình thường có kể tới sai số ngẫu nhiên. Nếu hiệu số quan sát được nhỏ
hơn hiệu số tính toán ở xác suất tin cậy đã lựa chọn thì xem như “giả thuyết không” (x và μ
không khác nhau) được khẳng định. Và khi đó có thể rút ra kết luận, không có sai số hệ thống
trong thực nghiệm. Ngược lại, nếu (x – μ) tương đối lớn hơn so với giá trị mong đợi hay giá
trị chuẩn thì có thể cho rằng, hiệu số có nghĩa và sai số hệ thống được chấp nhận.
28
Giá trị chuẩn để phủ định “giả thuyết không” có thể thu được sau khi viết lại
phương trình (2.11) dưới dạng :

tS
x−μ = ± (2.11)
n

ở đây n là số phép đo song song được thực hiện trong kiểm tra. Nếu đánh giá được độ tin
cậy σ, thì có thể biến đổi phương trình (2.11) bằng cách thay thế t và S bằng Z và σ tương
ứng.

Ví dụ: Một phương pháp mới xác định nhanh lưu huỳnh trong dầu hoả, được kiểm tra
bằng cách dùng để phân tích mẫu có hàm lượng lưu huỳnh biết trước, bằng 0,123%. Đã thu
được những kết quả xác định lưu huỳnh theo phần trăm như sau: 0,112; 0,118; 0,115; 0,119.
Có phải chăng những dữ kiện đó chỉ ra sai số hệ thống âm của phương pháp mới?

0,122 + 0,118 + 0,115 + 0,119


x= = 0,116
4

x – μ = 0,116 – 0,123= – 0,007

(0,00040)2 + (0,0020)2 + (0,0010)2 + (0,0030)2


S= = 0,0032
4 −1

Từ bảng (2.8) ta tìm thấy rằng, ở xác suất tin cậy 95% và ba bậc tự do t có giá trị 3,18. Do
tS 3,18 × 0,0032
đó: = = ±0,0059
n 3

Nhưng x – μ = – 0,007.

Có thể hy vọng rằng 5 lần trong số 100, trung bình tìm được bằng thực nghiệm sẽ sai lệch
± 0,0059 hoặc lớn hơn. Như vậy là nếu chúng ta kết luận rằng, 0,007 là hiệu số có nghĩa thì
trung bình, kết luận đó đúng trong 95 trường hợp và sai trong 5 trường hợp trong số 100.

So sánh hai trung bình thực nghiệm. Nhà hoá học thường sử dụng những số liệu phân tích
để khẳng định tính đồng nhất hay không của hai vật liệu. Trong trường hợp đó cần phải biết,
sự khác nhau của kết quả phân tích là do sai số ngẫu nhiên của cả hai dãy đo hay là do sự
khác nhau thật sự của nguyên liệu gây nên. Để thấy rõ chúng ta giả thiết rằng đã làm n1 phép
phân tích song song vật liệu 1 và n2 phép phân tích vật liệu 2. Dùng phương trình (2.10)
chúng ta có thể viết:

tS
μ1 = x1 ±
n1
tS
μ2 = x 2 ±
n2
29
ở đây x1 và x2 là những trung bình tìm được bằng thực nghiệm. Để khẳng định, có tồn tại
hay không sự khác nhau giữa x1 và x2, chúng ta phải đưa ra “giả thiết không” nghĩa là μ1 và
μ2 là đồng nhất. Sau đó làm cân bằng hai phương trình ta thu được:

tS tS
x1 = ± = x2 ±
n1 n2

Đẳng thức đó dễ dàng được chuyển thành:

n1 + n2
x1 − x2 = ± tS (2.12)
n1n2

Giá trị bằng số của biểu thức ở bên phải được tính toán với sự sử dụng giá trị t ứng với
xác suất tin cậy đã cho (số bậc tự do để tìm t bằng n1 + n2 – 2). Nếu hiệu số x1 − x2 tìm được
bằng thực nghiệm nhỏ hơn đại lượng tính toán được thì “giả thiết không” được khẳng định và
có thể cho rằng giữa những giá trị trung bình không có sự khác biệt có ý nghĩa. Ngược lại,
nếu hiệu số tìm được bằng thực nghiệm lớn hơn đại lượng tính toán có sử dụng t thì sự khác
nhau là có nghĩa.

Nếu độ tin cậy σ dã được đánh giá thì có thể biến đổi phương trình (2.12) bằng cách thay
thế t và S bằng Z và σ.

Ví dụ 1: Người ta so sánh thành phần sơn mà vết của nó được phát hiện trên quần áo của
nạn nhân trong tai nạn ôtô với sơn trên chiếc ôtô mà người lái nó bị nghi ngờ là thủ phạm của
trường hợp bất hạnh này. Những số liệu của phép xác định quang phổ Ti trong sơn được dẫn
ra dưới đây nói được gì về sự khác nhau trong thành phần của hai nguyên liệu. Theo những số
liệu sơ bộ, độ lệch tiêu chuẩn của phép phân tích được biết trước và bằng 0,35% Ti, nghĩa là S
→ σ = 0,35% Ti.

Hàm lượng Ti, %

Sơn trên quần áo: 4,0; 4,6.

Sơn trên ôtô: 4,5; 5,3; 5,5; 5,0; 4,9.

4,6 + 4,0
x1 = = 4,3
2

4,5 + 5,3 + 5,0 + 4,9 + 5,5


x2 = = 5,04
5

x1 − x 2 = 4,3 − 5,05 = −0,74% Ti

Chú ý rằng S → σ, biến đổi phương trình (2.12) một cách tương ứng và tiến hành tính
toán với xác suất tin cậy 95 và 99%:
30
n1 + n2 2+5
± Zσ = 1,96 × 0,35 = ±0,57
n1n2 2×5

2+5
= 2,58 × 0,35 = ±0,76
2×5

Chúng ta thấy rằng, chỉ 5 trường hợp trong số 100 kết quả khác 0,57% Ti và lớn hơn; và
chỉ có một trường hợp trong số 100 hiệu số lớn hơn 0,76% Ti. Như vậy, hoàn toàn chắc chắn
rằng sự khác nhau quan sát được –0,74% không phải là hậu quả của sai số ngẫu nhiên mà do
sự khác nhau thật sự về thành phần của hai mẫu sơn gây nên. Do đó chúng ta cần rút ra kết
luận là, người lái xe bị nghi ngờ không tham dự vào trường hợp bất hạnh nêu trên.

Ví dụ 2: Người ta phân tích hàm lượng rượu trong rượu vang từ hai thùng gỗ lớn để
khẳng định có phải chăng chúng có cùng một nguồn gốc. Hàm lượng etanol trung bình trong
thùng thứ nhất bằng 12,61% được xác nhận trên cơ sở 6 phép phân tích. Giá trị trung bình từ
4 phép phân tích rượu vang trong thùng gỗ thứ hai là 12,53% rượu. Giá trị thống nhất S đối
với 10 phép phân tích bằng 0,070%. Phải chăng những số liệu đó chỉ ra rằng, rượu vang ở hai
thùng là khác nhau?

Trong trường hợp này chúng ta sử dụng phương trình (2.12), dùng giá trị t đối với 8 bậc
tự do (10 – 2) ở xác suất tin cậy bằng 95%.

n1 + n2 6+4
± tS = 2,31 × 0,70 = ±0,10%
n1n2 6×4

Hiệu số quan sát được bằng:

x1 − x 2 = 12,61 − 12,53 = −0,08%

Năm trường hợp trong số 100, hiệu số 0,10% gây nên bởi sai số ngẫu nhiên. Do đó ở xác
suất tin cậy ấy sự khác nhau không được xác nhận.

Trong ví dụ cuối cùng, ở xác suất tin cậy 95% không phát hiện được sự khác nhau có nghĩa
của những kết quả. Cần nhận xét rằng, điều đó không có nghĩa là x1 và x 2 bằng nhau. Còn
phải đòi hỏi cả những bằng chứng khác về sự đồng nhất của rượu vang ở hai thùng. Vì thực
chất, hoàn toàn có khả năng, một là vang đỏ một là vang trắng.

Để xác nhận với xác suất có thể chấp nhận được rằng, cả hai thứ vang đều từ cùng một và
chỉ một nguồn mà thôi đòi hỏi phải kiểm tra nhiều đặc tính khác nữa như vị, mùi, chỉ số khúc
xạ, hàm lượng axit axetic, đường và vết các nguyên tố. Nếu trong kết quả của tất cả các đặc
tính ấy và cả những phép thử khác không phát hiện thấy một sự khác nhau nào có nghĩa thì có
thể khẳng định rằng cả hai thứ vang có cùng một nguồn gốc chung. Ngược lại, sự phát hiện dù
chỉ là một sự khác nhau có nghĩa cũng đủ chỉ rõ rằng hai thứ vang đó có nguồn gốc khác
nhau. Như vậy, sự khẳng định một sự khác nhau có nghĩa trong một thử nghiệm duy nhất trở
thành tiêu biểu hơn nhiều so với sự khẳng định không có sự khác nhau.
31
2.4.8 Loại trừ số liệu mang sai số thô bạo

Nếu dãy số liệu chứa kết quả vượt ra ngoài, nghĩa là kết quả này khác giá trị trung bình
(hoặc trung tuyến) tương đối nhiều thì cần phải quyết định giữ nó hoặc loại bỏ. Lựa chọn tiêu
chuẩn để loại trừ kết quả đáng nghi ngờ có khó khăn của nó. Nếu lấy tiêu chuẩn chặt chẽ để
loại trừ kết quả vượt ra ngoài dãy sẽ gây khó khăn cho việc vứt bỏ phép đo đáng nghi ngờ,
làm cho những kết quả sai có thể còn lại trong dãy, ảnh hưởng quá đáng đến giá trị trung bình
của dãy. Mặt khác, những đòi hỏi mềm về độ lặp lại cùng với phương pháp không chặt chẽ về
loại trừ những kết quả có thể vứt bỏ thì chúng vẫn tồn tại trong mẫu, nghĩa là đưa thêm độ lệch
vào dãy số liệu. Đáng tiếc là không tồn tại một quy luật vạn năng có thể hướng dẫn giải quyết
vấn đề loại trừ kết quả.

Từ nhiều tiêu chuẩn thống kê đã được đề nghị, người ta yêu thích tiêu chuẩn Q hơn cả.
Sắp xếp dãy số liệu thu được theo trật tự, ví dụ, tăng dần và tính Qtn (Q thực nghiệm) theo
công thức:

xn − xn ±1
Qtn =
xmax − xmin

trong đó: xn là giá trị nghi ngờ, xmax là giá trị lớn nhất, xmin là giá trị bé nhất trong dãy kết
quả thu được, xn ± 1 là giá trị lân cận của xn. Giá trị Qtc (Q tiêu chuẩn) ở xác suất tin cậy 90%
được dẫn ra ở bảng 2.9 để so sánh Qtn với Qtc, nếu Qtn > Qtc thì số liệu nghi ngờ bị loại trừ và
ngược lại.

Bảng 2.9 Giá trị chuẩn của tiêu chuẩn Qa

Số quan sát Qtc (xác suất 90%) Số quan sát Qtc

2 –
7 0,51
3 0,94
8 0,47
4 0,76
9 0,44
5 0,64
10 0,41
6 0,56
a
Theo Dean R.B., Dixon W.J. Anal.Chem. 23, 636 (1951)

Ví dụ: Khi phân tích mẫu canxit thu được hàm lượng CaO (biểu diễn bằng phần trăm):
55,95; 56,00; 56,04; 56,08; 56,23. Giá trị cuối cùng dường như là bất thường. Nên giữ hay
nên loại trừ nó?

Hiệu số giữa 56,23 và giá trị gần nó là 56,08 bằng 0,15%; xmax – xmin của mẫu (56,23 –
55,95) là 0,28%. Do đó:
32
0,15
Qtn = = 0,54
0,28

Đối với 5 lần đo Qtc = 0,64. Vì 0,54 < 0,64 nên kết quả cần phải giữ lại.

Mặc dù tiêu chuẩn Q có ưu thế so với những tiêu chuẩn khác nhưng việc ứng dụng nó
cũng cần phải thận trọng. Ví dụ, thường xảy ra tình trạng có phương sai của mẫu, một cách
ngẫu nhiên, là đại lượng nhỏ và sự ứng dụng không chuẩn tiêu chuẩn Q dẫn tới sự loại trừ
những giá trị mà thực chất cần phải giữ lại. Sự thật là nếu trong mẫu có 3 giá trị mà hai giá trị
đồng nhất thì giá trị thực nghiệm Q trở thành lớn không xác định. Mặt khác, khi sử dụng giá
trị của bảng tiêu chuẩn Q đối với mẫu nhỏ những số liệu sai lầm có thể vẫn được giữ lại.

Sự ứng dụng mò mẫm những tiêu chuẩn thống kê để giải quyết vấn đề loại trừ những
phép đo đáng nghi ngờ từ mẫu nhỏ tốt hơn một chút so với cách giải quyết tuỳ tiện. Phương
pháp trực giác dựa trên sự đánh giá độ lặp lại mong đợi, đặc biệt là nếu sự đánh giá đó dựa
trên sự thử toàn diện phương pháp phân tích, là phương pháp chín chắn hơn. Kết cục, sự loại
trừ kết quả thực nghiệm từ mẫu nhỏ cần phải dựa trên sự tin cậy chính xác đủ đảm bảo, nếu
không sẽ dẫn tới sai lầm. Nếu độ tin cậy như vậy không có, sự loại trừ kết quả cần phải thận
trọng.

Chúng tôi xin trình bày một số đề nghị để xử lý mẫu nhỏ chứa kết quả không thể đánh giá
được.

1. Kiểm tra cẩn thận tất cả những số liệu liên quan đến kết quả đáng nghi ngờ để xem xét,
có phải chăng đã cho sai số thô bạo xuất hiện ở kết quả này. Quản lý tốt nhật ký phòng thí
nghiệm, ghi chép chi tiết tất cả mọi quan sát là điều rất có lợi.

2. Tuỳ theo khả năng hãy đánh giá có bằng chứng xác đáng về độ lặp lại mong đợi của
phương pháp để đảm bảo là, kết quả rơi ra ngoài quả thật đáng bị nghi ngờ.

3. Nếu có thời gian và lượng mẫu đủ, hãy lặp lại phép phân tích. Sự tương ứng một lần
nữa kết quả thu được với những kết quả dường như là đúng đắn sẽ củng cố thêm dự định của
bạn về sự loại trừ kết quả rơi ra ngoài. Hơn nữa, kết quả nghi ngờ dường như ảnh hưởng ít
đến giá trị trung bình của mẫu lớn nếu cuối cùng buộc phải giữ nó.

4. Nếu không có khả năng thu được những số liệu bổ sung hãy ứng dụng tiêu chuẩn Q cho
mẫu và trên cơ sở đó giải quyết vấn đề về sự loại trừ kết quả nghi ngờ.

5. Nếu theo tiêu chuẩn Q, kết quả cần được giữ lại thì khi xử lý số liệu hãy sử dụng trung
vị chứ không phải là số trung bình. Trung vị có độ tin cậy lớn bởi vì nó giữ được giá trị dôi ra
ngoài trong mẫu mà không thể hiện ảnh hưởng đáng kể đến nó. Ngoài ra, có thể chỉ ra rằng
trung vị của mẫu với sự phân bố chuẩn gồm 3 phép đo cho sự đánh giá kết quả đúng, tin cậy
hơn so với giá trị trung bình của mẫu sau khi tùy ý loại trừ giá trị dôi ra ngoài.
33
2.1 Sự lan truyền sai số trên các phép tính

Nhà nghiên cứu thường đánh giá sai số của kết quả thu được qua phép tính với hai hoặc
một số kết quả đo lớn hơn mà mỗi kết quả này đều mang theo sai số của mình. Phương pháp
cộng các sai số riêng biệt phụ thuộc vào các phép tính số học được thực hiện với các đại
lượng có bao hàm sai số và đại lượng được tính toán ra. Ngoài ra ảnh hưởng của sai số hệ
thống và sai số ngẫu nhiên đến đại lượng tính toán được cũng khác nhau.

2.7.2 Phép cộng sai số hệ thống

Phương pháp đánh giá sai số hệ thống đối với tổng hoặc hiệu khác với phương pháp đánh
giá chúng đối với phép nhân hoặc chia.

2.5.1.1 Sai số của tổng hoặc hiệu

Chúng ta xét mối quan hệ:

y=a+b–c

Ở đây a,b và c là những giá trị của ba đại lượng đo được. Nếu Δa, Δb và Δc là những sai
số hệ thống tuyệt đối gắn liền với những phép đo của những đại lượng ấy. Những kết quả thật
của những phép đo bằng (a + Δa), (b + Δa) và (c + Δc). Sai số cộng trong phép xác định Y khi
đó bằng Δy và y + Δy = (a + Δa) + (b + Δb) – (c + Δc).

Trừ phương trình thứ hai cho phương trình thứ nhất có thể thu được sai số trong tính toán
kết quả, nghĩa là:

Δy = Δa + Δb – Δc (2.13)

Rõ ràng là khi cộng hoặc trừ, sai số tuyệt đối của tổng hoặc hiệu được xác định bằng sai
số tuyệt đối của các số hạng.

Ví dụ: Hãy tính sai số khi tính kết quả

+ 0,50 (+ 0,02)

+ 4,10 (– 0,03)

– 1,97 (– 0,05)

2,63

Ở đây số ở trong ngoặc là sai số hệ thống tuyệt đối. Sai số của tổng:

Δy = 0,02 + (– 0,03) – (– 0,05) = 0,04


34
2.5.1.2 Sai số nhân hoặc chia

Đầu tiên chúng ta xét phép nhân

y = a.b

Một lần nữa chúng ta giả thiết rằng, Δy thu được do sai số hệ thống Δa và Δb. Như vậy:

y + Δy = (a + Δa)(b + Δb) = ab + aΔb + bΔa + ΔaΔb

Trừ phương trình thứ hai cho phương trình thứ nhất ta thu được:

Δy = bΔa + aΔb + ΔaΔb

Bây giờ chia phương trình này cho phương trình thứ nhất, ta có:

Δy Δa Δb ΔaΔb
= + +
y a b ab

Thành phần thứ 3 trong vế phải của phương trình thường nhỏ hơn nhiều so với hai thành
phần khác bởi vì tử số là tích của hai số nhỏ và mẫu số là tích của hai số rất lớn. Vì ΔaΔb/ab
<< (Δa/b+ Δb/b), nên:

Δy Δa Δb
= + (2.14)
y a b

Chú ý là cả ba thành phần đều là sai số hệ thống tương đối chứ không phải là sai số tuyệt
đối như khi tính toán sai số của tổng hoặc hiệu.

Quan hệ tương tự cũng có thể rút ra đối với sai số của phép chia:

a
y=
b

Khi đó:

(a + Δa)
y + Δy =
(b + Δb)

Để thu được kết quả có thể viết hai phương trình trên dưới dạng:

yb = a

yb + bΔy + yΔb + ΔyΔb = a + Δa

Từ hai phương trình cuối cùng ta thu được:


35
bΔy + yΔb + ΔyΔb = Δa

Sau khi chia cho yb = a và biến đổi ta thu được:

Δy Δa Δb ΔyΔb
= − −
y a b yb

Một lần nữa chúng ta chấp nhận rằng: (ΔyΔb/yb) << (Δa/a – Δb/b).

Khi đó:

Δy Δa Δb
= −
y a b

Đối với trường hợp tổng quát hơn:

ab
y=
c

Bằng cách lý luận tương tự có thể chỉ ra rằng:

Δy Δa Δb Δc
= + − (2.15)
y a b c

Như vậy, khi nhân hoặc chia sai số tương đối của phép nhân hoặc chia được xác định
bằng sai số tương đối của các thành phần tham gia vào kết quả được tính toán.

Ví dụ: Hãy tính kết quả của những phép tính sau (trong ngoặc là những giá trị sai số hệ
thống tuyệt đối):

4,10( −0,02) × 0,0050( +0,0001)


y= = 0,010406
1,97( −0,04)

Trong trường hợp này, trong tính toán cần phải tính sai số tương đối. Như vậy:

Δy −0,02 0,0001 ( −0,04)


= + − = −0,0049 + 0,020 + 0,020 = 0,035
y 4,10 0,0050 1,97

Để thu được sai số tuyệt đối Δy trong tính toán y chúng ta viết:

Δy = 0,035.y= 0,035. 0,010406 = 0,0004

y = 0,0104 (+ 0,0004)
36
2.7.2 Cộng sai số ngẫu nhiên

Như chúng ta đã nhận xét trước đây, độ lệch tiêu chuẩn tuyệt đối là phương pháp thuận
lợi nhất để đánh giá sai số ngẫu nhiên của những kết quả thực nghiệm. Khác với sai số hệ
thống không nên ghi dấu cho độ lệch tiêu chuẩn bởi vì nó có thể dương hoặc âm với xác suất
như nhau, do đó độ lệch tiêu chuẩn của kết quả tính được nằm trong một số vùng.

Ví dụ, chúng ta xét phép cộng:

+ 0,50 (± 0,02)

+ 4,10 (± 0,03)

– 1,97 (± 0,05)

2,63

(Các số ở trong ngoặc là độ lệch tiêu chuẩn). Chúng ta nhận xét rằng nếu hai sai số đầu là
dương và sai số thứ ba là âm thì độ lêch tiêu chuẩn của kết quả phải là:

sy = + 0,02 + 0,03 – (– 0,05) = 0,10

Mặt khác, trong những tình huống bất ngờ sai số tổng cộng có thể bằng không. Kết quả sẽ
như thế nếu 3 đại lượng đều dương:

sy = + 0,02 + 0,03 – (+0,05) = 0,00

Trong bất kỳ trường hợp nào cũng không nên chấp nhận một tổ hợp bất kỳ của độ lệch
dẫn tới một giá trị nào đó giữa các cực trị làm sai số.

Thống kê chỉ rõ rằng giá trị tốt hơn hoặc đáng tin cậy hơn của độ lệch tiêu chuẩn tuyệt
đối, sy, của tổng hoặc hiệu được xác định bằng phương trình:

sy = s2a + s2b + s2c + ... (2.16)

ở đây sa; sb; sc ... là độ lệch tiêu chuẩn tuyệt đối của những số tham gia vào tổng hoặc
hiệu. Chúng ta nhận thấy rằng độ tản mạn tuyệt đối của kết quả là tổng độ tản mạn tuyệt đối
thành phần. Cũng có thể viết phương trình (2.16) dưới dạng:

s2y = s2a + s2b + s2c

Như vậy là khi nhân và chia, độ lệch tiêu chuẩn tương đối được tổ hợp lại. Ví dụ, để nhận
được độ lệch tiêu chuẩn đối với y trong tỷ số:

ab
y=
c
37
2 2 2
sy ⎛s ⎞ ⎛s ⎞ ⎛s ⎞
có thể viết: = ⎜ a ⎟ +⎜ b ⎟ +⎜ c ⎟ (2.17)
y ⎝ a ⎠ ⎝ b⎠ ⎝ c ⎠

Ví dụ: Hãy tính độ lệch tiêu chuẩn của tổng đã dẫn ra trong ví dụ đã xét trên. Vì tính toán
tổng, độ lệch tiêu chuẩn tuyệt đối được tổ hợp lại:

sy = ( ±0,02)2 + ( ±0,03)2 + ( ±0,05)2 = ±0,06

Từ đó: y = 2,63 (± 0,06)

Trong trường hợp này xác suất tương đối nhỏ hơn so với sai số cực đại:

(0,02 + 0,03 – 0,05 = 0,00)

Ví dụ: Hãy tính độ lệch tiêu chuẩn xác suất đối với kết quả của phép tính:

(4,10 ± 0,02)(0,0050 ± 0,0001)


y= = 0,01041 ± ?
1,97 ± 0,04

Trong trường hợp này chúng ta cần phải sử dụng độ lệch tiêu chuẩn tương đối. như vậy:

2 2 2
⎛ ±0,02 ⎞ ⎛ ±0,0001 ⎞ ⎛ ±0,04 ⎞
( )td
sy = ⎜ ⎟ +⎜ ⎟ +⎜
⎝ 4,10 ⎠ ⎝ 0,0050 ⎠ ⎝ 1,97 ⎠
⎟ = (±0,0049)2 + (±0,020)2 + (±0,020)2 = 0,029

Độ lệch tiêu chuẩn tuyệt đối được diễn tả như sau:

sy = y.(sy)td = 0,0104.0,029 = 0,0003

Do đó: y = 0,0104 (± 0,0003)

Ví dụ: Hãy tính độ lệch tiêu chuẩn kết quả của phép tính:

y=
[14,3( ±0,02) − 11,6( ±0,2)] × 50( ±0,16) = 3,191 ± ?
42,3( ±0,4)

Ban đầu cần tính độ lệch tiêu chuẩn đối với hiệu ở tử số:

s1 = ( ±0,2)2 + ( ±0,2)2 = ±0,28

Sau đó phương trình được viết lại thành:

2,7( ±0,28) × 50,0( ±0,1)


y= = 3,191
42,3( ±0,4)

Tiếp đó chúng ta tính độ lệch tiêu chuẩn tương đối của thương số:
38
2 2 2
⎛ ±0,28 ⎞ ⎛ ±0,1 ⎞ ⎛ ±0,4 ⎞
(sy )td = ⎜
⎝ 2,7 ⎠
⎟ +⎜ ⎟
⎝ 50,0 ⎠
+⎜ ⎟ = 0,10
⎝ 42,3 ⎠

Độ lệch tiêu chuẩn tuyệt đối của kết quả:

sy = 3,191.0,10 = 0,32

y = 3,2 (± 0,3)

Rất lý thú nhận xét rằng, trong giai đoạn tính ở tử số, sai số đã tăng.

2.7.2 Sự lan truyền sai số ở phép tính luỹ thừa

Để thấy rõ, sai số trong trường hợp khi cần phải nâng lũy thừa giá trị của kết quả thực
nghiệm hoặc khai căn nó thì sai số lan truyền như thế nào, chúng ta xét:

y = ax

ở đây x là chỉ số luỹ thừa hoặc căn số, số không chứa sai số.

Lấy vi phân phương trình đó:

dy = xa(x–1)da

Chia cho phương trình xuất phát ta được:

dy xa(x −1)da
=
y ax

nhưng:

a(x −1) 1
=
x a
a

do đó:

dy xda
=
y a

hoặc là đối với lượng tăng hữu hạn :

Δy Δa
=x (2.18)
y a

ở đây Δy là sai số tuyệt đối của phép xác định y, sinh ra do sai số Δa trong phép xác định
a. Rõ ràng là, sai số tương đối Δy/y của kết quả tính toán là sai số tương đối của giá trị thực
39
nghiệm Δa/a nhân với chỉ số luỹ thừa, x. Ví dụ, sai số tương đối của số bình phương hai lần
lớn hơn sai số của phép xác định chính số đó, còn sai số tương đối của một số nằm dưới dấu
căn bậc 3 bằng một phần ba sai số của phép xác định số đó.

Điều quan trọng cần chú ý là, quy luật lan truyền sai số ngẫu nhiên khi tăng chỉ số bằng
luỹ thừa khác với quy luật lan truyền sai số khi nhân bởi vì trong trường hợp đó không tồn tại
khả năng giản ước tương hỗ. Chúng ta nhớ lại rằng, độ lệch tiêu chuẩn của hai số và có thể
tính giá trị xác suất bằng cách lấy căn bậc hai của tổng bình phương sai số chúng ta áp dụng
phương pháp đó cho phép nhân một số với chính nó (a.a). Ở đây dấu tất nhiên là đồng nhất
bởi vì chính những đại lượng này là đồng nhất. Do đó sai số tương đối của phép xác định a2
phải bằng hai lần sai số xác định a. Phương trình (2.18) cũng được dùng để tính sai số ngẫu
nhiên; khi đó ta thay thế Δy và Δa bằng sy và sa.

Ví dụ 1: Độ lệch tiêu chuẩn khi đo đường kính d của quả cầu bằng ± 0,2 cm. Độ lệch tiêu
chuẩn bằng bao nhiêu khi tính thể tích quả cầu, nếu d = 10,0 cm?

3
4 ⎛ 10 ⎞
V= π = 523, 6 cm3
3 ⎜⎝ 2 ⎟⎠

Có thể viết:

s
(sy )td = Vy = 3sdd = 3 × 0,2
10
= 0,06

Vậy độ lệch tiêu chuẩn tuyệt đối của thể tích:

sy = 523,6.0,06 = 31

Do đó:

V = 524 (± 31) cm3 = 5,2(± 0,1).102 cm3

Ví dụ 2: Tích số tan (T) của muối bạc AgX bằng 4,0 (± 0,4).10–8.

Sai số tính toán độ tan AgX trong nước bằng bao nhiêu?

Trong trường hợp này (xem chương 3):

Độ tan = (4,0.10–8)1/2 = 2,0.10–4.

0,4 × 10 −8
(sx )td =
4,0 × 10 −8

(sy )td = 12 × 0,4


4,0
= 0,05
40
–4 –4
sy = 2,0.10 .0,05 = 0,1.10

Độ tan = 2,0 (± 0,1).10–4 g/l

2.7.2 Sự lan truyền sai số ở phép LOGARIT và ANTI LOGARIT

Để thấy rõ sai số ở phép tính LOGARIT và ANTI LOGARIT được lan truyền như thế
nào chúng ta lấy vi phân phương trình:

y = loga = 0,434.lna

ở đây ln là logarit tự nhiên. Như vậy:

da
dy = 0,434
a

Chuyển sang gia lượng hữu hạn, ta được:

Δa
Δy = 0,434 (2.19)
a

Chú ý là, sai số tuyệt đối của đại lượng y được xác định bằng sai số tương đối của đại
lượng a và ngược lại. Cũng như trước đây, có thể sử dụng phương trình (2.19) sau khi thay
thế Δa/a bằng độ lệch tiêu chuẩn tương đối còn Δy bằng độ lệch tiêu chuẩn tuyệt đối của đại
lượng y.

Ví dụ: Hãy tính độ lệch tiêu chuẩn tuyệt đối các kết quả của các phép tính sau. Độ lệch
tiêu chuẩn tuyệt đối đối với mỗi đại lượng được cho ở trong ngoặc.

a) y = log[2,00(± 0,02).10–3] = – 2,6990 ± ?

b) a = antlog[1,200 (0,003)] = 15,849 ± ?

c) a = antlog[45,4 (± 0,3)] = 2,5119.1045 ± ?

Giải:

a) Theo phương trình (2.19) chúng ta thấy rằng cần nhân độ lệch tiêu chuẩn tương đối với
0,434, nghĩa là:

0,02.10 −3
Δy = ±0,434 × = ±0,004 = s y
2,00.10 −3

Như vậy:

log[2,00 (± 0,002).10–3] = – 2,699 ± 0,004


41
b) Biến đổi phương trình (2.19) và thay thế Δa và Δy bằng độ lệch tiêu chuẩn tương ứng:

sa sy ±0,003
= = = ±0,0069
a 0,434 0,434

sa = ± 0,0069.a = ± 0,0069.15,849 = 0,11

Như vậy:

antlog[1,200 (± 0,002)] = 15,8 ± 0,1

c)

sa ±0,3
= = 0,69
a 0,434

sa = 0,69.a = 0,69.2,5119.1045 = 1,7.1045

Do đó:

antlog[45,4 (± 0,3)] = 2,5 (± 1,7).1045

Cần chú ý đến giá trị lớn của sai số tuyệt đối trong antilogarit của số có lượng nhỏ số
sau dấu phẩy. Sai số lớn trong trường hợp này được giải thích là số bên trái dấu phẩy (phần
đặc tính) chỉ dùng để chỉ chỗ của dấu phẩy. Trong ví dụ cuối cùng, sai số lớn trong
antilogarit là hệ quả của sai số lớn trong phần định trị của số (nghĩa là 0,4 ± 0,3).

2.2 Điều kiện có nghĩa của chữ số

Trong báo cáo về phép đo, nhà thực nghiệm không những cần đưa ra số liệu mà họ cho là
tốt nhất, có thể là số trung bình hoặc trung vị, mà còn cần đưa ra cả sự đánh giá về độ tin cậy
của nó. Vì độ tin cậy, tốt nhất là, diễn tả bằng độ lệch tiêu chuẩn của kết quả. Đôi khi có thể
gặp cả độ lệch khỏi giá trị trung bình, độ lệch khỏi trung vị hoặc là biên độ dao động bởi vì
những thông số này của độ lặp lại dễ tính hơn. Sự làm tròn kết quả thực nghiệm cũng là quy
luật tổng quát, như vậy chính xác là chỉ còn lại những giá trị đã biết, nhưng trong mỗi giá trị
đó còn có một chữ số đáng nghi ngờ. Quy luật đó được hiểu như là điều kiện có nghĩa của
chữ số.

Ví dụ, giá trị trung bình của các giá trị thực nghiệm 61,60; 61,46; 61,55; 61,61 bằng
61,555. Độ lệch tiêu chuẩn của tổng là ± 0,0069. Rõ ràng là, số thứ hai sau dấu phẩy trong
phần thập phân là đang nghi ngờ. Trong trường hợp này ghi tất cả các chữ số liên tiếp không
có ý nghĩa nên chúng ta phải làm tròn một cách tương ứng số trung bình. Cần phải bàn vấn
đề, lấy giá trị 61,55 hay 61,56 bởi vì giá trị 61,555 vừa đúng nằm giữa chúng. Có một quy
luật có ích: làm tròn số 5 luôn luôn dẫn tới số chẵn gần nhất. Khi đó xu hướng làm tròn theo
hướng định trước bị loại trừ bởi vì trong tình huống đã cho, số chẵn gần nhất sẽ có giá trị lớn
hơn hoặc nhỏ hơn có xác suất như nhau. Như vậy có thể cho giá trị sơ bộ: 61,56 ± 0,07.
42
Sự đánh giá độ tin cậy của độ lặp lại. Nếu có cơ sở để nghi ngờ ± 0,07, thì có
thể đưa ra kết quả dưới dạng 61,6 ± 0,1

Thường điều kiện có nghĩa của chữ số làm biến đổi sự đánh giá đặc biệt đối với độ lặp lại
của kết quả. Trong ví dụ nêu trên, kết quả bằng 61,6; về thực chất chúng ta nói rằng, chúng ta
bảo đảm các chữ số 6 và 1 nhưng giá trị số 6 thứ hai còn đáng nghi ngờ. Những thiếu sót của
phương pháp đó là hiển nhiên. Tất nhiên độc giả có thể đề nghị rằng, khoảng sai số nằm từ ±
0,05 đến ± 0,5

Khi sử dụng điều kiện có nghĩa của chữ số, điều quan trọng cần hiểu là, số 0 không chỉ có
chức năng như một chữ số mà còn được dùng để chỉ vị trí của dấu phẩy trong những số rất
nhỏ và rất lớn. Có thể dùng số Avogadro làm ví dụ. Ba số đầu tiên 6, 0 và 2 được biết một
cách tin cậy. Những chữ số tiếp theo đáng nghi ngờ nhưng có thể hơn cả, đó là số 3. Bởi vì
những chữ số tiếp sau 6023, không biết, sau số 3 chúng ta đặt 19 số 0. Ở đây những số không
chỉ chỉ rõ trật tự của số thôi chứ không có nghĩa khác. Rõ ràng là, cần phân biệt những chữ số
có nghĩa vật lý (nghĩa là những chữ số có nghĩa) và những chữ số hoặc không biết hoặc không
có nghĩa do phép đo không đáng tin cậy.

Những chữ số 0 liền sát với các chữ số đứng ở bên trái cũng có thể có nghĩa và không có
nghĩa. Ví dụ, trọng lượng của quả cân là 20 mg, không cần phải bổ chính đến phần mười
miligam, được biết với độ chính xác đến ba chữ số có nghĩa là 20,0. Nếu trọng lượng đó được
biểu diễn là 0,0200 g thì số chữ số có nghĩa không thay đổi. Nếu chúng ta muốn diễn tả thể
tích cốc hai lít dưới dạng 2000 ml thì số đó chỉ có một chữ số có nghĩa. Những con số 0 chỉ
chỉ rõ thứ tự của chỉ số. Nhưng có thể xảy ra trường hợp, thể tích của cốc được xác định bằng
thực nghiệm bằng 2,0 l. Trong trường hợp này số 0 sau dấu phẩy có nghĩa và chỉ rõ là thể tích
được biết với độ chính xác ít nhất là ± 0,5 l và cũng có thể là ± 0,05 l. Nếu như thể tích đó
được diễn tả bằng mililit, số 0 đứng sau số 2 là có nghĩa còn hai số 0 khác không có nghĩa. Sự
thực hiện phép ghi dưới dạng luỹ thừa loại bỏ được khó khăn đó. Khi đó chúng ta có thể diễn tả
thể tích dưới dạng 2,0.103 ml.

Từ những điều kiện trình bày trên ta thấy, sự thận trọng khi xác định số chữ số có nghĩa
của kết quả thu được qua một phép tính số học với hai hoặc một số lớn hơn số hạng mũ. Khi
cộng hoặc trừ, số chữ số có nghĩa có thể xác định ngay. Ví dụ:

3,4 + 0,02 + 1,31 = 4,73

Rõ ràng là chữ số thứ hai sau dấu phẩy không có nghĩa, do đó sai số tổng quát được xác
định bằng sai số ở số lẻ thứ nhất sau dấu phẩy trong số hạng 3,4.

Khi nhân hoặc chia các số liệu người ta thường chấp nhận quy tắc lấy số chữ số có nghĩa
của kết quả bằng số chữ số có nghĩa của đại lượng chứa số chữ số có nghĩa nhỏ nhất. Ví dụ:

24 × 0,452
= 0,108 = 0,11
100,0

Trong trường hợp này, số 24 có hai chữ số có nghĩa và kết quả đã được làm tròn tương
ứng với số này. Đáng tiếc quy luật đã nêu trên không phải luôn luôn ứng dụng được. Chúng ta
43
giả thiết rằng, sai số của số 24 có thể nhỏ, ví dụ là 0,5 hoặc lớn hơn, ví dụ là 5. Sai số của
phép chia đối với giới hạn ấyđược xác định như sau:

Sai số tuyệt đối Sai số Sai số tuyệt đối


Làm tròn
giả thiết của số 24 tương đối của số 0,108

0,5/24 =
> 0,5 0,108.0,02 = 0,002 0,108
0,02
<5 0,108.0,2 =0,02 0,11
5/24 = 0,2

Cần phải thận trọng đặc biệt khi làm tròn logarit và antilogarit đến số có nghĩa thích hợp.
Chúng ta chú ý tới ví dụ đã dẫn ra ở trên về sự lan truyền sai số phép tính logarit và
antilogarit; sự làm tròn tương ứng của đại lượng log2,00.10–3 dẫn tới kết quả –2,699. Thì ra
phép tính đã làm tăng chữ số có nghĩa. Nhưng thực chất chữ số thứ ba xuất phát từ kết quả chỉ
chỉ rõ vị trí của dấu phẩy trong số xuất phát. Thông tin về số 2,00 cho 3 chữ số: 0,699. Như
vậy có sự tương ứng giữa số chữ số có nghĩa của phần đó của kết quả và chữ số xuất phát.

Như đã chỉ rõ trong ví dụ được dẫn ra ở mục 2.5.4 khi tính antilogarit, có sự giảm số chữ
số có nghĩa. Nguyên nhân của hiện tượng dường như dị thường đó nằm trong chức năng của
phần đặc tính của logarit.

2.3 Bảo hiểm chất lượng (QA) và biểu đồ kiểm tra

Khi sử dụng những phương pháp phân tích để giải quyết những vấn đề phức tạp của thực
tế thì chất lượng của những kết quả thu được bằng những phương pháp này cũng như của
những dụng cụ và thiết bị được sử dụng để hoàn thành các phép đo cần phải được đánh giá
liên tục. Chúng ta thường gặp 3 thuật ngữ trong bàn luận về chất lượng của phép đo: bảo hiểm
chất lượng, kiểm tra chất lượng và đánh giá chất lượng. Ba thuật ngữ này đã được Taylor định
nghĩa trong bài viết của mình về đề tài chất lượng của phép đo như sau:

Bảo hiểm chất lượng (QA): Những hoạt động của một hệ thống tổ chức nhằm mục đích
chuyển đến cho nhà sản xuất hoặc người tiêu dùng một sản phẩm hoặc một dịch vụ quyền
được bảo hiểm.

Kiểm tra chất lượng (QC): Những hoạt động của một hệ thống tổ chức nhằm kiểm tra
chất lượng một sản phẩm hoặc một dịch vụ theo yêu cầu của người tiêu dùng. Cụ thể là làm
họ mãn nguyện một cách đầy đủ và đáng tin cậy.

Đánh giá chất lượng: Những hoạt động của một hệ thống tổ chức đảm bảo rằng công
việc kiểm tra đã được thực hiện có hiệu quả. Công việc đó khẳng định sự đánh giá tiếp theo là
những sản phẩm đã được sản xuất và sự thực hiện của cơ sở sản xuất đã được chấp nhận.
44
2.7.2 Sự cần thiết của bảo hiểm chất lượng

Đo đạc các chỉ tiêu hoá học là để phục vụ cuộc sống vốn rất đa dạng của loài người và cố
gắng thực hiện những nhiệm vụ bức thiết như ngăn ngừa và xử lý một số bệnh tật, bảo vệ môi
trường, bảo đảm an toàn cho sản xuất và sự lưu thông những vật liệu có ích, đồng thời thực
thi một số lớn các nghiên cứu khoa học. Những số liệu về các chỉ tiêu hoá học phải đáng tin
cậy và đó cũng phải là bằng chứng hiển nhiên về sự tồn tại của chúng. Những nghiên cứu về
bảo hiểm chất lượng hoàn toàn khẳng định những số liệu đó.

Có hai cách đánh giá chất lượng:

– Cách thứ nhất là sự đánh giá độ đúng và độ chính xác của phương pháp đo.

– Cách thứ hai là xem xét chất lượng một sản phẩm đã được sản xuất một cách phổ biến.

Sau đây là ví dụ cho mỗi loại:

Một ví dụ về sự cần thiết phải bảo hiểm chất lượng phương pháp đo. Công việc được bắt
đầu bằng việc kiểm tra các số liệu đo các thiết bị của bệnh viện cung cấp để xác định số hiệu
của máu. Các thiết bị đó phải được chuẩn hoá cùng tần số với các mẫu chuẩn để đảm bảo rằng
những kết quả thu được có độ đúng đủ tin cậy và độ chính xác hoàn toàn đủ cho bệnh viện.
Nếu phương pháp đo không đủ độ đúng và không chính xác sẽ dẫn tới chẩn đoán sai, không
thích hợp cho sự chăm sóc bệnh nhân hoặc thậm chí bị tử vong. Đó là những sản phẩm kết thúc
của phòng thí nghiệm, là thước đo chính họ.

Một ví dụ khác về sự cần thiết phải bảo hiểm chất lượng: bàn về phép xác định florua
trong thuốc đánh răng. Có ít nhất 3 lý do để giải thích vì sao phải đo cẩn thận và kiểm tra hàm
lượng florua trong thuốc đánh răng; hơn nữa kiểm tra là công việc quan trọng. Đầu tiên là
florua độc ở nồng độ cao nên chính phủ phải điều chỉnh. Thêm vào đó, tính hiệu quả của sản
phẩm thường phụ thuộc vào sự duy trì một khoảng nồng độ xác định của hợp phần có hoạt
tính. Nếu hàm lượng florua trong thuốc đánh răng quá nhỏ thì có thể không bảo vệ răng tránh
sâu có hiệu quả. Nếu thừa nhiều florua sẽ bị thải ra ngoài và trong trường hợp thừa ở mức độ
cao, florua sẽ trở thành nguy hiểm. Cuối cùng, công thức có hiệu quả có thể đã trở thành bằng
phát minh của một nhà sản xuất hoặc cũng có thể là của một người trong số những người
đang cạnh tranh nhau. Nếu công thức là bằng phát minh của một người thì công ty của người
đó muốn giữ hoàn toàn bí mật nồng độ florua, sao cho nồng độ này không nằm trong các dãy
của bằng phát minh. Nếu một cơ sở sản xuất đang nắm giữ bằng phát minh, họ có thể mong
muốn phân tích nhiều mẫu sản phẩm của những đối thủ cạnh tranh để đảm bảo không có sự
xâm phạm bằng phát minh.

Để đánh giá chất lượng người ta thường sử dụng biểu đồ kiểm tra. Chúng ta đề cập đến
hai ví dụ điển hình, trong đó công cụ thống kê được sử dụng.
45
2.7.2 Ứng dụng biểu đồ kiểm tra

Biểu đồ kiểm tra là đồ thị diễn tả sự biến đổi liên tục theo thời gian hoặc trong địa điểm
của một tiêu chuẩn chất lượng nào đó đặc trưng và quan trọng trong bảo hiểm chất lượng.
Biểu đồ còn chỉ rõ giới hạn thống kê của dao động, đó là sự chấp nhận đối với một phép đo
đặc thù đã được thực hiện.

Biểu đồ kiểm tra để giám sát chức năng thực hiện của một thiết bị phân tích

Trong ví dụ đầu tiên về đánh giá chất lượng, chúng ta sẽ bàn về vấn đề, làm thế nào để có
thể giám sát chức năng thực hiện của một thiết bị phân tích rất cơ sở - một cái cân phân tích.
Có thể giám sát cả độ đúng và độ chính xác của cân bằng phép xác định định kỳ trọng lượng
của một mẫu chuẩn. Sau đó là những phép đo trong những ngày liên tục trong giới hạn xác
định của một trọng lượng mẫu chuẩn. Những giới hạn này được gọi là giới hạn kiểm tra trên
(GKT) và giới hạn kiểm tra dưới (GKD). Chúng được định nghĩa như sau:


GKT = μ +
N

GKD = μ −
N

μ là giá trị trung bình của phép đo trọng lượng a, σ là độ lệch chuẩn của phép đo, N là số
kết quả thu được của mỗi mẫu. Giá trị trung bình và độ lệch chuẩn của một trọng lượng chuẩn
cần phải được xác định ngay từ những nghiên cứu ban đầu.

Ngoài độ lệch chuẩn nói trên, cần ghi chú thêm rằng, GKT và GKD cũng là độ lệch
chuẩn trên một khía cạnh khác của giá trị trung bình, chúng tạo thành một hành lang thích hợp
mà trọng lượng a đã đo được, hy vọng nằm trong khuôn khổ đó tới 99,7% thời gian.
46
Hình 2.5. Biểu đồ kiểm tra một cân phân tích hiện đại

Hình 2.5 là biểu đồ kiểm tra điển hình đối với một cân phân tích. Để xây dựng biểu đồ
này, chúng tôi đã tập trung những số liệu về trọng lượng đo trong 20 ngày liên tục một trọng
lượng chuẩn 20,000 g do Viện Tiêu chuẩn và Kỹ thuật Quốc gia cung cấp. Để thu được các số
liệu, cân đã được đưa về giá trị “0”, trọng lượng chuẩn đã được đặt trên đĩa cân và trọng
lượng đã được xác định. Toàn bộ quá trình đã được lặp lại 4 lần và mỗi ngày đo lại 5 lần. Từ
những thực nghiệm độc lập, người ta đã xác định được giá trị trung bình μ = 20,000 g và độ
lệch chuẩn σ = 0,00012 g, giá trị trung bình của năm phép đo là 3.0,00012 5 = 0,00016 nên
GKT = 20,00016 g và GKD = 19,99984 g. Với những giá trị đó và giá trị trung bình trọng
lượng của mỗi ngày chúng ta xây dựng được biểu đồ kiểm tra được dẫn ra trên hình 2.5.

Ghi chú, giá trị trung bình trọng lượng của mỗi ngày được diễn tả trên đồ thị bằng một
chấm đen. Theo cách đó, bất kỳ một xu hướng có tính chất hệ thống nào trong các phép đo
cũng có thể dễ dàng phát hiện. Vì trung bình trọng lượng của mẫu giữa GKD và GKT nên cân
phân tích được coi là đã qua kiểm tra thống kê. Khi giá trị trung bình mẫu nằm ngoài giới hạn
như đã xẩy ra trong ngày thứ 17, cân phân tích được coi là không qua được kiểm tra. Khi một
thiết bị hoặc một hệ thống thiết bị không qua được kiểm tra, lúc đó chúng ta sẽ phải cố gắng
tìm ra nguyên nhân cho tình huống đó. Ví dụ như, trong trường hợp của ngày thứ 17, cân đã
được phát hiện là không được sạch do đĩa cân bị bẩn và các bước sẽ phải thực hiện để đảm
bảo sự việc sẽ không tái diễn. Những độ lệch có hệ thống do giá trị trung bình sẽ được phát
hiện tương đối dễ dàng trên biểu đồ kiểm tra trong ví dụ tiếp theo.

Biểu đồ kiểm tra để đánh giá chất lượng một dược phẩm

Như đã nói trên đây, có thể dùng biểu đồ kiểm tra kết hợp với kỹ thuật phân tích để kiểm
tra quá trình sản xuất. Có một ví dụ rất hay về cách làm này, cả về việc kê đơn và một loại
thuốc đặc trị chứa benzoyl peoxit được dùng để điều trị mụn ở mặt và da. Benzoyl peoxit là
một loại thuốc sát trùng đã được chỉ dẫn là có hiệu quả cho da khi sử dụng ở dạng kem hay ở
dạng thuốc mỡ chứa 10% thành phần hoạt tính. Vì mỗi loại thuốc đều được cơ quan quản lý
thực phẩm và thuốc điều chỉnh nên nồng độ của benzoyl peoxit cần phải được kiểm tra và xác
nhận theo kiểm tra thống kê. Benzoyl peoxit là một chất oxi hóa nên có thể hoá hợp với một
lượng dư iođua sinh ra iot. Sau đó iot sinh ra được chuẩn độ bằng dung dịch natri tiosunfat
chuẩn để thực hiện phép đo benzoyl peoxit trong mẫu.

Biểu đồ kiểm tra trên hình 2.6 chỉ rõ, những kết quả phân tích 89 sản phẩm thông qua
những phép đo kem chứa 10% benzoyl peoxit danh định trong những ngày liên tiếp. Mỗi mẫu
là một đại diện tượng trưng bằng giá trị trung bình phần trăm benzoyl peoxit khác nhau của
kem thu được từ những điều kiện rất cụ thể dễ thực hiện.
47

Hình 2.6

Sử dụng biểu đồ kiểm tra để giám sát nồng độ benzoyl peoxit trong pha chế thuốc chống mụn ở da bán ở
thị trường

Biểu đồ kiểm tra cho biết, cho đến ngày thứ 83, đã qua kiểm tra thống kê với sự thay đổi
ngẫu nhiên bình thường về lượng benzoyl peoxit, nghĩa là nằm trong vùng giữa GKD và
GKT. Trước ngày thứ 83 chỉ có kết quả của ngày thứ 26 lệch khỏi giá trị trung bình nồng độ
9,94% và tiến sát tới giới hạn kiểm tra với sự tăng hệ thống đột biến cao hơn giới hạn kiểm tra
trên. Sự tăng đó là do điều kiện cụ thể của sản xuất gây nên, chỉ bị loại trừ khi nguyên nhân
được phát hiện và tổ chức sửa sai. Mẫu này gắn bó với ví dụ về cân phân tích đã nói trên đây,
chỉ rõ, sử dụng biểu đồ kiểm tra thuận lợi ra sao và những biện pháp hữu hiệu được thực hiện
để bảo hiểm chất lượng những số liệu ở những tình huống khác nhau.

Những ví dụ này tập trung xác định độ đúng của thiết bị và những quá trình dẫn tới đạt
tiêu chuẩn. Cũng có thể sử dụng biểu đồ kiểm tra để giám sát độ chính xác. Hãy đọc thêm
những ví dụ bổ sung về phương pháp luận bảo hiểm chất lượng trong sách của Taylor và tài
liệu tham khảo trong đó * .

*
K.Taylor, Quality Assurance of Chemical Measurements. Chelsea, MI: Lewis,1987.

You might also like