You are on page 1of 4

Trong ngôn ngữ hàng ngày, các từ ngữ "sai lệch" và lệch "" được dùng để chỉ cái

gì đó là trong số dòng hoặc bóp méo


về một bên. Khi đề cập đến hình dạng của tần số hoặc các phân bố xác suất, "Độ xiên" dùng để chỉ bất đối xứng của
phân phối. Một phân bố bất đối xứng với một đuôi mở rộng ra bên phải là được gọi là "tích cực lệch" hay "sai lệch về
bên phải", trong khi một phân bố bất đối xứng với một đuôi mở rộng ra trái là được gọi là "tiêu cực lệch" hay "sai
lệchbên trái "Độ xiên. có thể là từ vô cực trừ đi đến vô cùng tích cực.
Karl Pearson (1895) lần đầu tiên đề xuất đo Độ xiên của tiêu chuẩn hóa sự khác biệt giữa ý nghĩa và phương thức, đó
là,. chế độ dân số chưa được ước tính từ chế độ mẫu, nhưng ai có thể ước lượng sự khác biệt giữa ý nghĩa và
phương thức như là ba lần sự khác biệt giữa trung bình và trung vị (Stuart & Ord, 1994), dẫn đến dự toán sau đây Độ
xiên: . Nhiều thống kê sử dụng biện pháp này nhưng với '3 'bị loại, đó là,. Điều này thống kê khoảng từ -1 đến 1. Giá trị
tuyệt đối trên 0,2 chỉ ra Độ xiên lớn (Hildebrand, 1986).
Độ xiên cũng đã được quy định đối với thời điểm thứ ba về có nghĩa là:, mà chỉ đơn giản là giá trị kỳ vọng của phân
́ tiêu điểm z. Độ xiên đo theo cách này đôi khi được gọi là "Độ xiên của Fisher" Khi các độ lệch từ có
phối của một giông
nghĩa là lớn hơn trong một hướng hơn theo hướng khác., Số liệu này từ số không đi chệch hướng của các độ lệch lớn
hơn. Từ mẫu dữ liệu, Độ xiên của Fisher thường được ước tính bởi:. Đối với cỡ mẫu lớn (n> 150), g1 có thể được
phân phối khoảng bình thường, với một lỗi tiêu chuẩn của khoảng. Trong khi một người có thể sử dụng lấy mẫu phân
phối xây dựng khoảng tin cậy cho hay các xét nghiệm các giả thuyết về γ 1, rất hiếm khi có bất kỳ giá trị khi làm như
vậy.
Các biện pháp thông dụng nhất của Độ xiên (những người đã thảo luận ở đây) có thể tạo ra kết quả đáng ngạc nhiên,
như một giá trị âm khi hình dạng của phân phối có xuất hiện lệch về bên phải. Có thể có biện pháp thay thế cấp trên
không thường được sử dụng (Groeneveld & Meeden, 1984).
Điều quan trọng là các nhà nghiên cứu hành vi thông báo Độ xiên khi nó xuất hiện trong dữ liệu của họ. Great Độ xiên
có thể thúc đẩy các nhà nghiên cứu để điều tra Bên ngoài. Khi đưa ra quyết định về những biện pháp của địa điểm báo
cáo (có nghĩa là được rút ra theo hướng nghiêng) và có suy luận thống kê để sử dụng (một giả định mà bình thường
hoặc một trong đó không), nên đi vào xem xét các Độ xiên ước tính dân số . Phân bố không bình thường có Độ
xiên. Tất nhiên, một phân phối có thể được hoàn toàn đối xứng, nhưng xa bình thường. Biến đổi thường được sử dụng
để giảm (tích cực) Độ xiên bao gồm căn bậc hai, đăng nhập, và biến đổi đối ứng.

Độ nhọn
Karl Pearson (1905) xác định mức độ của một phân bố của độ nhọn như, ở đâu, giá trị kỳ vọng của phân phối của điểm
Z đã được nâng lên quyền lực thứ 4. β 2 là thường được gọi là "độ nhọn của Pearson," và β 2 3 (thường ký hiệu với
γ 2) là "độ nhọn vượt quá" hay độ nhọn Fisher's "," mặc dù nó đã được Pearson người quy định độ nhọn như β 2
3. Một ước tính không thiên vị cho γ 2 là. Đối với cỡ mẫu lớn (n> 1000), g2 có thể được phân phối khoảng bình
thường, với một lỗi tiêu chuẩn của khoảng (Snedecor, & Cochran, 1967). Trong khi một người có thể sử dụng phân bố
này lấy mẫu để xây dựng khoảng tin cậy cho hay các xét nghiệm các giả thuyết về γ 2, rất hiếm khi có bất kỳ giá trị
trong khi làm điều đó.
Pearson (1905) giới thiệu độ nhọn như một biện pháp như thế nào bằng phẳng phía trên cùng của một phân bố đối
xứng là khi so với một phân phối bình thường của các phương sai tương tự. Ông gọi phân phối hơn phẳng đứng đầu
(γ 2 <0) là "platykurtic," phân phối ít phẳng đứng đầu (γ 2> 0) là "leptokurtic", và đều phẳng đứng đầu phân phối là
"mesokurtic" (γ 2 ≈ 0 ). Độ nhọn thực sự là nhiều ảnh hưởng bởi điểm trong đuôi của phân phối hơn điểm tại trung
tâm phân phối một (DeCarlo, 1967). Theo đó, nó thường thích hợp để mô tả một phân phối leptokurtic là "chất béo
trong các đuôi" và phân phối một platykurtic là "mỏng ở đuôi."
Sinh viên (1927, Biometrika, 19, 160) xuất bản một mô tả dễ thương của độ nhọn, mà tôi trích dẫn ở đây: "ngắn hơn
đường cong Platykurtic có 'đuôi' hơn so với đường cong bình thường của lỗi và leptokurtic còn 'đuôi' Tôi bản thân mình
chịu. Trong tâm ý nghĩa các từ của technica memoria ở trên, nơi mà các con số đầu tiên đại diện cho thú mỏ vịt và
chuột túi thứ hai, lưu ý cho lepping "Hãy trỏ trình duyệt của bạn để http://members.aol.com/jeff570/k.html, di chuyển
xuống." độ nhọn ", và nhìn vào bản vẽ của sinh viên.
Người Moor (1986) đã chứng minh điều đó. Theo đó, nó có thể là tốt nhất để xử lý độ nhọn như mức độ mà điểm số
được phân tán ra khỏi vai của một phân phối, nơi mà các vai là điểm nơi Z2 = 1, nghĩa là, Z = ± 1. Balanda và
MacGillivray (1988) đã viết "cách tốt nhất là để xác định độ nhọn mơ hồ như là-vị trí chuyển động tự do quy mô và khối
lượng xác suất từ vai của một phân bố vào trung tâm và đuôi của nó." Nếu có một bắt đầu với một phân phối bình
thường và di chuyển điểm từ vai vào trung tâm và đuôi, giữ đúng không đổi, độ nhọn được tăng lên. Sự phân bố có thể
sẽ xuất hiện nhiều hơn lên đến đỉnh điểm trong trung tâm và béo hơn trong đuôi, giống như một phân phối Laplace ()
hoặc t sinh viên với vài độ tự do ().
Bắt đầu lại với một phân bố chuẩn, di chuyển điểm từ đuôi và trung tâm với vai sẽ làm giảm độ nhọn. Một phân bố
đồng đều chắc chắn có một đầu phẳng, với, nhưng γ 2 có thể đạt đến một giá trị tối thiểu của − 2 khi hai giá trị điểm là
đều có thể và tất cả các giá trị điểm số khác có xác suất bằng không (một hình chữ nhật U phân phối, có nghĩa là, một
phân phối nhị thức với n = 1, p = 0,5). Một đối tượng có thể là hình chữ nhật U phân phối có tất cả các điểm của nó
trong đuôi, nhưng gần gũi kiểm tra sẽ phát hiện ra rằng nó không có đuôi, và rằng tất cả các điểm của nó là ở vai của
mình, chính xác một từ có nghĩa là độ lệch chuẩn của nó. Giá trị của g2 ít hơn dự kiến cho một bản phân phối thống
nhất (− 1,2) có thể cho rằng phân phối là bimodal (Darlington, 1970), nhưng phân bố bimodal có thể có độ nhọn cao nếu
các phương thức được xa từ vai.
Một leptokurtic phân phối chúng ta phải xử lý là phân phối t của sinh viên. Các độ nhọn của t là vô hạn khi df <5, 6 khi
df = 5, 3 khi df = 6. Giảm độ nhọn hơn nữa (đối với số không) như df t tăng và phương pháp tiếp cận phân phối bình
thường.
Độ nhọn thường chỉ quan tâm khi giao dịch với khoảng phân phối đối xứng. Lệch phân phối luôn leptokurtic (Hopkins &
tuần, 1990). Trong số các biện pháp thay thế một số độ nhọn mà đã được đề xuất (không ai trong số đó thường được
sử dụng), là một trong đó điều chỉnh đo độ nhọn để loại bỏ hiệu lực của Độ xiên (Blest, 2003).
Có nhiều nhầm lẫn về độ nhọn là làm thế nào liên quan đến hình dạng của phân phối. Nhiều tác giả sách giáo khoa đã
khẳng định rằng độ nhọn là một thước đo của peakedness của các phân bố, mà là không đúng sự thật.
Nó rất dễ gây nhầm lẫn với đúng độ nhọn thấp cao, nhưng phân bố với độ nhọn giống hệt nhau có thể khác nhau trong
không đúng, và phân phối với phương sai giống nhau có thể khác nhau về độ nhọn. Đây là một số bản phân phối đơn
giản có thể giúp bạn đánh giá cao độ nhọn là, một phần, một biện pháp nặng nề đuôi tương đối so với tổng số không
đúng trong bản phát hành (ghi nhớ "σ 4" trong mẫu số).

Table 1.

Kurtosis for 7 Simple Distributions Also Differing in Variance


X freq A freq B freq C freq D freq E freq F freq G
05 20 20 20 10 05 03 01
10 00 10 20 20 20 20 20
15 20 20 20 10 05 03 01
Kurtosis -2.0 -1.75 -1.5 -1.0 0.0 1.33 8.0
Variance 25 20 16.6 12.5 8.3 5.77 2.27
Khi tôi trình bày những phân phối cho các đồng nghiệp của tôi và sinh viên tốt nghiệp và yêu cầu họ xác định được có
độ nhọn và có ít nhất là nhiều nhất, tất cả đều cho biết A có độ nhọn nhất, G ít nhất (trừ những người từ chối trả
lời). Nhưng trong thực tế, A có độ nhọn ít nhất (− 2 là giá trị nhỏ nhất của độ nhọn) và G nhất. Bí quyết là để làm một lô
tần số tâm thần, nơi đương̀ ngang là trong các đơn vị lệch chuẩn. Trong một phân phối tối đa platykurtic, mà ban đầu
xuất hiện để có tất cả các điểm trong đuôi của nó, điểm số không có nhiều hơn một σ xa có nghĩa là - đó là, nó không
có đuôi! Trong G phân phối leptokurtic, mà dường như chỉ có một điểm ít đuôi của nó, người ta phải nhớ rằng những
điểm số (5 & 15) đang có nhiều xa từ trung bình (3,3 σ ) hơn là của 5 & 15 của phân phối A. Trong thực tế, trong G
chín phần trăm số điểm có hơn ba σ từ có nghĩa là, nhiều hơn bạn mong đợi ở một bản phân phối mesokurtic (giống
như một phân phối chuẩn), do đó G quả thực có đuôi chất béo.
Nếu bạn là bạn phải hỏi SAS để tính toán độ nhọn vào điểm A trong Bảng 1, bạn sẽ nhận được một giá trị ít hơn − 2,0,
ít hơn so với độ nhọn dân số thấp nhất có thể. Tại sao? SAS giả sử dữ liệu của bạn là một mẫu và tính toán ước tính
độ nhọn g2 của dân số, mà có thể rơi dưới − 2.0.
Sune Karlsson, của Trường Kinh tế Stockholm, đã cung cấp cho tôi với những ví dụ đổi lần mà giữ đúng khoảng không
đổi, làm cho nó khá rõ ràng rằng một độ nhọn cao hơn ngụ ý rằng có nhiều cực quan sát (hay rằng các quan sát cực kỳ
khắc nghiệt hơn) . Nó cũng là bằng chứng cho thấy một độ nhọn cao hơn cũng ngụ ý rằng phân phối là 'đơn đạt vị trí'
(điều này sẽ được hiển nhiên hơn nữa nếu tổng của các tần số được so sánh). Tôi đã nêu bật các hàng đại diện cho
vai của phân phối để bạn có thể thấy rằng sự gia tăng độ nhọn là liên kết với một chuyển động của điểm ra khỏi vai.

Table 2.
Kurtosis for Seven Simple Distributions Not Differing in Variance
X Freq. A Freq. B Freq. C Freq. D Freq. E Freq. F Freq. G
−6.6 0 0 0 0 0 0 1
−0.4 0 0 0 0 0 3 0
1.3 0 0 0 0 5 0 0
2.9 0 0 0 10 0 0 0
3.9 0 0 20 0 0 0 0
4.4 0 20 0 0 0 0 0
5 20 0 0 0 0 0 0
10 0 10 20 20 20 20 20
15 20 0 0 0 0 0 0
15.6 0 20 0 0 0 0 0
16.1 0 0 20 0 0 0 0
17.1 0 0 0 10 0 0 0
18.7 0 0 0 0 5 0 0
20.4 0 0 0 0 0 3 0
26.6 0 0 0 0 0 0 1
Kurtosis −2.0 −1.75 −1.5 −1.0 0.0 1.33 8.0
Variance 25 25.1 24.8 25.2 25.2 25.0 25.1

Trong khi không chắc rằng một nhà nghiên cứu hành vi sẽ được quan tâm đến câu hỏi tập trung vào độ nhọn của một
phân phối, ước lượng của độ nhọn, kết hợp với các thông tin khác về hình dạng của một phân phối, có thể có
ích. DeCarlo (1997) mô tả một số sử dụng cho các số liệu thống kê g2. Khi xem xét hình dạng của một phân bố của
điểm, đó là hữu ích để có lúc biện pháp bàn tay của Độ xiên và độ nhọn, cũng như hiển thị đồ họa. Các thống kê này
có thể giúp một trong những quyết định lập dự toán hoặc xét nghiệm cần thực hiện tốt nhất với các dữ liệu phân tán
giống như trên tay. độ nhọn cao nên cảnh báo các nhà nghiên cứu để điều tra Bên ngoài ở một hoặc cả hai đuôi của
phân phối.
Các xét nghiệm của Tầm quan trọng
Một số kê các gói (bao gồm cả SPSS) cung cấp cho cả hai ước tính của Độ xiên và độ nhọn và sai số chuẩn cho
những ước lượng. Người ta có thể phân chia ước tính của nó là tiêu chuẩn lỗi để có được thử nghiệm az của giả
thuyết null rằng tham số này là số không (như sẽ được dự kiến trong một dân số bình thường), nhưng tôi thường thấy
các xét nghiệm như sử dụng ít.Một có thể làm một nhãn cầu "test" về các biện pháp và độ nhọn Độ xiên khi quyết định
có hay không một mẫu là "bình thường đủ" để sử dụng một thủ tục suy luận rằng giả định bình thường của dân số
(s). Nếu bạn muốn kiểm tra giả thuyết null rằng các mẫu đến từ dân bình thường, bạn có thể sử dụng một điều thiện
chi-vuông của thử nghiệm phù hợp, so sánh tần số quan sát trong khoảng mười hoặc hơn (từ thấp nhất đến điểm cao
nhất) với những tần số mà có thể dự kiến trong những khoảng thời gian đã được người dân bình thường. Thử nghiệm
này có quyền lực rất thấp, đặc biệt là với cỡ mẫu nhỏ, nơi mà bình thường có thể được giả định quan trọng nhất. Vì
vậy bạn có thể nghĩ rằng dữ liệu của bạn đủ gần bình thường (không đáng kể khác với bình thường) để sử dụng một
số liệu thống kê thử nghiệm mà giả bình thường khi trong thực tế, dữ liệu là quá rõ ràng không bình thường để sử dụng
như một thử nghiệm, các nonsignificance của độ lệch từ kết quả bình thường chỉ từ năng lượng thấp, mẫu nhỏ kích
cỡ.SAS 'proc UNIVARIATE sẽ thử nghiệm một giả thuyết null cho bạn bằng cách sử dụng các số liệu thống kê
Kolmogorov-Smirnov mạnh hơn (đối với mẫu vật lớn hơn) hoặc số liệu thống kê của Shapiro-Wilks (đối với mẫu nhỏ
hơn). Đây có quyền lực rất cao, đặc biệt là với cỡ mẫu lớn, trong trường hợp giả định bình thường có thể ít quan trọng
cho việc thống kê kiểm tra giả định là có bình thường được hỏi. Các xét nghiệm này có thể cho bạn biết rằng mẫu của
bạn khác nhau đáng kể từ bình thường ngay cả khi độ lệch từ bình thường là không đủ lớn để gây ra vấn đề với các số
liệu thống kê thử nghiệm mà giả bình thường.
SAS bài tập
Chuyển tới trang StatData của tôi và tải về tập tin EDA.dat. Chuyển tới trang SAS-Chương Trình của tôi và tải về tập tin
g1g2.sas chương trình. Chỉnh sửa chương trình để báo cáo điểm INFILE đúng vào thư mục nơi bạn đặt EDA.dat và
sau đó chạy chương trình, minh họa tính toán của g1 và g2. Nhìn vào chương trình. Các dữ liệu thô được đọc từ
EDA.dat và proc PHƯƠNG TIỆN sau đó được sử dụng để tính toán g1 và g2. Phần tiếp theo của chương trình sử
dụng proc STANDARD để chuyển đổi dữ liệu đến z điểm. PHƯƠNG TIỆN proc sau đó được sử dụng để tính toán g1
và g2 trên điểm z. Lưu ý rằng tiêu chuẩn của điểm đã không thay đổi các giá trị của g1 và g2. Phần tiếp theo của
chương trình tạo ra một tập hợp dữ liệu với các điểm z nâng lên thứ 3 và các quyền hạn thứ 4. Bước cuối cùng của
chương trình sử dụng những quyền hạn của z để tính g1 và g2 bằng cách sử dụng các công thức trình bày trước đó
trong Bản tin này. Lưu ý rằng các giá trị của g1 và g2 cũng tương tự như trước đó để từ proc PHƯƠNG TIỆN.
Chuyển tới trang SAS-Chương Trình của tôi và tải về và chạy tập tin độ nhọn-Uniform.sas. Nhìn vào chương trình. Một
vòng lặp DO và chức năng UNIFORM được sử dụng để tạo ra một mẫu của 500.000 điểm rút ra từ một dân số thống
nhất mà các phạm vi 0-1. PHƯƠNG TIỆN proc sau đó tính trung bình, độ lệch chuẩn, Độ xiên, và độ nhọn. Xem kết
quả. So sánh các số liệu thống kê thu được với các giá trị dự kiến sẽ cho các thông số sau đây của một phân bố thống
nhất là khoảng từ một đến b:

Parameter Expected Value Parameter Expected Value


a +b
Mean Skewness 0
2
(b − a ) 2
Standard Deviation Kurtosis −1.2
12

Chuyển tới trang SAS-Chương Trình của tôi và tải về và chạy tập tin "T.sas độ nhọn", mà thể hiện tác dụng của kích
thước mẫu (bậc tự do) trên độ nhọn của phân phối t. Nhìn vào chương trình. Trong mỗi phần của chương trình một
vòng DO được sử dụng để tạo ra 500.000 mẫu của N điểm (trong đó N là 10, 11, 17, hoặc 29), mỗi rút ra từ một dân số
bình thường với nghĩa là 0 và độ lệch chuẩn 1. PHƯƠNG TIỆN proc sau đó được sử dụng để tính toán t sinh viên cho
mỗi mẫu, outputting các điểm t vào một dữ liệu mới thiết lập. Chúng tôi sẽ xử lý dữ liệu này mới thiết lập như là việc
phân phối mẫu của t. PHƯƠNG TIỆN proc sau đó được sử dụng để tính toán độ lệch có nghĩa là, tiêu chuẩn, và độ
nhọn của phân phối mẫu của t. Đối với mỗi giá trị của bậc tự do, so sánh các số liệu thống kê thu được với giá trị dự
kiến của họ.

Mean Standard Deviation Kurtosis


df 6
0
df − 2 df − 4

Tải về và chạy Kurtosis_Beta2.sas chương trình của tôi. Nhìn vào chương trình. Mỗi phần của chương trình tạo ra một
trong các bản phân phối từ bảng 1 ở trên và sau đó chuyển đổi dữ liệu đến z điểm, nâng điểm z cho quyền lực thứ tư,
và tính β 2 là trung bình của Z4. Trừ đi 3 từ mỗi giá trị của β 2 và sau đó so sánh các kết quả γ 2 với giá trị cho trong
Bảng 1.
Tải về và chạy chương trình của tôi-Normal.sas độ nhọn. Nhìn vào chương trình. vòng DO và chức năng THƯỜNG
được sử dụng để tạo ra 10.000 mẫu, mỗi với 1.000 điểm rút ra từ một dân số bình thường với nghĩa là 0 và độ lệch
chuẩn 1. Proc PHƯƠNG TIỆN tạo ra một dữ liệu mới thiết lập với các g1 và g2 thống kê cho từng mẫu. PHƯƠNG
TIỆN proc sau đó tính trung bình và độ lệch chuẩn (tiêu chuẩn lỗi) cho Độ xiên và độ nhọn. So sánh các giá trị thu được
với những mong đợi, 0 cho các phương tiện, và và cho sai số chuẩn.

You might also like