Dân số so với độ lệch chuẩn mẫu
Trong thống kê, một số chỉ số được sử dụng để mô tả một tập dữ liệu tương ứng với xu hướng trung tâm, độ phân tán và độ lệch của nó. Độ lệch chuẩn là một trong những biện pháp phân tán dữ liệu phổ biến nhất từ trung tâm của tập dữ liệu.
Do những khó khăn thực tế, sẽ không thể sử dụng dữ liệu từ toàn bộ dân chúng khi một giả thuyết được kiểm tra. Do đó, chúng tôi sử dụng các giá trị dữ liệu từ các mẫu để suy luận về dân số. Trong tình huống như vậy, chúng được gọi là công cụ ước tính vì chúng ước tính các giá trị tham số dân số.
Điều cực kỳ quan trọng là sử dụng các công cụ ước tính không thiên vị trong suy luận. Một công cụ ước tính được cho là không thiên vị nếu giá trị dự kiến của công cụ ước tính đó bằng với tham số dân số. Ví dụ: chúng tôi sử dụng trung bình mẫu làm công cụ ước tính không thiên vị cho trung bình dân số. (Về mặt toán học, có thể chỉ ra rằng giá trị dự kiến của giá trị trung bình mẫu bằng với trung bình dân số). Trong trường hợp ước tính độ lệch chuẩn dân số, độ lệch chuẩn mẫu cũng là một công cụ ước lượng không thiên vị.
Độ lệch chuẩn dân số là gì?
Khi dữ liệu từ toàn bộ dân số có thể được đưa vào tài khoản (ví dụ trong trường hợp điều tra dân số), có thể tính độ lệch chuẩn của dân số. Để tính độ lệch chuẩn của dân số, đầu tiên độ lệch của các giá trị dữ liệu từ trung bình dân số được tính toán. Bình phương trung bình gốc (trung bình bậc hai) của độ lệch được gọi là độ lệch chuẩn dân số.
Trong một lớp học gồm 10 sinh viên, dữ liệu về các sinh viên có thể dễ dàng được thu thập. Nếu một giả thuyết được thử nghiệm trên quần thể sinh viên này, thì không cần sử dụng các giá trị mẫu. Ví dụ: trọng lượng của 10 học sinh (tính bằng kilôgam) được đo là 70, 62, 65, 72, 80, 70, 63, 72, 77 và 79. Sau đó, trọng lượng trung bình của mười người (tính bằng kilôgam) là (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, là 71 (tính bằng kilogam). Đây là ý nghĩa dân số.
Bây giờ để tính độ lệch chuẩn dân số, chúng tôi tính độ lệch so với giá trị trung bình. Độ lệch tương ứng so với giá trị trung bình là (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 và (79 - 71) = 8. Tổng bình phương độ lệch là ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-số 8)2 + 12 + 62 + số 82 = 366. Độ lệch chuẩn dân số là (366/10) = 6.05 (tính bằng kilôgam). 71 là trọng lượng trung bình chính xác của học sinh trong lớp và 6.05 là độ lệch chuẩn chính xác của cân nặng so với 71.
Độ lệch chuẩn mẫu là gì?
Khi dữ liệu từ một mẫu (có kích thước n) được sử dụng để ước tính các tham số của dân số, độ lệch chuẩn của mẫu được tính. Đầu tiên độ lệch của các giá trị dữ liệu từ giá trị trung bình mẫu được tính toán. Vì giá trị trung bình mẫu được sử dụng thay cho trung bình dân số (không xác định), nên lấy giá trị trung bình bậc hai là không phù hợp. Để bù cho việc sử dụng giá trị trung bình mẫu, tổng bình phương độ lệch được chia cho (n-1) thay vì n. Độ lệch chuẩn mẫu là căn bậc hai của điều này. Trong các ký hiệu toán học, S = √ (xTôi-ẍ)2 / (n-1), trong đó S là độ lệch chuẩn mẫu, là giá trị trung bình mẫu và xTôilà các điểm dữ liệu.
Bây giờ giả sử rằng, trong ví dụ trước, dân số là học sinh của toàn trường. Sau đó, lớp học sẽ chỉ là một mẫu. Nếu mẫu này được sử dụng trong ước tính, độ lệch chuẩn của mẫu sẽ là (366/9) = 6,38 (tính bằng kilôgam) vì 366 được chia cho 9 thay vì 10 (cỡ mẫu). Thực tế để quan sát là điều này không được đảm bảo là giá trị độ lệch chuẩn dân số chính xác. Nó chỉ là một ước tính cho nó.
Sự khác biệt giữa độ lệch chuẩn dân số và độ lệch chuẩn mẫu là gì? • Độ lệch chuẩn dân số là giá trị tham số chính xác được sử dụng để đo độ phân tán từ tâm, trong khi độ lệch chuẩn mẫu là một ước lượng không thiên vị cho nó. • Độ lệch chuẩn dân số được tính khi tất cả các dữ liệu liên quan đến từng cá nhân của dân số được biết đến. Khác, độ lệch chuẩn mẫu được tính. • Độ lệch chuẩn dân số được cho bởi σ = √ (xi-Cách)2/ n trong đó Quảng cáo là trung bình dân số và n là kích thước dân số nhưng độ lệch chuẩn mẫu được cho bởi S = (xi -)2 / (n-1) trong đó ẍ là giá trị trung bình mẫu và n là cỡ mẫu.
|