Độ lệch chuẩn so với trung bình
Trong thống kê mô tả và suy luận, một số chỉ số được sử dụng để mô tả một tập dữ liệu tương ứng với xu hướng trung tâm, độ phân tán và độ lệch của nó. Trong suy luận thống kê, chúng thường được gọi là công cụ ước tính vì chúng ước tính các giá trị tham số dân số.
Xu hướng trung tâm đề cập và định vị trung tâm của sự phân phối các giá trị. Giá trị trung bình, chế độ và trung vị là các chỉ số được sử dụng phổ biến nhất trong việc mô tả xu hướng trung tâm của tập dữ liệu. Phân tán là lượng lan truyền dữ liệu từ trung tâm phân phối. Phạm vi và độ lệch chuẩn là các biện pháp phân tán được sử dụng phổ biến nhất. Các hệ số độ lệch của Pearson được sử dụng để mô tả độ lệch của phân phối dữ liệu. Ở đây, độ lệch đề cập đến việc tập dữ liệu có đối xứng về tâm hay không và nếu không thì nó bị lệch như thế nào.
Nghĩa là gì?
Trung bình là chỉ số được sử dụng phổ biến nhất của xu hướng trung tâm. Cho một tập dữ liệu, giá trị trung bình được tính bằng cách lấy tổng của tất cả các giá trị dữ liệu và sau đó chia cho số lượng dữ liệu. Ví dụ: trọng lượng của 10 người (tính bằng kilôgam) được đo là 70, 62, 65, 72, 80, 70, 63, 72, 77 và 79. Sau đó, trọng lượng trung bình của mười người (tính bằng kilôgam) có thể là tính như sau. Tổng các trọng số là 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Trung bình = (tổng) / (số lượng dữ liệu) = 710/10 = 71 (tính bằng kilôgam).
Như trong ví dụ cụ thể này, giá trị trung bình của tập dữ liệu có thể không phải là điểm dữ liệu của tập hợp nhưng sẽ là duy nhất cho tập dữ liệu đã cho. Có nghĩa là sẽ có cùng đơn vị với dữ liệu gốc. Do đó, nó có thể được đánh dấu trên cùng trục với dữ liệu và có thể được sử dụng trong so sánh. Ngoài ra, không có hạn chế dấu hiệu cho giá trị trung bình của tập dữ liệu. Nó có thể âm, bằng 0 hoặc dương, vì tổng của tập dữ liệu có thể âm, bằng 0 hoặc dương.
Độ lệch chuẩn là gì?
Độ lệch chuẩn là chỉ số phân tán được sử dụng phổ biến nhất. Để tính độ lệch chuẩn, đầu tiên độ lệch của các giá trị dữ liệu từ giá trị trung bình được tính toán. Trung bình bình phương gốc của độ lệch được gọi là độ lệch chuẩn.
Trong ví dụ trước, độ lệch tương ứng so với giá trị trung bình là (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 và (79-71) = 8. Tổng của bình phương độ lệch là (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-số 8)2+ 12+ 62 + số 82 = 366. Độ lệch chuẩn là (366/10) = 6.05 (tính bằng kilogam). Từ đó, có thể kết luận rằng phần lớn dữ liệu nằm trong khoảng 71 ± 6.05, với điều kiện bộ dữ liệu không bị sai lệch nhiều và thực sự là như vậy trong ví dụ cụ thể này.
Vì độ lệch chuẩn có cùng đơn vị với dữ liệu gốc, nó cho chúng ta một thước đo về mức độ sai lệch của dữ liệu từ trung tâm; độ lệch chuẩn lớn hơn độ phân tán lớn hơn. Ngoài ra, độ lệch chuẩn sẽ là giá trị không âm bất kể tính chất của dữ liệu trong tập dữ liệu.
Sự khác biệt giữa độ lệch chuẩn và trung bình là gì? • Độ lệch chuẩn là thước đo độ phân tán từ tâm, trong khi đó có nghĩa là đo vị trí của tâm của tập dữ liệu. • Độ lệch chuẩn luôn là giá trị không âm, nhưng giá trị trung bình có thể lấy bất kỳ giá trị thực nào.
|