Giá trị trung bình và độ lệch chuẩn là hai số liệu thiết yếu trong Thống kê. Chúng ta có thể sử dụng mô-đun thống kê để tìm ra giá trị trung bình và độ lệch chuẩn trong Python. Độ lệch chuẩn còn được viết tắt là SD
Nghĩa là gì?
Giá trị trung bình là tổng của tất cả các mục chia cho số lượng mục. Ví dụ: nếu chúng ta có một danh sách gồm 5 số [1,2,3,4,5], thì giá trị trung bình sẽ là [1+2+3+4+5]/5 = 3
Độ lệch chuẩn là gì?
Độ lệch chuẩn là thước đo mức độ biến thiên hoặc phân tán của một tập hợp các giá trị. Trước tiên chúng ta cần tính giá trị trung bình của các giá trị, sau đó tính phương sai và cuối cùng là độ lệch chuẩn.
Công dụng của độ lệch chuẩn
Giả sử chúng ta có dữ liệu về dân số trên mỗi km vuông cho các tiểu bang khác nhau ở Hoa Kỳ. Chúng ta có thể tính độ lệch chuẩn để biết dân số được phân bổ đồng đều như thế nào. Giá trị nhỏ hơn có nghĩa là phân phối đồng đều trong khi giá trị lớn hơn có nghĩa là có rất ít người sống ở một số nơi trong khi một số khu vực đông dân cư
Hãy xem xét các bước cần thiết để tính giá trị trung bình và độ lệch chuẩn
Các bước để tính trung bình
- Lấy tổng của tất cả các mục
- Chia tổng cho số mục nhập
Các bước để tính độ lệch chuẩn
- Tính giá trị trung bình như đã thảo luận ở trên. Giá trị trung bình của [1, 2, 3, 4, 5] là 3
- Tính phương sai cho mỗi mục nhập bằng cách trừ giá trị trung bình khỏi giá trị của mục nhập. Vì vậy, phương sai sẽ là [-2, -1, 0, 1, 2]
- Sau đó bình phương từng giá trị kết quả đó và tính tổng kết quả. Đối với ví dụ trên, nó sẽ trở thành 4+1+0+1+4=10
- Sau đó chia kết quả cho số điểm dữ liệu trừ đi một. Điều này sẽ cho phương sai. Vậy phương sai sẽ là 10/[5-1] = 2. 5
- Căn bậc hai của phương sai [đã tính ở trên] là độ lệch chuẩn. Vậy độ lệch chuẩn sẽ là sqrt[2. 5] = 1. 5811388300841898
Tìm giá trị trung bình và độ lệch chuẩn trong Python
Viết code tính giá trị trung bình và độ lệch chuẩn trong Python. Chúng tôi sẽ sử dụng mô-đun thống kê và sau đó sẽ cố gắng viết triển khai của riêng chúng tôi
1. Sử dụng mô-đun thống kê
Mô-đun này cung cấp cho bạn tùy chọn tính toán giá trị trung bình và độ lệch chuẩn trực tiếp
Hãy bắt đầu bằng cách nhập mô-đun
import statistics
Hãy khai báo một danh sách với dữ liệu mẫu
data = [7,5,4,9,12,45]
Bây giờ để tính giá trị trung bình của dữ liệu mẫu, hãy sử dụng hàm sau
statistics.mean[data]
Câu lệnh này sẽ trả về giá trị trung bình của dữ liệu. Chúng ta có thể in giá trị trung bình ở đầu ra bằng cách sử dụng
print["Mean of the sample is % s " %[statistics.mean[data]]]
Chúng tôi nhận được đầu ra như
Mean of the sample is 13.666666666666666
Nếu bạn đang sử dụng IDE để mã hóa, bạn có thể di chuột qua câu lệnh và nhận thêm thông tin về số liệu thống kê. hàm nghĩa []
Ngoài ra, bạn có thể đọc tài liệu tại đây
Để tính độ lệch chuẩn của dữ liệu mẫu, hãy sử dụng
print["Standard Deviation of the sample is % s "%[statistics.stdev[data]]]
Chúng tôi nhận được đầu ra như
Standard Deviation of the sample is 15.61623087261029
Đây là một tài liệu ngắn gọn về số liệu thống kê. hàm stdev[]
Mã hoàn chỉnh để tìm độ lệch chuẩn và giá trị trung bình trong Python
Mã hoàn chỉnh cho các đoạn mã trên như sau
import statistics data = [7,5,4,9,12,45] print["Standard Deviation of the sample is % s "% [statistics.stdev[data]]] print["Mean of the sample is % s " % [statistics.mean[data]]]
2. Viết hàm tùy chỉnh để tính độ lệch chuẩn
Hãy viết hàm của chúng tôi để tính giá trị trung bình và độ lệch chuẩn trong Python
________số 8
Hàm này sẽ tính giá trị trung bình
Bây giờ hãy viết một hàm để tính độ lệch chuẩn
Điều này có thể hơi phức tạp, vì vậy hãy thực hiện từng bước một
Độ lệch chuẩn là căn bậc hai của phương sai. Vì vậy, chúng ta có thể viết hai chức năng
- hàm đầu tiên sẽ tính phương sai
- hàm thứ hai sẽ tính căn bậc hai của phương sai và trả về độ lệch chuẩn
Hàm tính phương sai như sau
def variance[data]: n = len[data] mean = sum[data] / n deviations = [[x - mean] ** 2 for x in data] variance = sum[deviations] / n return variance
Bạn có thể tham khảo các bước được đưa ra ở phần đầu của hướng dẫn để hiểu mã
Bây giờ chúng ta có thể viết một hàm tính căn bậc hai của phương sai
data = [7,5,4,9,12,45]0
Hoàn thành mã
Mã hoàn chỉnh như sau
data = [7,5,4,9,12,45]1
Phần kết luận
Giá trị trung bình và Độ lệch chuẩn là các giá trị toán học được sử dụng trong phân tích thống kê. Mô-đun thống kê Python cung cấp các hàm hữu ích để tính toán các giá trị này một cách dễ dàng