Đối với các tính năng số trong tập dữ liệu, khi chúng tôi nghĩ đến việc kiểm tra phân phối của nó, điều đầu tiên chúng tôi nghĩ đến là biểu đồ. Biểu đồ biểu đồ số lượng quan sát cho từng phạm vi giá trị của tính năng số. Các phạm vi này được gọi là Thùng. Hình dạng của phân phối phụ thuộc vào kích thước [chiều rộng hoặc cạnh] của các thùng
Trong blog này, chúng ta sẽ xem xét
- Cách truy cập các cạnh bin của biểu đồ
- Cách đặt độ rộng thùng tùy chỉnh thay vì mặc định
Chúng tôi sẽ sử dụng bộ dữ liệu mống mắt quen thuộc được tích hợp sẵn với seaborn
Hãy xem biểu đồ của một trong các tính năng sepal_length
trông như thế nào
Truy cập các cạnh thùng
Bây giờ, làm thế nào chúng ta có thể biết chính xác các cạnh thùng mà seaborn sử dụng?
Chúng tôi có thể truy cập tất cả các cạnh của thùng bằng dòng mã bên dưới
Với các biểu đồ biểu đồ Matplotlib, việc truy xuất các cạnh của thùng và số lượng quan sát trong mỗi thùng sẽ đơn giản hơn nhiều. Các hàm plt.hist[]
trả về số lượng thùng, cạnh thùng và các bản vá
Lưu ý rằng độ rộng thùng có thể hơi khác nhau với các chức năng hoặc gói khác nhau tùy thuộc vào chiến lược tạo thùng nào được sử dụng. Để thảo luận chi tiết về các phương pháp tạo thùng khác nhau, bạn có thể tham khảo liên kết bên dưới
Chọn kích thước thùng cho biểu đồ theo các bước đơn giản + Quy tắc Sturge - Thống kê cách thực hiện
Thống kê mô tả > Cách chọn kích thước thùng trong thống kê Nội dung. Trong thống kê, dữ liệu thường được sắp xếp theo một…
www. thống kê. com
Nếu bạn không quan tâm đến các ô đi kèm và chỉ muốn các con số, thì không cần tìm đâu xa hơn numpy
Vì một số lý do, nếu bạn không hài lòng với các cạnh thùng mặc định, thì việc đặt kích thước thùng rất dễ dàng. Bạn có thể chỉ định số lượng ngăn dưới dạng giá trị số nguyên trong tham số bins
hoặc chuyển danh sách các số cho các cạnh của ngăn
Hy vọng bạn thích bài viết này. Bạn cũng có thể thích những cái dưới đây
Thêm chú thích vào các ô Seaborn
chèn văn bản và số
balaji4u. vừa phải. com
PyCaret. Bộ tổng hợp học máy
một cửa cho tất cả các nhu cầu học máy của bạn
hướng tới khoa học dữ liệu. com
Chắp vá — Thế hệ tiếp theo của ggplots
Mở rộng tính linh hoạt của ggplot2 hơn nữa
hướng tới khoa học dữ liệu. com
Hệ thống phân cấp chức năng cốt truyện Seaborn
một chức năng cho mỗi họ lô
hướng tới khoa học dữ liệu. com
Cảm ơn vì đã đọc. Sẽ thật tuyệt nếu được nghe nhận xét, phản hồi của bạn về bala@python4u. Trong. Mã trong bài viết này có thể được truy cập trên https. //github. com/bala-srm/histogram_bins/blob/main/hist_bins. ipynb
Bài viết này sẽ chỉ cho bạn, thông qua một loạt ví dụ, cách khắc phục sự cố Python - Change The Bin Size Of An Histogram+ xảy ra trong mã
x = np.random.randn[1000] # Generate random numbers plt.hist[x, bins=20] # Select bin size plt.hist[x, bins=range[-4, 5]] # Select range
Sử dụng nhiều ví dụ, chúng ta đã học được cách giải quyết vấn đề Python - Change The Bin Size Of An Histogram+
Làm cách nào để bạn thay đổi kích thước thùng trên biểu đồ?
Để điều chỉnh độ rộng thùng, nhấp chuột phải vào trục ngang trên biểu đồ và sau đó nhấp vào Định dạng Trục từ danh sách thả xuống. Cái này là cái gì? . Chúng tôi có thể thay đổi số này thành bất kỳ số nào chúng tôi muốn. 10-Feb-2021
Kích thước thùng trong biểu đồ Python là gì?
Giá trị mặc định của số thùng được tạo trong biểu đồ là 10. Tuy nhiên, chúng ta có thể thay đổi kích thước của các thùng bằng tham số bin trong matplotlib. pyplot. lịch sử[]. 03-Jan-2021
Biểu đồ có thể có chiều rộng thùng khác nhau không?
Hầu hết các biểu đồ sử dụng chiều rộng của các ngăn càng bằng nhau càng tốt, nhưng cũng có thể sử dụng các chiều rộng của các ngăn không bằng nhau [xem phần 'Độ rộng của các ngăn thay đổi' của Biểu đồ]. Một chiến lược được đề xuất là định cỡ các thùng sao cho số lượng giá trị mà chúng chứa gần bằng nhau. 20-May-2021
Chiều rộng thùng của biểu đồ là gì?
Tính số thùng bằng cách lấy căn bậc hai của số điểm dữ liệu và làm tròn lên. Tính chiều rộng thùng bằng cách chia dung sai hoặc phạm vi thông số kỹ thuật [USL-LSL hoặc giá trị Max-Min] cho số thùng
Kích thước thùng trong một biểu đồ là gì?
Biểu đồ hiển thị dữ liệu số bằng cách nhóm dữ liệu thành "thùng" có chiều rộng bằng nhau. Mỗi ngăn được vẽ dưới dạng một thanh có chiều cao tương ứng với số lượng điểm dữ liệu trong ngăn đó. Các thùng đôi khi còn được gọi là "khoảng", "lớp" hoặc "xô"
Thùng có nghĩa là gì trong Python?
Thùng là số lượng khoảng thời gian bạn muốn chia tất cả dữ liệu của mình thành, sao cho dữ liệu có thể được hiển thị dưới dạng các thanh trên biểu đồ. Một phương pháp đơn giản để tính xem có bao nhiêu thùng phù hợp là lấy căn bậc hai của tổng số giá trị trong phân phối của bạn
Làm cách nào để đặt kích thước thùng trong Python?
Cách đặt kích thước thùng của biểu đồ Matplotlib trong Python
- dữ liệu = np. ngẫu nhiên. normal[50, 10, size = 10000] Tạo dữ liệu ngẫu nhiên
- rìu = plt. lịch sử [dữ liệu]
- bins_list = [-10, 20, 40, 50, 60, 80, 110] chỉ định điểm bắt đầu và kết thúc bin
- rìu = plt. lịch sử [dữ liệu, thùng = bins_list]
Làm cách nào để bạn tạo dữ liệu trong Python?
Làm mịn bằng phương tiện bin. Khi làm mịn bằng phương tiện bin, mỗi giá trị trong ngăn được thay thế bằng giá trị trung bình của ngăn. Làm mịn bằng trung vị bin. Trong phương pháp này, mỗi giá trị bin được thay thế bằng giá trị trung bình bin của nó. 13-Apr-2022
Làm thế nào để bạn tạo một thùng trong Python?
Hàm Python sau có thể được sử dụng để tạo thùng
- def create_bins[lower_bound, chiều rộng, số lượng]. """ create_bins trả về phân vùng có chiều rộng [khoảng cách] bằng nhau
- thùng = tạo_bins[lower_bound=10, chiều rộng=10, số lượng=5] thùng
Làm thế nào để bạn tạo một biểu đồ với chiều rộng lớp không bằng nhau?
Điều này được gọi là khoảng cách lớp không bằng nhau. Để vẽ biểu đồ cho thông tin này, trước tiên hãy tìm chiều rộng lớp của từng danh mục. Diện tích của thanh biểu thị tần suất, vì vậy để tìm chiều cao của thanh, hãy chia tần số cho chiều rộng của lớp. Đây được gọi là mật độ tần số