Làm thế nào để bạn tạo một thanh xếp chồng lên nhau trong python?

Biểu đồ thanh xếp chồng [còn gọi là biểu đồ thanh xếp chồng] mở rộng biểu đồ thanh tiêu chuẩn từ việc xem xét các giá trị số trên một biến phân loại thành hai. Mỗi thanh trong biểu đồ thanh tiêu chuẩn được chia thành một số thanh phụ xếp chồng lên nhau từ đầu đến cuối, mỗi thanh tương ứng với một mức của biến phân loại thứ hai

Biểu đồ thanh xếp chồng lên nhau ở trên mô tả doanh thu từ một nhà bán lẻ đồ thể dục hư cấu trong một khoảng thời gian cụ thể, qua hai biến phân loại. vị trí cửa hàng và bộ phận. Biến phân loại chính là vị trí cửa hàng. chúng ta có thể thấy từ chiều cao thanh tổng thể được sắp xếp mà Cherry St. địa điểm có doanh thu cao nhất và Apple Rd. thấp nhất. Mỗi thanh được chia nhỏ dựa trên cấp độ của biến phân loại thứ hai, bộ phận. Chúng ta có thể thấy rằng đối với hầu hết các địa điểm, quần áo có doanh số lớn hơn một chút so với thiết bị, do đó, doanh số này lớn hơn phụ kiện. Vị trí Strawberry Mall dường như có tỷ lệ doanh thu do thiết bị thấp hơn, trong khi thiết bị có tỷ trọng lớn hơn đối với Peach St

Khi nào bạn nên sử dụng biểu đồ thanh xếp chồng

Mục tiêu chính của biểu đồ thanh tiêu chuẩn là so sánh các giá trị số giữa các mức của biến phân loại. Một thanh được vẽ cho từng cấp độ của biến phân loại, độ dài của mỗi thanh biểu thị giá trị số. Biểu đồ thanh xếp chồng lên nhau cũng đạt được mục tiêu này, nhưng cũng nhắm đến mục tiêu thứ hai

Chúng tôi muốn chuyển sang biểu đồ thanh xếp chồng lên nhau khi chúng tôi quan tâm đến sự phân tách tương đối của từng thanh chính dựa trên các mức của biến phân loại thứ hai. Mỗi thanh hiện bao gồm một số thanh phụ, mỗi thanh tương ứng với một cấp độ của biến phân loại thứ cấp. Tổng chiều dài của mỗi thanh xếp chồng lên nhau giống như trước đây, nhưng bây giờ chúng ta có thể thấy các nhóm thứ cấp đã đóng góp vào tổng chiều dài đó như thế nào

Thứ tự của các biến phân loại

Một cân nhắc quan trọng trong việc xây dựng biểu đồ thanh xếp chồng là quyết định biến nào trong số hai biến phân loại sẽ là biến chính [chỉ ra vị trí trục chính và độ dài tổng thể của thanh] và biến nào sẽ là biến phụ [chỉ ra cách mỗi thanh chính sẽ được chia nhỏ]. Biến 'quan trọng' nhất phải là biến chính;

Ví dụ: nếu một biến phân loại mô tả dữ liệu thời gian [e. g. tóm tắt hàng tháng 20XX-Jan, 20XX-Feb, 20XX-Mar, v.v. ] thì đó thường sẽ là một lựa chọn rõ ràng cho phân loại chính. Tiếp theo trong hệ thống phân cấp chung là các biến số hoặc thứ tự khác, như độ tuổi [18-24, 25-34, 35-44, v.v. ] hoặc điểm xếp hạng [thỏa thuận trên thang điểm từ 1-7]. Các biến phân loại kiểu nhãn hoàn toàn [e. g. giới tính, bộ phận, khu vực địa lý] thường không có trọng số mạnh để được coi là chính. Như một sự cân nhắc khác, các biến có nhiều cấp độ hơn thường tốt hơn với vai trò là biến chính;

Cuối cùng, những quy tắc ngón tay cái này chỉ là những hướng dẫn chung. Kiến thức miền, mục tiêu trực quan hóa và thử nghiệm sẽ cho bạn thấy hệ thống phân cấp tốt nhất cho các biến phân loại cho từng trường hợp. Ví dụ: nếu chúng tôi quan tâm đến việc xem phân tích độ tuổi theo bộ phận sản phẩm, thì đây là lý do chính đáng để đặt biến phân loại thuần túy [bộ phận] làm biến chính.

Ví dụ về cấu trúc dữ liệu

cửa hàngQuần áoThiết bịPhụ kiệnCherry St. 8261. 684810. 341536. 57Trung Tâm Dâu Tây7875. 873126. 582019. 81Peach St. 4990. 234923. 481472. 59Lôi Av. 4658. 422955. 551390. 55Apple Rd. 3952. 001858. 46917. 90

Dữ liệu cho biểu đồ thanh xếp chồng thường được định dạng thành một bảng có ba cột trở lên. Các giá trị ở cột đầu tiên biểu thị các mức của biến phân loại chính. Mỗi cột sau cột đầu tiên sau đó sẽ tương ứng với một cấp độ của biến phân loại thứ cấp. Các giá trị ô chính cho biết độ dài của từng thanh phụ trong biểu đồ. Các thanh được xây dựng trên các hàng. khi biểu đồ thanh xếp chồng được tạo, mỗi thanh chính sẽ có tổng độ dài bằng tổng trên hàng tương ứng của nó

Đối với một số công cụ nhất định, bước trung gian để tạo biểu đồ thanh xếp chồng có thể yêu cầu tính tổng tích lũy trên mỗi hàng. Cột ngoài cùng bên phải sẽ chứa độ dài của các thanh chính. Thanh phụ được xác định bởi sự khác biệt về giá trị giữa các cột liên tiếp. Đối với các công cụ yêu cầu loại cấu trúc bảng dữ liệu này, hãy cẩn thận với các giá trị âm vì điều này có thể gây ra sự chồng chéo hoặc khoảng cách giữa các thanh làm sai lệch dữ liệu

cửa hàngQuần áo + Phụ kiện Thiết bị Cherry St. 8261. 6813 092. 0214 628. 59Trung Tâm Dâu Tây7875. 8711 002. 4513 022. 26Peach St. 4990. 239 913. 7111 386. 30Lôi Av. 4658. 427 613. 979 004. 52Apple Rd. 3952. 005 810. 466 728. 36

Các phương pháp hay nhất để sử dụng biểu đồ thanh xếp chồng

Biểu đồ thanh xếp chồng, về bản chất, đề xuất thực hiện theo các phương pháp hay nhất giống như biểu đồ thanh tiêu chuẩn mà chúng được xây dựng từ đó. Tuy nhiên, việc bổ sung biến phân loại thứ hai mang lại những cân nhắc bổ sung để tạo biểu đồ thanh xếp chồng hiệu quả

Duy trì đường cơ sở bằng không

Khi biểu đồ thanh tiêu chuẩn gặp giá trị âm, thanh tương ứng chỉ được vẽ bên dưới hoặc bên trái của đường cơ sở [tùy thuộc vào việc các thanh được định hướng theo chiều dọc hoặc chiều ngang tương ứng]. Trong biểu đồ thanh xếp chồng, một biểu diễn tương tự có thể được thực hiện, chỉ cần xếp chồng các thanh theo hướng âm

Tuy nhiên, khi kết hợp các thanh dương và thanh âm, sẽ không còn trường hợp chiều dài tổng thể của thanh tương ứng với tổng giá trị của thanh. Khi điều này xảy ra, bạn nên vẽ thêm một đường hoặc một loạt điểm trên đầu các thanh để hiển thị tổng số thực. sự khác biệt giữa độ dài của thanh dương và thanh âm

Khi các giá trị phụ nhất quán dương hoặc âm đối với mỗi nhóm phụ, sẽ dễ dàng duy trì thứ tự nhất quán của các thanh phụ trong mỗi thanh chính. Tuy nhiên, nếu nhiều nhóm con chuyển đổi giữa tích cực và tiêu cực tại các thời điểm khác nhau, thì sẽ không thể sắp xếp đẹp mắt vì các thanh chuyển đổi giữa ở trên và dưới đường cơ sở. Trong những trường hợp như thế này, tốt nhất bạn nên xem xét một loại biểu đồ khác cho dữ liệu. Biểu đồ đường hoặc biểu đồ thanh được nhóm có thể cung cấp hiển thị nhất quán hơn cho các nhóm riêng lẻ, mặc dù chúng mất khả năng xem tổng số chính. Nếu việc xem tổng số thực sự quan trọng, điều đó luôn có thể được hiển thị trong một biểu đồ bổ sung – đừng cảm thấy như thể bạn cần hiển thị mọi thứ trong một biểu đồ duy nhất

Thứ tự các cấp độ danh mục

Với biểu đồ thanh xếp chồng lên nhau, bạn sẽ cần xem xét thứ tự của các mức danh mục cho cả hai biến phân loại được vẽ trên biểu đồ. Quy tắc ngón tay cái cho biểu đồ thanh tiêu chuẩn có thể được áp dụng cho cả hai biến. sắp xếp các thanh từ lớn nhất đến nhỏ nhất trừ khi có một thứ tự cấp độ nội tại

Để làm rõ quy tắc này cho biến phân loại thứ cấp, quyết định này nên dựa trên quy mô tổng thể của từng cấp độ phân loại. Mỗi thanh chính được xếp chồng lên nhau theo cùng một thứ tự là một ý tưởng hay. Duy trì tính nhất quán này giúp dễ dàng liên kết các thanh phụ với các cấp danh mục phụ. Tính nhất quán này cũng có nghĩa là nhóm được vẽ đầu tiên luôn nằm trên đường cơ sở, làm cho kích thước của chúng dễ đọc. Do đó, nếu việc theo dõi các giá trị chính xác là quan trọng đối với một cấp độ biến thứ cấp cụ thể, thì các thanh phụ của nó nên được đặt trên đường cơ sở thay thế

Lựa chọn màu sắc hiệu quả

Mặc dù khuyến nghị chung là sử dụng một màu duy nhất trong biểu đồ thanh tiêu chuẩn, nhưng việc sử dụng màu để phân biệt các mức biến phụ là điều không thể tránh khỏi đối với biểu đồ thanh xếp chồng. Điểm quan trọng là đảm bảo rằng việc lựa chọn bảng màu để gán cho từng cấp độ phân loại phù hợp với loại biến. một bảng định tính cho các biến phân loại thuần túy và tuần tự hoặc phân kỳ cho các biến có thứ tự có ý nghĩa

sử dụng sai phổ biến

Giải thích các giá trị trên các nhóm riêng lẻ trong biểu đồ vùng xếp chồng

Mặc dù việc so sánh tổng các giá trị số giữa các cấp của biến phân loại chính là đơn giản, nhưng việc đánh giá các phân chia hoặc so sánh khác bằng cách sử dụng biến phân loại thứ cấp sẽ khó hơn. Nếu chúng ta muốn thấy sự thay đổi ở cấp độ thứ cấp trên biến phân loại chính, điều này chỉ có thể được thực hiện dễ dàng đối với cấp độ được vẽ trên đường cơ sở. Đối với tất cả các cấp độ phụ khác, đường cơ sở của chúng sẽ thay đổi, khiến việc đánh giá độ dài của thanh phụ thay đổi như thế nào giữa các thanh chính trở nên khó khăn hơn. Trong ví dụ dưới đây, khó có thể nói rằng nhóm màu vàng trung tâm đang thực sự giảm nhẹ theo thời gian

Ngay cả việc cố gắng so sánh các thanh phụ trong mỗi thanh chính cũng có thể khó khăn. Ngay cả khi làm theo hướng dẫn để sắp xếp các cấp danh mục phụ theo kích thước tổng thể, điều này không đảm bảo rằng chúng sẽ được sắp xếp theo kích thước trong một thanh chính cụ thể. Cũng ở hình trên, khó phân biệt nhóm “Tây” tím vượt nhóm “Miền” vàng về quy mô

Hãy nhớ rằng một trong những mục tiêu tiêu chuẩn của biểu đồ thanh xếp chồng là đưa ra các đánh giá tương đối về biến phân loại thứ cấp và việc đưa ra các đánh giá chính xác không quan trọng bằng. Nếu việc so sánh các nhóm phụ là quan trọng thì nên sử dụng loại biểu đồ khác như biểu đồ đường hoặc biểu đồ thanh được nhóm

Các tùy chọn biểu đồ thanh xếp chồng phổ biến

Biểu đồ thanh xếp chồng ngang

Giống như biểu đồ thanh tiêu chuẩn, các thanh trong biểu đồ thanh xếp chồng có thể được định hướng theo chiều ngang [với các danh mục chính trên trục tung] cũng như theo chiều dọc [với các danh mục chính trên trục hoành]. Định hướng ngang phục vụ các lợi ích tương tự như trước đây, cho phép dễ dàng hiển thị các mức danh mục dài mà không cần xoay hoặc cắt bớt

Biểu đồ thanh xếp chồng phần trăm

Một tùy chọn phổ biến khác cho biểu đồ thanh xếp chồng là tỷ lệ phần trăm hoặc tần suất tương đối, biểu đồ thanh xếp chồng. Ở đây, mỗi thanh chính được chia tỷ lệ để có cùng chiều cao, sao cho mỗi thanh phụ trở thành phần đóng góp phần trăm cho toàn bộ ở mỗi cấp danh mục chính. Điều này loại bỏ khả năng so sánh tổng số của các cấp danh mục chính, nhưng cho phép chúng tôi thực hiện phân tích tốt hơn về phân phối tương đối của các nhóm thứ cấp. Việc cố định chiều cao của từng thanh chính giống nhau cũng tạo ra một đường cơ sở khác ở đầu biểu đồ nơi có thể theo dõi nhóm con thứ hai trên các thanh chính

Chú thích giá trị

Một cách để giảm bớt vấn đề so sánh kích thước thanh phụ từ độ dài của chúng là thêm chú thích cho mỗi thanh cho biết kích thước của nó. Tuy nhiên, điều này làm tăng thêm một chút lộn xộn về mặt hình ảnh, vì vậy hãy cẩn thận về việc liệu nó có được sử dụng hay không. Đảm bảo rằng biểu đồ thanh xếp chồng phù hợp với các mục tiêu chính của bạn để trực quan hóa hoặc chọn một loại biểu đồ khác

Lô đất liên quan

Biểu đồ tròn

Khi chỉ có một thanh được vẽ, biểu đồ hình tròn có thể được coi là một giải pháp thay thế cho biểu đồ thanh xếp chồng. Tuy nhiên, bạn không nên sử dụng biểu đồ hình tròn khi muốn so sánh hai hoặc nhiều nhóm chính, như trường hợp thường xảy ra với biểu đồ thanh xếp chồng. Vì các biểu đồ hình tròn thường không có bất kỳ dấu tích nào, nên có thể khó đánh giá tỷ lệ chính xác hơn cả bên trong và giữa các bánh. Biểu đồ hình tròn cũng được giới hạn ở các so sánh tương đối hoặc tỷ lệ phần trăm, thay vì giá trị tuyệt đối. Ngoài ra, nhiều biểu đồ thanh xếp chồng lên nhau sẽ có xu hướng chiếm ít không gian hơn so với nhiều biểu đồ hình tròn, cho phép xem toàn bộ dữ liệu dễ dàng hơn

biểu đồ vùng

Khi biến phân loại chính được lấy từ một đối tượng địa lý liên tục, chẳng hạn như các khoảng thời gian, chúng ta có tùy chọn sử dụng biểu đồ vùng xếp chồng thay vì các thanh xếp chồng. Các khu vực xếp chồng lên nhau có xu hướng nhấn mạnh các thay đổi và xu hướng hơn là các con số chính xác và sẽ dễ đọc hơn nhiều khi có nhiều thanh để vẽ biểu đồ. Ngoài ra, bản chất kết nối của biểu đồ vùng giúp nhấn mạnh bản chất liên tục của biến chính

Biểu đồ thanh được nhóm

Nếu chúng ta tách từng thanh chính và thay vào đó đặt các thanh phụ theo nhóm trên đường cơ sở, thì chúng ta sẽ nhận được biểu đồ thanh được nhóm, còn được gọi là biểu đồ thanh nhóm. Với biểu đồ thanh được nhóm, chúng tôi đánh đổi khả năng quan sát tổng số trong từng cấp danh mục chính và hiểu chính xác hơn về cách các danh mục phụ xếp hạng trong từng cấp danh mục chính

Biểu đồ Marimekko

Khi biến số của chúng ta đại diện cho một loại tổng thể nào đó đã được chia thành các phần trên hai biến phân loại, thì một loại biểu đồ khó hiểu hơn mà chúng ta có thể chọn là biểu đồ Marimekko [còn gọi là biểu đồ Mekko, biểu đồ khảm, biểu đồ ma trận]. Biểu đồ Marimekko về cơ bản là một hình vuông hoặc hình chữ nhật đã được chia thành biểu đồ thanh xếp chồng lên nhau theo hai hướng tuần tự. So với biểu đồ thanh xếp chồng giá trị tuyệt đối tiêu chuẩn, giờ đây mỗi thanh chính sẽ có cùng chiều dài nhưng chiều rộng khác nhau. Lưu ý rằng điều này làm cho việc giải thích các thanh phụ thậm chí còn khó khăn hơn trong biểu đồ marimekko so với biểu đồ thanh xếp chồng vì chúng ta không thể chỉ nhìn vào độ dài của thanh mà thay vào đó cần xem xét các khu vực hộp

Công cụ trực quan

Biểu đồ thanh xếp chồng là loại biểu đồ phổ biến cho các công cụ trực quan, vì chúng được xây dựng dựa trên biểu đồ thanh tiêu chuẩn phổ biến. Tùy thuộc vào công cụ được sử dụng, biểu đồ thanh xếp chồng có thể chỉ là một phần của loại biểu đồ thanh cơ bản, được tạo tự động từ sự hiện diện của nhiều cột giá trị trong bảng dữ liệu. Các công cụ cũng có thể đặt biểu đồ thanh xếp chồng và biểu đồ thanh được nhóm lại với nhau, với tùy chọn để chọn giữa chúng

Khi biểu đồ thanh xếp chồng không phải là loại biểu đồ tích hợp sẵn cho một công cụ, có thể tạo một biểu đồ bằng cách tạo nhiều biểu đồ thanh chồng lên nhau. Đây là nơi cần tính toán tổng tích lũy hoặc bổ sung logic để xử lý các giá trị âm

Biểu đồ thanh xếp chồng là một trong nhiều loại biểu đồ khác nhau có thể được sử dụng để trực quan hóa dữ liệu. Tìm hiểu thêm từ các bài viết của chúng tôi về các loại biểu đồ thiết yếu, cách chọn loại trực quan hóa dữ liệu hoặc bằng cách duyệt qua bộ sưu tập đầy đủ các bài viết trong danh mục biểu đồ

Chủ Đề