Cách thêm giá trị trên đầu biểu đồ thanh trong python

nhập khẩu cốt truyện. graph_objects as go years = [1995, 1996, 1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012] fig = go. Hình [] hình. add_trace[đi. Thanh[x=năm, y=[219, 146, 112, 127, 124, 180, 236, 207, 236, 263, 350, 430, 474, 526, 488, 537, 500, 439], tên='Phần còn lại . add_trace[đi. Thanh[x=năm, y=[16, 13, 10, 11, 28, 37, 43, 55, 56, 88, 105, 156, 270, 299, 340, 403, 549, 499], name='Trung Quốc . update_layout[ title='Xuất khẩu phế liệu nhựa của Mỹ', xaxis_tickfont_size=14, yaxis=dict[ title='USD [triệu]', titlefont_size=16, tickfont_size=14, ], legend=dict[ x=0, y=1. 0, bgcolor='rgba[255, 255, 255, 0]', bordercolor='rgba[255, 255, 255, 0]' ], barmode='group', bargap=0. 15, # khoảng cách giữa các thanh của tọa độ vị trí liền kề. khoảng cách nhóm = 0. 1 # khoảng cách giữa các thanh có cùng tọa độ vị trí. ] quả sung. trình diễn[]

Một trong những loại biểu đồ cơ bản nhất là biểu đồ thanh và một trong những công cụ hữu ích nhất của bạn khi khám phá và hiểu dữ liệu của bạn

Biểu đồ thanh là gì?

Biểu đồ thanh [còn gọi là biểu đồ thanh, biểu đồ cột] vẽ các giá trị số cho các mức của đối tượng địa lý phân loại dưới dạng thanh. Các mức được vẽ trên một trục biểu đồ và các giá trị được vẽ trên trục kia. Mỗi giá trị phân loại yêu cầu một thanh và độ dài của mỗi thanh tương ứng với giá trị của thanh. Các thanh được vẽ trên một đường cơ sở chung để cho phép dễ dàng so sánh các giá trị

Biểu đồ thanh ví dụ này mô tả số lượng mua hàng được thực hiện trên một trang web bởi các loại người dùng khác nhau. Tính năng phân loại, loại người dùng, được vẽ trên trục hoành và chiều cao của mỗi thanh tương ứng với số lần mua được thực hiện theo từng loại người dùng. Từ biểu đồ này, chúng ta có thể thấy rằng mặc dù số lần mua hàng từ những người dùng mới tạo tài khoản người dùng cao gấp khoảng ba lần so với những người không tạo tài khoản người dùng [khách], nhưng cả hai đều bị lấn át bởi số lượng mua hàng do người dùng lặp lại thực hiện.

Khi nào bạn nên sử dụng biểu đồ thanh

Biểu đồ thanh được sử dụng khi bạn muốn hiển thị phân phối điểm dữ liệu hoặc thực hiện so sánh các giá trị chỉ số trên các nhóm con khác nhau của dữ liệu. Từ biểu đồ thanh, chúng ta có thể thấy nhóm nào cao nhất hoặc phổ biến nhất và cách các nhóm khác so sánh với các nhóm khác. Vì đây là một nhiệm vụ khá phổ biến nên biểu đồ thanh là một loại biểu đồ khá phổ biến

Biến chính của biểu đồ thanh là biến phân loại của nó. Một biến phân loại nhận các giá trị riêng biệt, có thể được coi là nhãn. Các ví dụ bao gồm tiểu bang hoặc quốc gia, loại ngành, phương thức truy cập trang web [máy tính để bàn, thiết bị di động] và loại khách truy cập [miễn phí, cơ bản, cao cấp]. Một số biến phân loại có các giá trị được sắp xếp, chẳng hạn như chia các đối tượng theo kích thước [nhỏ, trung bình, lớn]. Ngoài ra, một số biến không phân loại có thể được chuyển đổi thành các nhóm, như tổng hợp dữ liệu thời gian dựa trên ngày [ví dụ:. chia theo quý thành 20XX-Q1, 20XX-Q2, 20XX-Q3, 20XX-Q4, v.v. ] Điểm quan trọng đối với biến chính này là các nhóm khác biệt

Ngược lại, biến phụ sẽ có bản chất là số. Các giá trị của biến thứ cấp xác định độ dài của mỗi thanh. Những giá trị này có thể đến từ nhiều nguồn khác nhau. Ở dạng đơn giản nhất, các giá trị có thể là số lượng hoặc tỷ lệ tần số đơn giản cho lượng dữ liệu được chia thành từng loại – hoàn toàn không phải là một tính năng dữ liệu thực tế. Ví dụ: biểu đồ sau tính số lần xem trang trong khoảng thời gian sáu tháng. Bạn có thể thấy từ hình dung này rằng đã có một đỉnh nhỏ vào tháng 6 và tháng 7 trước khi quay trở lại đường cơ sở trước đó

Những lần khác, các giá trị có thể là giá trị trung bình, tổng số hoặc một số phép đo tóm tắt khác được tính riêng cho từng nhóm. Trong ví dụ sau, chiều cao của mỗi thanh mô tả quy mô giao dịch trung bình theo phương thức thanh toán. Lưu ý rằng mặc dù các khoản thanh toán trung bình cao nhất bằng séc, nhưng sẽ cần một biểu đồ khác để cho biết tần suất khách hàng thực sự sử dụng chúng

Ví dụ về cấu trúc dữ liệu

Loại thanh toánGiao dịch trung bìnhKiểm tra46. 861Thẻ tín dụng36. 681Thẻ ghi nợ28. 860Ví kỹ thuật số18. 900Tiền mặt4. 802

Dữ liệu được hiển thị dưới dạng biểu đồ thanh có thể ở dạng nhỏ gọn như bảng trên, với một cột cho các danh mục và cột thứ hai cho các giá trị của chúng. Những lần khác, dữ liệu có thể ở dạng chưa tổng hợp như đoạn mã bảng bên dưới, với công cụ trực quan hóa tự động thực hiện tổng hợp tại thời điểm tạo trực quan hóa

Đối với biểu đồ thanh dựa trên số lượng, chỉ cần cột đầu tiên. Đối với biểu đồ thanh dựa trên tóm tắt, hãy nhóm theo cột đầu tiên, sau đó tính số đo tóm tắt trên cột thứ hai

Các phương pháp hay nhất để sử dụng biểu đồ thanh

Sử dụng đường cơ sở có giá trị bằng 0 chung

Trước hết, hãy đảm bảo rằng tất cả các thanh của bạn đang được vẽ dựa trên đường cơ sở có giá trị bằng không. Đường cơ sở đó không chỉ giúp người đọc so sánh độ dài thanh dễ dàng hơn mà còn duy trì tính trung thực của hình ảnh hóa dữ liệu của bạn. Biểu đồ thanh có đường cơ sở khác không hoặc một số khoảng cách khác trong thang trục có thể dễ dàng trình bày sai sự so sánh giữa các nhóm vì tỷ lệ trong độ dài thanh sẽ không khớp với tỷ lệ trong giá trị thanh thực tế

Bằng cách cắt 90 điểm ra khỏi trục tung, một chênh lệch 4 điểm nhỏ có thể được phóng đại trông giống như 1. 3 tỷ lệ

Duy trì các dạng hình chữ nhật cho thanh của bạn

Một điều không nên lớn khác là làm rối tung hình dạng của các thanh được vẽ. Một số công cụ sẽ cho phép làm tròn các nắp thanh, thay vì chỉ có các cạnh thẳng. Việc làm tròn này có nghĩa là người đọc khó biết được nơi đọc giá trị thực. từ đỉnh của hình bán nguyệt, hay ở đâu đó ở giữa?

Tương tự, bạn nên tránh đưa hiệu ứng 3 chiều vào thanh của mình. Cũng như làm tròn nhiều, điều này có thể khiến việc đo chiều dài thanh trở nên khó khăn hơn và như một phần thưởng, có thể khiến các đường cơ sở không được căn chỉnh [xem điểm trên]

Xem xét thứ tự của các cấp độ danh mục

Một điều bạn nên cân nhắc khi sắp xếp một biểu đồ thanh là bạn sẽ vẽ các thanh theo thứ tự nào. Một quy ước tiêu chuẩn cần thực hiện là sắp xếp các thanh từ dài nhất đến ngắn nhất. trong khi luôn có thể so sánh độ dài thanh bất kể thứ tự, điều này có thể giảm bớt gánh nặng cho người đọc khi tự thực hiện những so sánh đó. Ngoại lệ chính cho điều này là nếu các nhãn danh mục vốn đã được sắp xếp theo một cách nào đó. Trong những trường hợp như vậy, thứ tự vốn có thường được ưu tiên

Mã quận vốn không được sắp xếp theo thứ tự, do đó, cách thể hiện tốt hơn là sắp xếp theo giá trị

Sử dụng màu sắc một cách khôn ngoan

Một cân nhắc khác là bạn nên sử dụng màu sắc như thế nào trong biểu đồ thanh của mình. Theo mặc định, một số công cụ nhất định sẽ tô màu mỗi thanh khác nhau, nhưng điều này có thể khiến người đọc mất tập trung bằng cách ngụ ý ý nghĩa bổ sung khi không tồn tại. Thay vào đó, màu sắc nên được sử dụng có mục đích. Ví dụ: bạn có thể sử dụng màu để đánh dấu các cột cụ thể để kể chuyện. Màu sắc cũng có thể được sử dụng nếu chúng có ý nghĩa đối với các chuyên mục được đăng [e. g. để phù hợp với màu sắc của công ty hoặc đội]

Màu sắc cầu vồng bên trái không thêm bất cứ điều gì có ý nghĩa để giải thích cốt truyện. Ở phía bên phải, hầu hết các thanh có màu xám trung tính để làm nổi bật sự so sánh của hai thanh màu

sử dụng sai phổ biến

Thay thế các thanh bằng hình ảnh

Có thể thay thế các thanh bằng hình ảnh mô tả những gì đang được đo [e. g. túi tiền cho số tiền], hãy cẩn thận rằng bạn không trình bày sai dữ liệu của mình theo cách này. Nếu lựa chọn biểu tượng của bạn chia tỷ lệ cả chiều rộng và chiều cao theo giá trị, thì sự khác biệt sẽ trông lớn hơn nhiều so với thực tế, vì cuối cùng mọi người sẽ so sánh diện tích của các thanh thay vì chỉ chiều rộng hoặc chiều cao của chúng. Trong ví dụ bên dưới, số lượt tải xuống đã tăng 58% từ năm 2018 đến năm 2019. Tuy nhiên, sự tăng trưởng này được phóng đại với biểu diễn dựa trên biểu tượng, vì diện tích bề mặt của biểu tượng năm 2019 lớn hơn 2. Gấp 5 lần kích thước của biểu tượng năm 2018

Nếu bạn cảm thấy cần phải sử dụng các biểu tượng để mô tả giá trị, thì tùy chọn tốt hơn – mặc dù vẫn chưa tuyệt vời – là sử dụng loại biểu đồ tượng hình để thay thế. Trong biểu đồ tượng hình, giá trị của mỗi danh mục được biểu thị bằng một loạt biểu tượng, với mỗi biểu tượng đại diện cho một số lượng nhất định. Theo một nghĩa nào đó, điều này giống như thay đổi kết cấu của thanh tương ứng thành một hình ảnh lặp lại. Một lưu ý quan trọng với loại biểu đồ này là nó có thể làm cho các giá trị khó đọc hơn, vì người đọc cần thực hiện một số thao tác tính nhẩm để đánh giá các giá trị tương đối của từng loại

Tùy chọn biểu đồ thanh phổ biến

thanh ngang so với. thanh dọc

Một biến thể biểu đồ thanh phổ biến là biểu đồ thanh nên được định hướng theo chiều dọc [với các danh mục trên trục hoành] hay theo chiều ngang [với các danh mục trên trục tung]. Mặc dù biểu đồ thanh dọc thường là mặc định, nhưng bạn nên sử dụng biểu đồ thanh ngang khi gặp các nhãn danh mục dài. Trong biểu đồ dọc, các nhãn này có thể chồng lên nhau và cần được xoay hoặc dịch chuyển để duy trì mức độ dễ đọc;

Nếu các thanh trong ví dụ trước được định hướng theo chiều dọc, thì các nhãn đánh dấu Nhóm sẽ cần được xoay để có thể đọc được

Bao gồm chú thích giá trị

Một bổ sung phổ biến cho biểu đồ thanh là chú thích giá trị. Mặc dù người đọc khá dễ dàng so sánh độ dài thanh và đánh giá các giá trị gần đúng từ biểu đồ thanh, nhưng các giá trị chính xác không nhất thiết phải dễ nêu. Chú thích có thể báo cáo những giá trị này khi chúng quan trọng và thường được đặt ở giữa thanh hoặc ở cuối thanh

Bao gồm râu ria biến đổi

Khi các giá trị số là một thước đo tóm tắt, thì việc xem xét thường xuyên là có hay không đưa các thanh lỗi vào biểu đồ. Các thanh lỗi là các râu bổ sung được thêm vào cuối mỗi thanh để biểu thị mức độ thay đổi trong các điểm dữ liệu riêng lẻ đã góp phần vào phép đo tóm tắt. Vì có nhiều sự lựa chọn cho phép đo độ không đảm bảo [e. g. độ lệch chuẩn, khoảng tin cậy, khoảng tứ phân vị] điều quan trọng là khi bạn hiển thị các thanh lỗi, bạn phải ghi chú trong chú thích hoặc nhận xét những gì các thanh lỗi thể hiện

Ngoài ra, bạn có thể muốn mô tả phương sai trong mỗi danh mục bằng một loại biểu đồ khác, chẳng hạn như biểu đồ hộp hoặc biểu đồ vĩ cầm. Mặc dù các biểu đồ này sẽ có nhiều yếu tố hơn để người đọc phân tích, nhưng chúng cung cấp hiểu biết sâu hơn về phân phối giá trị trong mỗi nhóm

Các thanh lỗi cho biết độ lệch chuẩn đối với số tiền giao dịch cho từng loại thanh toán. Sự thay đổi thấp hơn đối với thẻ tín dụng và thẻ ghi nợ so với các thẻ khác

Biểu đồ Lollipop

Một biến thể của biểu đồ thanh là biểu đồ kẹo mút. Nó trình bày chính xác thông tin giống như biểu đồ thanh, nhưng với tính thẩm mỹ khác nhau. Thay vì các thanh, chúng tôi có các dòng đứng đầu bởi các dấu chấm ở điểm cuối của chúng. Biểu đồ kẹo mút hữu ích nhất khi có nhiều danh mục và giá trị của chúng khá gần nhau. Bằng cách thay đổi hình thức thẩm mỹ của các giá trị được biểu thị, nó có thể làm cho biểu đồ dễ đọc hơn nhiều

Lô đất liên quan

Biểu đồ tròn

Nếu các giá trị trong biểu đồ thanh biểu thị các phần của tổng thể [tổng chiều dài thanh tổng số điểm dữ liệu hoặc 100%], thì loại biểu đồ thay thế mà bạn có thể sử dụng là biểu đồ hình tròn. Mặc dù biểu đồ hình tròn có nhiều sai lệch, nhưng nó vẫn lấp đầy một vị trí thích hợp khi có ít danh mục để vẽ biểu đồ và sự phân chia các bộ phận thành toàn bộ cần được đặt ở phía trước và chính giữa. Tuy nhiên, nói chung, bạn có nhiều khả năng sử dụng biểu đồ thanh trong mục đích sử dụng chung, vì việc so sánh giữa các danh mục sẽ dễ dàng hơn

Biểu đồ

Biểu đồ là anh em họ gần với biểu đồ thanh mô tả các giá trị tần số. Mặc dù biến chính của biểu đồ thanh có bản chất là phân loại, nhưng biến chính của biểu đồ là liên tục và ở dạng số. Các thanh trong biểu đồ thường được đặt ngay cạnh nhau để nhấn mạnh tính chất liên tục này. biểu đồ thanh thường có một số khoảng cách giữa các thanh để nhấn mạnh bản chất phân loại của biến chính

biểu đồ đường

Đối với biểu đồ thanh mô tả thống kê tóm tắt, biểu đồ đường là biểu đồ tương đối gần nhất. Giống như mối quan hệ từ biểu đồ thanh đến biểu đồ, biến chính của biểu đồ đường thường liên tục và ở dạng số, được nhấn mạnh bởi đường liên tục giữa các điểm. Việc tô vùng giữa đường kẻ và đường cơ sở bằng 0 sẽ tạo ra một biểu đồ vùng, có thể coi biểu đồ này là sự kết hợp của biểu đồ thanh và biểu đồ đường

Châm điểm

Ngoài ra, khi chúng tôi có số liệu thống kê tóm tắt về biến chính phân loại, chúng tôi có thể chọn biểu đồ dấu chấm hoặc biểu đồ dấu chấm Cleveland thay vì biểu đồ thanh. Biểu đồ chấm về cơ bản là một biểu đồ đường không có các đoạn đường kết nối từng điểm. Điều này giải phóng nó để được sử dụng với các cấp độ phân loại, thay vì tiến trình liên tục. Ưu điểm lớn nhất của biểu đồ chấm so với biểu đồ thanh là các giá trị được biểu thị theo vị trí thay vì độ dài, vì vậy chúng tôi không nhất thiết cần đường cơ sở bằng không. Khi đường cơ sở cần thiết trên biểu đồ thanh cản trở nhận thức về các thay đổi hoặc sự khác biệt giữa các thanh, thì biểu đồ đường hoặc biểu đồ chấm có thể là một lựa chọn thay thế tốt

Biểu đồ thanh xếp chồng và biểu đồ thanh được nhóm

Biểu đồ thanh có thể được mở rộng khi chúng tôi giới thiệu biến phân loại thứ hai để phân chia từng nhóm trong biến phân loại ban đầu. Nếu các giá trị thanh mô tả tần suất nhóm, biến phân loại thứ hai có thể chia số lượng của mỗi thanh thành các nhóm con. Áp dụng cho các thanh ban đầu, điều này dẫn đến biểu đồ thanh xếp chồng lên nhau, nhìn thấy ở bên trái trong hình bên dưới. Ngoài ra, nếu chúng ta di chuyển các thanh của các nhóm con khác nhau đến đường cơ sở, loại biểu đồ kết quả là biểu đồ thanh được nhóm, nhìn thấy ở bên phải. Chúng tôi cũng sử dụng biểu đồ thanh được nhóm khi chúng tôi tính toán các biện pháp tóm tắt thống kê qua các cấp độ của hai biến phân loại

Công cụ trực quan

Hầu hết các công cụ có thể tạo trực quan hóa, cho dù chúng là bảng tính, thư viện lập trình hay công cụ kinh doanh thông minh, đều có khả năng tạo biểu đồ thanh dọc cơ bản. Đôi khi, các tùy chọn cần được kiểm tra hoặc sửa đổi để tuân theo các phương pháp hay nhất. Tuy nhiên, đối với nhu cầu khám phá dữ liệu cơ bản, bất kỳ công cụ nào cũng phải đủ. Các biến thể khác như thanh ngang, thanh lỗi và chú thích có thể không phải lúc nào cũng khả dụng. Cụ thể, biến thể biểu đồ kẹo mút thường không được coi là loại biểu đồ mặc định và thay vào đó, thường sẽ yêu cầu tinh chỉnh chuyên biệt bằng các công cụ có lập trình

Biểu đồ thanh là một trong nhiều loại biểu đồ khác nhau có thể được sử dụng để hiển thị dữ liệu. Tìm hiểu thêm từ các bài viết của chúng tôi về các loại biểu đồ thiết yếu, cách chọn loại trực quan hóa dữ liệu hoặc bằng cách duyệt qua bộ sưu tập đầy đủ các bài viết trong danh mục biểu đồ

Chủ Đề