Biểu đồ thanh hoạt hình python

Dự án dành cho người mới bắt đầu nhanh chóng và từng bước để tạo biểu đồ thanh động cho bộ dữ liệu Covid tuyệt vời

Nhiệm vụ của chúng tôi là tạo một cuộc đua biểu đồ thanh hoạt hình [bcr] cho số trường hợp covid-19 theo quốc gia trong khoảng thời gian từ tháng 2 năm 2020 đến tháng 4 năm 2021

Không giống như các hướng dẫn khác cho phép bạn sử dụng tập dữ liệu bcr được tải sẵn, chúng tôi sẽ tạo, xử lý và xóa tập dữ liệu của riêng chúng tôi cho thanh biểu đồ cuộc đua

về vấn đề

Tuyên bố vấn đề của chúng tôi sẽ là hồ sơ trường hợp Covid-19 trên toàn thế giới

“Hy vọng là có thể nhìn thấy ánh sáng bất chấp bóng tối. ” — Desmond Tutu

Giới thiệu về tập dữ liệu

Bạn có thể tìm thấy dữ liệu thô ở đây. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/worldometer_coronavirus_daily_data. csv

Nếu bạn muốn bỏ qua các bước xử lý và làm sạch dữ liệu để chuyển thẳng sang phần tạo biểu đồ. Đây là tập dữ liệu đã sửa đổi của tôi. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/corona_dataset

Dữ liệu này đã được cạo từ worldometers. thông tin về 2021–04–24 của Joseph Assaker. 218 quốc gia được đại diện trong dữ liệu này

Tất cả các quốc gia có hồ sơ từ 2020–2–15 cho đến 2021–04–24 [435 ngày mỗi quốc gia]. Đó là ngoại trừ Trung Quốc, nơi có hồ sơ từ 2020–1–22 cho đến 2021–04–24 [459 ngày mỗi quốc gia]

Tóm tắt các cột dữ liệu

  1. quốc gia. chỉ định Quốc gia nơi dữ liệu của hàng được quan sát
  2. lục địa. chỉ định Lục địa của quốc gia được quan sát
  3. tổng_đã xác nhận. chỉ định tổng số trường hợp được xác nhận tại quốc gia được quan sát
  4. tổng_số_chết. chỉ định tổng số ca tử vong được xác nhận ở quốc gia được quan sát
  5. tổng_recovery. chỉ định tổng số ca phục hồi được xác nhận tại quốc gia được quan sát
  6. ca nhiễm bệnh hiện tại. chỉ định số lượng các trường hợp đang hoạt động ở quốc gia được quan sát
  7. nghiêm trọng_or_critical. chỉ định số trường hợp ước tính trong tình trạng nghiêm trọng hoặc nguy kịch ở quốc gia được quan sát
  8. tổng_trường_hợp_trên_1m_dân. chỉ định tổng số trường hợp trên 1 triệu dân ở quốc gia được quan sát
  9. tổng_số_người_chết_trên_1m_dân. chỉ số tổng số người chết trên 1 triệu dân ở quốc gia được quan sát
  10. tổng_kiểm tra. chỉ định tổng số bài kiểm tra được thực hiện ở quốc gia được quan sát
  11. total_tests_per_1m_population. chỉ định tổng số xét nghiệm được thực hiện trên 1 triệu dân ở quốc gia được quan sát
  12. dân số. chỉ định số lượng dân số ở quốc gia được quan sát

Lời cảm ơn cho Tập dữ liệu

Tất cả dữ liệu có trong tập dữ liệu này được lấy từ worldometers. thông tin

Bạn có thể tìm thấy mã sạch hoàn chỉnh trên Jupyter-notebook của tôi. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/Animated%20Bar%20Graph. ipynb

tải thư viện

import pandas as pd
import os

Tải tập dữ liệu

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]

Xử lý tập dữ liệu. Hãy tìm hiểu dữ liệu

df.head[]
df.shape[95289, 7]df.tail[]

Vì có nhiều dữ liệu của các quốc gia, chúng tôi cần chọn một số Dữ liệu quốc gia cụ thể mà chúng tôi muốn phân tích

df.loc[df["country"] == "Zimbabwe"].shape
Output:
[435, 7]

Do đó, chúng tôi có các giá trị trong khoảng 450 ngày cho mỗi quốc gia

df.isnull[].sum[]Output:
date                           0
country                        0
cumulative_total_cases         0
daily_new_cases             6469
active_cases                   0
cumulative_total_deaths     6090
daily_new_deaths           19190
dtype: int64

Chọn quốc gia cho Bar Plot

Chọn cột cum_total_cases dưới dạng chuỗi và nhóm chúng với tên quốc gia. Tôi sẽ chọn 8 quốc gia, đông dân nhất và hàng xóm của chúng tôi để đánh giá

Mã, Hình ảnh của tác giả

Chúng tôi chỉ có dữ liệu cho 435 hàng cho tất cả các quốc gia. Do đó, hãy lấy dữ liệu cho 435 hàng cho Trung Quốc

Xử lý dữ liệu cho Trung Quốc

CHINA=[]
for i in range[0,435]:
    CHINA.append[china[i]]

Chuyển đổi thành sê-ri

china = pd.Series[CHINA]china.shapeOutput:[435,]

Tuyệt quá. Bây giờ chiều dài của tất cả các cột của chúng tôi nằm trong bồn rửa. tôi. dữ liệu 435 ngày

Chúng ta cũng cần chọn cột ngày tháng. Để chỉ truy xuất 459 giá trị đầu tiên, vì các ngày lặp lại với các quốc gia, dữ liệu của số ngày tối đa mà chúng tôi có là 435 ngày cho tất cả các quốc gia

Cột ngày xử lý

________số 8

Chuyển đổi danh sách thành chuỗi

DATE = pd.Series[date]

Nối chuỗi để tạo cơ sở dữ liệu mới

Vì bây giờ chúng ta có các chuỗi khác nhau, hãy đặt tên cho các chuỗi này mà sau này sẽ được chuyển đổi thành Cột Dataframe

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
0
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
1

Kiểm tra các giá trị null nếu có

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
2

Chuyển đổi ngày thành định dạng Ngày giờ

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
3

Cuối cùng. Chúng tôi có định dạng và quốc gia cần thiết

Chúng ta cũng cần chọn cột ngày

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
4
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
5

TUYỆT. Khung dữ liệu của chúng tôi trông tuyệt vời và sẵn sàng để tiếp tục

Hãy bắt đầu với mã hóa biểu đồ thanh aminated ngay bây giờ

Cài đặt cuộc đua biểu đồ thanh

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
6

điểm cần lưu ý. Biểu đồ cần thời gian để tải, vì vậy hãy kiên nhẫn. Khác với tôi, đừng vội tìm ra những sai sót không đáng có hay tự nghi ngờ bản thân nếu phút chốc không thấy kết quả

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
8

df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
7

Thật buồn khi nhận thấy các ca bệnh đã tăng theo cấp số nhân ở Ấn Độ khi tháng 4 sắp đến, tất cả những điều đó dẫn đến sự hoảng loạn, tàn phá và thiệt hại về người vào thời điểm tôi viết blog này

Ghi chú. Nếu bạn gặp bất kỳ lỗi nào liên quan đến FFmpeg. đây là liên kết từng bước để giải quyết nó cho hệ thống của bạn. https. //www. wikihow. com/Install-FFmpeg-on-Windows

Tiết kiệm cốt truyện Race Bar

Bạn có thể lưu biểu đồ thanh bằng cách tải xuống từ tùy chọn tải xuống ở cuối hình ảnh. Hy vọng bạn thích hướng dẫn thú vị này. Thưởng thức và tiếp tục học hỏi 🙂

Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định của Tác giả.  

Chủ Đề