Dự án dành cho người mới bắt đầu nhanh chóng và từng bước để tạo biểu đồ thanh động cho bộ dữ liệu Covid tuyệt vời
Nhiệm vụ của chúng tôi là tạo một cuộc đua biểu đồ thanh hoạt hình [bcr] cho số trường hợp covid-19 theo quốc gia trong khoảng thời gian từ tháng 2 năm 2020 đến tháng 4 năm 2021
Không giống như các hướng dẫn khác cho phép bạn sử dụng tập dữ liệu bcr được tải sẵn, chúng tôi sẽ tạo, xử lý và xóa tập dữ liệu của riêng chúng tôi cho thanh biểu đồ cuộc đua
về vấn đề
Tuyên bố vấn đề của chúng tôi sẽ là hồ sơ trường hợp Covid-19 trên toàn thế giới
“Hy vọng là có thể nhìn thấy ánh sáng bất chấp bóng tối. ” — Desmond Tutu
Giới thiệu về tập dữ liệu
Bạn có thể tìm thấy dữ liệu thô ở đây. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/worldometer_coronavirus_daily_data. csv
Nếu bạn muốn bỏ qua các bước xử lý và làm sạch dữ liệu để chuyển thẳng sang phần tạo biểu đồ. Đây là tập dữ liệu đã sửa đổi của tôi. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/corona_dataset
Dữ liệu này đã được cạo từ worldometers. thông tin về 2021–04–24 của Joseph Assaker. 218 quốc gia được đại diện trong dữ liệu này
Tất cả các quốc gia có hồ sơ từ 2020–2–15 cho đến 2021–04–24 [435 ngày mỗi quốc gia]. Đó là ngoại trừ Trung Quốc, nơi có hồ sơ từ 2020–1–22 cho đến 2021–04–24 [459 ngày mỗi quốc gia]
Tóm tắt các cột dữ liệu
- quốc gia. chỉ định Quốc gia nơi dữ liệu của hàng được quan sát
- lục địa. chỉ định Lục địa của quốc gia được quan sát
- tổng_đã xác nhận. chỉ định tổng số trường hợp được xác nhận tại quốc gia được quan sát
- tổng_số_chết. chỉ định tổng số ca tử vong được xác nhận ở quốc gia được quan sát
- tổng_recovery. chỉ định tổng số ca phục hồi được xác nhận tại quốc gia được quan sát
- ca nhiễm bệnh hiện tại. chỉ định số lượng các trường hợp đang hoạt động ở quốc gia được quan sát
- nghiêm trọng_or_critical. chỉ định số trường hợp ước tính trong tình trạng nghiêm trọng hoặc nguy kịch ở quốc gia được quan sát
- tổng_trường_hợp_trên_1m_dân. chỉ định tổng số trường hợp trên 1 triệu dân ở quốc gia được quan sát
- tổng_số_người_chết_trên_1m_dân. chỉ số tổng số người chết trên 1 triệu dân ở quốc gia được quan sát
- tổng_kiểm tra. chỉ định tổng số bài kiểm tra được thực hiện ở quốc gia được quan sát
- total_tests_per_1m_population. chỉ định tổng số xét nghiệm được thực hiện trên 1 triệu dân ở quốc gia được quan sát
- dân số. chỉ định số lượng dân số ở quốc gia được quan sát
Lời cảm ơn cho Tập dữ liệu
Tất cả dữ liệu có trong tập dữ liệu này được lấy từ worldometers. thông tin
Bạn có thể tìm thấy mã sạch hoàn chỉnh trên Jupyter-notebook của tôi. https. //github. com/shelvi31/Animated-Bar-Graph/blob/main/Animated%20Bar%20Graph. ipynb
tải thư viện
import pandas as pd import os
Tải tập dữ liệu
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]
Xử lý tập dữ liệu. Hãy tìm hiểu dữ liệu
df.head[]
df.shape[95289, 7]df.tail[]
Vì có nhiều dữ liệu của các quốc gia, chúng tôi cần chọn một số Dữ liệu quốc gia cụ thể mà chúng tôi muốn phân tích
df.loc[df["country"] == "Zimbabwe"].shape Output: [435, 7]
Do đó, chúng tôi có các giá trị trong khoảng 450 ngày cho mỗi quốc gia
df.isnull[].sum[]Output: date 0 country 0 cumulative_total_cases 0 daily_new_cases 6469 active_cases 0 cumulative_total_deaths 6090 daily_new_deaths 19190 dtype: int64
Chọn quốc gia cho Bar Plot
Chọn cột cum_total_cases dưới dạng chuỗi và nhóm chúng với tên quốc gia. Tôi sẽ chọn 8 quốc gia, đông dân nhất và hàng xóm của chúng tôi để đánh giá
Mã, Hình ảnh của tác giảChúng tôi chỉ có dữ liệu cho 435 hàng cho tất cả các quốc gia. Do đó, hãy lấy dữ liệu cho 435 hàng cho Trung Quốc
Xử lý dữ liệu cho Trung Quốc
CHINA=[] for i in range[0,435]: CHINA.append[china[i]]
Chuyển đổi thành sê-ri
china = pd.Series[CHINA]china.shapeOutput:[435,]
Tuyệt quá. Bây giờ chiều dài của tất cả các cột của chúng tôi nằm trong bồn rửa. tôi. dữ liệu 435 ngày
Chúng ta cũng cần chọn cột ngày tháng. Để chỉ truy xuất 459 giá trị đầu tiên, vì các ngày lặp lại với các quốc gia, dữ liệu của số ngày tối đa mà chúng tôi có là 435 ngày cho tất cả các quốc gia
Cột ngày xử lý
________số 8Chuyển đổi danh sách thành chuỗi
DATE = pd.Series[date]
Nối chuỗi để tạo cơ sở dữ liệu mới
Vì bây giờ chúng ta có các chuỗi khác nhau, hãy đặt tên cho các chuỗi này mà sau này sẽ được chuyển đổi thành Cột Dataframe
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]0
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]1
Kiểm tra các giá trị null nếu có
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]2
Chuyển đổi ngày thành định dạng Ngày giờ
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]3
Cuối cùng. Chúng tôi có định dạng và quốc gia cần thiết
Chúng ta cũng cần chọn cột ngày
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]4
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]5
TUYỆT. Khung dữ liệu của chúng tôi trông tuyệt vời và sẵn sàng để tiếp tục
Hãy bắt đầu với mã hóa biểu đồ thanh aminated ngay bây giờ
Cài đặt cuộc đua biểu đồ thanh
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]6
điểm cần lưu ý. Biểu đồ cần thời gian để tải, vì vậy hãy kiên nhẫn. Khác với tôi, đừng vội tìm ra những sai sót không đáng có hay tự nghi ngờ bản thân nếu phút chốc không thấy kết quả
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]8
df = pd.read_csv["worldometer_coronavirus_daily_data.csv"]7
Thật buồn khi nhận thấy các ca bệnh đã tăng theo cấp số nhân ở Ấn Độ khi tháng 4 sắp đến, tất cả những điều đó dẫn đến sự hoảng loạn, tàn phá và thiệt hại về người vào thời điểm tôi viết blog này
Ghi chú. Nếu bạn gặp bất kỳ lỗi nào liên quan đến FFmpeg. đây là liên kết từng bước để giải quyết nó cho hệ thống của bạn. https. //www. wikihow. com/Install-FFmpeg-on-Windows
Tiết kiệm cốt truyện Race Bar
Bạn có thể lưu biểu đồ thanh bằng cách tải xuống từ tùy chọn tải xuống ở cuối hình ảnh. Hy vọng bạn thích hướng dẫn thú vị này. Thưởng thức và tiếp tục học hỏi 🙂
Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định của Tác giả.