Làm cách nào để bạn vẽ toàn bộ khung dữ liệu trong python?
Chúng tôi sẽ làm việc với bộ dữ liệu NIFTY-50. Chỉ số NIFTY 50 là điểm chuẩn của Sàn giao dịch chứng khoán quốc gia Ấn Độ cho thị trường chứng khoán Ấn Độ. NIFTY 50 là viết tắt của National Index Fifty, và đại diện cho mức bình quân gia quyền của 50 cổ phiếu công ty Ấn Độ trong 17 lĩnh vực. Bộ dữ liệu được cung cấp công khai trên Kaggle, nhưng chúng tôi sẽ sử dụng một tập hợp con dữ liệu chứa giá trị cổ phiếu của chỉ bốn lĩnh vực – ngân hàng, dược phẩm, CNTT và FMCG. Show
Bạn có thể tải xuống tập dữ liệu mẫu từ đây Hãy nhập các thư viện cần thiết và bộ dữ liệu được trích xuất cần thiết để trực quan hóa # Importing required modules import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline # Reading in the data nifty_bank = pd.read_csv('NIFTY BANK.csv',parse_dates=["Date"]) nifty_fmcg = pd.read_csv('NIFTY FMCG.csv',parse_dates=["Date"]) nifty_IT = pd.read_csv('NIFTY IT.csv',parse_dates=["Date"]) nifty_pharma = pd.read_csv('NIFTY PHARMA.csv',parse_dates=["Date"]) %matplotlib inline đảm bảo rằng các số liệu được vẽ biểu đồ hiển thị chính xác trong sổ ghi chép khi một ô được chạy Cái nhìn đầu tiên về dữ liệu NIFTY 50Hãy kết hợp các tệp CSV khác nhau trong một khung dữ liệu duy nhất dựa trên giá 'đóng cửa' của cổ phiếu vào một ngày cụ thể và lọc ra dữ liệu trước năm 2020. Sau đó, hãy xem xét một vài cột đầu tiên của tập dữ liệu nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head() Cốt truyện đầu tiên với gấu trúc. sơ đồ đườngBây giờ hãy cùng khám phá và trực quan hóa dữ liệu bằng gấu trúc. Để bắt đầu, sẽ rất thú vị khi xem chỉ số ngân hàng Nifty hoạt động như thế nào trong năm nay. Để vẽ biểu đồ bằng gấu trúc, bạn có thể gọi phương thức. phương thức plot() trên khung dữ liệu. Phương thức cốt truyện chỉ là một trình bao bọc đơn giản xung quanh plt của matplotlib. mảnh đất(). Bạn cũng sẽ cần chỉ định tọa độ x và y sẽ được tham chiếu dưới dạng trục x và y. Vì Ngày đã là cột chỉ mục nên nó sẽ được định cấu hình là trục X df.plot(y='NIFTY Bank index')
Như bạn có thể thấy ở trên, gọi. Phương thức plot() trên khung dữ liệu trả về một biểu đồ đường theo mặc định. Vẽ đồ thị trong gấu trúc rất đơn giản và yêu cầu cài đặt tối thiểu. Tuy nhiên, có nhiều cách để bạn có thể thay đổi đầu ra nếu muốn, với sự trợ giúp của một số tham số nhất định. Vẽ tham sốPhương thức cốt truyện có một số tham số khác ngoài x và y, có thể được điều chỉnh để thay đổi cốt truyện
Bây giờ, hãy vẽ cùng một khung dữ liệu với một số đối số khác, như chỉ định kích thước hình và nhãn df.plot(y='NIFTY Bank index',figsize=(10,6),title='Nifty Bank Index values in 2020',ylabel = 'Value'); phong cách cốt truyện khác nhau trong pandasCác phương pháp vẽ biểu đồ gấu trúc có thể được sử dụng để vẽ các kiểu khác với biểu đồ đường mặc định. Các phương thức này có thể được cung cấp dưới dạng đối số từ khóa “loại” cho plot(). Các tùy chọn có sẵn là Làm thế nào để bạn tạo ra những lô này?
Dataframe.plot(kind='
Dataframe.plot. Được rồi, bạn biết cách tạo biểu đồ đường. Bây giờ chúng ta sẽ xem xét một số lô khác trong gấu trúc. Lưu ý rằng bạn có thể tạo chúng bằng một trong các phương pháp được hiển thị ở trên lô thanhBiểu đồ thanh là biểu đồ trình bày dữ liệu phân loại với các thanh hình chữ nhật. Độ dài của các thanh tỷ lệ thuận với các giá trị mà chúng đại diện Để tạo biểu đồ thanh cho dữ liệu NIFTY, bạn sẽ cần lấy mẫu lại/tổng hợp dữ liệu vào cuối tháng. Thư viện của pandas có hàm resample(), lấy mẫu lại dữ liệu chuỗi thời gian. Phương pháp lấy mẫu lại trong gấu trúc tương tự như phương pháp nhóm của nó, vì về cơ bản, nó được nhóm theo một khoảng thời gian cụ thể. Hàm resample() trông như thế này df_sample = df.resample(rule = 'M').mean()[:5] df_sample Để tóm tắt những gì đã xảy ra ở trên
Bây giờ hãy tạo biểu đồ Bar như sau df_sample.plot(kind='bar',figsize=(10,6)) Như đã đề cập ở trên, bạn cũng có thể tạo cùng một cốt truyện mà không cần cung cấp đối số 'loại' ________số 8Sự lựa chọn của phương pháp là hoàn toàn tùy thuộc vào bạn. Các loại biểu đồ thanh Có hai loại biểu đồ thanh, cụ thể là
Đối với khi bạn muốn các thanh nằm ngang và không dọc. Biểu đồ thanh ngang có thể được tạo bằng cách chỉ định 'barh' làm loại biểu đồ df_sample.plot(kind='barh',figsize=(10,6)) 2. Biểu đồ thanh xếp chồng lên nhau Để tạo biểu đồ thanh xếp chồng lên nhau, hãy vượt qua Stacked=True nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()0 biểu đồMột biểu đồ là một đại diện của phân phối dữ liệu. Hãy tạo biểu đồ cho chỉ số NIFTY FMCG và chỉ số NIFTY Bank nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()1 Ở đây, alpha biểu thị hệ số minh bạch và các thùng đề cập đến các phạm vi dữ liệu đã được phân chia. Giá trị bin mặc định là 10. Kích thước thùng có thể được thay đổi bằng cách sử dụng từ khóa “bins” Một biểu đồ có thể được xếp chồng lên nhau bằng cách sử dụng. xếp chồng lên nhau = Đúng. sơ đồ KDEPandas có thể tạo biểu đồ Ước tính mật độ hạt nhân (KDE) bằng cách sử dụng hạt nhân Gaussian. Biểu đồ ước tính mật độ hạt nhân cho thấy sự phân bố của một biến đơn lẻ và có thể được coi là biểu đồ được làm mịn nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()2 ô hộpBiểu đồ hộp được sử dụng để mô tả dữ liệu thông qua các phần tư của chúng. Một biểu đồ hộp duy nhất có thể truyền tải rất nhiều thông tin, bao gồm các chi tiết về phạm vi liên vùng, trung vị và ngoại lệ. Trước tiên, hãy tạo các ô hộp cho khung dữ liệu của chúng tôi, sau đó bạn sẽ thấy cách diễn giải chúng nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()3 Đây là cách bạn có thể giải thích một biểu đồ hộp. Bất cứ điều gì bên ngoài các điểm ngoại lệ là những điều đã qua phần cuối của râu. Bạn có thể thấy rằng NiFTY FMCG có điểm ngoại lệ cao hơn đáng kể so với các điểm khác. Giống như biểu đồ thanh, biểu đồ hình hộp ngang cũng có thể được tạo bằng cách chỉ định vert=False nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()4 Diện tích lô đấtBiểu đồ vùng hiển thị dữ liệu định lượng một cách trực quan. nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()5 Theo mặc định, pandas tạo một biểu đồ vùng xếp chồng lên nhau, có thể hủy xếp chồng bằng cách chuyển giá trị của stack=False nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()6 âm mưu phân tánBiểu đồ phân tán được sử dụng để vẽ biểu đồ tương quan giữa hai biến. Các mối tương quan này được vẽ dưới dạng các điểm đánh dấu có màu sắc và kích cỡ khác nhau. Nếu bạn định vẽ biểu đồ phân tán thể hiện mối quan hệ giữa chỉ số NIFTY IT và NIFTY FMCG, bạn sẽ làm như thế này nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()7 Ô lục giácBiểu đồ bin lục giác, còn được gọi là biểu đồ hexbin, có thể được sử dụng thay thế cho biểu đồ phân tán. Loại biểu đồ này đặc biệt hữu ích khi số lượng điểm dữ liệu rất lớn và mỗi điểm không thể được vẽ riêng lẻ nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()8 lô bánhBiểu đồ hình tròn là biểu diễn theo tỷ lệ của dữ liệu số trong một cột. Hãy lấy dữ liệu được lấy mẫu lại vào cuối tháng cho chỉ số Ngân hàng NIFTY và xem nó được phân bổ như thế nào theo tháng. nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame(data=d) df.index=nifty_bank_2019['Date'] df.head()9 Lô bánh trong gấu trúc Tham số autopct được sử dụng để hiển thị giá trị phần trăm bằng định dạng chuỗi Python. Truyền thuyết, được bật theo mặc định, có thể bị tắt bằng cách chỉ định legend=False. Ngoài ra, nếu subplots=True được chỉ định, các ô hình tròn cho mỗi cột được vẽ dưới dạng các ô con df.plot(y='NIFTY Bank index')
0Công cụ vẽ đồ thị PandasPandas cũng có một mô-đun vẽ đồ thị có tên pandas. âm mưu. Mô-đun này bao gồm một số chức năng vẽ đồ thị và lấy Sê-ri hoặc Khung dữ liệu làm đối số. Các chức năng sau được chứa trong mô-đun biểu đồ gấu trúc. Mô tả bên dưới được lấy từ tài liệu chính thức của gấu trúc Chúng ta hãy đi qua một vài trong số họ Biểu đồ ma trận phân tánBạn đã thấy cách tạo biểu đồ phân tán bằng gấu trúc. Ma trận phân tán, như tên cho thấy, tạo ra một ma trận gồm các biểu đồ phân tán bằng cách sử dụng phương thức scatter_matrix trong gấu trúc. âm mưu df.plot(y='NIFTY Bank index')
1cốt truyện bootstrapBiểu đồ Bootstrap đánh giá trực quan độ không chắc chắn của thống kê, chẳng hạn như giá trị trung bình, trung bình, tầm trung, v.v. Bootstrapping liên quan đến việc tính toán một thống kê bằng cách lấy mẫu ngẫu nhiên từ cùng một dữ liệu nhiều lần, sau đó tính trung bình kết quả riêng lẻ của từng mẫu. Các giá trị kết quả thu được từ mỗi mẫu ngẫu nhiên sau đó được vẽ dưới dạng biểu đồ đường và thanh df.plot(y='NIFTY Bank index')
2Phần kết luậnTrong bài viết này, chúng tôi đã xem xét khả năng của gấu trúc như một thư viện vẽ đồ thị. Chúng tôi đã đề cập đến cách thực hiện một số biểu đồ cơ bản trong gấu trúc và đề cập đến một số biểu đồ nâng cao như biểu đồ ma trận bootstrap và phân tán. Các. plot() là một công cụ khá mạnh có thể giúp bạn bắt đầu ngay với quy trình trực quan hóa dữ liệu – với rất ít dòng mã. Trong trường hợp bạn muốn biết thêm về các khả năng của pandas với tư cách là một thư viện vẽ sơ đồ cũng như tạo kiểu và tùy chỉnh các sơ đồ của mình, thì phần vẽ sơ đồ trong tài liệu DataFrame của gấu trúc là một nơi tuyệt vời để bắt đầu
sao hải vương là gì. ai? Đó là trình theo dõi thử nghiệm và đăng ký mô hình tích hợp với bất kỳ ngăn xếp MLOps nào. Xem sản phẩm Mục lục
Đọc tiếpCác công cụ tốt nhất để học tăng cường bằng Python mà bạn thực sự muốn thửNgày nay, Học tăng cường sâu (RL) là một trong những chủ đề nóng nhất trong cộng đồng Khoa học dữ liệu. Sự phát triển nhanh chóng của RL đã dẫn đến nhu cầu ngày càng tăng về các công cụ RL dễ hiểu và thuận tiện để sử dụng Trong những năm gần đây, rất nhiều thư viện RL đã được phát triển. Các thư viện này được thiết kế để có tất cả các công cụ cần thiết để triển khai và kiểm tra các mô hình Học tăng cường Tuy nhiên, chúng khác nhau khá nhiều. Đó là lý do tại sao điều quan trọng là chọn một thư viện sẽ nhanh chóng, đáng tin cậy và phù hợp với nhiệm vụ RL của bạn Trong bài viết này, chúng tôi sẽ đề cập Tiêu chí chọn thư viện Deep Reinforcement Learning, thư viện RL. Pyqlearning, KerasRL, Tensorforce, RL_Coach, TFAgents, MAME RL, MushroomRL. Thư viện Python cho Học tăng cườngCó rất nhiều thư viện RL, vì vậy việc chọn đúng thư viện cho trường hợp của bạn có thể là một nhiệm vụ phức tạp. Cần hình thành tiêu chí đánh giá từng thư viện Làm cách nào để vẽ dữ liệu lớn trong Python?Python cho dữ liệu lớn Một ví dụ với Pandas, NumPy và Matplotlib. Thiết lập thư mục và lấy dữ liệu thử nghiệm. Tải dữ liệu trong Pandas. Làm việc với DataFrames. Vẽ đồ thị với Matplotlib và NumPy. . Tổng Hợp Các Thư Viện Hữu Ích. Nặng nề. MatplotLib. gấu trúc Thư viện hữu ích khác. scipy. ggplot. sinh ra biển. Bokeh. . Những ví dụ khác Bạn có thể vẽ một Dataframe Matplotlib không?Matplotlib là một thư viện python tuyệt vời có thể được sử dụng để vẽ biểu đồ khung dữ liệu gấu trúc . Có nhiều cách khác nhau để tạo ra một cốt truyện tùy thuộc vào yêu cầu. |