Chúng tôi sẽ làm việc với bộ dữ liệu NIFTY-50. Chỉ số NIFTY 50 là điểm chuẩn của Sàn giao dịch chứng khoán quốc gia Ấn Độ cho thị trường chứng khoán Ấn Độ. NIFTY 50 là viết tắt của National Index Fifty, và đại diện cho mức bình quân gia quyền của 50 cổ phiếu công ty Ấn Độ trong 17 lĩnh vực. Bộ dữ liệu được cung cấp công khai trên Kaggle, nhưng chúng tôi sẽ sử dụng một tập hợp con dữ liệu chứa giá trị cổ phiếu của chỉ bốn lĩnh vực – ngân hàng, dược phẩm, CNTT và FMCG.
Bạn có thể tải xuống tập dữ liệu mẫu từ đây
Hãy nhập các thư viện cần thiết và bộ dữ liệu được trích xuất cần thiết để trực quan hóa
# Importing required modules import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline # Reading in the data nifty_bank = pd.read_csv['NIFTY BANK.csv',parse_dates=["Date"]] nifty_fmcg = pd.read_csv['NIFTY FMCG.csv',parse_dates=["Date"]] nifty_IT = pd.read_csv['NIFTY IT.csv',parse_dates=["Date"]] nifty_pharma = pd.read_csv['NIFTY PHARMA.csv',parse_dates=["Date"]]
%matplotlib inline đảm bảo rằng các số liệu được vẽ biểu đồ hiển thị chính xác trong sổ ghi chép khi một ô được chạy
Cái nhìn đầu tiên về dữ liệu NIFTY 50
Hãy kết hợp các tệp CSV khác nhau trong một khung dữ liệu duy nhất dựa trên giá 'đóng cửa' của cổ phiếu vào một ngày cụ thể và lọc ra dữ liệu trước năm 2020.
Sau đó, hãy xem xét một vài cột đầu tiên của tập dữ liệu
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]
Cốt truyện đầu tiên với gấu trúc. sơ đồ đường
Bây giờ hãy cùng khám phá và trực quan hóa dữ liệu bằng gấu trúc. Để bắt đầu, sẽ rất thú vị khi xem chỉ số ngân hàng Nifty hoạt động như thế nào trong năm nay.
Để vẽ biểu đồ bằng gấu trúc, bạn có thể gọi phương thức. phương thức plot[] trên khung dữ liệu. Phương thức cốt truyện chỉ là một trình bao bọc đơn giản xung quanh plt của matplotlib. mảnh đất[]. Bạn cũng sẽ cần chỉ định tọa độ x và y sẽ được tham chiếu dưới dạng trục x và y. Vì Ngày đã là cột chỉ mục nên nó sẽ được định cấu hình là trục X
df.plot[y='NIFTY Bank index']
Như bạn có thể thấy ở trên, gọi. Phương thức plot[] trên khung dữ liệu trả về một biểu đồ đường theo mặc định. Vẽ đồ thị trong gấu trúc rất đơn giản và yêu cầu cài đặt tối thiểu. Tuy nhiên, có nhiều cách để bạn có thể thay đổi đầu ra nếu muốn, với sự trợ giúp của một số tham số nhất định.
Vẽ tham số
Phương thức cốt truyện có một số tham số khác ngoài x và y, có thể được điều chỉnh để thay đổi cốt truyện
- tham số x và y chỉ định các giá trị mà bạn muốn trên cột x và y. Trong trường hợp trên, đây là cột Ngày và chỉ mục Ngân hàng NIFTY
- figsize chỉ định kích thước của đối tượng hình
- Tiêu đề được sử dụng cho cốt truyện
- chú thích được đặt trên các ô con trên trục
- Phong cách. kiểu dòng matplotlib trên mỗi cột
- nhãn X và y. tên để sử dụng cho nhãn trên trục x và trục y.
- ô phụ. tạo các ô con riêng biệt cho mỗi cột
- Tốt bụng. loại cốt truyện để sản xuất. Chúng ta sẽ xem xét chi tiết tham số này trong các phần tiếp theo
Bây giờ, hãy vẽ cùng một khung dữ liệu với một số đối số khác, như chỉ định kích thước hình và nhãn
df.plot[y='NIFTY Bank index',figsize=[10,6],title='Nifty Bank Index values in 2020',ylabel = 'Value'];
phong cách cốt truyện khác nhau trong pandas
Các phương pháp vẽ biểu đồ gấu trúc có thể được sử dụng để vẽ các kiểu khác với biểu đồ đường mặc định. Các phương thức này có thể được cung cấp dưới dạng đối số từ khóa “loại” cho plot[]. Các tùy chọn có sẵn là
Làm thế nào để bạn tạo ra những lô này?
- Sử dụng tham số loại. Tham số này chấp nhận các giá trị chuỗi và xác định loại biểu đồ bạn sẽ tạo. Bạn có thể làm điều đó như thế này
Dataframe.plot[kind='', x,y]
- Another way to create plots is to use the method `DataFrame.plot.` instead of providing the kind keyword argument. This makes it easier to discover plot methods and the specific arguments they use:
Dataframe.plot.[]
Được rồi, bạn biết cách tạo biểu đồ đường. Bây giờ chúng ta sẽ xem xét một số lô khác trong gấu trúc. Lưu ý rằng bạn có thể tạo chúng bằng một trong các phương pháp được hiển thị ở trên
lô thanh
Biểu đồ thanh là biểu đồ trình bày dữ liệu phân loại với các thanh hình chữ nhật. Độ dài của các thanh tỷ lệ thuận với các giá trị mà chúng đại diện
Để tạo biểu đồ thanh cho dữ liệu NIFTY, bạn sẽ cần lấy mẫu lại/tổng hợp dữ liệu vào cuối tháng. Thư viện của pandas có hàm resample[], lấy mẫu lại dữ liệu chuỗi thời gian. Phương pháp lấy mẫu lại trong gấu trúc tương tự như phương pháp nhóm của nó, vì về cơ bản, nó được nhóm theo một khoảng thời gian cụ thể. Hàm resample[] trông như thế này
df_sample = df.resample[rule = 'M'].mean[][:5] df_sample
Để tóm tắt những gì đã xảy ra ở trên
- dữ liệu. resample[] được sử dụng để lấy mẫu lại dữ liệu chứng khoán
- 'M' là viết tắt của tần suất cuối tháng và biểu thị các giá trị bù mà bạn muốn lấy mẫu lại dữ liệu
- mean[] cho biết giá cổ phiếu trung bình trong khoảng thời gian này
Bây giờ hãy tạo biểu đồ Bar như sau
df_sample.plot[kind='bar',figsize=[10,6]]
Như đã đề cập ở trên, bạn cũng có thể tạo cùng một cốt truyện mà không cần cung cấp đối số 'loại'
________số 8Sự lựa chọn của phương pháp là hoàn toàn tùy thuộc vào bạn.
Các loại biểu đồ thanh
Có hai loại biểu đồ thanh, cụ thể là
- Biểu đồ thanh ngang
Đối với khi bạn muốn các thanh nằm ngang và không dọc. Biểu đồ thanh ngang có thể được tạo bằng cách chỉ định 'barh' làm loại biểu đồ
df_sample.plot[kind='barh',figsize=[10,6]]
2. Biểu đồ thanh xếp chồng lên nhau
Để tạo biểu đồ thanh xếp chồng lên nhau, hãy vượt qua Stacked=True
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]0
biểu đồ
Một biểu đồ là một đại diện của phân phối dữ liệu. Hãy tạo biểu đồ cho chỉ số NIFTY FMCG và chỉ số NIFTY Bank
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]1
Ở đây, alpha biểu thị hệ số minh bạch và các thùng đề cập đến các phạm vi dữ liệu đã được phân chia. Giá trị bin mặc định là 10. Kích thước thùng có thể được thay đổi bằng cách sử dụng từ khóa “bins”
Một biểu đồ có thể được xếp chồng lên nhau bằng cách sử dụng. xếp chồng lên nhau = Đúng.
sơ đồ KDE
Pandas có thể tạo biểu đồ Ước tính mật độ hạt nhân [KDE] bằng cách sử dụng hạt nhân Gaussian. Biểu đồ ước tính mật độ hạt nhân cho thấy sự phân bố của một biến đơn lẻ và có thể được coi là biểu đồ được làm mịn
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]2
ô hộp
Biểu đồ hộp được sử dụng để mô tả dữ liệu thông qua các phần tư của chúng. Một biểu đồ hộp duy nhất có thể truyền tải rất nhiều thông tin, bao gồm các chi tiết về phạm vi liên vùng, trung vị và ngoại lệ. Trước tiên, hãy tạo các ô hộp cho khung dữ liệu của chúng tôi, sau đó bạn sẽ thấy cách diễn giải chúng
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]3
Đây là cách bạn có thể giải thích một biểu đồ hộp.
Bất cứ điều gì bên ngoài các điểm ngoại lệ là những điều đã qua phần cuối của râu. Bạn có thể thấy rằng NiFTY FMCG có điểm ngoại lệ cao hơn đáng kể so với các điểm khác. Giống như biểu đồ thanh, biểu đồ hình hộp ngang cũng có thể được tạo bằng cách chỉ định vert=False
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]4
Diện tích lô đất
Biểu đồ vùng hiển thị dữ liệu định lượng một cách trực quan.
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]5
Theo mặc định, pandas tạo một biểu đồ vùng xếp chồng lên nhau, có thể hủy xếp chồng bằng cách chuyển giá trị của stack=False
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]6
âm mưu phân tán
Biểu đồ phân tán được sử dụng để vẽ biểu đồ tương quan giữa hai biến. Các mối tương quan này được vẽ dưới dạng các điểm đánh dấu có màu sắc và kích cỡ khác nhau. Nếu bạn định vẽ biểu đồ phân tán thể hiện mối quan hệ giữa chỉ số NIFTY IT và NIFTY FMCG, bạn sẽ làm như thế này
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]7
Ô lục giác
Biểu đồ bin lục giác, còn được gọi là biểu đồ hexbin, có thể được sử dụng thay thế cho biểu đồ phân tán. Loại biểu đồ này đặc biệt hữu ích khi số lượng điểm dữ liệu rất lớn và mỗi điểm không thể được vẽ riêng lẻ
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]8
lô bánh
Biểu đồ hình tròn là biểu diễn theo tỷ lệ của dữ liệu số trong một cột. Hãy lấy dữ liệu được lấy mẫu lại vào cuối tháng cho chỉ số Ngân hàng NIFTY và xem nó được phân bổ như thế nào theo tháng.
nifty_bank_2019 = nifty_bank[nifty_bank['Date'] > '2019-12-31'] nifty_fmcg_2019 = nifty_fmcg[nifty_fmcg['Date'] > '2019-12-31'] nifty_IT_2019 = nifty_IT[nifty_IT['Date'] > '2019-12-31'] nifty_pharma_2019 = nifty_pharma[nifty_pharma['Date'] > '2019-12-31'] d = { 'NIFTY Bank index': nifty_bank_2019['Close'].values, 'NIFTY FMCG index': nifty_fmcg_2019['Close'].values, 'NIFTY IT index': nifty_IT_2019['Close'].values, 'NIFTY Pharma index': nifty_pharma_2019['Close'].values, } # Inspecting the data df = pd.DataFrame[data=d] df.index=nifty_bank_2019['Date'] df.head[]9
Lô bánh trong gấu trúc
Tham số autopct được sử dụng để hiển thị giá trị phần trăm bằng định dạng chuỗi Python. Truyền thuyết, được bật theo mặc định, có thể bị tắt bằng cách chỉ định legend=False. Ngoài ra, nếu subplots=True được chỉ định, các ô hình tròn cho mỗi cột được vẽ dưới dạng các ô con
df.plot[y='NIFTY Bank index']
0Công cụ vẽ đồ thị Pandas
Pandas cũng có một mô-đun vẽ đồ thị có tên pandas. âm mưu. Mô-đun này bao gồm một số chức năng vẽ đồ thị và lấy Sê-ri hoặc Khung dữ liệu làm đối số. Các chức năng sau được chứa trong mô-đun biểu đồ gấu trúc. Mô tả bên dưới được lấy từ tài liệu chính thức của gấu trúc
Chúng ta hãy đi qua một vài trong số họ
Biểu đồ ma trận phân tán
Bạn đã thấy cách tạo biểu đồ phân tán bằng gấu trúc. Ma trận phân tán, như tên cho thấy, tạo ra một ma trận gồm các biểu đồ phân tán bằng cách sử dụng phương thức scatter_matrix trong gấu trúc. âm mưu
df.plot[y='NIFTY Bank index']
1cốt truyện bootstrap
Biểu đồ Bootstrap đánh giá trực quan độ không chắc chắn của thống kê, chẳng hạn như giá trị trung bình, trung bình, tầm trung, v.v. Bootstrapping liên quan đến việc tính toán một thống kê bằng cách lấy mẫu ngẫu nhiên từ cùng một dữ liệu nhiều lần, sau đó tính trung bình kết quả riêng lẻ của từng mẫu. Các giá trị kết quả thu được từ mỗi mẫu ngẫu nhiên sau đó được vẽ dưới dạng biểu đồ đường và thanh
df.plot[y='NIFTY Bank index']
2Phần kết luận
Trong bài viết này, chúng tôi đã xem xét khả năng của gấu trúc như một thư viện vẽ đồ thị. Chúng tôi đã đề cập đến cách thực hiện một số biểu đồ cơ bản trong gấu trúc và đề cập đến một số biểu đồ nâng cao như biểu đồ ma trận bootstrap và phân tán.
Các. plot[] là một công cụ khá mạnh có thể giúp bạn bắt đầu ngay với quy trình trực quan hóa dữ liệu – với rất ít dòng mã. Trong trường hợp bạn muốn biết thêm về các khả năng của pandas với tư cách là một thư viện vẽ sơ đồ cũng như tạo kiểu và tùy chỉnh các sơ đồ của mình, thì phần vẽ sơ đồ trong tài liệu DataFrame của gấu trúc là một nơi tuyệt vời để bắt đầu
sao hải vương là gì. ai?
Đó là trình theo dõi thử nghiệm và đăng ký mô hình tích hợp với bất kỳ ngăn xếp MLOps nào.
Ghi lại siêu dữ liệu mô hình từ mọi nơi trong quy trình của bạn. Xem kết quả trong ứng dụng web.
Xem sản phẩm
Mục lục
- Âm mưu với gấu trúc
- Nhập tập dữ liệu và thư viện
- Cốt truyện đầu tiên với gấu trúc. sơ đồ đường
- phong cách cốt truyện khác nhau trong pandas
- Công cụ vẽ đồ thị Pandas
- Phần kết luận
Đọc tiếp
Các công cụ tốt nhất để học tăng cường bằng Python mà bạn thực sự muốn thử
Ngày nay, Học tăng cường sâu [RL] là một trong những chủ đề nóng nhất trong cộng đồng Khoa học dữ liệu. Sự phát triển nhanh chóng của RL đã dẫn đến nhu cầu ngày càng tăng về các công cụ RL dễ hiểu và thuận tiện để sử dụng
Trong những năm gần đây, rất nhiều thư viện RL đã được phát triển. Các thư viện này được thiết kế để có tất cả các công cụ cần thiết để triển khai và kiểm tra các mô hình Học tăng cường
Tuy nhiên, chúng khác nhau khá nhiều. Đó là lý do tại sao điều quan trọng là chọn một thư viện sẽ nhanh chóng, đáng tin cậy và phù hợp với nhiệm vụ RL của bạn
Trong bài viết này, chúng tôi sẽ đề cập
Tiêu chí chọn thư viện Deep Reinforcement Learning, thư viện RL. Pyqlearning, KerasRL, Tensorforce, RL_Coach, TFAgents, MAME RL, MushroomRL. Thư viện Python cho Học tăng cườngCó rất nhiều thư viện RL, vì vậy việc chọn đúng thư viện cho trường hợp của bạn có thể là một nhiệm vụ phức tạp. Cần hình thành tiêu chí đánh giá từng thư viện