Hướng dẫn python density plot - biểu đồ mật độ trăn

Biểu đồ mật độ là một loại công cụ trực quan hóa dữ liệu. Đó là một biến thể của biểu đồ sử dụng ‘kernel làm mịn trong khi vẽ các giá trị. Đây là một phiên bản liên tục và mượt mà của một biểu đồ được suy ra từ một dữ liệu.

Các ô mật độ sử dụng ước tính mật độ hạt nhân (vì vậy chúng còn được gọi là các ô ước tính mật độ hạt nhân hoặc KDE) là hàm mật độ xác suất. Vùng của lô với đỉnh cao hơn là khu vực có điểm dữ liệu tối đa nằm giữa các giá trị đó.

Các lô mật độ có thể được thực hiện bằng cách sử dụng gấu trúc, seeborn, v.v. Trong bài viết này, chúng tôi sẽ tạo ra các lô mật độ bằng gấu trúc. Chúng tôi sẽ sử dụng hai bộ dữ liệu của Thư viện Seaborn là - ‘Car_crashes, và‘ Mẹo. & NBSP;

Cú pháp: pandas.dataframe.plot.dive | pandas.dataframe.plot.kde pandas.DataFrame.plot.density | pandas.DataFrame.plot.kde

trong đó gấu trúc -> bộ dữ liệu của loại ‘pandas dataframepandas -> the dataset of the type ‘pandas dataframe’

DataFrame -> Cột mà biểu đồ mật độ sẽ được vẽ-> the column for which the density plot is to be drawn

Biểu đồ -> Từ khóa chỉ đạo để vẽ sơ đồ/biểu đồ cho cột đã cho-> keyword directing to draw a plot/graph for the given column

Mật độ -> để vẽ đồ thị mật độ & nbsp;-> for plotting a density graph 

KDE -> Để vẽ đồ thị mật độ bằng cách sử dụng hàm ước tính mật độ hạt nhân-> to plot a density graph using the Kernel Density Estimation function

Ví dụ 1: Cho bộ dữ liệu ‘car_crashes, hãy để tìm hiểu bằng cách sử dụng biểu đồ mật độ là tốc độ phổ biến nhất do hầu hết các vụ tai nạn xe hơi xảy ra. Given the dataset ‘car_crashes’, let’s find out using the density plot which is the most common speed due to which most of the car crashes happened.

Python3

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

data = sns.load_dataset('car_crashes'____10

pandas as pd1pandas as pd2pandas as pd3pandas as pd4

Output:

Vẽ đồ thị:

Python3

pandas as pd5=pandas as pd7pandas as pd0

pandas as pd9import0pandas as pd0

import2

Output:

Sử dụng biểu đồ mật độ, chúng ta có thể tìm ra rằng tốc độ giữa 4-5 (kmph) là phổ biến nhất đối với các sự cố sự cố trong bộ dữ liệu vì nó là vùng mật độ cao (đỉnh cao).

Ví dụ 2: Đối với một bộ dữ liệu khác ‘Mẹo, hãy để tính toán những gì là mẹo phổ biến nhất được đưa ra bởi khách hàng. & NBSP; For another dataset ‘tips’, let’s calculate what was the most common tip given by a customer. 

Python3

data = sns.load_dataset(import6pandas as pd0

pandas as pd1pandas as pd2pandas as pd3pandas as pd4

Output:

‘Mẹo dữ liệu

Vẽ đồ thị:

Python3

seaborn as sns2=pandas as pd7pandas as pd0

pandas as pd9seaborn as sns7pandas as pd0

import2

Sử dụng biểu đồ mật độ, chúng ta có thể tìm ra rằng tốc độ giữa 4-5 (kmph) là phổ biến nhất đối với các sự cố sự cố trong bộ dữ liệu vì nó là vùng mật độ cao (đỉnh cao).

Ví dụ 2: Đối với một bộ dữ liệu khác ‘Mẹo, hãy để tính toán những gì là mẹo phổ biến nhất được đưa ra bởi khách hàng. & NBSP;

data = sns.load_dataset(import6pandas as pd0

Python3

‘Mẹo dữ liệu

pandas as pd9import5pandas as pd0

import2

Thông qua biểu đồ mật độ trên, chúng ta có thể suy ra rằng mẹo phổ biến nhất được đưa ra là trong phạm vi 2,5-3. Đỉnh/mật độ cao nhất (như được biểu thị trên trục y) được tìm thấy ở giá trị đầu là 2,5 - 3. & nbsp;

Vẽ biểu đồ trên bằng cách sử dụng cốt truyện.kde ()


KDE hoặc ước tính mật độ hạt nhân sử dụng hạt nhân Gaussian để ước tính hàm mật độ xác suất của một biến ngẫu nhiên. Dưới đây là việc thực hiện vẽ sơ đồ biểu đồ mật độ bằng cách sử dụng kde () cho bộ dữ liệu ’mẹo.

Approach:..

import0=pandas as pd7pandas as pd0

Sử dụng điều này, chúng ta có thể suy ra rằng không có sự khác biệt lớn giữa cốt truyện.dive () và Plot.kde () và do đó có thể được sử dụng thay thế cho nhau.

Các sơ đồ mật độ có lợi thế so với biểu đồ vì chúng xác định hình dạng của phân phối hiệu quả hơn so với biểu đồ. Họ không phải phụ thuộc vào số lượng thùng được sử dụng không giống như trong biểu đồ.

Làm thế nào để bạn tạo ra một âm mưu mật độ trong Python?

Nhập các thư viện cần thiết ..

Tạo hoặc nhập bộ dữ liệu từ Thư viện Seaborn ..

Chọn cột mà chúng ta phải tạo ra một cốt truyện ..

Để thực hiện cốt truyện, chúng tôi đang sử dụng hàm distpplot () được cung cấp bởi thư viện Seaborn để vẽ biểu đồ và biểu đồ mật độ với nhau trong đó chúng tôi phải vượt qua cột Dataset ..

Làm thế nào để bạn vẽ một âm mưu mật độ trong gấu trúc?

DataFrame -> Cột mà biểu đồ mật độ sẽ được vẽ ..

Biểu đồ -> Từ khóa chỉ đạo để vẽ một biểu đồ/biểu đồ cho cột đã cho ..Using the Python Seaborn module, we can build the Kdeplot with various functionality added to it.