Isnull() sum() trong python là gì?

Tuy nhiên, tôi nghĩ rằng gợi ý từ bài tập hơi sai lệch và không dạy gấu trúc thành ngữ. Theo mặc định, tất cả các hoạt động của pandas DataFrame được thực hiện trên mỗi cột vì pandas sử dụng bố cục chính của cột cho dữ liệu. Hãy để tôi giải thích dưới đây

Ví dụ: có một phương thức

import pandas as pd
6 trên chính DataFrame. gấu trúc. Khung dữ liệu. isnull — gấu trúc 1. 5. 0 tài liệu

Sẽ trả về cho bạn một Khung dữ liệu trong đó mỗi phần tử là đúng hoặc sai, đúng nếu phần tử là

import pandas as pd
7 sai nếu không thì. Để lấy tổng của mỗi cột, tôi sẽ xem xét
import pandas as pd
8 sẽ thực hiện tổng trên mỗi cột. gấu trúc. Khung dữ liệu. tổng — gấu trúc 1. 5. 0 tài liệu

Lưu ý rằng các giá trị thực được tính là 1 và sai là 0

Điều này sẽ mang lại số lượng giá trị null trong mỗi cột. Đối tượng kết quả phải là một

import pandas as pd
9 cũng có phương thức
import pandas as pd
0 sẽ tính tổng các giá trị của chuỗi

Bạn rất gần trong câu trả lời của bạn. Bạn có số lượng giá trị null trên mỗi cột nhưng không phải là tổng số cho toàn bộ Khung dữ liệu. Bạn đang thiếu một bước

Trả về một đối tượng có cùng kích thước boolean cho biết liệu các giá trị có phải là NA hay không. Các giá trị NA, chẳng hạn như Không có hoặc

import pandas as pd
1, được ánh xạ tới các giá trị True. Mọi thứ khác được ánh xạ tới các giá trị Sai. Các ký tự như chuỗi rỗng
import pandas as pd
2 hoặc
import pandas as pd
3 không được coi là giá trị NA [trừ khi bạn đặt
import pandas as pd
4]

Tôi sẽ giải thích chính xác kỹ thuật này làm gì, cú pháp hoạt động như thế nào và tôi sẽ chỉ cho bạn các ví dụ từng bước về cách sử dụng isnull

Nếu bạn cần một cái gì đó cụ thể, chỉ cần nhấp vào bất kỳ liên kết nào sau đây

Mục lục

  • Giới thiệu
  • cú pháp
  • ví dụ
  • Các câu hỏi thường gặp

Đầu tiên, hãy bắt đầu với phần giới thiệu về isnull và nó làm gì

Giới thiệu nhanh về Pandas isnull

Kỹ thuật Pandas isnull phát hiện các giá trị bị thiếu trong Python

Chúng ta có thể sử dụng kỹ thuật isnull trên một số loại đối tượng Pandas, bao gồm

  • Dòng gấu trúc
  • toàn bộ khung dữ liệu Pandas
  • các cột riêng lẻ trong một khung dữ liệu

Vì vậy, nó hơi linh hoạt về loại đối tượng mà chúng ta có thể sử dụng nó trên

Pandas isnull rất hữu ích cho việc sắp xếp dữ liệu

Kỹ thuật isnull rất hữu ích cho việc sắp xếp dữ liệu, làm sạch dữ liệu và phân tích dữ liệu

Các giá trị bị thiếu thường hơi rắc rối khi chúng ta phân tích dữ liệu và tạo các mô hình máy học

Trong trường hợp đó, chúng ta thường cần xác định các giá trị còn thiếu khi dọn dẹp, phân tích dữ liệu hoặc trước khi xây dựng mô hình máy học

Vì vậy, đây là một kỹ thuật đơn giản, nhưng thường là một kỹ thuật cần thiết khi bạn làm khoa học dữ liệu bằng Python

Cú pháp của isnull

Bây giờ bạn đã học được một chút về chức năng của kỹ thuật Pandas isnull, hãy xem cú pháp

Như tôi đã đề cập trước đó, chúng ta có thể sử dụng kỹ thuật

import pandas as pd
1 trên

  • khung dữ liệu
  • Loạt
  • cột khung dữ liệu

Cú pháp cho từng trường hợp sử dụng này sẽ hơi khác nhau, vì vậy chúng tôi sẽ xem xét cú pháp cho từng trường hợp một cách riêng biệt

Một lưu ý nhanh

Trước khi chúng ta xem xét cú pháp, tôi cần đề cập đến một vài điều

Đầu tiên, tất cả các giải thích cú pháp mà tôi sắp trình bày cho bạn giả sử rằng bạn đã nhập Pandas

Nếu bạn chưa làm như vậy, bạn có thể nhập Pandas bằng mã sau

import pandas as pd

Thứ hai, những giải thích cú pháp này sẽ giả định rằng bạn đã có sẵn chuỗi Pandas hoặc khung dữ liệu Pandas

Nếu bạn cần xem lại về khung dữ liệu, bạn có thể đọc phần giới thiệu nhanh của chúng tôi về khung dữ liệu Pandas

Cú pháp sê-ri

Hãy bắt đầu bằng cách xem cách chúng ta có thể sử dụng

import pandas as pd
1 trên một Chuỗi Pandas riêng lẻ

Đầu tiên, bạn chỉ cần gõ tên Sê-ri của mình, tiếp theo là

import pandas as pd
3 để gọi phương thức

Đó thực sự là nó

Đầu ra sẽ là một Chuỗi các giá trị boolean Đúng/Sai cho biết giá trị nào bị thiếu và giá trị nào không bị thiếu

cú pháp khung dữ liệu

Cú pháp cho một khung dữ liệu thực sự rất giống với cú pháp của Sê-ri

Bạn chỉ cần gõ tên của khung dữ liệu, rồi

import pandas as pd
3 để gọi phương thức

Vì vậy, nếu khung dữ liệu của bạn được đặt tên là

import pandas as pd
5, bạn sẽ nhập mã
import pandas as pd
6

Đầu ra sẽ là một đối tượng có cùng kích thước với khung dữ liệu của bạn có chứa các giá trị Đúng/Sai boolean. Các giá trị boolean này cho biết giá trị khung dữ liệu nào bị thiếu

cú pháp cột

Cuối cùng, hãy xem cú pháp sử dụng isnull trên cột khung dữ liệu

Hãy nhớ rằng một cột khung dữ liệu thực sự là một đối tượng chuỗi Pandas. Và để lấy một cột từ một khung dữ liệu, chúng ta có thể sử dụng “cú pháp dấu chấm”. Hãy xem và tôi sẽ giải thích thêm

Vì vậy, việc phát hiện các giá trị bị thiếu trong một cột là quy trình gồm hai bước

  • truy xuất cột từ khung dữ liệu bằng "cú pháp dấu chấm"
  • gọi phương thức
    import pandas as pd
    
    3

Vì vậy, nếu bạn có một khung dữ liệu có tên là

import pandas as pd
5 và có một cột có tên là
import pandas as pd
9, bạn sẽ sử dụng mã
import pandas as pd
00 để phát hiện các giá trị bị thiếu trong cột đó của khung dữ liệu

Đầu ra [ghi chú thêm]

Hãy nhanh chóng thảo luận về đầu ra

Như tôi đã đề cập trước đó, đầu ra là một đối tượng mới có cùng kích thước với đối tượng đầu vào

Đối tượng đầu ra sẽ chứa các giá trị boolean Đúng/Sai cho biết giá trị nào bị thiếu

Các giá trị được tính là "thiếu" là

  • import pandas as pd
    
    01
  • import pandas as pd
    
    02

Các giá trị giống như một chuỗi rỗng [i. e. ,

import pandas as pd
03] hoặc
import pandas as pd
04 sẽ không được tính là các giá trị bị thiếu khi bạn sử dụng phương pháp
import pandas as pd
1

ví dụ. cách phát hiện các giá trị bị thiếu trong Python

Bây giờ chúng ta đã xem xét cú pháp, hãy xem xét một số ví dụ về cách sử dụng kỹ thuật

import pandas as pd
1 của Pandas

ví dụ

  • Tìm các giá trị còn thiếu trong cột khung dữ liệu Pandas
  • Xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu
  • Đếm các giá trị còn thiếu trong mỗi cột của khung dữ liệu

Chạy mã này trước

Trước khi chúng tôi thực sự chạy các ví dụ, bạn sẽ cần chạy một số mã sơ bộ để

  • nhập gấu trúc
  • tạo một khung dữ liệu

Hãy làm từng cái một

tải gấu trúc

Trước tiên, bạn cần nhập Pandas

Bạn có thể làm điều đó với đoạn mã sau

import pandas as pd

Tạo một khung dữ liệu

Tiếp theo, chúng tôi sẽ tạo một khung dữ liệu với một số dữ liệu bán hàng giả

import pandas as pd
0

Và hãy in nó ra để xem nội dung

import pandas as pd
9

NGOÀI

import pandas as pd
0

Như bạn có thể thấy, khung dữ liệu này có bốn biến, với hỗn hợp dữ liệu ký tự và dữ liệu số

Điều quan trọng là bạn có thể thấy rằng một số hàng bị thiếu giá trị [i. e. ,

import pandas as pd
07]. Chúng tôi sẽ có thể sử dụng
import pandas as pd
1 để xác định những thứ đó theo cách có lập trình

VÍ DỤ 1. Tìm các giá trị còn thiếu trong cột khung dữ liệu Pandas

Trước tiên, hãy xác định các giá trị còn thiếu trong một cột

Tại đây, chúng tôi sẽ xác định các giá trị còn thiếu trong cột

import pandas as pd
09 của khung dữ liệu
import pandas as pd
90

import pandas as pd
5

NGOÀI

import pandas as pd
6Giải trình

Xác định các giá trị còn thiếu trong biến

import pandas as pd
09 là một quy trình gồm hai bước

  • trước tiên chúng ta cần truy xuất cột bằng "cú pháp dấu chấm"
  • sau đó, chúng ta cần gọi
    import pandas as pd
    
    3

Đến mã

import pandas as pd
93 lấy biến
import pandas as pd
09 từ khung dữ liệu

Sau đó, mã

import pandas as pd
3 xác định các giá trị còn thiếu

Lưu ý rằng đầu ra là một đối tượng có cùng hình dạng với biến

import pandas as pd
09. Giá trị của đầu ra là
import pandas as pd
97 nếu giá trị đầu vào bị thiếu và
import pandas as pd
98 nếu ngược lại

VÍ DỤ 2. Xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu

Tiếp theo, chúng tôi sẽ xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu

Để làm điều này, chúng tôi chỉ cần nhập tên của khung dữ liệu, sau đó nhập

import pandas as pd
99 để gọi phương thức

import pandas as pd
6

NGOÀI

import pandas as pd
7Giải trình

Tôi nghĩ rằng điều này là dễ hiểu

Để sử dụng phương thức Pandas isnull trên toàn bộ khung dữ liệu, chỉ cần nhập tên của khung dữ liệu, sau đó

import pandas as pd
3

Ở đầu ra, bạn có thể thấy các giá trị Đúng/Sai cho mọi giá trị của mọi cột. Giá trị đầu ra là

import pandas as pd
97 khi giá trị đầu vào bị thiếu và
import pandas as pd
98 nếu không

VÍ DỤ 3. Đếm các giá trị còn thiếu trong mỗi cột của khung dữ liệu

Cuối cùng, hãy làm một ví dụ khó hơn một chút nhưng hữu ích hơn

Tại đây, chúng tôi sẽ đếm số lượng giá trị bị thiếu trong mỗi cột của khung dữ liệu

Để làm được điều này, chúng ta thực sự cần sử dụng nhiều công cụ

Chúng tôi cần sử dụng

import pandas as pd
1 để xác định các giá trị còn thiếu và sau đó chúng tôi cần sử dụng phương pháp tổng Pandas để đếm chúng

Hãy cùng xem

import pandas as pd
2

NGOÀI

import pandas as pd
0Giải trình

Ở đầu ra, bạn có thể thấy số lượng giá trị bị thiếu, theo cột

Khi bạn đang làm sạch dữ liệu hoặc phân tích dữ liệu, một kỹ thuật như thế này có thể cực kỳ hữu ích

Lưu ý rằng để làm điều đó, chúng ta cần gọi hai phương thức Pandas nối tiếp. Chúng tôi đã nhập tên của khung dữ liệu, sau đó

import pandas as pd
3 để xác định các giá trị bị thiếu và
import pandas as pd
05 để đếm các giá trị bị thiếu

Hơn nữa, lưu ý rằng chúng tôi đã sử dụng một cú pháp đặc biệt để làm điều này. Chúng tôi đặt toàn bộ biểu thức bên trong dấu ngoặc đơn và đặt các phương thức Pandas khác nhau trên các dòng khác nhau. Phong cách mã hóa Pandas này không chính thống, nhưng cực kỳ mạnh mẽ, một khi bạn biết cách sử dụng nó đúng cách. Nó cho phép bạn kết hợp nhiều phương thức Pandas theo chuỗi để thực hiện các thao tác dữ liệu phức tạp. Ngoài ra, nó giúp việc đọc và gỡ lỗi mã của bạn dễ dàng hơn nhiều

Nếu bạn muốn tìm hiểu thêm về phong cách sắp xếp dữ liệu Pandas này, hãy đăng ký nhận bản tin email của chúng tôi

Để lại câu hỏi khác của bạn trong các ý kiến ​​​​dưới đây

Bạn có câu hỏi nào khác về kỹ thuật Pandas isnull không?

Có điều gì mà tôi chưa trình bày ở đây mà bạn cần trợ giúp không?

Nếu vậy, hãy để lại câu hỏi của bạn trong phần bình luận bên dưới

Để tìm hiểu thêm về Pandas, hãy đăng ký danh sách email của chúng tôi

Hướng dẫn này lẽ ra đã cung cấp cho bạn phần giới thiệu tốt về kỹ thuật isnull của Pandas, nhưng nếu bạn thực sự muốn nắm vững cách sắp xếp dữ liệu và khoa học dữ liệu trong Python, thì còn rất nhiều điều cần tìm hiểu

Vì vậy, nếu bạn đã sẵn sàng tìm hiểu thêm về Pandas và nhiều thông tin khác về khoa học dữ liệu, thì hãy đăng ký nhận bản tin email của chúng tôi

Tổng IsNull trong Python là gì?

Phương thức isnull[] trả về một đối tượng DataFrame trong đó tất cả các giá trị được thay thế bằng một giá trị Boolean Đúng cho các giá trị NULL và nếu không thì Sai .

IsNull[] kiểm tra cái gì?

Trả về giá trị Boolean cho biết liệu một biểu thức có chứa dữ liệu hợp lệ hay không [Null] . Đối số biểu thức được yêu cầu là một Biến thể chứa biểu thức số hoặc biểu thức chuỗi. IsNull trả về True nếu biểu thức là Null; .

Chủ Đề