Tuy nhiên, tôi nghĩ rằng gợi ý từ bài tập hơi sai lệch và không dạy gấu trúc thành ngữ. Theo mặc định, tất cả các hoạt động của pandas DataFrame được thực hiện trên mỗi cột vì pandas sử dụng bố cục chính của cột cho dữ liệu. Hãy để tôi giải thích dưới đây
Ví dụ: có một phương thức
import pandas as pd6 trên chính DataFrame. gấu trúc. Khung dữ liệu. isnull — gấu trúc 1. 5. 0 tài liệu
Sẽ trả về cho bạn một Khung dữ liệu trong đó mỗi phần tử là đúng hoặc sai, đúng nếu phần tử là
import pandas as pd7 sai nếu không thì. Để lấy tổng của mỗi cột, tôi sẽ xem xét
import pandas as pd8 sẽ thực hiện tổng trên mỗi cột. gấu trúc. Khung dữ liệu. tổng — gấu trúc 1. 5. 0 tài liệu
Lưu ý rằng các giá trị thực được tính là 1 và sai là 0
Điều này sẽ mang lại số lượng giá trị null trong mỗi cột. Đối tượng kết quả phải là một
import pandas as pd9 cũng có phương thức
import pandas as pd0 sẽ tính tổng các giá trị của chuỗi
Bạn rất gần trong câu trả lời của bạn. Bạn có số lượng giá trị null trên mỗi cột nhưng không phải là tổng số cho toàn bộ Khung dữ liệu. Bạn đang thiếu một bước
Trả về một đối tượng có cùng kích thước boolean cho biết liệu các giá trị có phải là NA hay không. Các giá trị NA, chẳng hạn như Không có hoặc
import pandas as pd1, được ánh xạ tới các giá trị True. Mọi thứ khác được ánh xạ tới các giá trị Sai. Các ký tự như chuỗi rỗng
import pandas as pd2 hoặc
import pandas as pd3 không được coi là giá trị NA [trừ khi bạn đặt
import pandas as pd4]
Tôi sẽ giải thích chính xác kỹ thuật này làm gì, cú pháp hoạt động như thế nào và tôi sẽ chỉ cho bạn các ví dụ từng bước về cách sử dụng isnull
Nếu bạn cần một cái gì đó cụ thể, chỉ cần nhấp vào bất kỳ liên kết nào sau đây
Mục lục
- Giới thiệu
- cú pháp
- ví dụ
- Các câu hỏi thường gặp
Đầu tiên, hãy bắt đầu với phần giới thiệu về isnull và nó làm gì
Giới thiệu nhanh về Pandas isnull
Kỹ thuật Pandas isnull phát hiện các giá trị bị thiếu trong Python
Chúng ta có thể sử dụng kỹ thuật isnull trên một số loại đối tượng Pandas, bao gồm
- Dòng gấu trúc
- toàn bộ khung dữ liệu Pandas
- các cột riêng lẻ trong một khung dữ liệu
Vì vậy, nó hơi linh hoạt về loại đối tượng mà chúng ta có thể sử dụng nó trên
Pandas isnull rất hữu ích cho việc sắp xếp dữ liệu
Kỹ thuật isnull rất hữu ích cho việc sắp xếp dữ liệu, làm sạch dữ liệu và phân tích dữ liệu
Các giá trị bị thiếu thường hơi rắc rối khi chúng ta phân tích dữ liệu và tạo các mô hình máy học
Trong trường hợp đó, chúng ta thường cần xác định các giá trị còn thiếu khi dọn dẹp, phân tích dữ liệu hoặc trước khi xây dựng mô hình máy học
Vì vậy, đây là một kỹ thuật đơn giản, nhưng thường là một kỹ thuật cần thiết khi bạn làm khoa học dữ liệu bằng Python
Cú pháp của isnull
Bây giờ bạn đã học được một chút về chức năng của kỹ thuật Pandas isnull, hãy xem cú pháp
Như tôi đã đề cập trước đó, chúng ta có thể sử dụng kỹ thuật
import pandas as pd1 trên
- khung dữ liệu
- Loạt
- cột khung dữ liệu
Cú pháp cho từng trường hợp sử dụng này sẽ hơi khác nhau, vì vậy chúng tôi sẽ xem xét cú pháp cho từng trường hợp một cách riêng biệt
Một lưu ý nhanh
Trước khi chúng ta xem xét cú pháp, tôi cần đề cập đến một vài điều
Đầu tiên, tất cả các giải thích cú pháp mà tôi sắp trình bày cho bạn giả sử rằng bạn đã nhập Pandas
Nếu bạn chưa làm như vậy, bạn có thể nhập Pandas bằng mã sau
import pandas as pd
Thứ hai, những giải thích cú pháp này sẽ giả định rằng bạn đã có sẵn chuỗi Pandas hoặc khung dữ liệu Pandas
Nếu bạn cần xem lại về khung dữ liệu, bạn có thể đọc phần giới thiệu nhanh của chúng tôi về khung dữ liệu Pandas
Cú pháp sê-ri
Hãy bắt đầu bằng cách xem cách chúng ta có thể sử dụng
import pandas as pd1 trên một Chuỗi Pandas riêng lẻ
Đầu tiên, bạn chỉ cần gõ tên Sê-ri của mình, tiếp theo là
import pandas as pd3 để gọi phương thức
Đó thực sự là nó
Đầu ra sẽ là một Chuỗi các giá trị boolean Đúng/Sai cho biết giá trị nào bị thiếu và giá trị nào không bị thiếu
cú pháp khung dữ liệu
Cú pháp cho một khung dữ liệu thực sự rất giống với cú pháp của Sê-ri
Bạn chỉ cần gõ tên của khung dữ liệu, rồi
import pandas as pd3 để gọi phương thức
Vì vậy, nếu khung dữ liệu của bạn được đặt tên là
import pandas as pd5, bạn sẽ nhập mã
import pandas as pd6
Đầu ra sẽ là một đối tượng có cùng kích thước với khung dữ liệu của bạn có chứa các giá trị Đúng/Sai boolean. Các giá trị boolean này cho biết giá trị khung dữ liệu nào bị thiếu
cú pháp cột
Cuối cùng, hãy xem cú pháp sử dụng isnull trên cột khung dữ liệu
Hãy nhớ rằng một cột khung dữ liệu thực sự là một đối tượng chuỗi Pandas. Và để lấy một cột từ một khung dữ liệu, chúng ta có thể sử dụng “cú pháp dấu chấm”. Hãy xem và tôi sẽ giải thích thêm
Vì vậy, việc phát hiện các giá trị bị thiếu trong một cột là quy trình gồm hai bước
- truy xuất cột từ khung dữ liệu bằng "cú pháp dấu chấm"
- gọi phương thức
import pandas as pd
3
Vì vậy, nếu bạn có một khung dữ liệu có tên là
import pandas as pd5 và có một cột có tên là
import pandas as pd9, bạn sẽ sử dụng mã
import pandas as pd00 để phát hiện các giá trị bị thiếu trong cột đó của khung dữ liệu
Đầu ra [ghi chú thêm]
Hãy nhanh chóng thảo luận về đầu ra
Như tôi đã đề cập trước đó, đầu ra là một đối tượng mới có cùng kích thước với đối tượng đầu vào
Đối tượng đầu ra sẽ chứa các giá trị boolean Đúng/Sai cho biết giá trị nào bị thiếu
Các giá trị được tính là "thiếu" là
import pandas as pd
01import pandas as pd
02
Các giá trị giống như một chuỗi rỗng [i. e. ,
import pandas as pd03] hoặc
import pandas as pd04 sẽ không được tính là các giá trị bị thiếu khi bạn sử dụng phương pháp
import pandas as pd1
ví dụ. cách phát hiện các giá trị bị thiếu trong Python
Bây giờ chúng ta đã xem xét cú pháp, hãy xem xét một số ví dụ về cách sử dụng kỹ thuật
import pandas as pd1 của Pandas
ví dụ
- Tìm các giá trị còn thiếu trong cột khung dữ liệu Pandas
- Xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu
- Đếm các giá trị còn thiếu trong mỗi cột của khung dữ liệu
Chạy mã này trước
Trước khi chúng tôi thực sự chạy các ví dụ, bạn sẽ cần chạy một số mã sơ bộ để
- nhập gấu trúc
- tạo một khung dữ liệu
Hãy làm từng cái một
tải gấu trúc
Trước tiên, bạn cần nhập Pandas
Bạn có thể làm điều đó với đoạn mã sau
import pandas as pd
Tạo một khung dữ liệu
Tiếp theo, chúng tôi sẽ tạo một khung dữ liệu với một số dữ liệu bán hàng giả
import pandas as pd0
Và hãy in nó ra để xem nội dung
import pandas as pd9
NGOÀI
import pandas as pd0
Như bạn có thể thấy, khung dữ liệu này có bốn biến, với hỗn hợp dữ liệu ký tự và dữ liệu số
Điều quan trọng là bạn có thể thấy rằng một số hàng bị thiếu giá trị [i. e. ,
import pandas as pd07]. Chúng tôi sẽ có thể sử dụng
import pandas as pd1 để xác định những thứ đó theo cách có lập trình
VÍ DỤ 1. Tìm các giá trị còn thiếu trong cột khung dữ liệu Pandas
Trước tiên, hãy xác định các giá trị còn thiếu trong một cột
Tại đây, chúng tôi sẽ xác định các giá trị còn thiếu trong cột
import pandas as pd09 của khung dữ liệu
import pandas as pd90
import pandas as pd5
NGOÀI
import pandas as pd6Giải trình
Xác định các giá trị còn thiếu trong biến
import pandas as pd09 là một quy trình gồm hai bước
- trước tiên chúng ta cần truy xuất cột bằng "cú pháp dấu chấm"
- sau đó, chúng ta cần gọi
import pandas as pd
3
Đến mã
import pandas as pd93 lấy biến
import pandas as pd09 từ khung dữ liệu
Sau đó, mã
import pandas as pd3 xác định các giá trị còn thiếu
Lưu ý rằng đầu ra là một đối tượng có cùng hình dạng với biến
import pandas as pd09. Giá trị của đầu ra là
import pandas as pd97 nếu giá trị đầu vào bị thiếu và
import pandas as pd98 nếu ngược lại
VÍ DỤ 2. Xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu
Tiếp theo, chúng tôi sẽ xác định các giá trị còn thiếu trong toàn bộ khung dữ liệu
Để làm điều này, chúng tôi chỉ cần nhập tên của khung dữ liệu, sau đó nhập
import pandas as pd99 để gọi phương thức
import pandas as pd6
NGOÀI
import pandas as pd7Giải trình
Tôi nghĩ rằng điều này là dễ hiểu
Để sử dụng phương thức Pandas isnull trên toàn bộ khung dữ liệu, chỉ cần nhập tên của khung dữ liệu, sau đó
import pandas as pd3
Ở đầu ra, bạn có thể thấy các giá trị Đúng/Sai cho mọi giá trị của mọi cột. Giá trị đầu ra là
import pandas as pd97 khi giá trị đầu vào bị thiếu và
import pandas as pd98 nếu không
VÍ DỤ 3. Đếm các giá trị còn thiếu trong mỗi cột của khung dữ liệu
Cuối cùng, hãy làm một ví dụ khó hơn một chút nhưng hữu ích hơn
Tại đây, chúng tôi sẽ đếm số lượng giá trị bị thiếu trong mỗi cột của khung dữ liệu
Để làm được điều này, chúng ta thực sự cần sử dụng nhiều công cụ
Chúng tôi cần sử dụng
import pandas as pd1 để xác định các giá trị còn thiếu và sau đó chúng tôi cần sử dụng phương pháp tổng Pandas để đếm chúng
Hãy cùng xem
import pandas as pd2
NGOÀI
import pandas as pd0Giải trình
Ở đầu ra, bạn có thể thấy số lượng giá trị bị thiếu, theo cột
Khi bạn đang làm sạch dữ liệu hoặc phân tích dữ liệu, một kỹ thuật như thế này có thể cực kỳ hữu ích
Lưu ý rằng để làm điều đó, chúng ta cần gọi hai phương thức Pandas nối tiếp. Chúng tôi đã nhập tên của khung dữ liệu, sau đó
import pandas as pd3 để xác định các giá trị bị thiếu và
import pandas as pd05 để đếm các giá trị bị thiếu
Hơn nữa, lưu ý rằng chúng tôi đã sử dụng một cú pháp đặc biệt để làm điều này. Chúng tôi đặt toàn bộ biểu thức bên trong dấu ngoặc đơn và đặt các phương thức Pandas khác nhau trên các dòng khác nhau. Phong cách mã hóa Pandas này không chính thống, nhưng cực kỳ mạnh mẽ, một khi bạn biết cách sử dụng nó đúng cách. Nó cho phép bạn kết hợp nhiều phương thức Pandas theo chuỗi để thực hiện các thao tác dữ liệu phức tạp. Ngoài ra, nó giúp việc đọc và gỡ lỗi mã của bạn dễ dàng hơn nhiều
Nếu bạn muốn tìm hiểu thêm về phong cách sắp xếp dữ liệu Pandas này, hãy đăng ký nhận bản tin email của chúng tôi
Để lại câu hỏi khác của bạn trong các ý kiến dưới đâyBạn có câu hỏi nào khác về kỹ thuật Pandas isnull không?
Có điều gì mà tôi chưa trình bày ở đây mà bạn cần trợ giúp không?
Nếu vậy, hãy để lại câu hỏi của bạn trong phần bình luận bên dưới
Để tìm hiểu thêm về Pandas, hãy đăng ký danh sách email của chúng tôi
Hướng dẫn này lẽ ra đã cung cấp cho bạn phần giới thiệu tốt về kỹ thuật isnull của Pandas, nhưng nếu bạn thực sự muốn nắm vững cách sắp xếp dữ liệu và khoa học dữ liệu trong Python, thì còn rất nhiều điều cần tìm hiểu
Vì vậy, nếu bạn đã sẵn sàng tìm hiểu thêm về Pandas và nhiều thông tin khác về khoa học dữ liệu, thì hãy đăng ký nhận bản tin email của chúng tôi