Hướng dẫn dùng pandas isna python
Lỗi #N/A là một lỗi thường gặp trong Excel. Nhưng trong một số trường hợp chúng ta không biết rõ công thức có xảy ra lỗi #N/A hay không. Bởi vậy chúng ta cần một phương pháp giúp kiểm tra lỗi đó, chính là hàm ISNA. Trong bài viết này các bạn hãy cùng Học Excel Online tìm hiểu cách dùng hàm ISNA trong Excel thông qua các ví dụ nhé. Show Nội dung chính Show
Nội dung chính
Cú phàm hàm ISNATrong tên hàm gồm 2 phần:
Cách viết như sau:
Tham số bên trong hàm ISNA là Value, tức là 1 giá trị. Giá trị này có thể là kết quả của 1 công thức, 1 hàm. Hàm ISNA sẽ trả về các kết quả:
Cách sử dụng hàm ISNABởi vì kết quả của hàm ISNA là True / False nên thông thường nó không đứng 1 mình mà kết hợp với hàm IF. Nhận biết lỗi #N/A của hàm VLOOKUPChúng ta xét ví dụ sau đây: Trong ví dụ trên, để xác định đơn giá các sản phẩm, chúng ta sẽ sử dụng hàm VLOOKUP:
=VLOOKUP(B2,$G$3:$H$5,2,0) Tuy nhiên kết quả chỉ đúng với những mã hàng có tên trong bảng đơn giá. Còn những hàng không có tên sẽ xuất hiện lỗi #N/A. Do đó chúng ta có thể sử dụng hàm ISNA để nhận biết lỗi này, kết hợp hàm IF để thay đổi kết quả hiển thị, ví dụ là hiển thị dòng chữ “Không có mã hàng” =IF(ISNA(VLOOKUP(B2,$G$3:$H$5,2,0)),”Không có mã hàng”,VLOOKUP(B2,$G$3:$H$5,2,0)) Câu lệnh trên có ý nghĩa:
Như vậy chúng ta đã có thể thay thế lỗi #N/A thành đoạn thông báo theo ý muốn được rồi. Điều này giúp nhận biết được nguyên nhân xảy ra lỗi, từ đó khắc phục lỗi dễ dàng hơn. Tuy nhiên các bạn có thể thấy công thức khá dài dòng phải không nào? Trong phiên bản Excel 2016 hoặc Office 365, bạn còn có thể sử dụng hàm IFNA để rút ngắn công thức trên. Xem chi tiết: Hướng dẫn sử dụng hàm IFNA để tránh lỗi #N/A trong Excel Tìm hiểu về lỗi #N/A trong Excel và cách khắc phục Tác giả: duongquan211287· · · Làm sạch dữ liệu (data cleaning) là một công việc tẻ nhạt. Thực tế nó và chuẩn bị dữ liệu là phần tốn thời gian nhất của một dự án khoa học dữ liệu. Theo một nghiên cứu của IBM Data Analytsics thì 80% thời gian quý giá của một nhà khoa học dữ liệu được dành chỉ đơn giản là tìm kiếm, làm sạch và sắp xếp dữ liệu, chỉ còn lại 20% thời gian để thực sự làm phân tích. Xử lý missing data là một phần quan trọng trong làm sạch dữ liệu. Việc xử lý missing data nhanh chóng, gọn gàng giúp tiết kiệm rất nhiều thời gian cho dự án. Có nhiều công cụ mạnh làm tốt công việc này và một trong số đó là pandas. Pandas là một thư viện phân tích dữ liệu được sử dụng rộng rãi cho Python. Bạn có thể tham khảo cách cài đặt, khai báo và các thông tin cơ bản về pandas trong bài "Xử lý dữ liệu với Pandas trong Python". Giờ chúng ta hãy tìm hiểu sơ lược về missing data: Missing data là gì?Missing data là dữ liệu bị thiếu, được hiển thị như NaN, Nat, Null, N/A, v.v. Missing data xuất hiện do nhiều nguyên nhân như:
Missing data có thể được phân thành 3 loại: Missing at Random (dữ liệu khuyết ngẫu nhiên), Missing Completely at Random (dữ liệu thiếu hoàn toàn ngẫu nhiên) và Missing Not at Random (dữ liệu khuyết không ngẫu nhiên). Missing data trong pandasDo dữ liệu có nhiều dạng và hình thức nên pandas rất linh hoạt trong việc xử lý missing data. Missing data được đánh dấu mặc định là NaN để tăng tốc độ tính toán và thuận tiện. Tuy nhiên pandas cũng có thể dễ dàng phân biệt missing data vào các loại khác nhau: dấu phẩy động, số nguyên, boolean và đối tượng
chung. Ví dụ 1: Các loại missing data:
Output:
Thao tác với missing data trong pandasPandas cho phép bạn thao tác linh hoạt với missing data trong Series, DataFrame như tìm giá trị bị thiếu (missing value), xác định giá trị tồn tại (không bị thiếu), loại bỏ giá trị bị thiếu, chèn giá trị bị thiếu, điền vào giá trị bị thiếu, v.v. Bên dưới mình sẽ trình bày các ví dụ cụ thể cho các thao tác. Xác định giá trị bị thiếu và giá trị đang tồn tại: isna(), notna() Ví dụ 2: Xác định giá trị bị thiếu bằng
Output:
Ví dụ 3: Xác định giá trị tồn tại (existing values) bằng
Output:
Xóa giá trị bị thiếu: dropna() Ví dụ 4: Xóa giá trị thiếu bằng
Output:
Điền vào giá trị thiếu: fillna() Sử dụng Ví dụ 5: Thay thế giá trị bị thiếu bằng một giá trị vô hướng (scalar value)
Output:
Ví dụ 6:
Output:
Ví dụ 7: Sử dụng tham số
Output:
Chèn missing data Pandas cho phép bạn chèn giá trị vào missing data bằng Ví dụ 8: Chèn missing data cho các container (Series, DataFrame) chứa con số
Output:
Tạm kếtĐến đây mình đã trình bày về các thao tác với mising data hay sử dụng trong pandas. Hi vọng bài viết giúp ích cho các bạn. Các bạn có thể tìm hiểu thêm bằng cách truy cập các đường link trong phần tham khảo. Hãy để lời góp ý trong phần bình luận bên dưới. Cảm ơn các bạn đã đọc. Hẹn gặp lại trong các bài viết tiếp theo. Tham khảo1. http://pandas.pydata.org/pandas-docs/stable/user_guide/missing_data.html 2. https://pandas.pydata.org/pandas-docs/stable/user_guide/cookbook.html#cookbook-missing-data 3. https://towardsdatascience.com/handling-missing-values-with-pandas-b876bf6f008f |