Hướng dẫn how do you find duplicates in a column in python? - làm thế nào để bạn tìm thấy các bản sao trong một cột trong python?
Tôi có một danh sách các mặt hàng có khả năng có một số vấn đề xuất khẩu. Tôi muốn có được một danh sách các mục trùng lặp để tôi có thể so sánh thủ công chúng. Khi tôi cố gắng sử dụng phương pháp trùng lặp gấu trúc, nó chỉ trả về bản sao đầu tiên. Có một cách nào để có được tất cả các bản sao và không chỉ là cách đầu tiên? Show Một tiểu mục nhỏ của bộ dữ liệu của tôi trông như thế này:
Mã của tôi trông như thế này hiện tại:
Có một vài mục trùng lặp. Nhưng, khi tôi sử dụng mã trên, tôi chỉ nhận được mục đầu tiên. Trong tài liệu tham khảo API, tôi thấy làm thế nào tôi có thể nhận được mục cuối cùng, nhưng tôi muốn có tất cả chúng để tôi có thể kiểm tra trực quan chúng để xem lý do tại sao tôi có được sự khác biệt. Vì vậy, trong ví dụ này, tôi muốn nhận cả ba mục A036 và cả 11795 mục và bất kỳ mục nào khác, thay vì chỉ đầu tiên. Bất cứ sự giúp đỡ nào đều được đánh giá cao. Cải thiện bài viết Lưu bài viết Cải thiện bài viết Lưu bài viết ĐọcDataframe.duplicated() method of Pandas.
Nếu ’sai, điều này xem xét tất cả các giá trị giống nhau với các bản sao. Python3
Các 3 4 5, 7, 9 2 3 4import 3, import 5, import 7 2 3 4 5, 7, 9 2 3 4 5, 7, 9 2Trả về: Sê -ri Boolean biểu thị các hàng trùng lặp. & Nbsp; & nbsp; 3 4import 3, = 7, = 9 2 3 4[( 3, 7, 9[( 8 3'Stuti' 0
Đầu ra: & nbsp; & nbsp; Cải thiện bài viết Select duplicate rows based on all columns. Python3
Các 3 4 5, 7, 9 2Các 3 4 5, 7, 9 2 3 4 5, 7, 9 2 3 4 5, 7, import 7 2 3 4import 3, = 7, = 9 2 3 4[( 3, 7, 9[( 8 3'Stuti' 0
‘ 70 71 72Đầu ra: & nbsp; & nbsp; Cải thiện bài viết Select duplicate rows based on all columns. Python3
Các 3 4 5, 7, 9 2 3 4import 3, import 5, import 7 2 3 4 5, 7, 9 2 3 4 5, 7, 9 2 3 4 5, 7, import 7 2Các 3 4[( 3, 7, 9[( 8 3'Stuti' 0
67= import 57= import 59import 60 70 71 72Đầu ra: & nbsp; & nbsp; Ví dụ 3: Nếu bạn muốn chọn các hàng trùng lặp chỉ dựa trên một số cột đã chọn thì hãy truyền danh sách các tên cột trong tập hợp con làm đối số. & NBSP; & NBSP; If you want to select duplicate rows based only on some selected columns then pass the list of column names in subset as an argument. Python3
Các 3 4 5, 7, 9 2 3 4import 3, import 5, import 7 2Các 3 4 5, 7, 9 2 3 4 5, 7, import 7 2 3 4import 3, = 7, = 9 2 3 4[( 3, 7, 9[( 8 3'Stuti' 0
67= import 57= import 59import 60Đầu ra: & nbsp; & nbsp; 72Đầu ra: & nbsp; & nbsp; Ví dụ 3: Nếu bạn muốn chọn các hàng trùng lặp chỉ dựa trên một số cột đã chọn thì hãy truyền danh sách các tên cột trong tập hợp con làm đối số. & NBSP; & NBSP; Select duplicate rows based on more than one column name. Python3
Các Các 3 4import 3, import 5, import 7 2 3 4 5, 7, 9 2 3 4 5, 7, 9 2 3 4 5, 7, import 7 2 3 4import 3, = 7, = 9 2 3 4[( 3, 7, 9[( 8 3'Stuti' 0
67= pandas as pd 48, 2import 60 70pandas as pd 52Ví dụ 4: Chọn các hàng trùng lặp dựa trên nhiều tên cột. & NBSP; 72Đầu ra: & nbsp; & nbsp; |