Lập chỉ mục lại trong python
Hàm reindex() được sử dụng để tuân thủ DataFrame với chỉ mục mới với logic điền tùy chọn, đặt NA/NaN ở các vị trí không có giá trị trong chỉ mục trước đó Show cú pháp DataFrame.reindex(self, labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None) Điều chỉnh DataFrame thành chỉ mục mới với logic điền tùy chọn, đặt NA/NaN ở các vị trí không có giá trị trong chỉ mục trước đó. Một đối tượng mới được tạo trừ khi chỉ mục mới tương đương với chỉ mục hiện tại và copy=False Thông số TênMô tảLoại/Giá trị mặc địnhBắt buộc/Nhãn tùy chọn Nhãn / chỉ mục mới để phù hợp với trục được chỉ định bởi 'trục' thành giống như mảngChỉ mục tùy chọn, cộtCác nhãn / chỉ mục mới để tuân theo, phải được chỉ định bằng cách sử dụng từ khóa. Tốt nhất là một đối tượng Chỉ mục để tránh trùng lặp dataarray-likeOptionalaxis Trục để nhắm mục tiêu. Có thể là tên trục ('chỉ mục', 'cột') hoặc số (0, 1). int hoặc str, Phương thức tùy chọnPhương pháp sử dụng để lấp đầy các lỗ hổng trong DataFrame được giới thiệu lại. Xin lưu ý. điều này chỉ áp dụng cho DataFrames/Series có chỉ số tăng/giảm đơn điệu Lập chỉ mục lại nhãn hàng và nhãn cột thay đổi DataFrame. Điều đó có nghĩa là Reindex khớp dữ liệu để khớp với một nhóm thẻ cụ thể dọc theo một trục cụ thể. Nhiều hoạt động có thể được thực hiện thông qua lập chỉ mục như sau
Ghi chú. Hãy để tôi giải thích ngắn gọn một vài tính năng gọn gàng ở trên
Lập chỉ mục lại để căn chỉnh với các đối tượng khácBạn có thể muốn lấy một đối tượng và xác định lại nó để gắn nhãn trục của nó giống với đối tượng khác. Kiểm tra ví dụ dưới đây để hiểu hiện tượng tương tự Điền trong quá trình lập chỉ mục lạireindex() nhận một phương thức tham số tùy chọn, là một phương thức điền với các giá trị như sau
Làm đầy các giới hạn trong quá trình lập chỉ mục lạiĐối số giới hạn cung cấp thêm quyền kiểm soát đối với phần đệm trong quá trình lập chỉ mục lại. Giới hạn chỉ định số trận đấu liên tiếp tối đa. Để hiểu hiện tượng này, hãy xem xét ví dụ dưới đây đổi tênPhương thức rename() cho phép bạn gắn nhãn lại một trục dựa trên một số đối sánh (dict hoặc sê-ri) hoặc một hàm ngẫu nhiên. Để hiểu điều này, hãy xem xét ví dụ sau Nhiệm vụ chính của Pandas reindex là điều chỉnh DataFrame thành một chỉ mục mới với logic điền tùy chọn và đặt NA/NaN ở vị trí mà các giá trị không có trong chỉ mục trước đó. Nó trả về một đối tượng mới trừ khi chỉ mục mới được tạo tương đương với chỉ mục hiện tại và giá trị của bản sao trở thành Sai Lập chỉ mục lại được sử dụng để thay đổi chỉ mục của các hàng và cột của DataFrame. Chúng ta có thể lập chỉ mục lại một hoặc nhiều hàng bằng cách sử dụng phương thức reindex(). Các giá trị mặc định trong chỉ mục mới được gán NaN nếu nó không có trong DataFrame cú phápThông sốnhãn. Đó là một tham số tùy chọn đề cập đến các nhãn mới hoặc chỉ mục để phù hợp với trục được chỉ định bởi 'trục' chỉ mục, cột. Nó cũng là một tham số tùy chọn đề cập đến các nhãn mới hoặc chỉ mục. Nó thường thích một đối tượng chỉ mục để tránh dữ liệu trùng lặp trục. Nó cũng là một tham số tùy chọn nhắm mục tiêu trục và có thể là tên trục hoặc các số phương pháp. Nó cũng là một tham số tùy chọn được sử dụng để lấp đầy các lỗ hổng trong DataFrame được lập chỉ mục lại. Nó chỉ có thể được áp dụng cho DataFrame hoặc Sê-ri với thứ tự tăng/giảm đơn điệu Không có. Đó là một giá trị mặc định không lấp đầy khoảng trống đệm / điền vào. Nó được sử dụng để truyền quan sát hợp lệ cuối cùng sang quan sát hợp lệ tiếp theo chèn lấp / bfill. Để lấp đầy khoảng trống, Nó sử dụng quan sát hợp lệ tiếp theo gần nhất. Để lấp đầy khoảng trống, nó sử dụng quan sát hợp lệ tiếp theo sao chép. Giá trị mặc định của nó là True và trả về một đối tượng mới dưới dạng giá trị boolean, ngay cả khi các chỉ mục được truyền giống nhau mức độ. Nó được sử dụng để phát trên cấp độ và khớp các giá trị chỉ mục trên cấp độ MultiIndex đã qua fill_value. Giá trị mặc định của nó là np. NaN và được sử dụng để điền vào các giá trị (NaN) còn thiếu hiện có. Nó cần bất kỳ phần tử mới nào để căn chỉnh DataFrame thành công, với giá trị này trước khi tính toán giới hạn. Nó xác định số phần tử liên tiếp tối đa được điền tiến hoặc lùi sức chịu đựng. Nó cũng là một tham số tùy chọn xác định khoảng cách tối đa giữa nhãn gốc và nhãn mới cho các kết quả khớp không chính xác. Tại các vị trí phù hợp, các giá trị của chỉ mục phải thỏa mãn nhất phương trình abs(index[indexer] ? target) <= dung sai trả lạiNó trả về DataFrame được giới thiệu lại ví dụ 1Ví dụ dưới đây cho thấy hoạt động của hàm reindex() để lập chỉ mục lại khung dữ liệu. Trong chỉ mục mới, các giá trị mặc định được gán NaN trong chỉ mục mới không có bản ghi tương ứng trong DataFrame Ghi chú. Chúng ta có thể sử dụng fill_value để điền các giá trị còn thiếuđầu ra A B D E Parker NaN NaN NaN NaN William NaN NaN NaN NaN Smith NaN NaN NaN NaN Terry NaN NaN NaN NaN Phill NaN NaN NaN NaN Bây giờ, chúng ta có thể sử dụng khung dữ liệu. chức năng reindex() để lập chỉ mục lại khung dữ liệu đầu ra P Q R S A NaN NaN NaN NaN B NaN NaN NaN NaN C NaN NaN NaN NaN D NaN NaN NaN NaN E NaN NaN NaN NaN Lưu ý rằng các chỉ mục mới được điền bằng các giá trị NaN. Chúng ta có thể điền vào các giá trị còn thiếu bằng tham số fill_value đầu ra P Q R S A 100 100 100 100 B 100 100 100 100 C 100 100 100 100 D 100 100 100 100 E 100 100 100 100 ví dụ 2 Ví dụ này cho thấy hoạt động của hàm reindex() để lập chỉ mục lại trục cột đầu ra A B D E Parker NaN NaN NaN NaN William NaN NaN NaN NaN Smith NaN NaN NaN NaN Terry NaN NaN NaN NaN Phill NaN NaN NaN NaN Lưu ý rằng các giá trị NaN có trong các cột mới sau khi lập chỉ mục lại, chúng ta có thể sử dụng đối số fill_value cho hàm để xóa các giá trị NaN |