Công thức thứ tự đảo ngược excel
Bài viết này hướng dẫn bạn cách đảo ngược thứ tự của một danh sách trong Excel. Ví dụ ta muốn đảo danh sách ở cột A bên dưới Show
1. Nhập giá trị 1 vào ô B1 và giá trị 2 vào ô B2 2. Chọn phạm vi B1. B2, nhấp vào góc dưới bên phải của phạm vi này và kéo nó xuống ô B8 3. Nhấp vào bất kỳ số nào trong danh sách ở cột B 4. Để sắp xếp theo thứ tự giảm dần, trên tab Dữ liệu, trong nhóm Sắp xếp & Lọc, bấm ZA Kết quả. Không chỉ danh sách ở cột B mà cả danh sách ở cột A cũng bị đảo ngược Nếu bạn có Excel 365 hoặc Excel 2021, hãy sử dụng SEQUENCE, SORTBY và ROWS để sắp xếp danh sách theo thứ tự đảo ngược. Công thức sau đây khá tuyệt vời 5. Trước tiên, hãy sử dụng hàm SEQUENCE để tạo danh sách các số. Hàm SEQUENCE bên dưới có 4 đối số. Hàng = 8, Cột = 1, Bắt đầu = 1, Bước = 1 Ghi chú. hàm SEQUENCE, được nhập vào ô B1, điền vào nhiều ô. Ồ. Hành vi này trong Excel 365/2021 được gọi là tràn 6. Hàm SORTBY sắp xếp một phạm vi dựa trên các giá trị trong một phạm vi tương ứng. Sử dụng -1 (đối số thứ ba) để sắp xếp theo thứ tự giảm dần 7. Lồng hàm SEQUENCE bên trong hàm SORTBY 8. Nếu bạn có một danh sách dài hơn gồm 20 tên, hãy thay đổi giá trị 8 thành 20 trong công thức hiển thị ở trên hoặc tốt hơn nữa, hãy sử dụng hàm ROWS Học các phương pháp sắp xếp gấu trúc là một cách tuyệt vời để bắt đầu hoặc thực hành phân tích dữ liệu cơ bản bằng Python. Thông thường nhất, phân tích dữ liệu được thực hiện với bảng tính, SQL hoặc gấu trúc. Một trong những điều tuyệt vời khi sử dụng pandas là nó có thể xử lý một lượng lớn dữ liệu và cung cấp khả năng thao tác dữ liệu hiệu suất cao Trong hướng dẫn này, bạn sẽ học cách sử dụng 2 và 3, điều này sẽ cho phép bạn sắp xếp dữ liệu hiệu quả trong DataFrameĐến cuối hướng dẫn này, bạn sẽ biết cách
Để làm theo hướng dẫn này, bạn sẽ cần có hiểu biết cơ bản về DataFrames của gấu trúc và một số thông tin quen thuộc với Tiền thưởng miễn phí. Nhấp vào đây để nhận Bảng cheat Python và tìm hiểu kiến thức cơ bản về Python 3, như làm việc với các kiểu dữ liệu, từ điển, danh sách và hàm Python Bắt đầu với phương pháp sắp xếp PandasXin nhắc lại, DataFrame là cấu trúc dữ liệu có các trục được gắn nhãn cho cả hàng và cột. Bạn có thể sắp xếp DataFrame theo giá trị hàng hoặc cột cũng như theo chỉ mục hàng hoặc cột Cả hàng và cột đều có các chỉ mục, là các biểu diễn bằng số về vị trí của dữ liệu trong DataFrame của bạn. Bạn có thể truy xuất dữ liệu từ các hàng hoặc cột cụ thể bằng các vị trí chỉ mục của DataFrame. Theo mặc định, số chỉ mục bắt đầu từ số không. Bạn cũng có thể gán chỉ mục của riêng mình theo cách thủ công Loại bỏ các quảng cáoChuẩn bị bộ dữ liệuTrong hướng dẫn này, bạn sẽ làm việc với dữ liệu tiết kiệm nhiên liệu do Cơ quan Bảo vệ Môi trường Hoa Kỳ (EPA) tổng hợp trên các phương tiện được sản xuất từ năm 1984 đến 2021. Bộ dữ liệu tiết kiệm nhiên liệu của EPA rất tuyệt vời vì nó có nhiều loại thông tin khác nhau mà bạn có thể sắp xếp, từ loại dữ liệu văn bản đến số. Tập dữ liệu có tổng cộng tám mươi ba cột Để làm theo, bạn sẽ cần cài đặt thư viện pandas Python. Mã trong hướng dẫn này được thực thi bằng pandas 1. 2. 0 và Python3. 9. 1 Ghi chú. Toàn bộ bộ dữ liệu tiết kiệm nhiên liệu là khoảng 18 MB. Việc đọc toàn bộ tập dữ liệu vào bộ nhớ có thể mất một hoặc hai phút. Việc giới hạn số lượng hàng và cột sẽ giúp cải thiện hiệu suất nhưng vẫn sẽ mất vài giây trước khi dữ liệu được tải xuống Đối với mục đích phân tích, bạn sẽ xem dữ liệu MPG (dặm trên gallon) trên các phương tiện theo kiểu dáng, kiểu dáng, năm và các thuộc tính phương tiện khác. Bạn có thể chỉ định cột nào sẽ đọc vào DataFrame của mình. Đối với hướng dẫn này, bạn sẽ chỉ cần một tập hợp con của Dưới đây là các lệnh để đọc các cột có liên quan của tập dữ liệu tiết kiệm nhiên liệu vào DataFrame và để hiển thị năm hàng đầu tiên >>>
Bằng cách gọi 9 bằng URL tập dữ liệu, bạn có thể tải dữ liệu vào DataFrame. Thu hẹp các cột dẫn đến thời gian tải nhanh hơn và sử dụng bộ nhớ thấp hơn. Để hạn chế hơn nữa mức tiêu thụ bộ nhớ và để có cảm nhận nhanh về dữ liệu, bạn có thể chỉ định số lượng hàng sẽ tải bằng cách sử dụng 0Làm quen với >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 2Bạn sử dụng 2 để sắp xếp các giá trị trong DataFrame dọc theo một trong hai trục (cột hoặc hàng). Thông thường, bạn muốn sắp xếp các hàng trong DataFrame theo giá trị của một hoặc nhiều cộtHình trên cho thấy kết quả của việc sử dụng 2 để sắp xếp các hàng của DataFrame dựa trên các giá trị trong cột 4. Điều này tương tự như cách bạn sắp xếp dữ liệu trong bảng tính bằng cộtLàm quen với >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 3Bạn sử dụng 3 để sắp xếp DataFrame theo chỉ mục hàng hoặc nhãn cột của nó. Sự khác biệt so với việc sử dụng 2 là bạn đang sắp xếp DataFrame dựa trên chỉ mục hàng hoặc tên cột của nó, chứ không phải theo giá trị trong các hàng hoặc cột nàyChỉ mục hàng của DataFrame được viền màu xanh lam trong hình trên. Một chỉ mục không được coi là một cột và bạn thường chỉ có một chỉ mục hàng. Chỉ số hàng có thể được coi là số hàng, bắt đầu từ số không Sắp xếp khung dữ liệu của bạn trên một cộtĐể sắp xếp DataFrame dựa trên các giá trị trong một cột, bạn sẽ sử dụng 2. Theo mặc định, điều này sẽ trả về một DataFrame mới được sắp xếp theo thứ tự tăng dần. Nó không sửa đổi DataFrame gốcSắp xếp theo một cột theo thứ tự tăng dầnĐể sử dụng 2, bạn chuyển một đối số cho phương thức chứa tên của cột mà bạn muốn sắp xếp theo. Trong ví dụ này, bạn sắp xếp DataFrame theo cột 90, đại diện cho MPG thành phố dành cho ô tô chỉ sử dụng nhiên liệu>>> 0Điều này sắp xếp DataFrame của bạn bằng cách sử dụng các giá trị cột từ 90, trước tiên hiển thị các phương tiện có MPG thấp nhất. Theo mặc định, 2 sắp xếp dữ liệu của bạn theo thứ tự tăng dần. Mặc dù bạn không chỉ định tên cho đối số mà bạn đã chuyển đến 2, nhưng bạn thực sự đã sử dụng tham số 94 mà bạn sẽ thấy trong ví dụ tiếp theoLoại bỏ các quảng cáoThay đổi thứ tự sắp xếpMột tham số khác của 2 là 4. Theo mặc định, 2 có 4 được đặt thành 8. Nếu bạn muốn DataFrame được sắp xếp theo thứ tự giảm dần, thì bạn có thể chuyển 00 cho tham số này>>>
Bằng cách chuyển 00 đến 4, bạn đảo ngược thứ tự sắp xếp. Bây giờ DataFrame của bạn được sắp xếp theo thứ tự giảm dần theo MPG trung bình được đo trong điều kiện thành phố. Các phương tiện có giá trị MPG cao nhất nằm ở hàng đầu tiênChọn thuật toán sắp xếpThật tốt khi lưu ý rằng pandas cho phép bạn chọn các thuật toán sắp xếp khác nhau để sử dụng với cả 2 và 3. Các thuật toán khả dụng là 05, 06 và 07. Để biết thêm thông tin về các thuật toán sắp xếp khác nhau này, hãy xem Thuật toán sắp xếp trong PythonThuật toán được sử dụng theo mặc định khi sắp xếp trên một cột là 05. Để thay đổi thuật toán này thành thuật toán sắp xếp ổn định, hãy sử dụng 06. Bạn có thể làm điều đó với tham số 10 trong 2 hoặc 3, như thế này>>>
Sử dụng 10, bạn đặt thuật toán sắp xếp thành 06. Đầu ra trước đó đã sử dụng thuật toán 05 mặc định. Nhìn vào các chỉ số được đánh dấu, bạn có thể thấy các hàng theo một thứ tự khác. Điều này là do 05 không phải là thuật toán sắp xếp ổn định, nhưng 06 thìGhi chú. Trong gấu trúc, 10 bị bỏ qua khi bạn sắp xếp trên nhiều cột hoặc nhãnKhi bạn sắp xếp nhiều bản ghi có cùng khóa, thuật toán sắp xếp ổn định sẽ duy trì thứ tự ban đầu của các bản ghi đó sau khi sắp xếp. Vì lý do đó, việc sử dụng thuật toán sắp xếp ổn định là cần thiết nếu bạn dự định thực hiện nhiều loại Sắp xếp khung dữ liệu của bạn trên nhiều cộtTrong phân tích dữ liệu, bạn thường muốn sắp xếp dữ liệu của mình dựa trên giá trị của nhiều cột. Hãy tưởng tượng bạn có một tập dữ liệu với tên và họ của mọi người. Sẽ rất hợp lý nếu sắp xếp theo họ và sau đó là tên, để những người có cùng họ được sắp xếp theo thứ tự abc theo tên của họ Trong ví dụ đầu tiên, bạn đã sắp xếp DataFrame của mình trên một cột có tên là 90. Từ quan điểm phân tích, MPG trong điều kiện thành phố là một yếu tố quan trọng có thể xác định mức độ mong muốn của một chiếc xe hơi. Ngoài MPG trong điều kiện thành phố, bạn cũng có thể muốn xem MPG cho điều kiện đường cao tốc. Để sắp xếp theo hai khóa, bạn có thể chuyển danh sách tên cột tới 94>>> 9Bằng cách chỉ định danh sách các tên cột 90 và 4, bạn sắp xếp DataFrame trên hai cột bằng cách sử dụng 2. Ví dụ tiếp theo sẽ giải thích cách chỉ định thứ tự sắp xếp và lý do tại sao điều quan trọng là phải chú ý đến danh sách tên cột bạn sử dụngSắp xếp theo nhiều cột theo thứ tự tăng dầnĐể sắp xếp DataFrame trên nhiều cột, bạn phải cung cấp danh sách tên cột. Ví dụ: để sắp xếp theo 74 và 75, bạn nên tạo danh sách sau rồi chuyển cho 2>>> 0Bây giờ DataFrame của bạn được sắp xếp theo thứ tự tăng dần bởi 74. Nếu có hai hoặc nhiều sản phẩm giống hệt nhau, thì nó được sắp xếp theo 75. Thứ tự các tên cột được chỉ định trong danh sách của bạn tương ứng với cách DataFrame của bạn sẽ được sắp xếpLoại bỏ các quảng cáoThay đổi thứ tự sắp xếp cộtVì bạn đang sắp xếp bằng nhiều cột, nên bạn có thể chỉ định thứ tự sắp xếp các cột của mình. Nếu bạn muốn thay đổi thứ tự sắp xếp logic từ ví dụ trước, thì bạn có thể thay đổi thứ tự tên cột trong danh sách mà bạn chuyển đến tham số 94>>> 1Khung dữ liệu của bạn hiện được sắp xếp theo cột ________ 575 theo thứ tự tăng dần, sau đó được sắp xếp theo ________ 574 nếu có hai hoặc nhiều mô hình giống nhau. Bạn có thể thấy rằng việc thay đổi thứ tự các cột cũng thay đổi thứ tự sắp xếp các giá trị Sắp xếp theo nhiều cột theo thứ tự giảm dầnCho đến thời điểm này, bạn chỉ sắp xếp theo thứ tự tăng dần trên nhiều cột. Trong ví dụ tiếp theo, bạn sẽ sắp xếp theo thứ tự giảm dần dựa trên cột 74 và 75. Để sắp xếp theo thứ tự giảm dần, hãy đặt 4 thành 00>>> 7Các giá trị trong cột 74 theo thứ tự bảng chữ cái đảo ngược và các giá trị trong cột 75 theo thứ tự giảm dần đối với bất kỳ ô tô nào có cùng 74. Với dữ liệu văn bản, sắp xếp phân biệt chữ hoa chữ thường, nghĩa là văn bản viết hoa sẽ xuất hiện đầu tiên theo thứ tự tăng dần và cuối cùng theo thứ tự giảm dầnSắp xếp theo nhiều cột với thứ tự sắp xếp khác nhauBạn có thể tự hỏi liệu có thể sắp xếp bằng cách sử dụng nhiều cột hay không và để các cột đó sử dụng các đối số 4 khác nhau. Với gấu trúc, bạn có thể thực hiện việc này bằng một lệnh gọi phương thức duy nhất. Nếu bạn muốn sắp xếp một số cột theo thứ tự tăng dần và một số cột theo thứ tự giảm dần, thì bạn có thể chuyển danh sách Booleans tới 4Trong ví dụ này, bạn sắp xếp DataFrame của mình theo các cột 74, 75 và 90, với hai cột đầu tiên được sắp xếp theo thứ tự tăng dần và 90 được sắp xếp theo thứ tự giảm dần. Để làm như vậy, bạn chuyển danh sách tên cột tới 94 và danh sách Booleans tới 4>>> 3Bây giờ Khung dữ liệu của bạn được sắp xếp theo thứ tự tăng dần của 74 và 75, nhưng với cột 90 theo thứ tự giảm dần. Điều này rất hữu ích vì nó nhóm các ô tô theo thứ tự phân loại và hiển thị những ô tô có MPG cao nhất trước tiênSắp xếp khung dữ liệu của bạn trên chỉ mục của nóTrước khi sắp xếp theo chỉ mục, bạn nên biết chỉ mục đại diện cho điều gì. DataFrame có thuộc tính 000, theo mặc định là đại diện bằng số cho các vị trí hàng của nó. Bạn có thể coi chỉ mục là số hàng. Nó giúp tra cứu và nhận dạng hàng nhanh chóngSắp xếp theo chỉ số theo thứ tự tăng dầnBạn có thể sắp xếp DataFrame dựa trên chỉ mục hàng của nó với 3. Sắp xếp theo các giá trị cột như bạn đã làm trong các ví dụ trước sẽ sắp xếp lại các hàng trong DataFrame của bạn, do đó, chỉ mục trở nên lộn xộn. Điều này cũng có thể xảy ra khi bạn lọc DataFrame hoặc khi bạn thêm hoặc xóa hàngĐể minh họa việc sử dụng 3, hãy bắt đầu bằng cách tạo một DataFrame được sắp xếp mới bằng cách sử dụng 2>>> 1Bạn đã tạo một DataFrame được sắp xếp bằng nhiều giá trị. Lưu ý cách chỉ mục hàng không theo thứ tự cụ thể. Để đưa DataFrame mới của bạn trở lại thứ tự ban đầu, bạn có thể sử dụng 3>>> 00Bây giờ chỉ số theo thứ tự tăng dần. Cũng giống như 2, đối số mặc định cho 4 trong 3 là 8 và bạn có thể chuyển sang thứ tự giảm dần bằng cách chuyển 00. Sắp xếp trên chỉ mục không ảnh hưởng đến chính dữ liệu vì các giá trị không thay đổiĐiều này đặc biệt hữu ích khi bạn đã chỉ định một chỉ mục tùy chỉnh với 010. Nếu bạn muốn đặt chỉ mục tùy chỉnh bằng cách sử dụng cột 74 và 75, thì bạn có thể chuyển danh sách tới 010>>> 01Sử dụng phương pháp này, bạn thay thế chỉ mục hàng dựa trên số nguyên mặc định bằng hai nhãn trục. Đây được coi là một hoặc một chỉ số phân cấp. Khung dữ liệu của bạn hiện được lập chỉ mục theo nhiều khóa, bạn có thể sắp xếp khóa này bằng 3>>> 02Trước tiên, bạn chỉ định một chỉ mục mới cho Khung dữ liệu của mình bằng cách sử dụng các cột 74 và 75, sau đó bạn sắp xếp chỉ mục bằng cách sử dụng 3. Bạn có thể đọc thêm về cách sử dụng 010 trong tài liệu về gấu trúcLoại bỏ các quảng cáoSắp xếp theo chỉ mục theo thứ tự giảm dầnĐối với ví dụ tiếp theo, bạn sẽ sắp xếp DataFrame của mình theo chỉ mục của nó theo thứ tự giảm dần. Hãy nhớ rằng khi sắp xếp DataFrame của bạn với 2, bạn có thể đảo ngược thứ tự sắp xếp bằng cách đặt 4 thành 00. Tham số này cũng hoạt động với 3, vì vậy bạn có thể sắp xếp DataFrame của mình theo thứ tự ngược lại như thế này>>> 03Bây giờ DataFrame của bạn được sắp xếp theo chỉ mục của nó theo thứ tự giảm dần. Một điểm khác biệt giữa việc sử dụng 3 và 2 là 3 không có tham số 94 vì nó sắp xếp DataFrame trên chỉ mục hàng theo mặc địnhKhám phá các khái niệm sắp xếp theo chỉ mục nâng caoCó nhiều trường hợp trong phân tích dữ liệu mà bạn muốn sắp xếp theo chỉ mục phân cấp. Bạn đã thấy cách bạn có thể sử dụng 74 và 75 trong một 014. Đối với tập dữ liệu này, bạn cũng có thể sử dụng cột 031 làm chỉ mụcĐặt cột 031 làm chỉ mục có thể hữu ích trong việc liên kết các bộ dữ liệu liên quan. Ví dụ: EPA cũng sử dụng 031 để đại diện cho ID hồ sơ phương tiện. Điều này liên kết dữ liệu khí thải với dữ liệu tiết kiệm nhiên liệu. Sắp xếp chỉ mục của cả hai bộ dữ liệu trong DataFrames có thể tăng tốc bằng các phương pháp khác, chẳng hạn như 034. Để tìm hiểu thêm về cách kết hợp dữ liệu trong gấu trúc, hãy xem Kết hợp dữ liệu trong gấu trúc với hợp nhất(),. tham gia () và concat ()Sắp xếp các cột trong DataFrame của bạnBạn cũng có thể sử dụng các nhãn cột của DataFrame để sắp xếp các giá trị hàng. Sử dụng 3 với tham số tùy chọn 036 được đặt thành 037 sẽ sắp xếp DataFrame theo nhãn cột. Thuật toán sắp xếp được áp dụng cho nhãn trục thay vì dữ liệu thực tế. Điều này có thể hữu ích cho việc kiểm tra trực quan DataFrameLàm việc với DataFrame >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 036Khi bạn sử dụng 3 mà không chuyển bất kỳ đối số rõ ràng nào, nó sẽ sử dụng 040 làm đối số mặc định. Trục của DataFrame đề cập đến chỉ mục ( 040) hoặc cột ( 042). Bạn có thể sử dụng cả hai trục để lập chỉ mục và chọn dữ liệu trong DataFrame cũng như để sắp xếp dữ liệuSử dụng nhãn cột để sắp xếpBạn cũng có thể sử dụng nhãn cột của DataFrame làm khóa sắp xếp cho 3. Đặt 036 thành 037 sắp xếp các cột trong DataFrame của bạn dựa trên nhãn cột>>> 04Các cột trong DataFrame của bạn được sắp xếp từ trái sang phải theo thứ tự bảng chữ cái tăng dần. Nếu bạn muốn sắp xếp các cột theo thứ tự giảm dần, thì bạn có thể sử dụng 046>>> 05Sử dụng 042 trong 3, bạn đã sắp xếp các cột trong DataFrame của mình theo cả thứ tự tăng dần và giảm dần. Điều này có thể hữu ích hơn trong các tập dữ liệu khác, chẳng hạn như tập dữ liệu có nhãn cột tương ứng với các tháng trong năm. Trong trường hợp đó, bạn nên sắp xếp dữ liệu của mình theo thứ tự tăng dần hoặc giảm dần theo thángLàm việc với dữ liệu bị thiếu khi sắp xếp trong PandasThông thường, dữ liệu trong thế giới thực có nhiều điểm không hoàn hảo. Mặc dù gấu trúc có một số phương pháp mà bạn có thể sử dụng để làm sạch dữ liệu của mình trước khi sắp xếp, nhưng đôi khi thật tuyệt khi thấy dữ liệu nào bị thiếu trong khi bạn sắp xếp. Bạn có thể làm điều đó với tham số 049Tập hợp con của dữ liệu tiết kiệm nhiên liệu được sử dụng cho hướng dẫn này không có giá trị bị thiếu. Để minh họa việc sử dụng 049, trước tiên, bạn cần tạo một số dữ liệu còn thiếu. Đoạn mã sau tạo một cột mới dựa trên cột 051 hiện có, ánh xạ 8 trong đó 051 bằng với 054 và 055 trong đó không>>> 06Bây giờ bạn có một cột mới tên là 056 chứa cả hai giá trị 8 và 055. Bạn sẽ sử dụng cột này để xem tác động của 049 khi bạn sử dụng hai phương pháp sắp xếp. Để tìm hiểu thêm về cách sử dụng 060, bạn có thể đọc Pandas Project. Tạo sổ điểm với Python & PandasLoại bỏ các quảng cáoHiểu tham số >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 049 trong >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 2 2 chấp nhận một tham số có tên là 049, giúp sắp xếp dữ liệu còn thiếu trong cột mà bạn đang sắp xếp. Nếu bạn sắp xếp trên một cột có dữ liệu bị thiếu, thì các hàng có giá trị bị thiếu sẽ xuất hiện ở cuối Khung dữ liệu của bạn. Điều này xảy ra bất kể bạn đang sắp xếp theo thứ tự tăng dần hay giảm dầnĐây là khung dữ liệu của bạn trông như thế nào khi bạn sắp xếp trên cột có dữ liệu bị thiếu >>> 07Để thay đổi hành vi đó và để dữ liệu bị thiếu xuất hiện đầu tiên trong DataFrame của bạn, bạn có thể đặt 049 thành 066. Tham số 049 chỉ chấp nhận các giá trị 068, là giá trị mặc định và 066. Đây là cách sử dụng 070 trong 2>>> 08Giờ đây, mọi dữ liệu bị thiếu từ các cột bạn đã sử dụng để sắp xếp sẽ được hiển thị ở đầu Khung dữ liệu của bạn. Điều này hữu ích nhất khi bạn lần đầu tiên bắt đầu phân tích dữ liệu của mình và không chắc liệu có giá trị nào bị thiếu hay không Hiểu tham số >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 049 trong >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 3 3 cũng chấp nhận 049. Khung dữ liệu của bạn thường sẽ không có giá trị 055 như một phần của chỉ mục, vì vậy tham số này ít hữu ích hơn trong 3. Tuy nhiên, thật tốt khi biết rằng nếu DataFrame của bạn có 055 trong chỉ mục hàng hoặc tên cột, thì bạn có thể nhanh chóng xác định điều này bằng cách sử dụng 3 và 049Theo mặc định, tham số này được đặt thành 068, đặt các giá trị 055 ở cuối kết quả được sắp xếp. Để thay đổi hành vi đó và có dữ liệu bị thiếu trước tiên trong DataFrame của bạn, hãy đặt 049 thành 066Sử dụng các phương pháp sắp xếp để sửa đổi khung dữ liệu của bạnTrong tất cả các ví dụ bạn đã thấy cho đến nay, cả 2 và 3 đều trả về các đối tượng DataFrame khi bạn gọi các phương thức đó. Đó là bởi vì tính năng sắp xếp trong gấu trúc không hoạt động theo mặc định. Nói chung, đây là cách phổ biến và ưa thích nhất để phân tích dữ liệu của bạn với gấu trúc vì nó tạo ra một DataFrame mới thay vì sửa đổi bản gốc. Điều này cho phép bạn giữ nguyên trạng thái của dữ liệu từ khi bạn đọc nó từ tệp của mìnhTuy nhiên, bạn có thể trực tiếp sửa đổi DataFrame gốc bằng cách chỉ định tham số tùy chọn 7 với giá trị là 8. Phần lớn các phương thức pandas bao gồm tham số 7. Dưới đây, bạn sẽ thấy một vài ví dụ về việc sử dụng 090 để sắp xếp DataFrame của bạn tại chỗSử dụng >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 2 tại chỗVới 7 được đặt thành 8, bạn sửa đổi DataFrame ban đầu, do đó, các phương thức sắp xếp trả về 094. Sắp xếp DataFrame của bạn theo các giá trị của cột 90 giống như ví dụ đầu tiên, nhưng với 7 được đặt thành 8>>> 09Lưu ý cách gọi 2 không trả về DataFrame. Đây là bản gốc của 099 trông như thế nào>>> 0Trong đối tượng 099, các giá trị hiện được sắp xếp theo thứ tự tăng dần dựa trên cột 90. Khung dữ liệu ban đầu của bạn đã được sửa đổi và các thay đổi sẽ tiếp tục. Nói chung, bạn nên tránh sử dụng 090 để phân tích vì không thể hoàn tác các thay đổi đối với DataFrame của bạnSử dụng >>> df.sort_values( .. by="city08", .. ascending=False .. ) city08 cylinders fuelType .. mpgData trany year 9 23 4 Regular .. Y Automatic 4-spd 1993 2 23 4 Regular .. Y Manual 5-spd 1985 7 23 4 Regular .. Y Automatic 3-spd 1993 8 23 4 Regular .. Y Manual 5-spd 1993 76 23 4 Regular .. Y Manual 5-spd 1993 . .. .. .. .. .. .. ... 58 10 8 Regular .. N Automatic 3-spd 1985 80 9 8 Regular .. N Automatic 3-spd 1985 1 9 12 Regular .. N Manual 5-spd 1985 47 9 8 Regular .. N Automatic 3-spd 1985 99 9 8 Premium .. N Automatic 4-spd 1993 [100 rows x 10 columns] 3 Tại chỗVí dụ tiếp theo minh họa rằng 7 cũng hoạt động với 3Vì chỉ mục được tạo theo thứ tự tăng dần khi bạn đọc tệp của mình vào DataFrame, nên bạn có thể sửa đổi lại đối tượng 099 của mình để đưa nó trở lại thứ tự ban đầu. Sử dụng 3 với 7 được đặt thành 8 để sửa đổi Khung dữ liệu>>> 1Bây giờ DataFrame của bạn đã được sửa đổi lại bằng cách sử dụng 3. Vì DataFrame của bạn vẫn có chỉ mục mặc định, nên việc sắp xếp nó theo thứ tự tăng dần sẽ đưa dữ liệu trở lại thứ tự ban đầuNếu bạn đã quen thuộc với các hàm có sẵn của Python là 11 và 12, thì tham số 7 có sẵn trong các phương thức sắp xếp của pandas có thể rất giống nhau. Để biết thêm thông tin, bạn có thể xem Cách sử dụng sorted() và sort() trong PythonLoại bỏ các quảng cáoPhần kết luậnBây giờ bạn đã biết cách sử dụng hai phương thức cốt lõi của thư viện pandas. 2 và 3. Với kiến thức này, bạn có thể thực hiện phân tích dữ liệu cơ bản với DataFrame. Mặc dù có rất nhiều điểm tương đồng giữa hai phương pháp này, nhưng việc nhìn thấy sự khác biệt giữa chúng sẽ giúp bạn biết rõ nên sử dụng phương pháp nào cho các nhiệm vụ phân tích khác nhauTrong hướng dẫn này, bạn đã học cách
Những phương pháp này là một phần quan trọng để thành thạo phân tích dữ liệu. Họ sẽ giúp bạn xây dựng một nền tảng vững chắc để bạn có thể thực hiện các hoạt động gấu trúc nâng cao hơn. Nếu bạn muốn xem một số ví dụ về cách sử dụng phương pháp sắp xếp gấu trúc nâng cao hơn, thì tài liệu về gấu trúc là một nguồn tài nguyên tuyệt vời Đánh dấu là đã hoàn thành Xem ngay Hướng dẫn này có một khóa học video liên quan do nhóm Real Python tạo. Xem nó cùng với hướng dẫn bằng văn bản để hiểu sâu hơn. Sắp xếp dữ liệu bằng Python với gấu trúc 🐍 Thủ thuật Python 💌 Nhận một Thủ thuật Python ngắn và hấp dẫn được gửi đến hộp thư đến của bạn vài ngày một lần. Không có thư rác bao giờ. Hủy đăng ký bất cứ lúc nào. Được quản lý bởi nhóm Real Python Gửi cho tôi thủ thuật Python » Giới thiệu về anh chàng Spencer Spencer là kỹ sư dữ liệu yêu thích Python và tự động hóa. Anh ấy là một lập trình viên Python tự học, làm việc với các nhóm khoa học dữ liệu và xây dựng các ứng dụng chuyên sâu về dữ liệu » Thông tin thêm về SpencerMỗi hướng dẫn tại Real Python được tạo bởi một nhóm các nhà phát triển để nó đáp ứng các tiêu chuẩn chất lượng cao của chúng tôi. Các thành viên trong nhóm đã làm việc trong hướng dẫn này là Aldren Bartosz Geir Arne Joanna Gia-cốp Bậc thầy Kỹ năng Python trong thế giới thực Với quyền truy cập không giới hạn vào Python thực Tham gia với chúng tôi và có quyền truy cập vào hàng nghìn hướng dẫn, khóa học video thực hành và cộng đồng các Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bậc thầy Kỹ năng Python trong thế giới thực Tham gia với chúng tôi và có quyền truy cập vào hàng ngàn hướng dẫn, khóa học video thực hành và cộng đồng Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bạn nghĩ sao? Đánh giá bài viết này Tweet Chia sẻ Chia sẻ EmailBài học số 1 hoặc điều yêu thích mà bạn đã học được là gì? Mẹo bình luận. Những nhận xét hữu ích nhất là những nhận xét được viết với mục đích học hỏi hoặc giúp đỡ các sinh viên khác. và nhận câu trả lời cho các câu hỏi phổ biến trong cổng thông tin hỗ trợ của chúng tôi |