Ví dụ pandas to_html
Pandas DataFrame là một cấu trúc chứa hai chiều dữ liệu và các nhãn tương ứng của nó. DataFrames được sử dụng rộng rãi trong khoa học dữ liệu, học máy, tính toán khoa học và nhiều lĩnh vực sử dụng nhiều dữ liệu khác Show DataFrames tương tự như bảng SQL hoặc bảng tính mà bạn đang làm trong Excel hoặc Calc. Trong nhiều trường hợp, DataFrame nhanh hơn, dễ sử dụng hơn và mạnh hơn bảng hoặc bảng tính vì chúng là một phần không thể thiếu của hệ sinh thái Python và NumPy. Trong bài hướng dẫn này, chúng ta sẽ học
Started any. Đi nào Giới thiệu Pandas DataFramePandas DataFrames là cấu trúc dữ liệu chứa
Bạn có thể bắt đầu làm việc với DataFrames bằng cách nhập Pandas
Hãy tưởng tượng bạn đang sử dụng Pandas để phân tích dữ liệu về các thành viên ứng dụng cho vị trí phát triển ứng dụng web bằng Python. Giả sử bạn quan tâm đến tên, thành phố, độ tuổi và điểm số của ứng viên trong bài kiểm tra lập trình Python hoặc điểm số py-score namecityagepy-core1Nam TranHCM city1882. 02Huy NguyenHà Nội1979. 03 Minh Huy Tp.Hà Nội 2389. 04Lâm LễThành phố Đà Nẵng1796. 05 Đạt Nguyễn Tp.HCM 2294. 0 Trong bảng này, hàng đầu tiên chứa các cột đánh dấu (tên, thành phố, tuổi và điểm số). Cột đầu tiên chứa các hàng nhãn (1, 2, v. v. ). Tất cả các ô khác nhau được điền với các giá trị dữ liệu Bây giờ bạn có mọi thứ bạn cần để tạo Pandas DataFrame Có một số cách để tạo Pandas DataFrame. Trong hầu hết các trường hợp, bạn sẽ sử dụng hàm tạo DataFrame và cung cấp dữ liệu, nhãn và thông tin khác. Bạn có thể chuyển dữ liệu dưới dạng danh sách hai chiều, bộ tuple hoặc mảng NumPy. Bạn có thể chuyển nó dưới dạng từ điển hoặc phiên bản Pandas Series hoặc dưới dạng một số kiểu dữ liệu khác không được cập nhật trong hướng dẫn này Đối chiếu với ví dụ này, giả sử bạn đang sử dụng từ điển để chuyển dữ liệu
dữ liệu là một biến tham chiếu Python đến từ điển chứa thành viên dữ liệu của bạn. Nó cũng chứa các nhãn của các cột
Cuối cùng, row_labels đề cập đến một danh sách chứa các nhãn của các hàng, là các số từ 1 đến 5 Bây giờ bạn đã có sẵn để tạo Pandas DataFrame
df là một biến chứa tham chiếu đến Pandas DataFrame của bạn. Pandas DataFrame này trông giống như bảng ứng cử viên ở trên và có các tính năng sau
Pandas DataFrames đôi khi dữ liệu có thể rất lớn, khiến việc xem xét tất cả các hàng hóa giống nhau một lúc là không thực tế. You can't use. head() to show the first entry number and. tail() to show the end of the end number
Đó là cách bạn có thể hiển thị phần đầu hoặc phần cuối của Pandas DataFrame. Tham số n chỉ số hàng sẽ hiển thị
Bạn có thể truy cập một cột trong Pandas DataFrame giống như cách bạn lấy giá trị từ từ điển
Đó là cách bạn có thể có một cột cụ thể. Bạn đã xuất ra cột tương ứng với nhãn 'thành phố', chứa vị trí của tất cả các dữ liệu bạn muốn làm cùng Mỗi cột của Pandas DataFrame là một ví dụ của pandas. Sê-ri, một cấu trúc chứa dữ liệu theo chiều và nhãn của chúng. Bạn có thể lấy một mục của Dòng đối tượng (hàng) giống như cách bạn làm với từ điển, bằng cách sử dụng nhãn của nó làm từ khóa
Trong trường hợp này, 'Ha Noi city' là giá trị dữ liệu và '3' là nhãn tương ứng. Như bạn sẽ thấy trong phần sau, có nhiều cách khác để lấy một mục cụ thể trong Pandas DataFrame Bạn cũng có thể truy cập toàn bộ hàng bằng truy cập trình duyệt. lộc []
Lần này, bạn đã trích xuất hàng tương ứng với nhãn 3, chứa dữ liệu cho ứng cử viên có tên là Minh Huy. Ngoài các giá trị dữ liệu từ hàng này, bạn đã trích xuất nhãn của các cột tương ứng Data return also as a example of pandas. Loạt Khởi tạo một Pandas DataFrameNhư đã đề cập, có một số cách để tạo Pandas DataFrame. Trong phần này, chúng ta sẽ học cách thực hiện công việc này bằng cách sử dụng hàm tạo DataFrame cùng với
Bạn có thể bắt đầu bằng cách nhập Pandas cùng với NumPy, mà bạn sẽ sử dụng trong ví dụ sau
Tạo Pandas DataFrame với DictionariesNhư bạn đã thấy, bạn có thể tạo Pandas DataFrame bằng từ điển Python ________số 8Key of dictionary là cột nhãn của DataFrame và giá trị từ điển là giá trị dữ liệu trong các cột DataFrame tương ứng. Các giá trị có thể được chứa trong một bộ dữ liệu, danh sách, mảng NumPy một chiều, đối tượng Chuỗi Pandas hoặc một số trong các kiểu dữ liệu khác. Bạn cũng có thể cung cấp một giá trị duy nhất sẽ được sao chép dọc theo toàn bộ cột Có thể kiểm tra thứ tự của các cột bằng số cột và đánh dấu hàng bằng chỉ mục
Như bạn có thể thấy, bạn đã chỉ định các nhãn hàng 100, 200 và 300. You are also started thethứ tự của các cột. z, y, x Create Pandas DataFrame with ListsMột cách khác để tạo Pandas DataFrame là sử dụng danh sách của từ điển 0Một lần nữa, các khóa của từ điển là cột nhãn và giá trị từ điển là giá trị dữ liệu trong DataFrame Bạn cũng có thể sử dụng danh sách lồng nhau hoặc danh sách danh sách làm giá trị dữ liệu. Nếu bạn làm như vậy, thì bạn nên chỉ rõ ràng ràng buộc của cột, hàng hoặc cả hai khi bạn tạo DataFrame 1Đó là cách bạn có thể sử dụng danh sách lồng nhau để tạo Pandas DataFrame. Bạn cũng có thể sử dụng danh sách các bộ dữ liệu theo cách tương tự. Để làm như vậy, chỉ cần thay thế các ví dụ liststrong lồng nhau trên các bộ dữ liệu Tạo Pandas DataFrame với NumPy ArraysBạn có thể truyền hai chiều mảng NumPy vào phương thức khởi tạo DataFrame giống như cách bạn làm với danh sách 2Mặc dù ví dụ này trông gần giống với cách khai triển danh sách lồng nhau ở trên, nhưng nó có một điểm ưu tiên. You can only copy tham số tùy chọn Khi sao chép được đặt thành Sai (cài đặt mặc định), dữ liệu từ mảng NumPy sẽ không được sao chép. Điều này có nghĩa là dữ liệu gốc từ mảng được gán cho Pandas DataFrame. Nếu bạn đã sửa đổi mảng, thì DataFrame của bạn cũng sẽ thay đổi 3Như bạn đã thấy, khi bạn thay đổi mục đầu tiên của arr, bạn cũng đã sửa đổi df_
Nếu hành động này không như bạn muốn, thì bạn nên chỉ định copy = True trong hàm tạo DataFrame. Bằng cách đó, df_ sẽ được tạo ra với một bản sao của các giá trị từ arr thay vì các giá trị thực Create Pandas DataFrame with from FilesBạn có thể lưu và tải dữ liệu và gắn nhãn từ Pandas DataFrame đến và từ một số loại tệp, bao gồm CSV, Excel, SQL, JSON, v. v. Đây là một tính năng rất mạnh mẽ Bạn có thể lưu dữ liệu từ DataFrame của mình vào tệp CSV với. to_csv() 4Câu lệnh trên sẽ tạo ra một tệp CSV có tên dữ liệu. csv in your working directory 5Đó là cách bạn đọc và lấy dữ liệu Pandas DataFrame từ một tệp. Trong trường hợp này, index_col = 0 chỉ định rằng các nhãn hàng nằm trong cột đầu tiên của tệp CSV |