Trong python, thư viện của gấu trúc được sử dụng để xử lý và phân tích dữ liệu. Pandas Dataframe là một hàm tạo dữ liệu dạng bảng đa dạng và có thể thay đổi kích thước 2D với các trục được đánh dấu. Trong Dataframe, kiến thức được sắp xếp theo cách dạng bảng trong các cột và hàng. Pandas Dataframe chứa 3 yếu tố cần thiết chính, tôi. e. , dữ liệu, cột và hàng. Chúng tôi sẽ triển khai các kịch bản của mình trong Trình biên dịch Spyder, vì vậy hãy bắt đầu
ví dụ 1
Chúng tôi sử dụng phương pháp cơ bản và đơn giản nhất để chuyển đổi danh sách thành khung dữ liệu trong kịch bản đầu tiên của chúng tôi. Để triển khai mã chương trình của bạn, hãy mở Spyder IDE từ thanh tìm kiếm của Windows, sau đó tạo một tệp mới để ghi mã tạo Dataframe vào đó. Sau đó, bắt đầu viết mã chương trình của bạn. Trước tiên, chúng tôi nhập mô-đun của gấu trúc, sau đó tạo danh sách các chuỗi và thêm các mục vào đó. Sau đó, chúng tôi gọi hàm tạo khung dữ liệu và chuyển danh sách của chúng tôi làm đối số. Sau đó, chúng ta có thể gán hàm tạo khung dữ liệu cho một biến
nhập gấu trúc as pd
str_list = [‘flower’, ‘tutor’, ‘python’, ‘skills’]
daf = pd.Khung dữ liệu[ str_list ]
in[daf]
Sau khi tạo thành công tệp mã khung dữ liệu của bạn, hãy lưu tệp của bạn với “. phần mở rộng py. Trong kịch bản của chúng tôi, chúng tôi lưu tệp của mình với “dataframe. py”
Bây giờ hãy chạy “khung dữ liệu của bạn. py” và kiểm tra cách bạn chuyển đổi danh sách thành khung dữ liệu
ví dụ 2
Chúng tôi sử dụng hàm Zip[] để chuyển đổi danh sách thành khung dữ liệu trong kịch bản tiếp theo của chúng tôi. Chúng tôi sử dụng cùng một tệp mã để triển khai thêm và viết mã tạo khung dữ liệu qua Zip[]. Trước tiên, chúng tôi nhập mô-đun của gấu trúc, sau đó tạo danh sách các chuỗi và thêm các mục vào đó. Ở đây chúng tôi tạo hai danh sách. Danh sách các chuỗi và một chuỗi khác là danh sách các số nguyên. Sau đó, chúng tôi gọi hàm tạo khung dữ liệu và chuyển danh sách của chúng tôi
Sau đó, chúng ta có thể gán hàm tạo khung dữ liệu cho một biến. Sau đó, chúng tôi gọi hàm dataframe và truyền hai tham số vào đó. Tham số ban đầu là zip[] và tiếp theo là cột. Hàm zip[] nhận các biến có thể lặp lại và kết hợp chúng thành một bộ. Trong hàm zip, bạn có thể sử dụng bộ dữ liệu, bộ, danh sách hoặc từ điển. Vì vậy, trước tiên, chương trình nén cả hai tệp với các cột được chỉ định và sau đó gọi hàm khung dữ liệu
nhập gấu trúc as pd
string_list = [‘program’, ‘develop’, ‘coding, ‘skills’]
integer_list = [10, 22, 31, 44]
df = pd.Khung dữ liệu[danh sách[zip[ string_list, integer_list]], columns = [‘key’, ‘value’]]
print[df]
Lưu và chạy “khung dữ liệu của bạn. py” và kiểm tra chức năng zip hoạt động như thế nào
ví dụ 3
Trong kịch bản thứ ba, chúng tôi sử dụng từ điển để chuyển đổi danh sách thành khung dữ liệu. Chúng tôi sử dụng cùng một “khung dữ liệu. py” và tạo khung dữ liệu bằng danh sách trong dict. Trước tiên, chúng tôi nhập mô-đun của gấu trúc, sau đó tạo danh sách các chuỗi và thêm các mục vào đó. Ở đây chúng tôi tạo ba danh sách. Danh sách các quốc gia, ngôn ngữ lập trình và số nguyên. Sau đó, chúng tôi tạo một danh sách chính tả và gán nó cho một biến. Sau đó, chúng ta gọi hàm khung dữ liệu, gán nó cho một biến và truyền dict cho nó. Sau đó, chúng tôi sử dụng chức năng in để hiển thị khung dữ liệu
nhập gấu trúc as pd
con_name = [“Japan”, “UK”, “Canada”, “Finland”]
pro_lang = [“Java”, “Python”, “C++”, “.Net ” ]
var_list = . con_name [ 11, 44, 33, 55]
dict = { ‘countries’ : con_name, ‘Ngôn ngữ’. pro_lang , ‘số’. var_list
daf = pd. Khung dữ liệu[dict]
in[daf]
Một lần nữa, lưu và thực hiện “dataframe. py” và kiểm tra màn hình đầu ra theo cách có thứ tự
Phần kết luận
Nếu bạn đang làm việc với một lượng lớn dữ liệu, điều quan trọng trước tiên là thay đổi dữ liệu thành định dạng mà người dùng hiểu được. Khung dữ liệu cung cấp cho bạn chức năng truy cập dữ liệu hiệu quả. Trong python, dữ liệu chủ yếu hiện diện ở dạng Danh sách và điều quan trọng là tạo khung dữ liệu thông qua danh sách