Hướng dẫn how does python handle xlsx file? - python xử lý tệp xlsx như thế nào?

The .xlsx is the extension of the excel document that can store a large amount of data in tabular form, and many types of arithmetic and logical calculation can be done easily in an excel spreadsheet. Đôi khi cần phải đọc dữ liệu từ tài liệu Excel bằng tập lệnh Python cho mục đích lập trình. Nhiều mô -đun tồn tại trong Python để đọc tài liệu Excel. Một số mô -đun hữu ích là XLRD, OpenPyXL và Pandas. Các cách để sử dụng các mô -đun này để đọc tệp Excel trong Python đã được hiển thị trong hướng dẫn này..xlsx is the extension of the excel document that can store a large amount of data in tabular form, and many types of arithmetic and logical calculation can be done easily in an excel spreadsheet. Sometimes it is required to read the data from the excel document using Python script for programming purposes. Many modules exist in Python to read the excel document. Some of the useful modules are xlrd, openpyxl, and pandas. The ways to use these modules to read the excel file in Python have been shown in this tutorial.

Pre-requisite:

Một tệp excel giả với phần mở rộng .xlsx sẽ được yêu cầu để kiểm tra các ví dụ của hướng dẫn này. Bạn có thể sử dụng bất kỳ tệp Excel hiện có hoặc tạo một tệp mới. Ở đây, một tệp excel mới có tên là tệp sales.xlsx đã được tạo với dữ liệu sau. Tệp này đã được sử dụng để đọc bằng cách sử dụng các mô -đun Python khác nhau trong phần tiếp theo của hướng dẫn này.sales.xlsx file has been created with the following data. This file has used for reading by using different python modules in the next part of this tutorial.

sales.xlsx

Ngày bán hàngNgười bán hàngSố lượng
12/05/18Sila Ahmed60000
06/12/19Mir Hossain50000
09/08/20Sarmin Jahan45000
07/04/21Mahmudul Hasan30000

Ví dụ-1: Đọc tệp Excel bằng XLRD

Mô -đun XLRD không được cài đặt với Python theo mặc định. Vì vậy, bạn phải cài đặt mô -đun trước khi sử dụng nó. Phiên bản mới nhất của mô -đun này không hỗ trợ tệp Excel với tiện ích mở rộng .xlsx. Vì vậy, bạn phải cài đặt phiên bản 1.2.0 của mô -đun này để đọc tệp XLSX. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt phiên bản cần thiết của XLRD.xlrd.

$ pip installXLRD == 1.2.0pip install xlrd==1.2.0

Sau khi hoàn thành quá trình cài đặt, hãy tạo tệp Python với tập lệnh sau để đọc tệp sales.xlsx bằng mô -đun XLRD. Hàm open_workbook () được sử dụng trong tập lệnh Mở tệp XLSX để đọc. Tệp Excel này chỉ chứa một tờ. Vì vậy, hàm workbook.sheet_by_index () đã được sử dụng trong tập lệnh với giá trị đối số 0. Tiếp theo, vòng lặp ‘cho vòng lặp đã được sử dụng để đọc các giá trị ô của bảng tính bằng cách sử dụng các giá trị hàng và cột. Hai hàm phạm vi () đã được sử dụng trong tập lệnh để xác định kích thước hàng và cột dựa trên dữ liệu trang tính. Hàm cell_value () đã được sử dụng để đọc giá trị ô cụ thể của trang tính trong mỗi lần lặp của vòng lặp. Mỗi trường trong đầu ra sẽ được phân tách bằng một không gian tab.sales.xlsx file using the xlrd module. open_workbook() function is used in the script open the xlsx file for reading. This excel file contains one sheet only. So, the workbook.sheet_by_index() function has been used in the script with the argument value 0. Next, the nested ‘for’ loop has used to read the cell values of the worksheet using the row and column values. Two range() functions have been used in the script to define the row and column size based on the sheet data. The cell_value() function has used to read the particular cell value of the sheet in each iteration of the loop. Each field in the output will be separated by one tab space.

# Nhập mô -đun XLRD Nhập XLRD
import xlrd

# Mở sổ làm việc trên sổ làm việc = xlrd.open_workbook ("sales.xlsx")
workbook = xlrd.open_workbook("sales.xlsx")

# Mở bảng tính bảng tính = workbook.sheet_by_index (0)
worksheet = workbook.sheet_by_index(0)

# Lặp lại các hàng và cột cho i trong phạm vi (0, 5): & nbsp; & nbsp; cho j trong phạm vi (0, 3): & nbsp; & nbsp; & nbsp; & nbsp; # In các giá trị ô bằng không gian tab & nbsp; & nbsp; & nbsp; & nbsp; in (bảng tính.cell_value (i, j), end = '\ t') & nbsp; & nbsp; in('')
for i in range(0, 5):
    for j in range(0, 3):
        # Print the cell values with tab space
        print(worksheet.cell_value(i, j), end='\t')
    print('')

Output:

Đầu ra sau sẽ xuất hiện sau khi thực thi tập lệnh trên.

Hướng dẫn how does python handle xlsx file? - python xử lý tệp xlsx như thế nào?

Ví dụ-2: Đọc tệp Excel bằng OpenPyXL

OpenPyXL là một mô -đun Python khác để đọc tệp XLSX và nó cũng không được cài đặt với Python theo mặc định. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt mô -đun này trước khi sử dụng nó.openpyxl is another python module to read the xlsx file, and it is also not installed with Python by default. Run the following command from the terminal to install this module before using it.

Sau khi hoàn thành quá trình cài đặt, hãy tạo tệp Python với tập lệnh sau để đọc tệp sales.xlsx. Giống như mô -đun XLRD, mô -đun OpenPyXL có hàm Load_Workbook () để mở tệp XLSX để đọc. Tệp sales.xlsx được sử dụng làm giá trị đối số của hàm này. Đối tượng của wookbook.active đã được tạo trong tập lệnh để đọc các giá trị của các thuộc tính max_row và max_column. Các thuộc tính này đã được sử dụng trong các vòng lặp để đọc nội dung của tệp sales.xlsx. Hàm phạm vi () đã được sử dụng để đọc các hàng của trang tính và hàm iter_cols () đã được sử dụng để đọc các cột của trang tính. Mỗi trường trong đầu ra sẽ được phân tách bằng hai không gian tab.sales.xlsx file. Like the xlrd module, the openpyxl module has the load_workbook() function to open the xlsx file for reading. The sales.xlsx file is used as the argument value of this function. The object of the wookbook.active has been created in the script to read the values of the max_row and the max_column properties. These properties have been used in the nested for loops to read the content of the sales.xlsx file. The range() function has been used to read the rows of the sheet, and the iter_cols() function has been used to read the columns of the sheet. Each field in the output will be separated by two tab spaces.

# Nhập mô -đun OpenYxl Nhập OpenPyxl
import openpyxl

# Xác định biến để tải wookbook wookbook = openpyxl.load_workbook ("sales.xlsx")
wookbook = openpyxl.load_workbook("sales.xlsx")

# Xác định biến để đọc tờ Active: Bảng tính = wookbook.Active
worksheet = wookbook.active

# Lặp lại vòng lặp để đọc các giá trị ô cho i trong phạm vi (0, bảng tính.max_row): & nbsp; & nbsp; bảng tính forcolin.iter_cols (1, bảng tính.max_column): & nbsp; & nbsp; & nbsp; & nbsp; in (col [i] .value, end = "\ t \ t") & nbsp; & nbsp; in('')
for i in range(0, worksheet.max_row):
    for col in worksheet.iter_cols(1, worksheet.max_column):
        print(col[i].value, end="\t\t")
    print('')

Output:

Đầu ra sau sẽ xuất hiện sau khi thực thi tập lệnh trên.

Hướng dẫn how does python handle xlsx file? - python xử lý tệp xlsx như thế nào?

Ví dụ-2: Đọc tệp Excel bằng OpenPyXL

OpenPyXL là một mô -đun Python khác để đọc tệp XLSX và nó cũng không được cài đặt với Python theo mặc định. Chạy lệnh sau từ thiết bị đầu cuối để cài đặt mô -đun này trước khi sử dụng nó.pandas from the terminal.

Sau khi hoàn thành quá trình cài đặt, hãy tạo tệp Python với tập lệnh sau để đọc tệp sales.xlsx. Giống như mô -đun XLRD, mô -đun OpenPyXL có hàm Load_Workbook () để mở tệp XLSX để đọc. Tệp sales.xlsx được sử dụng làm giá trị đối số của hàm này. Đối tượng của wookbook.active đã được tạo trong tập lệnh để đọc các giá trị của các thuộc tính max_row và max_column. Các thuộc tính này đã được sử dụng trong các vòng lặp để đọc nội dung của tệp sales.xlsx. Hàm phạm vi () đã được sử dụng để đọc các hàng của trang tính và hàm iter_cols () đã được sử dụng để đọc các cột của trang tính. Mỗi trường trong đầu ra sẽ được phân tách bằng hai không gian tab.sales.xlsx file. The read_excel() function of pandas is used for reading the xlsx file. This function has used in the script to read the sales.xlsx file. The DataFrame() function has used here to read the content of the xlsx file in the data frame and store the values in the variable named data. The value of the data has been printed later.

# Nhập Pandas nhập khẩu Pandas dưới dạng PD
import pandas as pd

# Tải tệp xlsx excel_data = pd.read_excel ('sales.xlsx') '])# In bản in nội dung ("Nội dung của tệp là: \ n", dữ liệu)
excel_data = pd.read_excel('sales.xlsx')
# Read the values of the file in the dataframe
data = pd.DataFrame(excel_data, columns=['Sales Date', 'Sales Person', 'Amount'])
# Print the content
print("The content of the file is:\n", data)

Output:

Đầu ra sau sẽ xuất hiện sau khi thực thi tập lệnh trên. Đầu ra của tập lệnh này khác với hai ví dụ trước. Các số hàng được in trong cột đầu tiên, trong đó giá trị hàng đã được tính từ 0. Các giá trị ngày được căn chỉnh theo cách tập trung. Tên của các nhân viên bán hàng được liên kết đúng. Số tiền được căn chỉnh trái.

Hướng dẫn how does python handle xlsx file? - python xử lý tệp xlsx như thế nào?

Conclusion:

Người dùng Python cần làm việc với các tệp XLSX cho các mục đích lập trình khác nhau. Ba cách khác nhau để đọc tệp XLSX đã được hiển thị trong hướng dẫn này bằng cách sử dụng ba mô -đun Python. Mỗi mô -đun có các hàm và thuộc tính khác nhau để đọc tệp XLSX. Hướng dẫn này sẽ giúp người dùng Python đọc tệp XLSX dễ dàng bằng tập lệnh Python sau khi đọc hướng dẫn này.

Thông tin về các Tác giả

Hướng dẫn how does python handle xlsx file? - python xử lý tệp xlsx như thế nào?

Tôi là một huấn luyện viên của các khóa học lập trình web. Tôi thích viết bài báo hoặc hướng dẫn về các chủ đề CNTT khác nhau. Tôi có một kênh YouTube trong đó nhiều loại hướng dẫn dựa trên Ubuntu, Windows, Word, Excel, WordPress, Magento, Laravel, v.v.

Python có thể đọc các tệp XLSX không?

Hai cách phổ biến để đọc các tệp XLSX trong Python là openpyxl và pandas. Phần này sẽ phác thảo các bước bạn có thể thực hiện cho từng bước. OpenPyXL là một thư viện Python được tạo để đọc và viết các tệp Excel 2010 XLSX/XLSM/XLTX/XLTM. Nó có thể đọc cả hai.OpenPyXL and Pandas. This section will outline the steps you can take for each one. OpenPyXL is a Python library created for reading and writing Excel 2010 xlsx/xlsm/xltx/xltm files. It can read both the .

Làm cách nào để tải tệp XLSX trong Python?

Các bước để nhập một tệp Excel vào Python bằng Pandas..
Bước 1: Chụp đường dẫn tệp. Đầu tiên, bạn sẽ cần ghi lại đường dẫn đầy đủ nơi lưu trữ tệp Excel trên máy tính của bạn. ....
Bước 2: Áp dụng mã Python. Và đây là mã Python phù hợp với ví dụ của chúng tôi. ....
Bước 3: Chạy mã Python để nhập tệp Excel ..

Python có thể xử lý các tệp excel không?

Python là tuyệt vời để xử lý excel-files. Bạn có thể xử lý các tệp lớn dễ dàng hơn nhiều, bạn tạo mã có thể tái tạo và bạn cung cấp một tài liệu cho các đồng nghiệp của bạn. Chúng tôi cũng thấy chúng tôi có thể dễ dàng truy cập vào các tính năng nâng cao của Python. Bạn có thể tự động hóa toàn bộ quá trình báo cáo của bạn.. You can handle large files much easier, you create reproducible code and you provide a documentation for your colleagues. We also saw the we have easily access to advanced features of Python. You could automate your whole reporting process.

Làm thế nào để Python lưu trữ dữ liệu trong Excel?

Tạo một tờ Excel.Nhập gấu trúc dưới dạng pdwriter = pd.excelwriter ('demo.xlsx', động cơ = 'xlsxwriter') writer.save () ....
Thêm dữ liệu số lượng lớn vào một tờ Excel.Nhập GANDAS dưới dạng PD.....
Nối dữ liệu ở cuối một tờ Excel.Mã này sẽ nối dữ liệu ở cuối Excel.....
Thêm định dạng có điều kiện vào đầu ra ..