Trong hướng dẫn Python ngắn gọn này, chúng ta sẽ tìm hiểu cách đọc các tệp Excel [XLSX] bằng Python. Cụ thể, chúng tôi sẽ đọc các tệp XLSX trong Python bằng mô -đun Python OpenPyXL. Đầu tiên, chúng tôi bắt đầu bằng ví dụ đơn giản nhất về việc đọc tệp XLSX trong Python. Thứ hai, chúng ta sẽ tìm hiểu cách đọc nhiều tệp Excel bằng Python.
Trong các bài viết trước, chúng tôi đã học được cách sử dụng phương thức Pandas read_excel để nhập các tệp XLSX với Python. Tuy nhiên, như đã đề cập trước đây, chúng tôi sẽ sử dụng một gói khác có tên OpenPyXL trong bài đăng này. Trong đoạn tiếp theo, chúng ta sẽ tìm hiểu cách cài đặt OpenPyXL.
- Cú pháp OpenPyXL
- Điều kiện tiên quyết: Python và OpenPyxl
- Việc sử dụng openpyxl trong python là gì?
- Làm cách nào để đọc tệp Excel [XLSX] trong Python?
- Cách đọc tệp Excel [XLSX] trong Python
- 1. Nhập các mô -đun cần thiết
- 2. Đặt đường dẫn thành tệp Excel [XLSX]
- 3. Đọc tệp Excel [sổ làm việc]
- 4. Đọc bảng hoạt động từ tệp Excel
- 5. Làm việc, hoặc thao tác, bảng Excel
- 6. Phần thưởng: Xác định số lượng hàng và cột trong tệp Excel
- Đọc tệp Excel [XLSX] đến Từ điển Python
- Tạo một từ điển từ một tệp excel
- Cách đọc nhiều tệp Excel [XLSX] trong Python
- 1. Nhập các mô -đun
- 2. Đọc tất cả các tệp XLSX trong thư mục vào danh sách
- 3. Tạo các đối tượng sổ làm việc [tức là, đọc các tệp XLSX]
- 4. Làm việc với các tệp Excel đã nhập
- Kết luận: Đọc các tệp Excel [XLSX] trong Python
Cú pháp OpenPyXL
Điều kiện tiên quyết: Python và OpenPyxl
Code language: Python [python]
import openpyxl from pathlib import Path xlsx_file = Path['SimData', 'play_data.xlsx'] wb_obj = openpyxl.load_workbook[xlsx_file] # Read the active sheet: sheet = wb_obj.active
Việc sử dụng openpyxl trong python là gì?
Điều kiện tiên quyết: Python và OpenPyxl
Việc sử dụng openpyxl trong python là gì?
Việc sử dụng openpyxl trong python là gì?
Làm cách nào để đọc tệp Excel [XLSX] trong Python? is a Python module that can be used for reading and writing Excel [with extension xlsx/xlsm/xltx/xltm] files. Furthermore, this module enables a Python script to modify Excel files. For instance, if we want togo through thousands of rows but just read certain data points and make small changes to these points, we can do this based on some criteria with openpyxl.
Làm cách nào để đọc tệp Excel [XLSX] trong Python?
Cách đọc tệp Excel [XLSX] trong Python
Cách đọc tệp Excel [XLSX] trong Python
1. Nhập các mô -đun cần thiết
1. Nhập các mô -đun cần thiết
2. Đặt đường dẫn thành tệp Excel [XLSX]
Code language: Python [python]
import openpyxl from pathlib import Path
2. Đặt đường dẫn thành tệp Excel [XLSX]
3. Đọc tệp Excel [sổ làm việc]
Code language: Python [python]
# Setting the path to the xlsx file: xlsx_file = Path['SimData', 'play_data.xlsx']
4. Đọc bảng hoạt động từ tệp Excel
3. Đọc tệp Excel [sổ làm việc]
4. Đọc bảng hoạt động từ tệp Excel
5. Làm việc, hoặc thao tác, bảng Excel4. Đọc bảng hoạt động từ tệp Excel
5. Làm việc, hoặc thao tác, bảng Excel
sheet = wb_obj.active
Code language: Python [python]
6. Phần thưởng: Xác định số lượng hàng và cột trong tệp Excel
5. Làm việc, hoặc thao tác, bảng Excel
6. Phần thưởng: Xác định số lượng hàng và cột trong tệp Excel
Code language: Python [python]
print[sheet["C2"].value]
Một ví dụ khác, về những gì chúng ta có thể làm với bảng tính trong Python, là chúng ta có thể lặp lại qua các hàng và in chúng:
Code language: Python [python]
for row in sheet.iter_rows[max_row=6]: for cell in row: print[cell.value, end=" "] print[]
Lưu ý rằng chúng tôi đã sử dụng max_row và đặt nó thành 6 để in 6 hàng đầu tiên từ tệp excel.
6. Phần thưởng: Xác định số lượng hàng và cột trong tệp Excel
Trong bước thứ sáu và phần thưởng, chúng tôi sẽ tìm hiểu xem chúng tôi có bao nhiêu hàng và cột trong tệp excel ví dụ mà chúng tôi đã nhập với Python:
Code language: Python [python]
print[sheet.max_row, sheet.max_column]
Đọc tệp Excel [XLSX] đến Từ điển Python
Bây giờ, trước khi chúng ta tìm hiểu cách đọc nhiều tệp XLSX, chúng ta sẽ nhập dữ liệu từ Excel vào từ điển Python. Nó khá đơn giản, nhưng ví dụ dưới đây, chúng ta cần biết tên cột trước khi bắt đầu. Nếu chúng ta muốn tìm ra tên cột, chúng ta có thể chạy mã sau [hoặc chỉ cần mở tệp Excel]:
Code language: Python [python]
import openpyxl from pathlib import Path xlsx_file = Path['SimData', 'play_data.xlsx'] wb_obj = openpyxl.load_workbook[xlsx_file] sheet = wb_obj.active col_names = [] for column in sheet.iter_cols[1, sheet.max_column]: col_names.append[column[0].value] print[col_names]
Tạo một từ điển từ một tệp excel
Trong phần này, cuối cùng chúng tôi sẽ đọc tệp Excel bằng Python và tạo từ điển.
Code language: Python [python]
data = {} for i, row in enumerate[sheet.iter_rows[values_only=True]]: if i == 0: data[row[1]] = [] data[row[2]] = [] data[row[3]] = [] data[row[4]] = [] data[row[5]] = [] data[row[6]] = [] else: data['Subject ID'].append[row[1]] data['First Name'].append[row[2]] data['Day'].append[row[3]] data['Age'].append[row[4]] data['RT'].append[row[5]] data['Gender'].append[row[6]]
Bây giờ, hãy để Lừa đi qua ví dụ mã ở trên. Đầu tiên, chúng tôi tạo một từ điển Python [dữ liệu]. Thứ hai, chúng tôi lặp qua mỗi hàng [sử dụng ITER_ROWS] và chúng tôi chỉ đi qua các hàng có giá trị. Thứ hai, chúng tôi có một câu lệnh IF trong đó chúng tôi kiểm tra xem nó có phải là hàng đầu tiên không và chúng tôi thêm các phím vào từ điển. Đó là, chúng tôi đặt tên cột làm khóa. Thứ ba, chúng tôi nối dữ liệu vào từng khóa [tên cột] trong câu lệnh khác.
Cách đọc nhiều tệp Excel [XLSX] trong Python
Trong phần này, chúng tôi sẽ tìm hiểu cách đọc nhiều tệp XLSX trong Python bằng OpenPyXL. Ngoài ra, OpenPyXL và PATH, chúng tôi cũng sẽ làm việc với mô -đun HĐH.
1. Nhập các mô -đun
Trong bước đầu tiên, chúng tôi sẽ nhập Đường dẫn mô -đun, GLOB và OPENPYXL:
0Code language: Python [python]
import openpyxl from pathlib import Path
2. Đọc tất cả các tệp XLSX trong thư mục vào danh sách
Thứ hai, chúng ta sẽ đọc tất cả các tệp .xlsx trong một thư mục con vào danh sách. Bây giờ, chúng tôi sử dụng mô -đun GLOB cùng với đường dẫn:
1Code language: Python [python]
import openpyxl from pathlib import Path
3. Tạo các đối tượng sổ làm việc [tức là, đọc các tệp XLSX]
Thứ ba, bây giờ chúng ta có thể đọc tất cả các tệp XLSX bằng Python. Một lần nữa, chúng tôi sẽ sử dụng phương thức load_workbook. Tuy nhiên, lần này chúng tôi sẽ lặp qua từng tệp chúng tôi tìm thấy trong thư mục con,
2Code language: Python [python]
import openpyxl from pathlib import Path
Bây giờ, trong các ví dụ mã ở trên, chúng tôi đang sử dụng khả năng hiểu danh sách Python [hai lần, trong cả bước 2 và 3]. Đầu tiên, chúng tôi tạo một danh sách tất cả các tệp XLSX trong thư mục XLSX_FILES. Thứ hai, chúng tôi lặp qua danh sách này và tạo một danh sách các sổ làm việc. Tất nhiên, chúng tôi có thể thêm điều này vào dòng mã đầu tiên ở trên.
4. Làm việc với các tệp Excel đã nhập
Trong bước thứ tư, bây giờ chúng ta có thể làm việc với các tệp Excel đã nhập. Ví dụ: chúng ta có thể nhận được tệp đầu tiên bằng cách thêm vào [0] vào danh sách. Nếu chúng ta muốn biết tên trang của tệp này, chúng ta sẽ thích: ________ 19. đó là, nhiều điều chúng ta có thể làm và đã thực hiện trong ví dụ trước về đọc các tệp XLSX trong Python, có thể được thực hiện khi chúng ta Đọc nhiều tệp excel.
Lưu ý, đây là một ví dụ tuyệt vời về cách sử dụng ngôn ngữ lập trình này. Ví dụ, các ví dụ khác là sử dụng nó để đổi tên các tệp trong Python.
Kết luận: Đọc các tệp Excel [XLSX] trong Python
Trong bài đăng này, chúng tôi đã học được cách:
- Đọc một tệp excel trong python bằng openpyxl
- Đọc tệp xlsx đến từ điển Python
- Đọc nhiều tệp Excel trong Python
Đó là nếu khóa học có thể nhập dữ liệu từ một loạt các định dạng tệp khác. Chẳng hạn, hãy đọc bài đăng về phân tích các tệp JSON trong Python để tìm hiểu thêm về đọc các tệp JSON.