Hướng dẫn read excel python - đọc excel python

Nội dung chính ShowShow

  • Cách cài openpyxl trong python
  • Cài openpyxl bằng pip install openpyxl
  • Các class hỗ trợ xử lý file excel trong module openpyxl
  • Đọc file excel trong python | openpyxl
  • Đọc toàn bộ file excel bằng python
  • Đọc một sheet trong file excel bằng python
  • Đọc một ô trong file excel bằng python
  • Đọc các ô tại một phạm vi chỉ định trong sheet excel
  • Trích xuất dữ liệu từ file Excel bằng Python
  • Trích xuất toàn bộ giá trị các ô trong sheet excel bằng python
  • Lấy giá trị các ô tại một phạm vi chỉ định trong sheet excel
  • Đếm số dòng có dữ liệu trong excel bằng python
  • Đếm số cột có dữ liệu trong excel bằng python
  • Tổng kết

Hướng dẫn cách xử lý file excel trong python. Bạn sẽ học được cách cài openpyxl và dùng module này để đọc file excel trong python cũng như là để trích xuất dữ liệu từ file Excel bằng Python sau bài học này.xử lý file excel trong python. Bạn sẽ học được cách cài openpyxl và dùng module này để đọc file excel trong python cũng như là để trích xuất dữ liệu từ file Excel bằng Python sau bài học này.

  • Bài viết liên quan: Ghi dữ liệu vào file Excel trong Python.

Cách cài openpyxl trong python

Cài openpyxl bằng pip install openpyxl

Các class hỗ trợ xử lý file excel trong module openpyxlpip trên màn hình Anaconda Prompt như sau:

Đọc file excel trong python | openpyxl

Hướng dẫn read excel python - đọc excel python

Đọc toàn bộ file excel bằng python

Đọc một sheet trong file excel bằng pythonpip như sau:

Đọc một ô trong file excel bằng python

Các class hỗ trợ xử lý file excel trong module openpyxl

Đọc file excel trong python | openpyxl

Đọc toàn bộ file excel bằng pythonĐọc một sheet trong file excel bằng python
Đọc một ô trong file excel bằng pythonĐọc các ô tại một phạm vi chỉ định trong sheet excel
Trích xuất dữ liệu từ file Excel bằng PythonTrích xuất toàn bộ giá trị các ô trong sheet excel bằng python
Lấy giá trị các ô tại một phạm vi chỉ định trong sheet excelĐếm số dòng có dữ liệu trong excel bằng python

Đếm số cột có dữ liệu trong excel bằng python

Đọc file excel trong python | openpyxl

Đọc toàn bộ file excel bằng python

Đọc một sheet trong file excel bằng python

Đọc một ô trong file excel bằng python

import openpyxl
import pprint
  • Đọc các ô tại một phạm vi chỉ định trong sheet excel

Trích xuất dữ liệu từ file Excel bằng Python

wb = openpyxl.load_workbook('./user/sample.xlsx')

Trích xuất toàn bộ giá trị các ô trong sheet excel bằng pythonworkbook object, chúng ta có thể dùng các phương thức tích hợp trong class workbook để xử lý file excel với object đó, ví dụ như lấy toàn bộ tên sheet trong excel:

print(wb.sheetnames)

Đọc một sheet trong file excel bằng python

Đọc một ô trong file excel bằng python

sheet = wb['Sheet1']

Đọc các ô tại một phạm vi chỉ định trong sheet excelworksheet object, chúng ta có thể truy cập tới một ô trong worksheet đó, ví như A2, B3.. bằng cách tạo ra một object của class cell chứa nội dung của ô đó như sau:

cellA2 = sheet['A2']
cellB3 = sheet['B3']

Đọc một ô trong file excel bằng python

Đọc các ô tại một phạm vi chỉ định trong sheet excelcell object, chúng ta có thể sử dụng các phương thức tích hợp trong class cell để xử lý object vừa tạo, ví dụ như lấy giá trị của ô đó:

cell = sheet['A2']
print(cell.value)

Trích xuất dữ liệu từ file Excel bằng Python

cell = sheet.cell(row=2, column=1)
print(cell.value)

Đọc các ô tại một phạm vi chỉ định trong sheet excel

Trích xuất dữ liệu từ file Excel bằng Pythonworksheet object đã tạo ở trên và lấy ra từ worksheet toàn bộ các ô trong phạm vi đó dưới dạng một tuple như sau:

cells_tuple = sheet['A2:C4']

pprint.pprint(cells_tuple)



Trích xuất toàn bộ giá trị các ô trong sheet excel bằng python

print(cells_tuple[0][1].value)


print(cells_tuple[0][0].value)

  • Lấy giá trị các ô tại một phạm vi chỉ định trong sheet excel

Đếm số dòng có dữ liệu trong excel bằng python

g = sheet.iter_rows(min_row=2, max_row=4, min_col=1, max_col=3)

print(type(g))


cells_list=list(g)

pprint.pprint(cells_list)



Đếm số cột có dữ liệu trong excel bằng python

wb = openpyxl.load_workbook('./user/sample.xlsx')
0
  • Tổng kết

Trích xuất dữ liệu từ file Excel bằng Python

Trích xuất toàn bộ giá trị các ô trong sheet excel bằng python

Bằng cách sử dụng thuộc tính

print(wb.sheetnames)

3 trong class Worksheet, chúng ta có thể tạo ra một generator - một hàm dùng để tạo ra các trình lặp trong python, rồi sau đó dùng class list để biến generator trên thành một list chứa toàn bộ giá trị các ô trong sheet excel như dưới đây:class Worksheet, chúng ta có thể tạo ra một generator - một hàm dùng để tạo ra các trình lặp trong python, rồi sau đó dùng class list để biến generator trên thành một list chứa toàn bộ giá trị các ô trong sheet excel như dưới đây:

wb = openpyxl.load_workbook('./user/sample.xlsx')
1

Chúng ta cũng có thể tự tạo ra một hàm lấy toàn bộ giá trị các ô trong sheet excel bằng cách sử dụng tới List comprehension trong python như sau:

wb = openpyxl.load_workbook('./user/sample.xlsx')
2

Với cả hai cách trên đều cho ra cùng kết quả, toàn bộ giá trị các ô trong sheet được lấy ra dưới dạng một list 2 chiều trong python như sau:list 2 chiều trong python như sau:

wb = openpyxl.load_workbook('./user/sample.xlsx')
3

Lấy giá trị các ô tại một phạm vi chỉ định trong sheet excel

Nếu chúng ta chỉ muốn lấy giá trị các ô tại một phạm vi chỉ định trong sheet excel, thay vì đọc toàn bộ sheet và lấy ra toàn bộ giá trị của ô trong đó, chúng ta chỉ cần đọc các ô tại một phạm vi chỉ định như Kiyoshi đã hướng dẫn ở trên, và sau đó lấy ra các giá trị của ô tồn tại trong phạm vi đó là xong.

wb = openpyxl.load_workbook('./user/sample.xlsx')
4

Kết quả, toàn bộ giá trị các ô tại phạm vi chỉ định trong sheet được lấy ra dưới dạng list hai chiều như sau:

wb = openpyxl.load_workbook('./user/sample.xlsx')
5

Đếm số dòng có dữ liệu trong excel bằng python

Để đếm số dòng có dữ liệu trong excel bằng python, chúng ta sử dụng thuộc tính max_row trong class Workbook với cú pháp sau đây:max_row trong class Workbook với cú pháp sau đây:

sheet.max_row

Ví dụ, chúng ta đếm số dòng có dữ liệu trong excel bằng python với mã lệnh sau đây:

wb = openpyxl.load_workbook('./user/sample.xlsx')
6

Ứng dụng sheet.max_row, chúng ta có thể tạo ra một hàm đếm số dòng có dữ liệu và lấy tất cả dữ liệu đó ra trừ dòng header như sau:

wb = openpyxl.load_workbook('./user/sample.xlsx')
7

Khi sử dụng hàm này, chúng ta chỉ cần chỉ định đối số là đường dẫn của file excel cần xử lý là xong.

wb = openpyxl.load_workbook('./user/sample.xlsx')
8

Đếm số cột có dữ liệu trong excel bằng python

Để đếm số cột có dữ liệu trong excel bằng python, chúng ta sử dụng thuộc tính max_column trong class Workbook với cú pháp sau đây:max_column trong class Workbook với cú pháp sau đây:

sheet.max_column

Ví dụ, chúng ta đếm số cột có dữ liệu trong excel bằng python với mã lệnh sau đây:

wb = openpyxl.load_workbook('./user/sample.xlsx')
9

Kết quả trả về sẽ là số cột lớn nhất có chứa dữ liệu trong file excel được chỉ định.

Tổng kết

Trên đây Kiyoshi đã hướng dẫn bạn về cách đọc file excel trong python rồi. Để nắm rõ nội dung bài học hơn, bạn hãy thực hành viết lại các ví dụ của ngày hôm nay nhé.đọc file excel trong python rồi. Để nắm rõ nội dung bài học hơn, bạn hãy thực hành viết lại các ví dụ của ngày hôm nay nhé.

Và hãy theo dõi tiếp bài viết Ghi dữ liệu vào file Excel trong Python để hoàn toàn làm chủ các thao tác xử lý file excel trong python nhé.

Viết bởi Kiyoshi. Đã đăng ký bản quyền tác giả tại Creativecommons và DMCA