Pandas có đọc được file excel nhiều sheet không?

Đọc file Excel (phần mở rộng. xlsx,. xls) với Python Pandas. Để đọc tệp excel dưới dạng DataFrame, hãy sử dụng phương pháp pandas

1
2
3
4
5
2

Bạn có thể đọc trang đầu tiên, trang cụ thể, nhiều trang hoặc tất cả các trang. Pandas chuyển đổi cấu trúc này thành cấu trúc DataFrame, đây là cấu trúc dạng bảng

khóa học liên quan. Phân tích dữ liệu với Python Pandas

Excel

Trong bài viết này, chúng tôi sử dụng một tệp Excel ví dụ. Các chương trình chúng tôi sẽ thực hiện để đọc Excel thành Python

Tạo một file excel gồm 2 sheet sheet1 và sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets

Nội dung của từng cái như sau

tờ1

Pandas có đọc được file excel nhiều sheet không?

tờ2

Pandas có đọc được file excel nhiều sheet không?

Cài đặt xlrd

gấu trúc. . read_excel một. ) sử dụng thư viện có tên xlrd trong nội bộ

xlrd là một thư viện để đọc (nhập) tệp Excel (. xlsx,. xls) bằng Python

bài viết liên quan. Cách dùng xlrd, xlwt đọc ghi file Excel bằng Python

Nếu bạn gọi gấu trúc. read_excel s() trong môi trường chưa cài đặt xlrd, bạn sẽ nhận được thông báo lỗi tương tự như sau

Nhập Lỗi. Cài đặt xlrd >= 0. 9. 0 để được hỗ trợ Excel

xlrd có thể được cài đặt bằng pip. (pip3 tùy thuộc vào môi trường)

1
$ pip install xlrd

đọc excel

Chỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên.
Nếu có nhiều trang tính, gấu trúc chỉ sử dụng trang tính đầu tiên.
Nó đọc là DataFrame.

1
2
3
4
5
import pandas as pd

df = pd.read_excel('sample.xlsx')

print(df)

Đoạn code trên xuất ra nội dung sheet excel

1
2
3
4
  Unnamed: 0   A   B   C
0 one 11 12 13
1 two 21 22 23
2 three 31 32 33

Nhận trang tính

Bạn có thể chỉ định trang tính để đọc với đối số sheet_name

Chỉ định theo số (bắt đầu từ 0)

1
2
3
df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)

print(df_sheet_index)
1
2
3
4
1
0

Chỉ định theo tên trang tính

1
2
3
$ pip install xlrd
1____5
1
0

Tải nhiều tờ

Cũng có thể chỉ định một danh sách trong đối số sheet_name. Nó là OK ngay cả khi nó là một số 0 bắt đầu hoặc tên trang tính

Số hoặc tên trang tính được chỉ định là khóa chính và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển được đặt hàng OrderedDict với giá trị giá trị

Trong bài viết trước, chúng tôi đã đề cập đến cách đọc tệp Excel bằng Python. Ở đây, chúng tôi sẽ cố gắng đọc nhiều trang tính Excel (từ cùng một tệp) với gấu trúc Python. Chúng ta có thể làm điều này theo hai cách. sử dụng phương pháp

$ pip install xlrd
7, với đối số tùy chọn
$ pip install xlrd
8;

pd. phương thức read_excel()

Trong ví dụ dưới đây

  • Chọn trang tính để đọc theo chỉ mục.
    1
    2
    3
    4
    5
    0 có nghĩa là ba tờ đầu tiên
  • Chọn trang tính để đọc theo tên.
    1
    50. Phương pháp này yêu cầu bạn phải biết trước tên trang tính
  • Chọn tất cả các sheet. sheet_name = Không có
1
6

Chúng tôi sẽ đọc tất cả các trang tính từ tệp Excel mẫu, sau đó sử dụng khung dữ liệu đó cho các ví dụ về sau

1
51 trả về một từ điển các khung dữ liệu.
1
52 của từ điển chứa tên trang tính và
1
53 của từ điển chứa nội dung trang tính

1
5

Để lấy dữ liệu từ một trang tính cụ thể, chỉ cần tham khảo khóa trong từ điển. Ví dụ:

1
54 trả về trang tính trong đó dữ liệu bắt đầu từ hàng 5

$ pip install xlrd
2

pd. Tệp Excel()

Với cách làm này, chúng ta tạo một đối tượng

$ pip install xlrd
9 để biểu diễn tệp Excel. Chúng tôi không cần chỉ định trang nào sẽ đọc khi sử dụng phương pháp này. Lưu ý rằng phương thức read_excel() trước đó trả về một khung dữ liệu hoặc một từ điển các khung dữ liệu;

$ pip install xlrd
4

Để lấy tên trang tính, chúng ta có thể sử dụng tất cả thuộc tính

1
57 từ đối tượng
1
58, thuộc tính này trả về danh sách tên trang tính (chuỗi)

Bạn có thể kéo dữ liệu từ nhiều trang tính trong Excel không?

Trên tab Dữ liệu, bên dưới Công cụ, bấm Hợp nhất. Trong hộp Hàm, hãy bấm vào hàm mà bạn muốn Excel sử dụng để hợp nhất dữ liệu. Trong mỗi trang nguồn, hãy chọn dữ liệu của bạn rồi bấm vào Thêm. Đường dẫn tệp được nhập trong Tất cả tài liệu tham khảo

Làm cách nào tôi có thể đọc nhiều tệp xlsx trong gấu trúc?

Làm cách nào để nối dữ liệu Excel từ Nhiều tệp bằng Pandas? .
Yêu cầu hệ thống
Bước 1. Nhập các mô-đun
Bước 2. Đọc các tệp Excel
Bước 3. Tham gia các hoạt động trên các khung dữ liệu
Bước 4. ghi kết quả vào tệp csv

Làm cách nào để so sánh hai trang tính Excel bằng gấu trúc?

Làm cách nào để so sánh hai cột trong cùng một bảng tính Excel bằng cách sử dụng gấu trúc? .
cú pháp. Khung dữ liệu. bằng (khác)
Thông số. OtherSeries hoặc DataFrame. Sê-ri hoặc Khung dữ liệu khác được so sánh với Sê-ri hoặc Khung dữ liệu đầu tiên
trả lại. bool Đúng nếu tất cả các phần tử đều giống nhau trong cả hai đối tượng, Sai nếu không