Hướng dẫn how does pandas read excel files in jupyter? - Làm thế nào để gấu trúc đọc tệp excel trong jupyter?

Tương tự, chúng tôi có thể tải các tệp Microsoft Excel dễ dàng như vậy. Ví dụ: tệp Excel cho cùng một bộ dữ liệu Titanic có sẵn tại Vandebilt.edu [liên kết đầy đủ trong tập lệnh sau]. Chúng tôi có tập lệnh sau:

import pandas as pd
df = pd.read_excel['//biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.xls']
print [df.head]  

Ngoài ra còn có một bộ tham số tùy chọn rộng rãi để đọc các tệp Excel, ví dụ:

  • Chọn trang tính trong tệp Excel để đọc
  • Bỏ qua hàng
  • Chỉ định việc xử lý các giá trị Na

Dòng kết quả dưới Jupyter như sau. Bộ dữ liệu trông rất giống với tệp CSV trước được đọc trong.

Bạn có thể dễ dàng nhập một tệp excel vào Python bằng gấu trúc. Để thực hiện mục tiêu này, bạn sẽ cần sử dụng read_excel:

import pandas as pd

df = pd.read_excel[r'Path where the Excel file is stored\File name.xlsx']
print[df]

Lưu ý rằng đối với phiên bản Excel trước đó, bạn có thể cần sử dụng phần mở rộng tệp của ‘XLS,

Và nếu bạn có một bảng Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng:Excel sheet that you’d like to import, you may then apply:

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]

Bây giờ, hãy xem xét một ví dụ bao gồm dữ liệu sẽ được nhập vào Python.

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là ‘Danh sách sản phẩm‘]:Product List‘]:

Sản phẩm Giá bán
Máy tính desktop700
Máy tính bảng250
Máy in120
Máy tính xách tay1200

Sau đó, bạn sẽ nhập dữ liệu trên vào Python như thế nào?

Bạn có thể làm theo các bước dưới đây để nhập tệp Excel vào Python.

Bước 1: Chụp đường dẫn tệp

Đầu tiên, bạn sẽ cần phải chụp toàn bộ đường dẫn nơi tệp Excel được lưu trữ trên máy tính của bạn.

Ví dụ, hãy để giả sử rằng một tệp excel được lưu trữ theo đường dẫn sau:

C: \ Users \ Ron \ Desktop \ Sản phẩm Danh sách.xlsxProduct List.xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn.

Don Tiết quên bao gồm tên tệp [trong ví dụ của chúng tôi, nó ‘Danh sách sản phẩm‘ như được tô sáng màu xanh]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, nó ‘.xlsx‘ như được tô sáng màu xanh lá cây].Product list‘ as highlighted in blue]. You’ll also need to include the Excel file extension [in our case, it’s ‘.xlsx‘ as highlighted in green].

Bước 2: Áp dụng mã Python

Và đây là mã Python cho ví dụ của chúng tôi:

import pandas as pd

df = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx']
print[df]

Lưu ý rằng bạn nên đặt ra R R R trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\. Ngoài ra, don không quên đặt tên tệp ở cuối đường dẫn + .xlsx, that you should place “r” before the path string to address special characters, such as ‘\’. In addition, don’t forget to put the file name at the end of the path + ‘.xlsx’

Bước 3: Chạy mã Python để nhập tệp Excel

Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được bộ dữ liệu sau:

            Product  Price
0  Desktop Computer    700
1            Tablet    250
2           Printer    120
3            Laptop   1200

Lưu ý rằng chúng tôi có kết quả giống như những kết quả được lưu trữ trong tệp Excel.

Lưu ý: Bạn sẽ phải cài đặt gói bổ sung nếu bạn gặp lỗi sau khi chạy mã:: you will have to install an additional package if you get the following error when running the code:

Bước nhập khẩu: Thiếu phụ thuộc tùy chọn ‘XLRD

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt OpenPyXL cho các tệp .xlsx:

pip install openpyxl

Bước tùy chọn: Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc cột cụ thể từ tệp Excel?

Ví dụ: nếu bạn muốn chỉ chọn cột sản phẩm thì sao? Nếu trường hợp đó, bạn có thể chỉ định tên cột này như đã bị bắt dưới đây:

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx'] 
df = pd.DataFrame[data, columns=['Product']]
print[df]

Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột sản phẩm:

            Product
0  Desktop Computer
1            Tablet
2           Printer
3            Laptop

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của họ bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột sản phẩm và giá cả, bạn có thể sử dụng cú pháp này:

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx'] 
df = pd.DataFrame[data, columns=['Product', 'Price']]
print[df]

Bạn cần phải đảm bảo rằng các tên cột được chỉ định trong mã khớp chính xác với các tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NAN.

Sự kết luận

Bạn chỉ thấy cách nhập một tệp excel vào Python bằng gấu trúc.

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu trường hợp đó, bạn có thể muốn kiểm tra hướng dẫn sau đây rằng & nbsp; giải thích cách nhập tệp CSV vào Python bằng Pandas.

Bạn cũng có thể kiểm tra tài liệu Pandas & nbsp; để tìm ra & nbsp; thêm về các tùy chọn khác nhau mà bạn có thể áp dụng liên quan đến read_excel.

Làm thế nào để gấu trúc đọc các tệp excel trong máy tính xách tay Jupyter?

Dòng kết quả dưới Jupyter như sau. Bộ dữ liệu trông rất giống với tệp CSV trước được đọc. Nhận Jupyter cho khoa học dữ liệu ngay bây giờ với nền tảng học tập O'Reilly ...
Chọn trang tính trong tệp Excel để đọc ..
Bỏ qua hàng ..
Chỉ định xử lý các giá trị NA ..

Làm thế nào để gấu trúc đọc tệp excel?

Như được hiển thị ở trên, cách dễ nhất để đọc một tệp excel sử dụng gấu trúc là chỉ cần chuyển trong tệp filepath vào tệp excel.Tham số IO = là tham số đầu tiên, vì vậy bạn có thể chỉ cần chuyển trong chuỗi vào tệp.Cái này là cái gì?Tham số chấp nhận cả một đường dẫn đến một tệp, đường dẫn HTTP, đường dẫn FTP trở lên.passing in the filepath to the Excel file. The io= parameter is the first parameter, so you can simply pass in the string to the file. What is this? The parameter accepts both a path to a file, an HTTP path, an FTP path or more.

Làm thế nào để tôi có được gấu trúc để đọc các tệp xlsx?

Sử dụng hàm pandas.read_excel [] để đọc bảng excel vào gấu trúc DataFrame, theo mặc định, nó tải bảng đầu tiên từ tệp excel và phân tích lại hàng đầu tiên dưới dạng tên cột DataFrame.Tệp Excel có một phần mở rộng.XLSX. read_excel[] function to read excel sheet into pandas DataFrame, by default it loads the first sheet from the excel file and parses the first row as a DataFrame column name. Excel file has an extension . xlsx.

Pandas có thể đọc một tệp excel mở không?

Đọc một tập tin Excel vào một bản dữ liệu gấu trúc.Hỗ trợ XLS, XLSX, XLSM, XLSB, ODF, ODF và Tệp ODT được đọc từ hệ thống tập tin hoặc URL cục bộ.Hỗ trợ một tùy chọn để đọc một tờ hoặc một danh sách các tờ.. Supports xls , xlsx , xlsm , xlsb , odf , ods and odt file extensions read from a local filesystem or URL. Supports an option to read a single sheet or a list of sheets.

Chủ Đề