Hầu hết các lần trong Python, bạn chỉ cần nhập chỉ một tệp bằng pandas bởi pd.read [tên tệp] hoặc sử dụng hàm open [] và đọc [] mặc định. Nhưng tin tức flash, bạn thực sự có thể làm nhiều hơn nữa !! Trong bài viết này, tôi sẽ chỉ cho bạn cách nhập nhiều tệp vào IDE Python của bạn.
Xin lưu ý rằng IDE tôi đã sử dụng cho quá trình này là Jupyter Notebook.
Pandas có thể được sử dụng để đọc một số loại tệp nhất định như được chỉ định trong Jupyter Notebook. Các loại tệp này bao gồm:
1. Clipboard
2. CSV
3. Excel
4. Lông
5. FWF
6. GBQ
7. HDF
8. HTML
9. Json
10. MSGPACK
11. Parquet
12. Sas
13. SQL
14. Truy vấn SQL
15. Bảng SQL
16. Stata
17. Bảng
Để xem danh sách này trong sổ ghi chép Jupyter của bạn. Đây là tất cả những gì bạn phải làm.
1. Hãy chắc chắn rằng bạn đã cài đặt gấu trúc
pip install pandas
2. Nhập Gandas vào sổ ghi chép Jupyter của bạn
Import pandas as pd
3. Cố gắng đọc tệp của bạn và kiểm tra các định dạng tệp khác có thể đọc trong Python
Data = pd.read_#fileformat[filename]
[#FileFormat chỉ là người giữ vị trí cho định dạng tệp]
Sau khi gạch dưới [_] Nhấn phím tab trên bàn phím của bạn.
Nhập nhiều tệp trong Python
Nhập nhiều tệp trong Python được thực hiện với một mô -đun gọi là GLOBGLOB
GLOB là một mô -đun giúp nhập bất kỳ định dạng tệp nào vào Notebook Python. Nó được sử dụng với một số ký tự đại diện để nhập các loại tệp cụ thể để ngăn chặn nhập các tệp không cần thiết không cần thiết trong sổ ghi chép Python của bạn.
Để cài đặt GLOB, bạn phải chạy lệnh PIP trong dấu nhắc lệnh hoặc lời nhắc Anaconda
Pip install glob3
Nhập Glob vào Python [Anaconda]mporting glob into python [Anaconda]
Import glob
Nhập tất cả các tệp trong thư mục hiện tại của bạn
Myfiles = [I for in glob.glob[‘*’]] Note: * is a wildcard which denotes all. This takes all the files in that current directory into python.
Nhập tất cả các định dạng tệp Excel trong Python
Myfiles = [I for in glob.glob[‘*.xlsx’]]
Mã trên cũng có thể được viết theo cách mặc định như hình dưới đây:
Myfiles = [] [This is an empty list]
Tạo vòng lặp cho vòng lặp
For each_file in glob.glob[‘*.xlsx’]: Myfiles.append[each_file]Print[Myfiles]
Điều này sẽ cung cấp cho bạn tất cả các tệp Excel trong thư mục hiện tại của bạn.
Trong các trường hợp có các trường như data1.xlsx, data2.xlsx, data3.xlsx, data21.xlsx, data22.xlsx, e.t.c; Chúng ta có thể sử dụng một ký tự đại diện [?] Để chọn một số tệp nhất định.
Mynewfiles = [] For each_file in glob.glob[‘data?.xlsx’]: Mynewfiles.append[each_file]Print[Mynewfiles]
Mã trên sẽ cung cấp cho chúng tôi các tệp có tên Data1.xlsx, Data2.xlsx, Data3.xlsx mà không có data21.xlsx, data22.xlsx mặc dù nó là định dạng excel [.xlsx]
Nhập tệp với một loạt các số
Import pandas as pd
0Điều này sẽ trả về các tệp với các giá trị số trong vị trí được chỉ định trong phạm vi được chỉ định.
Người giữ chỗ
Sử dụng trình giữ chỗ có thể thú vị chỉ để làm cho mã của bạn dễ đọc và dễ hiểu hơn.
Kết hợp {} và .format giúp đạt được điều này.
Chỉ nhập các tệp CSV
Import pandas as pd
1Hầu hết các lần, nó được ưu tiên để định dạng tệp của bạn được gán cho một biến.
Nhập tệp XML
Import pandas as pd
2Bạn có thể nhập bất kỳ định dạng tệp nào vào Python bằng phương thức trên Python.
Để đọc các tệp này, bạn có thể sử dụng các chức năng mở và đọc trong Python như đã thấy dưới đây:
Import pandas as pd
3Điều này sẽ trả về nội dung của tệp [tệp XML].
4
Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm.
Learn more.
Tôi có một thư mục đầy đủ các tài liệu văn bản, văn bản cần được tải vào một biến danh sách duy nhất.
Mỗi chỉ mục của danh sách, phải là văn bản đầy đủ của mỗi tài liệu.
Cho đến nay tôi có mã này, nhưng nó cũng không hoạt động.
Import pandas as pd
4Có cách nào tốt hơn để làm điều này?
Chỉnh sửa: Thay thế hàm đọc CSV [Data = pd.read_#fileformat[filename]
2] bằng hàm đọc văn bản [Data = pd.read_#fileformat[filename]
3]. Replaced the csv reading function [
Data = pd.read_#fileformat[filename]
2] with text reading function [Data = pd.read_#fileformat[filename]
3].
hỏi ngày 23 tháng 2 năm 2017 lúc 5:43Feb 23, 2017 at 5:43
0
Bạn chỉ cần
Data = pd.read_#fileformat[filename]
4 mỗi tệp và nối nó vào danh sách Data = pd.read_#fileformat[filename]
5 của bạn như sau:Import pandas as pd
5Mỗi mục nhập danh sách sau đó sẽ là toàn bộ nội dung của mỗi tệp văn bản. Lưu ý, sử dụng
Data = pd.read_#fileformat[filename]
3 sẽ cung cấp cho bạn một danh sách các dòng cho mỗi tệp thay vì văn bản thô.Với một danh sách tổng hợp
Import pandas as pd
6Cách tiếp cận này mặc dù có thể kết thúc với việc sử dụng nhiều tài nguyên hơn vì không có phần
Data = pd.read_#fileformat[filename]
7 để tự động đóng mỗi tệp.Đã trả lời ngày 23 tháng 2 năm 2017 lúc 7:54Feb 23, 2017 at 7:54
Martin Evansmartin EvansMartin Evans
44.4K16 Huy hiệu vàng80 Huy hiệu bạc91 Huy hiệu đồng16 gold badges80 silver badges91 bronze badges
2
- Giải quyết vấn đề này bằng mô -đun
Data = pd.read_#fileformat[filename]
8, coi các đường dẫn là đối tượng bằng các phương thức. - Sử dụng
Data = pd.read_#fileformat[filename]
9 để tạo đối tượngData = pd.read_#fileformat[filename]
8 của đường dẫn [hoặc sử dụngPip install glob3
1] và sử dụngPip install glob3
2 [hoặcPip install glob3
3] để tìm các tệp phù hợp với mẫu cụ thể.Pip install glob3
4Pip install glob3
5 được sử dụng để thêm các thư mục [mở rộng] vào đối tượngData = pd.read_#fileformat[filename]
8.
- Giải pháp thay thế:
Pip install glob3
7Pip install glob3
8
Pip install glob3
9 có thể được sử dụng để đọc văn bản thànhImport glob
0, mà không cần sử dụngImport glob
1. Các tập tin được mở và sau đó đóng.The file is opened and then closed.Import glob
2- Giải pháp thay thế:
Import glob
3Pip install glob3
9 có thể được sử dụng để đọc văn bản thànhImport glob
0, mà không cần sử dụngImport glob
1. Các tập tin được mở và sau đó đóng.
Import pandas as pd
7Import glob
4 - Tạo một Import glob
0 của Import glob
6 của văn bản.
Import glob
7 Thay thế
Import pandas as pd
8lựa chọn 1
- Lựa chọn 2
Import pandas as pd
9Import glob
8 vớiImport glob
9 có thể được sử dụng để mở và đọc văn bản tệp vào một danh sách và đóng tệp.
Cũng xem như vậy: Cách mở mọi tệp trong thư mụcDec 31, 2020 at 20:08
Đã trả lời ngày 31 tháng 12 năm 2020 lúc 20:08Trenton McKinney
Trenton McKinneyTrenton McKinney31 gold badges119 silver badges131 bronze badges
48.7K31 Huy hiệu vàng119 Huy hiệu bạc131 Huy hiệu đồng
Data = pd.read_#fileformat[filename]
0Tôi thấy đây là một cách dễ dàng hơn:Jun 3, 2020 at 12:23
Data = pd.read_#fileformat[filename]
1
Đã trả lời ngày 3 tháng 6 năm 2020 lúc 12:23
Nam G Vu67 gold badges222 silver badges357 bronze badges
31.7K67 Huy hiệu vàng222 Huy hiệu bạc357 Huy hiệu đồngDec 17, 2018 at 8:04
1