Mô-đun glob
là một phần hữu ích của thư viện chuẩn Python. glob
[viết tắt của toàn cầu] được sử dụng để trả về tất cả các đường dẫn tệp khớp với một mẫu cụ thể
Chúng ta có thể sử dụng glob
để tìm kiếm một mẫu tệp cụ thể hoặc có lẽ hữu ích hơn là tìm kiếm các tệp có tên tệp khớp với một mẫu nhất định bằng cách sử dụng các ký tự đại diện
Theo Wikipedia, “glob
mẫu chỉ định bộ tên tệp có ký tự đại diện”
Các mẫu này tương tự như biểu thức chính quy nhưng đơn giản hơn nhiều
- Dấu hoa thị [*]. Khớp không hoặc nhiều ký tự
- Dấu chấm hỏi [?] khớp chính xác với một ký tự
Mặc dù có thể sử dụng glob
để tìm kiếm một tệp có tên tệp cụ thể, nhưng tôi thấy nó đặc biệt hữu ích khi đọc trong một số tệp có tên tương tự. Sau khi xác định các tệp này, chúng có thể được nối vào một khung dữ liệu để phân tích thêm
Ở đây chúng tôi có một thư mục đầu vào với một số tệp csv chứa dữ liệu chứng khoán. Hãy sử dụng toàn cầu để xác định các tệp
Ví dụ toàn cầuỞ đây chúng tôi đọc tất cả các tệp csv trong thư mục đầu vào của bạn và ghép chúng vào một khung dữ liệu
Chúng ta có thể thấy một vấn đề nhỏ với điều này trong đầu ra mẫu bên dưới — chúng ta không biết hàng đó thuộc về tệp nào. Mã cổ phiếu chỉ là tên của mỗi tệp và không được bao gồm trong khung dữ liệu được nối của chúng tôi