Lưu ý rằng phương thức
import glob
print['all csv files in data directory:', glob.glob['data/*.csv']]
8 trả về một bộ dữ liệu với số lượng hàng và cột của khung dữ liệuDung dịch
import glob import pandas as pd fewest = float['Inf'] for filename in glob.glob['data/*.csv']: dataframe = pd.read_csv[filename] fewest = min[fewest, dataframe.shape[0]] print['smallest file has', fewest, 'records']
Có thể bạn đã chọn khởi tạo biến
9 với số lớn hơn số bạn đang xử lý, nhưng điều đó có thể dẫn đến rắc rối nếu bạn sử dụng lại mã với số lớn hơn. Python cho phép bạn sử dụng vô cực dương, sẽ hoạt động cho dù số của bạn lớn đến đâu. Hàmimport glob print['all csv files in data directory:', glob.glob['data/*.csv']]
0 nhận ra các chuỗi đặc biệt nào khác?all csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
So sánh dữ liệu
Viết chương trình đọc tập dữ liệu khu vực và vẽ biểu đồ GDP bình quân đầu người cho từng khu vực theo thời gian trong một biểu đồ
Dung dịch
Giải pháp này xây dựng chú thích hữu ích bằng cách sử dụng phương thức chuỗi
1 để trích xuấtall csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
2 từ đường dẫn 'data/gapminder_gdp_a_specific_region. csv'all csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
0data/gapminder_gdp_africa.csv gdpPercap_1952 298.846212 gdpPercap_1957 335.997115 gdpPercap_1962 355.203227 gdpPercap_1967 412.977514 ⋮ ⋮ ⋮ gdpPercap_1997 312.188423 gdpPercap_2002 241.165877 gdpPercap_2007 277.551859 dtype: float64 data/gapminder_gdp_asia.csv gdpPercap_1952 331 gdpPercap_1957 350 gdpPercap_1962 388 gdpPercap_1967 349 ⋮ ⋮ ⋮ gdpPercap_1997 415 gdpPercap_2002 611 gdpPercap_2007 944 dtype: float64
Xử lý đường dẫn tệp
Mô-đun
3 cung cấp các tóm tắt hữu ích cho thao tác tệp và đường dẫn như trả về tên của tệp mà không có phần mở rộng tệp. Điều này rất hữu ích khi lặp qua các tệp và thư mục. Trong ví dụ dưới đây, chúng tôi tạo một đối tượngall csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
4 và kiểm tra các thuộc tính của nóall csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
1data/gapminder_gdp_africa.csv gdpPercap_1952 298.846212 gdpPercap_1957 335.997115 gdpPercap_1962 355.203227 gdpPercap_1967 412.977514 ⋮ ⋮ ⋮ gdpPercap_1997 312.188423 gdpPercap_2002 241.165877 gdpPercap_2007 277.551859 dtype: float64 data/gapminder_gdp_asia.csv gdpPercap_1952 331 gdpPercap_1957 350 gdpPercap_1962 388 gdpPercap_1967 349 ⋮ ⋮ ⋮ gdpPercap_1997 415 gdpPercap_2002 611 gdpPercap_2007 944 dtype: float64
2data/gapminder_gdp_africa.csv gdpPercap_1952 298.846212 gdpPercap_1957 335.997115 gdpPercap_1962 355.203227 gdpPercap_1967 412.977514 ⋮ ⋮ ⋮ gdpPercap_1997 312.188423 gdpPercap_2002 241.165877 gdpPercap_2007 277.551859 dtype: float64 data/gapminder_gdp_asia.csv gdpPercap_1952 331 gdpPercap_1957 350 gdpPercap_1962 388 gdpPercap_1967 349 ⋮ ⋮ ⋮ gdpPercap_1997 415 gdpPercap_2002 611 gdpPercap_2007 944 dtype: float64
Gợi ý. Có thể kiểm tra tất cả các thuộc tính và phương thức có sẵn trên đối tượng
4 bằng hàmall csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
6all csv files in data directory: ['data/gapminder_all.csv', 'data/gapminder_gdp_africa.csv', \ 'data/gapminder_gdp_americas.csv', 'data/gapminder_gdp_asia.csv', 'data/gapminder_gdp_europe.csv', \ 'data/gapminder_gdp_oceania.csv']
Làm cách nào để đọc nhiều tệp csv trong python bằng vòng lặp?
Phương pháp 1. Vòng lặp For .Khởi tạo một danh sách trống. Chúng tôi làm điều này để lưu trữ kết quả của chúng tôi khi chúng tôi thực hiện chúng trong vòng lặp forCho-Mỗi tên tệp, đọc và nối thêm. Chúng tôi đọc sử dụng pd. read_csv[] , trả về một khung dữ liệu cho mỗi đường dẫn. .Kết hợp từng Khung dữ liệu. chúng tôi sử dụng pLàm cách nào để lặp qua csv Python?
Làm cách nào để đọc tệp CSV liên tiếp bằng Python? .Mở tệp 'sinh viên. .Tạo đối tượng trình đọc [trình lặp] bằng cách chuyển đối tượng tệp trong csv. .Bây giờ, khi chúng ta có đối tượng trình đọc này, là một trình lặp, sau đó sử dụng trình lặp này với vòng lặp for để đọc các hàng riêng lẻ của csv dưới dạng danh sách các giá trịLàm cách nào để đọc nhiều tệp CSV trong python bằng gấu trúc?
# Đọc tệp CSV từ Danh sách df = pd. concat[bản đồ[pd. .# Nhập thư viện nhập toàn cầu nhập gấu trúc dưới dạng pd # Nhận danh sách tệp CSV từ đường dẫn thư mục = '/apps/data_csv_files csv_files = global. .df = pd. .# Bằng cách sử dụng hàm def readcsv[args]. trả lại pd. .# Sử dụng dask nhập thư viện dữ liệuLàm cách nào để đọc nhiều tệp CSV trong python mà không cần gấu trúc?
Thư viện tích hợp sẵn của CSV Python có thể được sử dụng để đọc các tệp csv mà không cần sử dụng gấu trúc. Ở đây chúng ta đang sử dụng hàm reader[] để đọc dữ liệu từ tệp . Mặc dù load_csv[] là một chức năng hữu ích, nhưng nó có một số hạn chế. Trong khi đọc tệp, nó không xử lý các khoảng trống/hàng.