Mục lục
2 phút đọc & nbsp; & nbsp; Cập nhật: ngày 21 tháng 2 năm 2022
Tệp CSV là gì
Lần đầu tiên tôi bắt đầu làm việc với các tệp CSV khi lấy phần phụ trợ của chương trình giảng dạy bootcamp kỹ thuật phần mềm của mình. Đó là cho đến khi tôi bắt đầu đi sâu hơn vào phần khoa học dữ liệu của tôi tiếp tục học rằng tôi bắt đầu sử dụng chúng một cách thường xuyên.
CSV là viết tắt của các giá trị được phân tách bằng dấu phẩy và các tệp chứa tiện ích mở rộng .csv
chứa một bộ sưu tập các giá trị được phân tách bằng dấu phẩy được sử dụng để lưu trữ dữ liệu.
Trong hướng dẫn này, chúng tôi sẽ sử dụng tập dữ liệu công khai Beach Water Quality
được lưu trữ trong tệp bwq.csv
. Bạn có thể lấy tệp bằng cách tải xuống từ Kaggle, tuy nhiên, bạn sẽ có thể đọc bất kỳ tệp CSV nào theo các hướng dẫn bên dưới.
Đọc tệp CSV bằng Python
Có hai cách phổ biến để đọc một tệp .csv
khi sử dụng Python. Đầu tiên bằng cách sử dụng thư viện csv
và lần thứ hai bằng cách sử dụng thư viện pandas
.
1. Sử dụng thư viện CSV
import csv
with open["./bwq.csv", 'r'] as file:
csvreader = csv.reader[file]
for row in csvreader:
print[row]
Ở đây chúng tôi đang nhập thư viện csv
để sử dụng phương thức
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
1 mà nó chứa để giúp chúng tôi đọc tệp csv
.Từ khóa
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
3 cho phép chúng tôi mở và đóng tệp mà không phải đóng rõ ràng nó.Phương pháp
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
4 có hai đối số loại import pandas as pd
data = pd.read_csv["bwq.csv"]
data
5. Đầu tiên tên tệp và đối số chế độ thứ hai. Chúng tôi đang sử dụng import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 để đọc, tuy nhiên điều này có thể được bỏ qua vì import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 được giả định theo mặc định.Sau đó chúng tôi lặp lại trên tất cả các hàng.
Bạn nên mong đợi một đầu ra trong thiết bị đầu cuối trông giống như thế này:
Đầu ra đầu cuối Python2. Sử dụng thư viện Pandas
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
Ở đây, chúng tôi đang nhập Pandas, một thư viện Python được sử dụng để tiến hành thao tác và phân tích dữ liệu. Nó chứa phương thức
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
8 chúng ta cần để đọc tệp csv
của chúng ta.Bạn nên mong đợi đầu ra sẽ trông giống như thế này:
Các vấn đề phân định có thể có
Phần lớn các tệp csv
được phân tách bằng dấu phẩy, tuy nhiên, có một số tệp được phân tách bởi các ký tự khác, như các dấu chấm, ví dụ, có thể đưa ra kết quả kỳ lạ trong Python.
Giải pháp cho các dấu phân cách sử dụng thư viện CSV
Để thay đổi dấu phân cách sử dụng thư viện csv
, chỉ cần truyền trong đối số
import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
2 trong phương thức import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
3 như vậy:import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
Đối với các trường hợp cạnh khác trong việc đọc các tệp csv
bằng thư viện csv
, hãy xem trang này trong tài liệu Python.
Giải pháp cho các phân định bằng thư viện Pandas
Để thay đổi dấu phân cách sử dụng thư viện pandas
, chỉ cần truyền trong đối số
import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
2 trong phương thức import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
8 như vậy:import pandas as pd
data = pd.read_csv["fileWithColonDelimeter.csv", delimiter= ':']
data
Đối với các trường hợp cạnh khác trong việc đọc các tệp csv
bằng thư viện Pandas, hãy xem trang này các tài liệu Pandas.
Tiếp theo
Để biết thêm về hướng dẫn sâu sắc về những gì bạn có thể làm sau khi đọc tệp csv
, hãy xem âm mưu kết tủa với Python, Pandas và Matplotlib của Alex Couture-Beil.
Trong khi bạn ở đây:
Trái đất là khung CI/CD dễ dàng. Phát triển đường ống CI/CD cục bộ và chạy chúng ở bất cứ đâu!
Develop CI/CD pipelines locally and run them anywhere!
Nhận thông báo về các bài viết mới!
Chúng tôi sẽ không gửi cho bạn thư rác. Hủy đăng ký bất cứ lúc nào.