Mô-đun nào trong Python được sử dụng để xử lý tệp CSV?

Lần đầu tiên tôi bắt đầu làm việc với các tệp CSV khi học phần phụ trợ trong chương trình đào tạo bootcamp kỹ thuật phần mềm của mình. Mãi cho đến khi tôi bắt đầu đi sâu hơn vào phần khoa học dữ liệu trong quá trình học liên tục của mình, tôi mới bắt đầu sử dụng chúng một cách thường xuyên

CSV là viết tắt của các giá trị được phân tách bằng dấu phẩy và các tệp chứa tiện ích mở rộng

import pandas as pd
data = pd.read_csv("bwq.csv")
data
5 chứa một tập hợp các giá trị được phân tách bằng dấu phẩy được sử dụng để lưu trữ dữ liệu

Trong hướng dẫn này, chúng tôi sẽ sử dụng tập dữ liệu

import pandas as pd
data = pd.read_csv("bwq.csv")
data
6 công khai được lưu trữ trong tệp
import pandas as pd
data = pd.read_csv("bwq.csv")
data
7. Bạn có thể lấy tệp bằng cách tải xuống từ Kaggle, tuy nhiên, bạn sẽ có thể đọc bất kỳ tệp csv nào theo hướng dẫn bên dưới

Đọc tệp CSV bằng Python

Có hai cách phổ biến để đọc tệp

import pandas as pd
data = pd.read_csv("bwq.csv")
data
5 khi sử dụng Python. Đầu tiên bằng cách sử dụng thư viện
import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 và thứ hai bằng cách sử dụng thư viện
import pandas as pd
data = pd.read_csv("bwq.csv")
data
0

1. Sử dụng Thư viện CSV

import csv

with open("./bwq.csv", 'r') as file:
  csvreader = csv.reader(file)
  for row in csvreader:
    print(row)

Ở đây chúng tôi đang nhập thư viện

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 để sử dụng phương pháp
import pandas as pd
data = pd.read_csv("bwq.csv")
data
1 mà nó chứa để giúp chúng tôi đọc tệp
import pandas as pd
data = pd.read_csv("bwq.csv")
data
9

Từ khóa

import pandas as pd
data = pd.read_csv("bwq.csv")
data
3 cho phép chúng tôi mở và đóng tệp mà không cần phải đóng tệp một cách rõ ràng

Phương thức

import pandas as pd
data = pd.read_csv("bwq.csv")
data
4 nhận hai đối số kiểu
import pandas as pd
data = pd.read_csv("bwq.csv")
data
5. Đầu tiên là tên tệp và thứ hai là đối số chế độ. Chúng tôi đang sử dụng
import pandas as pd
data = pd.read_csv("bwq.csv")
data
6 để đọc, tuy nhiên điều này có thể được bỏ qua vì
import pandas as pd
data = pd.read_csv("bwq.csv")
data
6 được mặc định

Sau đó chúng tôi lặp lại trên tất cả các hàng

Bạn sẽ mong đợi một đầu ra trong thiết bị đầu cuối trông giống như thế này

Mô-đun nào trong Python được sử dụng để xử lý tệp CSV?
Đầu ra thiết bị đầu cuối Python

2. Sử dụng thư viện Pandas

import pandas as pd
data = pd.read_csv("bwq.csv")
data

Ở đây chúng tôi đang nhập Pandas, một thư viện Python được sử dụng để tiến hành thao tác và phân tích dữ liệu. Nó chứa phương thức

import pandas as pd
data = pd.read_csv("bwq.csv")
data
8 mà chúng tôi cần để đọc tệp
import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 của chúng tôi

Bạn nên mong đợi đầu ra trông giống như thế này

Mô-đun nào trong Python được sử dụng để xử lý tệp CSV?

Các vấn đề về dấu phân cách có thể xảy ra

Phần lớn các tệp

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 được phân tách bằng dấu phẩy, tuy nhiên, có một số tệp được phân tách bằng các ký tự khác, chẳng hạn như dấu hai chấm, có thể tạo ra kết quả lạ trong Python

Giải pháp cho dấu phân cách bằng thư viện CSV

Để thay đổi dấu phân cách bằng thư viện

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9, chỉ cần chuyển đối số
import csv

with open("./fileWithColonDelimeter.csv", 'r') as file:
  csvreader = csv.reader(file, delimiter=':')
  for row in csvreader:
    print(row)
2 trong phương thức
import csv

with open("./fileWithColonDelimeter.csv", 'r') as file:
  csvreader = csv.reader(file, delimiter=':')
  for row in csvreader:
    print(row)
3 như vậy

import csv

with open("./fileWithColonDelimeter.csv", 'r') as file:
  csvreader = csv.reader(file, delimiter=':')
  for row in csvreader:
    print(row)

Đối với các trường hợp cạnh khác khi đọc tệp

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 bằng thư viện
import pandas as pd
data = pd.read_csv("bwq.csv")
data
9, hãy xem trang này trong tài liệu Python

Giải pháp cho dấu phân cách bằng thư viện Pandas

Để thay đổi dấu phân cách bằng thư viện

import pandas as pd
data = pd.read_csv("bwq.csv")
data
0, chỉ cần chuyển đối số
import csv

with open("./fileWithColonDelimeter.csv", 'r') as file:
  csvreader = csv.reader(file, delimiter=':')
  for row in csvreader:
    print(row)
2 trong phương thức
import csv

with open("./fileWithColonDelimeter.csv", 'r') as file:
  csvreader = csv.reader(file, delimiter=':')
  for row in csvreader:
    print(row)
8 như vậy

import pandas as pd
data = pd.read_csv("bwq.csv")
data
4

Đối với các trường hợp cạnh khác khi đọc tệp

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9 bằng thư viện Pandas, hãy xem trang này tài liệu Pandas

Tiếp theo

Để có hướng dẫn chi tiết hơn về những gì bạn có thể làm sau khi đọc tệp

import pandas as pd
data = pd.read_csv("bwq.csv")
data
9, hãy xem Plotting Precipitation with Python, Pandas and Matplotlib của Alex Couture-Beil

Mô-đun nào nên được sử dụng để truy cập tệp CSV?

Mô-đun CSV Python . Để đọc/ghi dữ liệu, bạn cần lặp qua các hàng của CSV. Bạn cần sử dụng phương pháp tách để lấy dữ liệu từ các cột được chỉ định.

Mô-đun CSV có được bao gồm trong Python không?

Mô-đun csv được tích hợp trong thư viện chuẩn của Python do PEP 305 . Nó trình bày các lớp và phương thức để thực hiện thao tác đọc/ghi trên tệp CSV theo khuyến nghị của PEP 305. CSV là định dạng dữ liệu xuất ưa thích của phần mềm bảng tính Excel của Microsoft.