Mô-đun nào trong Python được sử dụng để xử lý tệp CSV?
Lần đầu tiên tôi bắt đầu làm việc với các tệp CSV khi học phần phụ trợ trong chương trình đào tạo bootcamp kỹ thuật phần mềm của mình. Mãi cho đến khi tôi bắt đầu đi sâu hơn vào phần khoa học dữ liệu trong quá trình học liên tục của mình, tôi mới bắt đầu sử dụng chúng một cách thường xuyên Show
CSV là viết tắt của các giá trị được phân tách bằng dấu phẩy và các tệp chứa tiện ích mở rộng 5 chứa một tập hợp các giá trị được phân tách bằng dấu phẩy được sử dụng để lưu trữ dữ liệuTrong hướng dẫn này, chúng tôi sẽ sử dụng tập dữ liệu 6 công khai được lưu trữ trong tệp 7. Bạn có thể lấy tệp bằng cách tải xuống từ Kaggle, tuy nhiên, bạn sẽ có thể đọc bất kỳ tệp csv nào theo hướng dẫn bên dướiĐọc tệp CSV bằng PythonCó hai cách phổ biến để đọc tệp 5 khi sử dụng Python. Đầu tiên bằng cách sử dụng thư viện 9 và thứ hai bằng cách sử dụng thư viện 01. Sử dụng Thư viện CSV
Ở đây chúng tôi đang nhập thư viện 9 để sử dụng phương pháp 1 mà nó chứa để giúp chúng tôi đọc tệp 9Từ khóa 3 cho phép chúng tôi mở và đóng tệp mà không cần phải đóng tệp một cách rõ ràngPhương thức 4 nhận hai đối số kiểu 5. Đầu tiên là tên tệp và thứ hai là đối số chế độ. Chúng tôi đang sử dụng 6 để đọc, tuy nhiên điều này có thể được bỏ qua vì 6 được mặc địnhSau đó chúng tôi lặp lại trên tất cả các hàng Bạn sẽ mong đợi một đầu ra trong thiết bị đầu cuối trông giống như thế này Đầu ra thiết bị đầu cuối Python2. Sử dụng thư viện Pandas
Ở đây chúng tôi đang nhập Pandas, một thư viện Python được sử dụng để tiến hành thao tác và phân tích dữ liệu. Nó chứa phương thức 8 mà chúng tôi cần để đọc tệp 9 của chúng tôiBạn nên mong đợi đầu ra trông giống như thế này Các vấn đề về dấu phân cách có thể xảy raPhần lớn các tệp 9 được phân tách bằng dấu phẩy, tuy nhiên, có một số tệp được phân tách bằng các ký tự khác, chẳng hạn như dấu hai chấm, có thể tạo ra kết quả lạ trong PythonGiải pháp cho dấu phân cách bằng thư viện CSVĐể thay đổi dấu phân cách bằng thư viện 9, chỉ cần chuyển đối số 2 trong phương thức 3 như vậy
Đối với các trường hợp cạnh khác khi đọc tệp 9 bằng thư viện 9, hãy xem trang này trong tài liệu PythonGiải pháp cho dấu phân cách bằng thư viện PandasĐể thay đổi dấu phân cách bằng thư viện 0, chỉ cần chuyển đối số 2 trong phương thức 8 như vậy 4Đối với các trường hợp cạnh khác khi đọc tệp 9 bằng thư viện Pandas, hãy xem trang này tài liệu PandasTiếp theoĐể có hướng dẫn chi tiết hơn về những gì bạn có thể làm sau khi đọc tệp 9, hãy xem Plotting Precipitation with Python, Pandas and Matplotlib của Alex Couture-Beil
Mô-đun nào nên được sử dụng để truy cập tệp CSV?Mô-đun CSV Python
. Để đọc/ghi dữ liệu, bạn cần lặp qua các hàng của CSV. Bạn cần sử dụng phương pháp tách để lấy dữ liệu từ các cột được chỉ định.
Mô-đun CSV có được bao gồm trong Python không?Mô-đun csv được tích hợp trong thư viện chuẩn của Python do PEP 305 . Nó trình bày các lớp và phương thức để thực hiện thao tác đọc/ghi trên tệp CSV theo khuyến nghị của PEP 305. CSV là định dạng dữ liệu xuất ưa thích của phần mềm bảng tính Excel của Microsoft. |