Tệp CSV [Giá trị được phân tách bằng dấu phẩy] là tệp có các giá trị được phân tách bằng dấu phẩy. Nó thường được sử dụng để nhập và xuất với cơ sở dữ liệu và bảng tính
Các giá trị hầu hết được phân tách bằng dấu phẩy. Đôi khi một ký tự khác được sử dụng như dấu chấm phẩy, ký tự ngăn cách được gọi là dấu phân cách
Khóa học liên quan. Phân tích dữ liệu với Pandas và Python
Tệp CSV là gì?
Tệp CSV là một loại tệp văn bản thuần túy chứa các giá trị được phân tách bằng dấu phân cách. Phần mở rộng ________ 00 là viết tắt của ________ 01, vì dấu phân cách thường là dấu phẩy
Excel có thể mở tệp CSV. Ứng dụng web cho phép xuất dữ liệu thành tệp CSV
Theo mặc định, tệp csv có các hàng và cột, vì nó là biểu diễn của dữ liệu dạng bảng. Bạn có thể xem mọi giá trị dưới dạng ô và mọi dòng dưới dạng hàng
Tệp mẫu CSV
Bạn có thể trình bày một bảng trong tệp CSV [các giá trị được phân tách bằng dấu phẩy]. Văn bản là dữ liệu dạng bảng. Mỗi dòng của tệp csv là một dòng bên trong bảng, trong đó mọi giá trị [được phân tách bằng dấu phẩy] là dấu phân cách [dấu phẩy, dấu chấm phẩy hoặc dấu phân cách khác*]
Vì các tệp CSV là dữ liệu văn bản thuần túy nên hầu hết tất cả các ngôn ngữ lập trình đều hỗ trợ nó. Bạn có thể dễ dàng phân tích nó bằng Python
Bảng dữ liệu
Bạn có thể có bảng này
TênTuổiLươngChris20$3600Harry25$3200Barry30$3000dữ liệu CSV
Và biểu thị cùng một dữ liệu dưới dạng tệp
csvReader = csv.reader[csvfile, delimiter=',']0
Chris,20,3600
Harry,25,3200
Barry,30,3000
Ở đây, mỗi hàng trong tệp khớp với một hàng trong bảng và mỗi giá trị là một ô trong bảng
Đọc CSV
Trong Python, có hai cách phổ biến để đọc tệp csv
- đọc csv với mô-đun csv
- đọc csv với mô-đun pandas [xem bên dưới]
Mô-đun CSV Python
Python đi kèm với một mô-đun để phân tích các tệp csv, mô-đun
csvReader = csv.reader[csvfile, delimiter=',']3. Bạn có thể sử dụng mô-đun này để đọc và ghi dữ liệu mà không phải thực hiện các thao tác chuỗi và tương tự
Đọc tệp CSV
Hãy tìm hiểu cách đọc tệp csv. Bạn có thể sử dụng mô-đun csv. Mô-đun đã được cài đặt, chỉ cần nhập nó với
csvReader = csv.reader[csvfile, delimiter=',']4
Sau đó, bạn sẽ muốn mở tệp csv, bạn có thể với
with open['office.csv'] as csvfile:
Sau đó, tạo một đối tượng trình đọc
csvReader = csv.reader[csvfile, delimiter=',']5 trong đó các tham số là tên tệp và dấu phân cách
Điều này nghe có vẻ khó, nhưng nó đơn giản như
csvReader = csv.reader[csvfile, delimiter=',']
Sau đó, bạn có thể lặp qua các hàng và phân tích chúng hoặc hiển thị chúng
import csv
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
Khi bạn chạy chương trình, nó sẽ hiển thị cho bạn từng hàng dưới dạng danh sách
csvReader = csv.reader[csvfile, delimiter=',']0
Vì là danh sách nên bạn có thể truy cập các ô bằng dấu ngoặc vuông.
Ô đầu tiên là
csvReader = csv.reader[csvfile, delimiter=',']6, ô thứ hai là
csvReader = csv.reader[csvfile, delimiter=',']7, v.v.
csvReader = csv.reader[csvfile, delimiter=',']3
Đọc CSV dưới dạng Dict
Nếu bạn muốn đọc dữ liệu trong từ điển thay vì danh sách, bạn có thể làm điều đó.
Mô-đun csv đi kèm với một
csvReader = csv.reader[csvfile, delimiter=',']8. Điều này cho phép bạn đọc tệp csv dưới dạng từ điển.
Nếu bạn muốn đọc nó dưới dạng từ điển, hãy đảm bảo bao gồm tiêu đề vì tiêu đề đó sẽ được đưa vào ánh xạ khóa-giá trị
csvReader = csv.reader[csvfile, delimiter=',']5
Sau đó, chương trình của bạn có thể đọc csv với
csvReader = csv.reader[csvfile, delimiter=',']9
csvReader = csv.reader[csvfile, delimiter=',']7
Chương trình sau đó xuất ra từ điển
csvReader = csv.reader[csvfile, delimiter=',']8
Một
import csv0 hoạt động hoàn toàn giống như
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
import csv1 bình thường
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
Khóa học liên quan. Phân tích dữ liệu với Pandas và Python
Chức năng mô-đun CSV
Mô-đun
csvReader = csv.reader[csvfile, delimiter=',']3 đi kèm với nhiều chức năng khác nhau
- csv. field_size_limit – trả về kích thước trường tối đa
- csv. get_dialect – lấy phương ngữ được liên kết với tên
- csv. list_dialects – hiển thị tất cả các phương ngữ đã đăng ký
- csv. trình đọc – đọc dữ liệu từ tệp csv
- csv. register_dialect - liên kết phương ngữ với tên
- csv. nhà văn – ghi dữ liệu vào tệp csv
- csv. unregister_dialect - xóa phương ngữ được liên kết với tên đăng ký phương ngữ
- csv. QUOTE_ALL - Trích dẫn mọi thứ, bất kể loại nào
- csv. QUOTE_MINIMAL - Trường trích dẫn có ký tự đặc biệt
- csv. QUOTE_NONNUMERIC - Trích dẫn tất cả các trường không phải là giá trị số
- csv. QUOTE_NONE – Không trích dẫn bất cứ điều gì trong đầu ra
Bài viết này chỉ tập trung vào
import csv3, cho phép bạn đọc một tệp
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
Đọc CSV với Pandas
Pandas là một thư viện phân tích dữ liệu. Nó thường được sử dụng trong khoa học dữ liệu. Nếu bạn làm việc nhiều với dữ liệu, sử dụng mô-đun
import csv4 sẽ tốt hơn
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
Đầu tiên chúng ta bắt đầu với một số dữ liệu. Giả sử bạn có tệp csv chứa số liệu thống kê quốc gia,
import csv5
with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
Quốc gia, Thủ đô, Ngôn ngữ, Đơn vị tiền tệ
Hoa Kỳ, Washington, Anh, đô la Mỹ
Canada, Ottawa, Anh và Pháp, đô la Canada