Chúng ta có thể thay đổi dấu phân cách trong tệp csv python không?

Tệp CSV [Giá trị được phân tách bằng dấu phẩy] là tệp có các giá trị được phân tách bằng dấu phẩy. Nó thường được sử dụng để nhập và xuất với cơ sở dữ liệu và bảng tính

Các giá trị hầu hết được phân tách bằng dấu phẩy. Đôi khi một ký tự khác được sử dụng như dấu chấm phẩy, ký tự ngăn cách được gọi là dấu phân cách

Khóa học liên quan. Phân tích dữ liệu với Pandas và Python

Tệp CSV là gì?

Tệp CSV là một loại tệp văn bản thuần túy chứa các giá trị được phân tách bằng dấu phân cách. Phần mở rộng ________ 00 là viết tắt của ________ 01, vì dấu phân cách thường là dấu phẩy

Excel có thể mở tệp CSV. Ứng dụng web cho phép xuất dữ liệu thành tệp CSV

Theo mặc định, tệp csv có các hàng và cột, vì nó là biểu diễn của dữ liệu dạng bảng. Bạn có thể xem mọi giá trị dưới dạng ô và mọi dòng dưới dạng hàng

Tệp mẫu CSV

Bạn có thể trình bày một bảng trong tệp CSV [các giá trị được phân tách bằng dấu phẩy]. Văn bản là dữ liệu dạng bảng. Mỗi dòng của tệp csv là một dòng bên trong bảng, trong đó mọi giá trị [được phân tách bằng dấu phẩy] là dấu phân cách [dấu phẩy, dấu chấm phẩy hoặc dấu phân cách khác*]

Vì các tệp CSV là dữ liệu văn bản thuần túy nên hầu hết tất cả các ngôn ngữ lập trình đều hỗ trợ nó. Bạn có thể dễ dàng phân tích nó bằng Python

Bảng dữ liệu

Bạn có thể có bảng này

TênTuổiLươngChris20$3600Harry25$3200Barry30$3000

dữ liệu CSV

Và biểu thị cùng một dữ liệu dưới dạng tệp

csvReader = csv.reader[csvfile, delimiter=',']
0

Chris,20,3600
Harry,25,3200
Barry,30,3000

Ở đây, mỗi hàng trong tệp khớp với một hàng trong bảng và mỗi giá trị là một ô trong bảng

Đọc CSV

Trong Python, có hai cách phổ biến để đọc tệp csv

  • đọc csv với mô-đun csv
  • đọc csv với mô-đun pandas [xem bên dưới]

Mô-đun CSV Python

Python đi kèm với một mô-đun để phân tích các tệp csv, mô-đun

csvReader = csv.reader[csvfile, delimiter=',']
3. Bạn có thể sử dụng mô-đun này để đọc và ghi dữ liệu mà không phải thực hiện các thao tác chuỗi và tương tự

Đọc tệp CSV

Hãy tìm hiểu cách đọc tệp csv. Bạn có thể sử dụng mô-đun csv. Mô-đun đã được cài đặt, chỉ cần nhập nó với

csvReader = csv.reader[csvfile, delimiter=',']
4

Sau đó, bạn sẽ muốn mở tệp csv, bạn có thể với

with open['office.csv'] as csvfile:

Sau đó, tạo một đối tượng trình đọc

csvReader = csv.reader[csvfile, delimiter=',']
5 trong đó các tham số là tên tệp và dấu phân cách

Điều này nghe có vẻ khó, nhưng nó đơn giản như

csvReader = csv.reader[csvfile, delimiter=',']

Sau đó, bạn có thể lặp qua các hàng và phân tích chúng hoặc hiển thị chúng

import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]

Khi bạn chạy chương trình, nó sẽ hiển thị cho bạn từng hàng dưới dạng danh sách

csvReader = csv.reader[csvfile, delimiter=',']
0

Vì là danh sách nên bạn có thể truy cập các ô bằng dấu ngoặc vuông.
Ô đầu tiên là

csvReader = csv.reader[csvfile, delimiter=',']
6, ô thứ hai là
csvReader = csv.reader[csvfile, delimiter=',']
7, v.v.

csvReader = csv.reader[csvfile, delimiter=',']
3

Đọc CSV dưới dạng Dict

Nếu bạn muốn đọc dữ liệu trong từ điển thay vì danh sách, bạn có thể làm điều đó.
Mô-đun csv đi kèm với một

csvReader = csv.reader[csvfile, delimiter=',']
8. Điều này cho phép bạn đọc tệp csv dưới dạng từ điển.

Nếu bạn muốn đọc nó dưới dạng từ điển, hãy đảm bảo bao gồm tiêu đề vì tiêu đề đó sẽ được đưa vào ánh xạ khóa-giá trị

csvReader = csv.reader[csvfile, delimiter=',']
5

Sau đó, chương trình của bạn có thể đọc csv với

csvReader = csv.reader[csvfile, delimiter=',']
9

csvReader = csv.reader[csvfile, delimiter=',']
7

Chương trình sau đó xuất ra từ điển

csvReader = csv.reader[csvfile, delimiter=',']
8

Một

import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
0 hoạt động hoàn toàn giống như
import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
1 bình thường

Khóa học liên quan. Phân tích dữ liệu với Pandas và Python

Chức năng mô-đun CSV

Mô-đun

csvReader = csv.reader[csvfile, delimiter=',']
3 đi kèm với nhiều chức năng khác nhau

  • csv. field_size_limit – trả về kích thước trường tối đa
  • csv. get_dialect – lấy phương ngữ được liên kết với tên
  • csv. list_dialects – hiển thị tất cả các phương ngữ đã đăng ký
  • csv. trình đọc – đọc dữ liệu từ tệp csv
  • csv. register_dialect - liên kết phương ngữ với tên
  • csv. nhà văn – ghi dữ liệu vào tệp csv
  • csv. unregister_dialect - xóa phương ngữ được liên kết với tên đăng ký phương ngữ
  • csv. QUOTE_ALL - Trích dẫn mọi thứ, bất kể loại nào
  • csv. QUOTE_MINIMAL - Trường trích dẫn có ký tự đặc biệt
  • csv. QUOTE_NONNUMERIC - Trích dẫn tất cả các trường không phải là giá trị số
  • csv. QUOTE_NONE – Không trích dẫn bất cứ điều gì trong đầu ra

Bài viết này chỉ tập trung vào

import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
3, cho phép bạn đọc một tệp

Đọc CSV với Pandas

Pandas là một thư viện phân tích dữ liệu. Nó thường được sử dụng trong khoa học dữ liệu. Nếu bạn làm việc nhiều với dữ liệu, sử dụng mô-đun

import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
4 sẽ tốt hơn

Đầu tiên chúng ta bắt đầu với một số dữ liệu. Giả sử bạn có tệp csv chứa số liệu thống kê quốc gia,

import csv

with open['office.csv'] as csvfile:
csvReader = csv.reader[csvfile, delimiter=',']
for row in csvReader:
print[row]
5

Quốc gia, Thủ đô, Ngôn ngữ, Đơn vị tiền tệ
Hoa Kỳ, Washington, Anh, đô la Mỹ
Canada, Ottawa, Anh và Pháp, đô la Canada

Chủ Đề