Làm cách nào để bỏ qua dòng đầu tiên khi đọc tệp csv trong python?

Cuộc gọi đến

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv['basketball_data.csv', skiprows=[2, 4]]

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
9 đọc hàng đầu tiên và loại bỏ nó. Từ đó, bạn đã sẵn sàng lặp lại dữ liệu thực tế

Thay vào đó, bạn có thể muốn sử dụng

import pandas as pd

#import DataFrame and skip first 2 rows
df = pd.read_csv['basketball_data.csv', skiprows=2]

#view DataFrame
df

        B	14	9
0	C	29	6
1	D	30	2
0, phân tích cú pháp hàng đầu tiên dưới dạng tên trường theo mặc định. Ví dụ

Các ví dụ sau đây cho thấy cách sử dụng từng phương pháp trong thực tế với tệp CSV sau có tên là Basketball_data. csv

ví dụ 1. Bỏ qua một hàng cụ thể

Chúng tôi có thể sử dụng đoạn mã sau để nhập tệp CSV và bỏ qua hàng thứ hai

import pandas as pd

#import DataFrame and skip 2nd row
df = pd.read_csv['basketball_data.csv', skiprows=[2]]

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
2	D	30	2

Lưu ý rằng hàng thứ hai [với nhóm 'B'] đã bị bỏ qua khi nhập tệp CSV vào DataFrame của gấu trúc

Ghi chú. Hàng đầu tiên trong tệp CSV được coi là hàng 0

ví dụ 2. Bỏ qua một số hàng cụ thể

Chúng tôi có thể sử dụng đoạn mã sau để nhập tệp CSV và bỏ qua hàng thứ hai và thứ tư

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv['basketball_data.csv', skiprows=[2, 4]]

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6

Lưu ý rằng hàng thứ hai và thứ tư [với nhóm 'B' và 'D'] đã bị bỏ qua khi nhập tệp CSV vào DataFrame của gấu trúc

ví dụ 3. Bỏ qua N hàng đầu tiên

Chúng tôi có thể sử dụng đoạn mã sau để nhập tệp CSV và bỏ qua hai hàng đầu tiên

import pandas as pd

#import DataFrame and skip first 2 rows
df = pd.read_csv['basketball_data.csv', skiprows=2]

#view DataFrame
df

        B	14	9
0	C	29	6
1	D	30	2

Lưu ý rằng hai hàng đầu tiên trong tệp CSV đã bị bỏ qua và hàng có sẵn tiếp theo [với nhóm 'B'] trở thành hàng tiêu đề cho DataFrame

Trong bài viết này, chúng tôi sẽ thảo luận về cách bỏ qua các hàng từ trên cùng, dưới cùng hoặc tại các chỉ số cụ thể trong khi đọc tệp csv và tải nội dung vào Khung dữ liệu

Thư viện của gấu trúc Python cung cấp chức năng đọc tệp csv và tải dữ liệu trực tiếp vào khung dữ liệu cũng như bỏ qua các dòng được chỉ định từ tệp csv i. e

pandas.read_csv[filepath_or_buffer, skiprows=N, ....]

Có thể chấp nhận số lượng lớn đối số. Nhưng ở đây chúng ta sẽ chỉ thảo luận về một vài lập luận quan trọng mà thôi. e.
Đối số.
  • filepath_or_buffer. đường dẫn của tệp csv hoặc đối tượng của nó
  • mũi dùi. Số dòng cần bỏ qua khi đọc csv
    • Nếu đó là một int thì bỏ qua các dòng đó từ trên xuống
    • Nếu đó là danh sách int thì bỏ qua các dòng ở các vị trí chỉ mục đó
    • Nếu đó là một chức năng có thể gọi được thì hãy chuyển từng chỉ mục cho chức năng này để kiểm tra xem dòng có bị bỏ qua hay không

Nó sẽ đọc tệp csv đã cho bằng cách bỏ qua các dòng đã chỉ định và tải các dòng còn lại vào một khung dữ liệu

Để sử dụng mô-đun gấu trúc nhập này như thế này,

import pandas as pd

Hãy hiểu bằng các ví dụ,

quảng cáo

Giả sử chúng tôi có một người dùng tệp CSV đơn giản. csv và nội dung của nó là,

>>cat users.txt
Name,Age,City
jack,34,Sydeny
Riti,31,Delhi
Aadi,16,New York
Suse,32,Lucknow
Mark,33,Las vegas
Suri,35,Patna


Hãy tải tệp csv này vào một khung dữ liệu bằng cách sử dụng read_csv[] và bỏ qua các hàng theo nhiều cách khác nhau,

Bỏ qua N hàng từ trên cùng trong khi đọc tệp csv sang Dataframe

Trong khi gọi gấu trúc. read_csv[] nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ đầu trong khi đọc tệp csv và khởi tạo khung dữ liệu.
Ví dụ: nếu chúng tôi muốn bỏ qua 2 dòng từ trên xuống khi đọc người dùng. csv và khởi tạo một khung dữ liệu tôi. e.

# Skip 2 rows from top in csv and initialize a dataframe
usersDf = pd.read_csv['users.csv', skiprows=2]

print['Contents of the Dataframe created by skipping top 2 lines from csv file ']
print[usersDf]

Đầu ra.
Contents of the Dataframe created by skipping top 2 lines from csv file 
   Riti  31      Delhi
0  Aadi  16   New York
1  Suse  32    Lucknow
2  Mark  33  Las vegas
3  Suri  35      Patna

Nó bỏ qua 2 dòng trên cùng từ csv và sử dụng dòng thứ 3 [tại chỉ mục 2] làm hàng tiêu đề và tải các hàng còn lại từ csv làm hàng dữ liệu trong .

Bây giờ nếu chúng ta chỉ muốn bỏ qua một số hàng cụ thể trong khi đọc csv thì sao?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp csv vào Dataframe

Trong khi gọi gấu trúc. read_csv[] nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách các số nguyên, thì nó sẽ bỏ qua các hàng từ csv tại các chỉ mục được chỉ định trong danh sách. Ví dụ: nếu chúng tôi muốn bỏ qua các dòng ở chỉ mục 0, 2 và 5 trong khi đọc người dùng. csv và khởi tạo một khung dữ liệu tôi. e

# Skip  rows at specific index
usersDf = pd.read_csv['users.csv', skiprows=[0,2,5]]

print['Contents of the Dataframe created by skipping specifying lines from csv file ']
print[usersDf]

Đầu ra.
______9
Nó bỏ qua các dòng ở vị trí chỉ mục 0, 2 & 5 từ csv và tải các hàng còn lại từ csv vào khung dữ liệu.

Bỏ qua N hàng từ đầu trừ tiêu đề trong khi đọc tệp csv vào Dataframe

Như chúng ta đã thấy trong ví dụ đầu tiên, khi đọc người dùng. csv khi bỏ qua 3 dòng từ trên xuống sẽ tạo dòng thứ 3 làm hàng tiêu đề. Nhưng đó không phải là hàng chứa tên cột.
Vì vậy, nếu tệp csv của chúng ta có hàng tiêu đề và chúng ta muốn bỏ qua 2 hàng dữ liệu đầu tiên thì chúng ta cần chuyển một danh sách tới các dòng bỏ qua i. e.

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv['basketball_data.csv', skiprows=[2, 4]]

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
0
Đầu ra.
______11
Nó sẽ đọc tệp csv vào khung dữ liệu bằng cách bỏ qua 2 dòng sau hàng tiêu đề trong tệp csv.

Bỏ qua các hàng dựa trên điều kiện trong khi đọc tệp csv sang Dataframe

Chúng ta cũng có thể truyền hàm có thể gọi được hoặc hàm lambda để quyết định bỏ qua hàng nào. Khi chuyển chức năng có thể gọi làm đối số trong bỏ qua trong khi gọi gấu trúc. read_csv[], nó sẽ gọi hàm trước khi đọc từng hàng để kiểm tra xem có nên bỏ qua các hàng này hay không. Nó sẽ chuyển vị trí chỉ mục của mỗi hàng trong hàm này.
Hãy bỏ qua các hàng trong tệp csv có vị trí chỉ mục là bội số của 3 i. e. bỏ qua mọi dòng thứ 3 trong khi đọc tệp csv và tải khung dữ liệu ra khỏi tệp,

import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd.read_csv['basketball_data.csv', skiprows=[2, 4]]

#view DataFrame
df

        team	points	rebounds
0	A	22	10
1	C	29	6
2
Đầu ra.
______40

Bỏ qua N hàng từ dưới cùng/chân trang trong khi đọc tệp csv sang Dataframe

Để bỏ qua N số hàng từ dưới lên trong khi đọc tệp csv sang khung dữ liệu, vui lòng chuyển đối số skipfooter & engine trong  pandas. read_csv[] tôi. e

import pandas as pd
1
Đầu ra.
______42
Theo mặc định, read_csv[] sử dụng công cụ C để phân tích cú pháp nhưng nó không cung cấp chức năng nhảy từ dưới lên. Nếu muốn sử dụng chức năng này, chúng ta phải chuyển đối số engine cùng với skipfooter nếu không chúng ta sẽ nhận được cảnh báo như sau,
import pandas as pd
3
Ví dụ đầy đủ như sau,< .
import pandas as pd
4
Output:
import pandas as pd
5
 

Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python

 
  • Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
  • Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
  • Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
  • Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
  • Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
  • Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
  • Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
  • Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
  • Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
  • Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
  • Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
  • Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
  • Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
  • Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
  • Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
  • Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
 

Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?

Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học

Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python

Hãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay

Lệnh nào sau đây sẽ bỏ qua hàng đầu tiên trong một. Tệp CSV?

Giải pháp. Lệnh được sử dụng để bỏ qua một hàng trong tệp CSV là skip[] .

Chức năng nào được sử dụng để bỏ qua một hàng trong tệp CSV?

Ở đây, chúng ta sẽ thảo luận về cách bỏ qua các hàng khi đọc tệp csv. Chúng tôi sẽ sử dụng phương thức read_csv[] của thư viện Pandas cho nhiệm vụ này.

Skiprows nghĩa là gì trong Python?

bỏ qua. dạng danh sách hoặc số nguyên . Số hàng cần bỏ qua [được lập chỉ mục 0] hoặc số hàng cần bỏ qua [int] ở đầu tệp . "

Cách tốt nhất để đọc tệp CSV bằng Python là gì?

Đọc tệp CSV bằng Python .
Sử dụng Thư viện CSV. nhập csv với open[". /wq. csv", 'r'] dưới dạng tệp. csvreader = csv. trình đọc [tệp] cho hàng trong csvreader. print[row] Ở đây chúng tôi đang nhập thư viện csv để sử dụng. .
Sử dụng thư viện Pandas. nhập gấu trúc dưới dạng dữ liệu pd = pd. read_csv["bwq. csv"] dữ liệu

Chủ Đề