Để có được số lượng hàng trong một khung dữ liệu, hãy sử dụng:
df.shape[0]
[và df.shape[1]
để lấy số lượng cột].
Thay thế bạn có thể sử dụng
len[df]
hoặc là
len[df.index]
[và len[df.columns]
cho các cột]
shape
linh hoạt và tiện lợi hơn len[]
, đặc biệt là cho công việc tương tác [chỉ cần thêm vào cuối], nhưng len
nhanh hơn một chút [xem thêm câu trả lời này ].
Để tránh : count[]
vì nó trả về số lượng không phải NA/null quan sát trên trục được yêu cầu
len[df.index]
nhanh hơn
import pandas as pd
import numpy as np
df = pd.DataFrame[np.arange[24].reshape[8, 3],columns=['A', 'B', 'C']]
df['A'][5]=np.nan
df
# Out:
# A B C
# 0 0 1 2
# 1 3 4 5
# 2 6 7 8
# 3 9 10 11
# 4 12 13 14
# 5 NaN 16 17
# 6 18 19 20
# 7 21 22 23
%timeit df.shape[0]
# 100000 loops, best of 3: 4.22 µs per loop
%timeit len[df]
# 100000 loops, best of 3: 2.26 µs per loop
%timeit len[df.index]
# 1000000 loops, best of 3: 1.46 µs per loop
df.__len__
Chỉ là một cuộc gọi đến len[df.index]
import inspect
print[inspect.getsource[pd.DataFrame.__len__]]
# Out:
# def __len__[self]:
# """Returns length of info axis, but here we use the index """
# return len[self.index]
Tại sao bạn không nên sử dụng count[]
df.count[]
# Out:
# A 7
# B 8
# C 8