Hướng dẫn dùng count pandas python

Để có được số lượng hàng trong một khung dữ liệu, hãy sử dụng:

df.shape[0]

(và df.shape[1] để lấy số lượng cột).

Thay thế bạn có thể sử dụng

len(df)

hoặc là

len(df.index)

(và len(df.columns) cho các cột)

shape linh hoạt và tiện lợi hơn len(), đặc biệt là cho công việc tương tác (chỉ cần thêm vào cuối), nhưng len nhanh hơn một chút (xem thêm câu trả lời này ).

Để tránh : count() vì nó trả về số lượng không phải NA/null quan sát trên trục được yêu cầu

len(df.index) nhanh hơn

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(24).reshape(8, 3),columns=['A', 'B', 'C'])
df['A'][5]=np.nan
df
# Out:
#     A   B   C
# 0   0   1   2
# 1   3   4   5
# 2   6   7   8
# 3   9  10  11
# 4  12  13  14
# 5 NaN  16  17
# 6  18  19  20
# 7  21  22  23

%timeit df.shape[0]
# 100000 loops, best of 3: 4.22 µs per loop

%timeit len(df)
# 100000 loops, best of 3: 2.26 µs per loop

%timeit len(df.index)
# 1000000 loops, best of 3: 1.46 µs per loop

df.__len__ Chỉ là một cuộc gọi đến len(df.index)

import inspect 
print(inspect.getsource(pd.DataFrame.__len__))
# Out:
#     def __len__(self):
#         """Returns length of info axis, but here we use the index """
#         return len(self.index)

Tại sao bạn không nên sử dụng count()

df.count()
# Out:
# A    7
# B    8
# C    8