Cách tính tổng một cột trong Python mà không cần gấu trúc

Pandas là một công cụ đặc biệt cho phép chúng tôi thực hiện các thao tác dữ liệu phức tạp một cách hiệu quả và hiệu quả. Bên trong gấu trúc, chúng tôi chủ yếu xử lý tập dữ liệu ở dạng DataFrame. DataFrames là cấu trúc dữ liệu 2 chiều trong pandas. DataFrames bao gồm các hàng, cột và dữ liệu

Tổng ở đây thể hiện việc bổ sung tất cả các giá trị của DataFrame. Hoạt động này có thể được tính theo hai cách

  1. Bằng cách sử dụng phương thức sum[] hai lần
  2. Bằng cách sử dụng DataFrame. giá trị. phương thức tổng []

Cả hai phương pháp đều có ưu và nhược điểm, phương pháp 2 nhanh và thỏa mãn nhưng nó trả về giá trị float trong trường hợp giá trị nan

Trong hướng dẫn này, bạn sẽ tìm hiểu cách sử dụng Pandas để tính tổng, bao gồm cách cộng các cột và hàng trong khung dữ liệu. Khả năng cộng các giá trị để tính tổng cột hoặc tổng hàng cho phép bạn tạo một số thống kê tóm tắt hữu ích

Đến cuối hướng dẫn này, bạn sẽ học được cách

  • Tính tổng của một cột khung dữ liệu Pandas
  • Tính tổng của một hàng khung dữ liệu Pandas
  • Thêm các cột khung dữ liệu Pandas lại với nhau
  • Thêm các cột khung dữ liệu Pandas đáp ứng một điều kiện
  • Tính tổng của một Pandas GroupBy Dataframe

Câu trả lời nhanh. Sử dụng gấu trúc. sum[] Để thêm các cột và hàng trong khung dữ liệu

Cách thêm giá trị Mô tảVí dụTheo cộtThêm tất cả giá trị số vào cột Pandas hoặc cột của khung dữ liệu
# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
1Row-wiseThêm tất cả giá trị số vào hàng Pandas
# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
2Cột cụ thểThêm giá trị của cột cụ thể
# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
3Cách sử dụng phương pháp tổng Pandas để thêm giá trị theo các cách khác nhau

Mục lục

Đang tải một khung dữ liệu Pandas mẫu

Nếu bạn muốn làm theo từng dòng hướng dẫn, hãy sao chép mã bên dưới. Mã này tải một Khung dữ liệu Pandas mẫu mà chúng tôi sẽ tham khảo trong suốt hướng dẫn. Nếu bạn có dữ liệu của riêng mình, vui lòng sử dụng dữ liệu đó theo cùng, nhưng kết quả của bạn sẽ thay đổi

# Loading a Sample Pandas Dataframe
import pandas as pd

df = pd.DataFrame.from_dict[{
    'Name': ['Nik', 'Kate', 'Kevin', 'Evan', 'Jane', 'Kyra', 'Melissa'],
    'January_Sales': [90, 95, 75, 93, 60, 85, 75],
    'February_Sales': [95, 95, 75, 65, 50, 85, 100],
    'March_Sales': [100, 95, 50, 75, 90, 50, 80]
}]

print[df.head[]]

# Returns:
#     Name  January_Sales  February_Sales  March_Sales
# 0    Nik             90              95          100
# 1   Kate             95              95           95
# 2  Kevin             75              75           50
# 3   Evan             93              65           75
# 4   Jane             60              50           90

Chúng ta có thể thấy rằng chúng ta có bốn cột. 1 chứa tên của nhân viên bán hàng và 3 chứa giá trị bán hàng của từng nhân viên bán hàng

Trong phần tiếp theo, bạn sẽ tìm hiểu cách sử dụng Pandas để cộng tất cả các giá trị trong cột khung dữ liệu

Tính tổng của một cột khung dữ liệu Pandas

Một nhiệm vụ phổ biến mà bạn có thể cần thực hiện là cộng tất cả các giá trị trong cột Pandas Dataframe. Rất may, Pandas làm điều này rất dễ dàng với phương pháp

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
4. Chúng ta có thể áp dụng phương pháp này cho chuỗi Pandas [có nghĩa là cột] hoặc toàn bộ khung dữ liệu

Hãy bắt đầu bằng cách tìm hiểu cách cộng tất cả các giá trị trong cột Pandas

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572

Tương tự, chúng ta có thể tính tổng của tất cả các cột trong Khung dữ liệu Pandas. Chúng ta có thể làm điều này bằng cách áp dụng phương thức

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
4 trên toàn bộ khung dữ liệu

Hãy thử xem

# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540

Điều này trả về một chuỗi Pandas dễ dàng truy vấn, nếu chúng tôi muốn trả về tổng của một cột cụ thể. Theo mặc định, Pandas sẽ chỉ cộng các cột số, nghĩa là chúng tôi không cộng cột Tên của mình

Trong phần tiếp theo, bạn sẽ tìm hiểu cách tính tổng của một hàng Pandas Dataframe

Tính tổng của một hàng khung dữ liệu Pandas

Trong nhiều trường hợp, bạn sẽ muốn cộng các giá trị trên các hàng trong Khung dữ liệu Pandas. Tương tự như ví dụ trên, chúng ta có thể sử dụng phương thức

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
6. Theo mặc định, Pandas sẽ áp dụng đối số
# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
7, đối số này sẽ cộng các giá trị theo chỉ mục. Nếu chúng ta có thể thay đổi điều này thành
# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
8, các giá trị sẽ được thêm vào theo cột

Hãy xem cách chúng ta có thể cộng các giá trị trên các hàng trong Pandas

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
1

Bạn có thể thắc mắc tại sao chúng tôi áp dụng đối số

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
9 ở đây. Trong các phiên bản tương lai của Pandas, một
# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
0 sẽ bị ném nếu bao gồm các cột không phải là số

Điều gì sẽ xảy ra nếu chúng ta muốn chỉ định một chỉ mục để làm cho các hàng dễ phân biệt hơn? . Hãy xem nó trông như thế nào

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
5

Đây là kết quả rõ ràng hơn nhiều cho phép chúng tôi nhìn rõ hơn mã định danh của hàng, trong trường hợp này là tên của nhân viên bán hàng

Trong phần tiếp theo, bạn sẽ tìm hiểu cách chỉ cần thêm một số cột của Khung dữ liệu Pandas lại với nhau

Thêm các cột khung dữ liệu Pandas lại với nhau

Pandas giúp dễ dàng thêm các cột khác nhau một cách có chọn lọc. Giả sử chúng ta chỉ muốn cộng hai cột lại với nhau theo hàng chứ không phải tất cả chúng, chúng ta chỉ cần thêm trực tiếp các cột. Lợi ích của phương pháp này là chúng ta có thể chỉ định một cột mới lưu trữ các giá trị này

Hãy xem nó trông như thế nào

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
6

Chúng tôi có thể thấy rằng chúng tôi đã tạo một cột mới lưu trữ tổng của hai trong số các cột của chúng tôi. Một điều tuyệt vời về hoạt động này là nó được vector hóa, có nghĩa là nó rất nhanh và tận dụng sức mạnh của Pandas

Trong phần tiếp theo, bạn sẽ tìm hiểu cách thêm cột khung dữ liệu theo điều kiện

Thêm các cột khung dữ liệu Pandas đáp ứng một điều kiện

Có thể có lúc bạn muốn thêm nhiều cột vào một khung dữ liệu, nhưng không phải tất cả các cột đó. Chúng tôi có thể làm điều này bằng cách thêm các cột Pandas một cách có điều kiện, với sự trợ giúp của việc hiểu danh sách

Đối với ví dụ này, hãy sửa đổi khung dữ liệu của chúng tôi để bao gồm một cột số bổ sung

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
7

Bây giờ, khi chúng tôi thêm các giá trị của các hàng của mình, có thể không hợp lý khi bao gồm cột cuối cùng. Giả sử, chúng tôi chỉ muốn bao gồm các cột có từ Bán hàng. Những gì chúng ta có thể làm là tạo một cách hiểu danh sách để kiểm tra xem từ Bán hàng có tồn tại trong một cột hay không

Hãy xem làm thế nào chúng ta có thể làm điều này

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
8

Bạn có thể tìm hiểu thêm về cách thực hiện điều này trong hướng dẫn này, bằng cách tìm hiểu cách lặp qua các cột và kiểm tra điều kiện. Để làm điều này, trước tiên chúng tôi sẽ sử dụng Pandas để lấy các cột của DataFrame dưới dạng danh sách

Bây giờ chúng tôi đã chọn các cột của mình, chúng tôi có thể sử dụng đối số

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
8 và chỉ cộng các cột có chứa Bán hàng. Hãy xem nó trông như thế nào

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
0

Bằng cách này, chúng tôi có thể cộng các giá trị trên các cột theo hàng một cách an toàn mà không cần thêm vào các cột mà chúng tôi không muốn đưa vào

Trong phần tiếp theo, bạn sẽ tìm hiểu cách tính tổng của Khung dữ liệu Pandas khi dữ liệu được nhóm bằng cách sử dụng

# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
3

Tính tổng của một Pandas GroupBy Dataframe

Trong phần cuối cùng này, bạn sẽ tìm hiểu cách tính tổng của Pandas Dataframe khi nhóm dữ liệu bằng phương pháp

# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
3. Đối với điều này, chúng tôi sẽ sửa đổi khung dữ liệu của mình để bao gồm một cột cho giới tính của nhân viên bán hàng. Điều này có thể cho phép chúng tôi nhóm dữ liệu theo giới tính và tính tổng theo giới tính

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
3

Bây giờ chúng ta có thể nhóm dữ liệu của mình bằng cách sử dụng nhóm theo phương pháp để nhóm dữ liệu theo giới tính. Để tìm hiểu thêm về cách nhóm dữ liệu bằng phương pháp

# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
3, hãy xem video của tôi tại đây

Cách sử dụng phương pháp Pandas
# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
3

Hãy nhóm dữ liệu của chúng tôi và thêm tất cả các cột số

# Add all values in a Pandas column
january_sum = df['January_Sales'].sum[]
print[january_sum]

# Returns: 572
0

Chúng ta có thể thấy rằng trước tiên, việc nhóm dữ liệu của chúng ta theo

# Calculate the sum of all columns in a Pandas Dataframe
dataframe_sum = df.sum[]
print[dataframe_sum]

# Returns: 
# Name              NikKateKevinEvanJaneKyraMelissa
# January_Sales                                 573
# February_Sales                                565
# March_Sales                                   540
7 và sau đó thêm các giá trị vào khung dữ liệu sẽ trả về một tổng theo cột dựa trên các nhóm Giới tính

Phần kết luận

Trong hướng dẫn này, bạn đã học cách sử dụng phương pháp tổng Pandas để tính tổng trên các khung dữ liệu. Bạn đã học cách thêm giá trị theo hàng và theo cột. Bạn cũng đã học cách thêm cột theo điều kiện và cách thêm giá trị trong Khung dữ liệu Pandas được nhóm

Chủ Đề