Danh sách bộ lọc python giữa hai số

Bạn cũng có thể nhận kết quả tìm kiếm cho từng hàng. đối với mỗi vận động viên, họ có đến từ Jamaica không?

# Search each row for a value
result = df['Country'] == 'Jamaica'
print(list(result))
## [True, False, False, True, False, False, False, False]

Điều tương tự có thể được thực hiện với một chức năng. chức năng

## True
2 từ Numpy

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
## [True, False, False, True, False, False, False, False]

Thay vì chỉ tìm kiếm các vận động viên có tên nhất định, chúng ta có thể tìm kiếm

## True
3 tên của các vận động viên có chữ “e” trong tên của họ chẳng hạn

## True
0
## True
1

Lưu ý rằng nhiệm vụ cụ thể là tìm kiếm một chữ cái trong một cột chuỗi cũng có thể được thực hiện bằng phương pháp

## True
4

## True
2
## True
1

Đó là một bước bổ sung nhỏ để thêm kết quả tìm kiếm vào chính khung dữ liệu

## True
4
## True
5

Làm điều tương tự nhưng sử dụng một vòng lặp

## True
6
## True
5

Các toán tử logic 'và' (

## True
5) và 'hoặc' (
## True
6) có thể được sử dụng để tìm các hàng phù hợp với các tiêu chí rất cụ thể. Lưu ý các dấu ngoặc tròn đang được sử dụng để nhóm các đánh giá logic lại với nhau

## True
8
## True
9

Ngoài các toán tử logic, các ký hiệu bất đẳng thức sau đây có thể được trộn và khớp

  • Lớn hơn.
    ## True
    7
  • Ít hơn.
    ## True
    8
  • Lớn hơn hoặc bằng.
    ## True
    9
  • Ít hơn hoặc bằng.
    ## True
    20
  • không bằng.
    ## True
    21
## True
40
## True
41

Tương tự như ví dụ trước, điều tương tự có thể được thực hiện với hàm

## True
2 từ Numpy

## True
42
## True
41

Ví dụ, vận động viên không phải người Mỹ nào chạy dưới 10 tuổi trong trận chung kết?

## True
44
## True
45

…hoặc

## True
46
## True
45

Thay vì tìm kiếm thông qua dữ liệu trong một cột, bạn cũng có thể tìm kiếm thông qua tên của các cột để xem cột bạn đang tìm kiếm đã được tạo chưa. Ví dụ: đã tạo một cột chứa thời gian các vận động viên chạy trong trận chung kết chưa?

Giả sử giá trị đầu tiên là 20 và giá trị thứ hai là 30 và chúng tôi muốn tạo danh sách chứa các số từ giá trị thứ nhất đến giá trị thứ hai. Như thế này,

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
3

Có nhiều cách khác nhau để tạo danh sách chứa các số từ A đến B. Trong đó, cả A và B đều là số. Hãy thảo luận từng cái một,

Phương pháp 1. Sử dụng hàm phạm vi ()

Hàm range() trong Python, chấp nhận ba đối số i. e. bắt đầu, dừng lại và bước. Nó trả về một chuỗi các số nguyên từ đầu (bao gồm) đến dừng (độc quyền) theo bước đã cho

quảng cáo

Để tạo danh sách các số từ A đến B, chúng ta sẽ chuyển bắt đầu là A và dừng là B. Giá trị mặc định của kích thước bước là 1. Do đó, nó sẽ trả về một dãy số từ A đến B-1. Sau đó, chúng ta có thể chuyển chuỗi đó thành một danh sách

Tâm điểm. Các số trong danh sách sẽ từ A đến B-1. Số B bị loại. Nếu bạn cũng muốn bao gồm cả B, hãy chuyển B+1 vào hàm range()

Hãy xem một ví dụ, nơi chúng ta sẽ tạo một dãy số từ 20 đến 30 (không bao gồm 30)

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
4

đầu ra

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
3

Chúng tôi đã tạo một Danh sách các số từ 20 đến 30. Ở đâu, 30 không bao gồm trong danh sách

Phương pháp 2. sử dụng numpy. hàm arange()

Hàm arange() của mô-đun NumPy, chấp nhận ba đối số i. e. bắt đầu, dừng lại và bước. Nó trả về một mảng số nguyên gọn gàng từ đầu (bao gồm) đến dừng (độc quyền) theo kích thước bước đã cho

Để tạo danh sách các số từ A đến B, chúng ta sẽ chuyển bắt đầu là A và dừng là B. Giá trị mặc định của kích thước bước là 1. Do đó, nó sẽ trả về một mảng số từ A đến B-1. Sau đó, chúng ta có thể gọi hàm tolist() của mảng, để chuyển đổi nó thành một danh sách các số

Tâm điểm. Các số trong danh sách sẽ từ A đến B-1. Số B bị loại. Nếu bạn cũng muốn bao gồm cả B, hãy chuyển B+1 vào hàm range()

Hãy xem một ví dụ, nơi chúng ta sẽ tạo một dãy số từ 20 đến 30 (không bao gồm 30)

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
6

đầu ra

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
3

Chúng tôi đã tạo Danh sách các số từ a đến b (không bao gồm b). Trong đó a là 20, và b là 30

Phương pháp 3. Sử dụng vòng lặp while

Tạo một danh sách trống. Sau đó, sử dụng vòng lặp while để lặp từ a đến b và với mỗi số thứ i trong vòng lặp, hãy thêm số i vào danh sách. Bằng cách này, danh sách của chúng tôi sẽ có các số từ a đến b-1. Hãy xem một ví dụ, trong đó chúng ta sẽ tạo một dãy số từ a đến b. Trong đó a là 20, và b là 30

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
8

đầu ra

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
3

Chúng tôi đã tạo Danh sách các số từ a đến b (không bao gồm b). Trong đó a là 20, và b là 30

Phương pháp 4. Sử dụng danh sách hiểu

Để tạo một danh sách các số từ a đến b. Truyền a và b cho hàm range(). Nó sẽ cho một dãy số từ a đến b-1. Sau đó tạo một danh sách từ chúng, sử dụng List Comprehension. Hãy xem một ví dụ,

## [True, False, False, True, False, False, False, False]
0

đầu ra

import numpy as np

result = np.where(df['Country'] == 'Jamaica', True, False)
print(list(result))
3

Chúng tôi đã tạo Danh sách các số từ a đến b (không bao gồm b). Trong đó a là 20, và b là 30

Bản tóm tắt

Chúng tôi đã học về bốn cách khác nhau để tạo danh sách các số từ a đến b (không bao gồm b). Cảm ơn

Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python

 
  • Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
  • Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
  • Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
  • Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
  • Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
  • Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
  • Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
  • Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
  • Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
  • Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
  • Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
  • Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
  • Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
  • Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
  • Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
  • Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
 

Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?

Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học

Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python

Hãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay