Hướng dẫn is series same as list in python? - sê-ri có giống với danh sách trong python không?

Hãy nói rằng bạn có số lẻ từ 1 đến 20 và bạn đang lưu trữ chúng theo những cách sau:

# Python list
my_odd_nums = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
# Numpy array
my_odd_nums = numpy.array([1, 3, 5, 7, 9, 11, 13, 15, 17, 19])
# Pandas series
my_series = pandas.Series(my_odd_nums)
>>
0 1
1 3
2 5
3 7
4 9
5 11
6 13
7 15
8 17
9 19
dtype: int64

Danh sách, mảng và loạt gấu trúc trông khá giống nhau ngay từ cái nhìn đầu tiên, vì vậy mọi người thường hỏi - tại sao chúng ta cần các cấu trúc dữ liệu khác nhau? Những ưu và nhược điểm và trường hợp sử dụng là gì? Mục đích của bài viết ngắn gọn này là để xóa một số sự nhầm lẫn đó.

1. Danh sách Python

Danh sách là một trong 4 loại dữ liệu tích hợp trong Python để lưu trữ nhiều mục (3 loại dữ liệu khác là từ điển, bộ dữ liệu và bộ). Một danh sách duy nhất có thể lưu trữ nhiều loại dữ liệu cùng một lúc - số nguyên, phao, chuỗi. Một danh sách thậm chí có thể lưu trữ các danh sách, bộ dữ liệu và từ điển khác.

Để làm việc với các danh sách sau đây là các phương thức liên quan:

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
7

Ví dụ: phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
8 được sử dụng để thêm một mục vào danh sách hiện có:

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]

Để biết thêm chi tiết về cách áp dụng các phương pháp và chức năng đó, hãy xem bài viết này: Làm việc với Danh sách Python: Một trò gian lận.

2. Mảng numpy

Numpy, mặt khác, là một thư viện Python cốt lõi để tính toán khoa học (do đó tên là Số Python Python hay Numpy). Thư viện cung cấp các phương thức và chức năng để tạo và làm việc với các đối tượng đa chiều được gọi là mảng. Các mảng là lưới của các giá trị và không giống như danh sách Python, chúng có cùng loại dữ liệu:

# 1-dimesional array
array([1, 2, 3])
# 2-dimensional array
array([[1, 2],
[3, 4],
[5, 6]])

Một ví dụ về các phương thức được sử dụng thường xuyên là trình tạo số ngẫu nhiên:

# generate random integers
ran = np.random.randint(0,20,5) # low, high, size
print(ran)
>> array([1, 3, 5])

Vì các mảng Numpy đều là loại dữ liệu số, một loạt các hoạt động thống kê có thể được áp dụng:

# to add all values in an array
my_array = array([1,2,3])
my_array.sum()>> 6

Numpy là một thư viện mạnh mẽ với các chức năng toán học toàn diện và các thói quen đại số tuyến tính, vì vậy nó là nền tảng trong nhiều thư viện khoa học dữ liệu/học máy/học tập sâu.

3. Sê -ri Gandas

Sê-ri Pandas là danh sách các giá trị 1 chiều (có thể là các loại dữ liệu hỗn hợp-số nguyên, phao, văn bản) được lưu trữ với một chỉ mục được dán nhãn. Và nếu nhiều chuỗi được kết hợp với một chỉ mục duy nhất, nó được gọi là khung dữ liệu. Nói cách khác, khung dữ liệu là một tập hợp các loạt có cùng chỉ mục. Pandas là thư viện phổ biến nhất trong khoa học dữ liệu cho dữ liệu gây tranh cãi.

Một loạt có thể được tạo ra từ một danh sách Pythion hiện có hoặc một mảng numpy:

# index
countries = ["US", "BD", "CA"]
# data
data = [100, 200, 300]
# series
myseries = pd.Series(data, index = countries)
>>
US 100
BD 200
CA 300
dtype: int64

Để quay lại câu hỏi ban đầu: sự khác biệt và lợi thế của danh sách, mảng và loạt là gì?

Một điểm khác biệt chính là không gian cần thiết để lưu trữ dữ liệu. Hãy nói rằng chúng tôi có các số từ 0 đến 20 và được lưu trữ trong 3 cấu trúc dữ liệu. Nhìn vào sự khác biệt trong không gian lưu trữ. Numpy Array là một người chiến thắng rõ ràng.

Sự khác biệt khác là hiệu suất cao đáng kể của các mảng numpy trong các hoạt động vectơ và ma trận.

Mặc dù có một số khác biệt, mỗi loại dữ liệu có các trường hợp ứng dụng cụ thể trong khoa học dữ liệu - ví dụ, danh sách Python để lưu trữ các loại dữ liệu phức tạp bao gồm dữ liệu văn bản; Mảng numpy cho tính toán số hiệu suất cao; và loạt gandas để thao tác dữ liệu bảng để trực quan hóa, mô hình thống kê cũng như lọc và tóm tắt.

Hy vọng đó là một cuộc thảo luận hữu ích, nếu bạn có ý kiến, vui lòng viết chúng xuống bên dưới hoặc kết nối với tôi qua Medium, Twitter hoặc LinkedIn.

Sê -ri Pandas có thể được chuyển đổi thành danh sách bằng phương pháp đúc

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 hoặc loại.

Có thể có những tình huống khi bạn muốn thực hiện các hoạt động trong danh sách thay vì đối tượng gấu trúc. Trong những trường hợp như vậy, bạn có thể lưu trữ các cột DataFrame trong danh sách và thực hiện các hoạt động cần thiết. Sau đó, bạn có thể chuyển đổi danh sách trở lại thành DataFrame.

Trong bài viết này, bạn sẽ tìm hiểu cách sử dụng các phương pháp này để chuyển đổi loạt gấu trúc thành danh sách theo sau là một vài mẹo thực tế để sử dụng chúng.

Tạo một loạt gấu trúc

Hãy để tạo ra một loạt gấu trúc đơn giản làm ví dụ.

import pandas as pd

# Create the data of the series as a dictionary
data_ser = {'Name': 'Sony',
            'Country of Origin': 'Japan',
            'Revenue': 25000000000}

# Create the series
ser = pd.Series(data_ser)

ser
Name                        Sony
Country of Origin          Japan
Revenue              25000000000
dtype: object

Có nhiều phương pháp khác cũng để tạo ra một loạt từ trên cao.

Cách sử dụng phương thức tolist () để chuyển đổi chuỗi gấu trúc thành danh sách

Để chuyển đổi loạt gấu trúc thành danh sách, chỉ cần gọi phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 trên loạt mà bạn muốn chuyển đổi.

# Convert the series to a list
list_ser = ser.tolist()

print('Created list:', list_ser)
Created list: ['Sony', 'Japan', 25000000000]

Chuyển đổi cột DataFrame thành Danh sách

Các cột của một gấu trúc DataFrame cũng là các đối tượng của Pandas Series. Bạn có thể chuyển đổi các cột thành một danh sách bằng phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9.

Hãy để tạo ra một khung dữ liệu đơn giản để thực hiện thao tác này như được hiển thị bên dưới.

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
0After tải/tạo DataFrame, sử dụng phương thức
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 trên cột đã chọn.
Hướng dẫn is series same as list in python? - sê-ri có giống với danh sách trong python không?

After loading/creating the DataFrame, use the

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 method on the selected column.

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
1
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
2

Sử dụng phương thức đúc loại để chuyển đổi chuỗi thành danh sách

Typecasting là quá trình chuyển đổi loại dữ liệu của một đối tượng sang kiểu dữ liệu khác.

Bạn có thể trực tiếp thực hiện đúc loại để chuyển đổi một loạt thành một danh sách trong gấu trúc. Tất cả những gì bạn phải làm là chuyển chuỗi cho chức năng

# 1-dimesional array
array([1, 2, 3])
# 2-dimensional array
array([[1, 2],
[3, 4],
[5, 6]])
3

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
3
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
4

Bạn cũng có thể thực hiện đúc loại để chuyển đổi cột DataFrame thành danh sách. Nó tương tự như sử dụng phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 trong đó bạn chọn cột sẽ được chuyển đổi và sau đó đánh máy nó thành danh sách.
It is similar to using the
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 method wherein you select the column which is to be converted and then typecast it to a list.

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
5
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
2

Những mẹo có ích

  1. Nếu bạn đang chuyển đổi cột DataFrame thành danh sách, hãy nhớ rằng bạn không thể chuyển đổi nó thành danh sách và lưu trữ nó trong cùng một biến. Bạn cần lưu trữ danh sách trong một biến mới.
  2. Phương pháp
    mylist = [10, 12, 8, 6, 14]
    mylist.append(99)
    >> [10, 12, 8, 6, 14, 99]
    9 và các phương pháp đúc loại hoạt động cho loạt gandas cũng có các đối tượng lồng nhau.
  3. Phương pháp đúc loại có thể hoạt động trên bất kỳ điều gì có thể lặp lại trong khi phương pháp
    mylist = [10, 12, 8, 6, 14]
    mylist.append(99)
    >> [10, 12, 8, 6, 14, 99]
    9 sẽ chỉ được sử dụng trên các vòng lặp mà nó được gọi rõ ràng.

Kiểm tra kiến ​​thức của bạn

Câu 1: Phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 có thể chuyển đổi cột DataFrame thành danh sách. Đúng hay sai? The
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 method can convert a DataFrame column to a list inplace. True or False?

Answer:

Trả lời: SAI. Một biến mới phải được gán để lưu trữ danh sách. False. A new variable must be assigned to store the list.

Nhận khóa học Python hoàn thành miễn phí

Đối mặt với tình huống tương tự như mọi người khác?

Xây dựng sự nghiệp khoa học dữ liệu của bạn với trình độ được công nhận trên toàn cầu, được công nghiệp phê duyệt. Có được suy nghĩ, sự tự tin và các kỹ năng làm cho nhà khoa học dữ liệu trở nên có giá trị.

Hướng dẫn is series same as list in python? - sê-ri có giống với danh sách trong python không?

Nhận khóa học Python hoàn thành miễn phí

Xây dựng sự nghiệp khoa học dữ liệu của bạn với trình độ được công nhận trên toàn cầu, được công nghiệp phê duyệt. Có được suy nghĩ, sự tự tin và các kỹ năng làm cho nhà khoa học dữ liệu trở nên có giá trị.

Câu 2: Bạn có DataFrame DF có cột col_1, col_2 và col_3. Viết mã để chuyển đổi col_2 thành một danh sách bằng phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9. You have a DataFrame df having columns col_1, col_2, and col_3. Write the code to convert col_2 to a list using the
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 method.

Answer:

Trả lời:

# 1-dimesional array
array([1, 2, 3])
# 2-dimensional array
array([[1, 2],
[3, 4],
[5, 6]])
9
# 1-dimesional array
array([1, 2, 3])
# 2-dimensional array
array([[1, 2],
[3, 4],
[5, 6]])
9

Câu 3: Viết mã để chuyển đổi Series Pandas Series thành danh sách bằng phương thức đúc loại. Write the code to convert a pandas Series ser to a list using the type casting method.

Answer:

Trả lời:

# generate random integers
ran = np.random.randint(0,20,5) # low, high, size
print(ran)
>> array([1, 3, 5])
0
# generate random integers
ran = np.random.randint(0,20,5) # low, high, size
print(ran)
>> array([1, 3, 5])
0

Câu 4: Viết mã để chuyển đổi Series Pandas Series thành danh sách bằng phương thức

mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9. Write the code to convert a pandas Series ser to a list using the
mylist = [10, 12, 8, 6, 14]
mylist.append(99)
>> [10, 12, 8, 6, 14, 99]
9 method.

Answer:

Trả lời:

# generate random integers
ran = np.random.randint(0,20,5) # low, high, size
print(ran)
>> array([1, 3, 5])
2
# generate random integers
ran = np.random.randint(0,20,5) # low, high, size
print(ran)
>> array([1, 3, 5])
2

>

Bài viết này được đóng góp bởi Shreyansh B và Shri Varsheni

Bạn có thể chuyển đổi loạt phim thành Liệt kê Python không?

Sê -ri Pandas có thể được chuyển đổi thành một danh sách bằng phương thức Tolist () hoặc loại đúc. Có thể có những tình huống khi bạn muốn thực hiện các hoạt động trong danh sách thay vì đối tượng gấu trúc. Trong những trường hợp như vậy, bạn có thể lưu trữ các cột DataFrame trong danh sách và thực hiện các hoạt động cần thiết.. There can be situations when you want to perform operations on a list instead of a pandas object. In such cases, you can store the DataFrame columns in a list and perform the required operations.

Một loạt trong Python là gì?

Sê-ri là một mảng được dán nhãn một chiều có khả năng giữ dữ liệu thuộc bất kỳ loại nào (số nguyên, chuỗi, float, đối tượng Python, v.v.).Các nhãn trục được gọi chung là chỉ mục.a one-dimensional labeled array capable of holding data of any type (integer, string, float, python objects, etc.). The axis labels are collectively called index.

Sự khác biệt giữa loạt và mảng trong Python là gì?

Sê -ri Là mảng numpy tổng quát, sự khác biệt thiết yếu là sự hiện diện của chỉ số: Trong khi mảng numpy có một chỉ số số nguyên được xác định ngầm được sử dụng để truy cập các giá trị, sê -ri PANDAS có một chỉ số được xác định rõ ràng liên quan đến các giá trị.the presence of the index: while the Numpy Array has an implicitly defined integer index used to access the values, the Pandas Series has an explicitly defined index associated with the values.

Là một loạt giống như một khung dữ liệu?

Sê -ri chỉ có thể chứa một danh sách đơn với chỉ mục, trong khi DataFrame có thể được tạo ra nhiều hơn một loạt hoặc chúng ta có thể nói rằng DataFrame là một tập hợp các chuỗi có thể được sử dụng để phân tích dữ liệu. or we can say that a dataframe is a collection of series that can be used to analyse the data.