Pandas series là một cấu trúc dữ liệu một chiều. Nó có thể chứa dữ liệu thuộc nhiều loại bao gồm các đối tượng, số float, chuỗi và số nguyên. Bạn có thể tạo một chuỗi bằng cách gọi
import pandas as pd8
s = pd.Series[]
print[s]
Một danh sách, mảng numpy, dict có thể được biến thành một chuỗi pandas. Bạn nên sử dụng cấu trúc dữ liệu đơn giản nhất đáp ứng nhu cầu của bạn. Trong bài viết này, chúng ta sẽ thảo luận về cấu trúc dữ liệu chuỗi
khóa học liên quan. Phân tích dữ liệu với Python Pandas
Tạo chuỗi
Giới thiệu
Pandas có nhiều cấu trúc dữ liệu để xử lý dữ liệu. Một trong số đó là loạt.
Cú pháp của một chuỗi là.
1
2
3
import pandas as pd
s = pd.Series[]
print[s]
Điều này tạo ra một loạt trống
Tạo chuỗi từ danh sách
Để biến một danh sách thành một chuỗi, tất cả những gì bạn phải làm là
1
2
3
>>> import pandas as pd
>>> items = [1,2,3,4]
>>> s = pd.Series[items]
Nội dung của s là
0 1
1 2
2 3
3 4
dtype. int64
Theo mặc định được chỉ định một chỉ mục. Đầu tiên, nó hiển thị chỉ mục, sau đó là giá trị phần tử
Tạo chuỗi từ ndarray
Bạn có thể tạo một chuỗi từ ndarray gọn gàng
1
2
3
4
>>> import pandas as pd
>>> import numpy as np
>>> data = np.array[['x','y','z']]
>>> s = pd.Series[data]
Điều này xuất ra như sau
1
2
3
4
5
6
>>> s
0 x
1 y
2 z
dtype: object
>>>
Tạo một chuỗi từ một dict
Nếu bạn có một cuốn từ điển, bạn có thể biến nó thành một bộ truyện
1
2
3
4
10
2
3
Nội dung của bộ truyện như sau
import pandas as pd0
s = pd.Series[]
print[s]
import pandas as pd1
s = pd.Series[]
print[s]
Là chỉ mục, nó đã sử dụng các khóa từ điển
loạt gấu trúc
Chuỗi gấu trúc lấy chỉ mục
Bạn có thể truy cập dữ liệu chuỗi giống như với một danh sách hoặc ndarray
import pandas as pd2____03
s = pd.Series[]
print[s]
Bạn cắt một chuỗi, giống như bạn làm với một danh sách
import pandas as pd4
s = pd.Series[]
print[s]
import pandas as pd5
s = pd.Series[]
print[s]
import pandas as pd0
s = pd.Series[]
print[s]
import pandas as pd7
s = pd.Series[]
print[s]
khóa học liên quan. Phân tích dữ liệu với Python Pandas
Chuỗi Pandas có thể được định nghĩa là một mảng một chiều có khả năng lưu trữ các loại dữ liệu khác nhau. Chúng ta có thể dễ dàng chuyển đổi danh sách, bộ dữ liệu và từ điển thành sê-ri bằng phương pháp "sê-ri". Các nhãn hàng của chuỗi được gọi là chỉ số. Một chuỗi không thể chứa nhiều cột. Nó có tham số sau
- dữ liệu. Nó có thể là bất kỳ danh sách, từ điển hoặc giá trị vô hướng nào
- mục lục. Giá trị của chỉ mục phải là duy nhất và có thể băm được. Nó phải có cùng độ dài với dữ liệu. Nếu chúng tôi không chuyển bất kỳ chỉ mục nào, np mặc định. sắp xếp [n] sẽ được sử dụng
- gõ. Nó đề cập đến kiểu dữ liệu của chuỗi
- sao chép. Nó được sử dụng để sao chép dữ liệu
Tạo một chuỗi
Chúng ta có thể tạo Series theo hai cách
- Tạo một chuỗi trống
- Tạo Sê-ri bằng cách sử dụng đầu vào
Tạo một chuỗi rỗng
Chúng tôi có thể dễ dàng tạo một chuỗi trống trong Pandas, điều đó có nghĩa là nó sẽ không có bất kỳ giá trị nào
Cú pháp được sử dụng để tạo Chuỗi rỗng
Ví dụ dưới đây tạo một đối tượng kiểu Empty Series không có giá trị và có kiểu dữ liệu mặc định, i. e. , float64
Ví dụ
đầu ra
19
2
3
Tạo Sê-ri bằng cách sử dụng đầu vào
Chúng ta có thể tạo Sê-ri bằng cách sử dụng các đầu vào khác nhau
Tạo chuỗi từ mảng
Trước khi tạo Sê-ri, trước tiên chúng ta phải nhập mô-đun numpy sau đó sử dụng hàm array[] trong chương trình. Nếu dữ liệu là ndarray, thì chỉ mục được truyền phải có cùng độ dài
Nếu chúng ta không chuyển một chỉ mục, thì theo mặc định, chỉ mục của phạm vi [n] sẽ được chuyển trong đó n xác định độ dài của một mảng, i. e. , [0,1,2,. phạm vi[len[mảng]]-1]
Ví dụ
đầu ra
import pandas as pd0
s = pd.Series[]
print[s]
Tạo một chuỗi từ dict
Chúng tôi cũng có thể tạo Sê-ri từ dict. Nếu đối tượng từ điển đang được truyền dưới dạng đầu vào và chỉ mục không được chỉ định, thì các khóa từ điển được thực hiện theo thứ tự được sắp xếp để tạo chỉ mục
Nếu chỉ mục được thông qua, thì các giá trị tương ứng với một nhãn cụ thể trong chỉ mục sẽ được trích xuất từ từ điển
đầu ra
import pandas as pd1
s = pd.Series[]
print[s]
Tạo một chuỗi bằng Scalar
Nếu chúng ta lấy các giá trị vô hướng, thì chỉ mục phải được cung cấp. Giá trị vô hướng sẽ được lặp lại để khớp với độ dài của chỉ mục
đầu ra
import pandas as pd2
s = pd.Series[]
print[s]
Truy cập dữ liệu từ chuỗi với Vị trí
Khi bạn tạo đối tượng kiểu Sê-ri, bạn có thể truy cập các chỉ mục, dữ liệu và thậm chí cả các phần tử riêng lẻ của nó
Dữ liệu trong Sê-ri có thể được truy cập tương tự như dữ liệu trong ndarray
đầu ra
Chuỗi thuộc tính đối tượng
Thuộc tính Series được định nghĩa là bất kỳ thông tin nào liên quan đến đối tượng Series như kích thước, kiểu dữ liệu. vân vân. Dưới đây là một số thuộc tính mà bạn có thể sử dụng để lấy thông tin về đối tượng Sê-ri
Thuộc tínhMô tảSê-ri. indexXác định chỉ mục của Sê-ri. Loạt. shapeIt trả về một bộ dữ liệu có hình dạng. Loạt. dtypeIt trả về kiểu dữ liệu của dữ liệu. Loạt. sizeIt trả về kích thước của dữ liệu. Loạt. emptyIt trả về True nếu đối tượng Series trống, ngược lại trả về false. Loạt. hasnansIt trả về True nếu có bất kỳ giá trị NaN nào, nếu không thì trả về false. Loạt. nbytesIt trả về số byte trong dữ liệu. Loạt. ndimIt trả về số lượng kích thước trong dữ liệu. Loạt. itemsizeIt trả về kích thước kiểu dữ liệu của itemTruy xuất mảng Chỉ mục và mảng dữ liệu của một đối tượng sê-ri
Chúng ta có thể truy xuất mảng chỉ mục và mảng dữ liệu của một đối tượng Sê-ri hiện có bằng cách sử dụng thuộc tính chỉ mục và giá trị
đầu ra
import pandas as pd3
s = pd.Series[]
print[s]
Truy xuất Loại [dtype] và Kích thước của Loại [itemsize]
Bạn có thể sử dụng thuộc tính dtype với đối tượng Sê-ri asdtype để truy xuất loại dữ liệu của một phần tử riêng lẻ của đối tượng sê-ri, bạn có thể sử dụng thuộc tính kích thước vật phẩm để hiển thị số byte được phân bổ cho từng hạng mục dữ liệu
đầu ra
Truy xuất hình dạng
Hình dạng của đối tượng Sê-ri xác định tổng số phần tử bao gồm các giá trị bị thiếu hoặc trống [NaN]
đầu ra
Truy xuất Kích thước, Kích thước và Số byte
đầu ra
Kiểm tra tính trống rỗng và sự hiện diện của NaN
Để kiểm tra đối tượng Series có trống không, bạn có thể sử dụng thuộc tính empty. Tương tự, để kiểm tra xem một đối tượng sê-ri có chứa một số giá trị NaN hay không, bạn có thể sử dụng thuộc tính hasans