Hướng dẫn python pandas program with output class 12 - chương trình pandas python với đầu ra lớp 12

Show

Danh sách các chương trình cho tin học & nbsp; thực hành. Tập tin thực tế - xii & nbsp; & nbsp;

I. Python Pandas: Xử lý dữ liệu

  1. Tạo một loạt gấu trúc từ một từ điển của các giá trị và một ndarray.

  2. Viết một chương trình gấu trúc để thực hiện các hoạt động số học trên hai loạt gấu trúc.

  3. Viết một chương trình gấu trúc để thêm một số dữ liệu vào một chuỗi hiện có.

  4. Viết một chương trình gấu trúc để chọn các hàng trong đó tỷ lệ phần trăm lớn hơn 70.

  5. Viết một chương trình gấu trúc để chọn các hàng tỷ lệ phần trăm là từ 70 đến 90 (bao gồm)

  6. Viết một chương trình gấu trúc để thay đổi tỷ lệ phần trăm theo một hàng nhất định của người dùng.

  7. Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho dọc theo các hàng và gán tất cả dữ liệu.

  8. Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho cùng với các cột và gán tất cả dữ liệu.

  9. Viết một chương trình gấu trúc để nối một danh sách các từ điển hoặc chuỗi vào một dữ liệu hiện có và hiển thị dữ liệu kết hợp.

  10. Chương trình & nbsp; để chọn hoặc lọc hàng từ DataFrame dựa trên các giá trị trong các cột trong gấu trúc (sử dụng các toán tử quan hệ và logic)

  11. Lọc ra các hàng dựa trên các tiêu chí khác nhau như các hàng trùng lặp.

  12. Nhập và xuất dữ liệu giữa tệp Pandas và CSV.

  • Để tạo và mở khung dữ liệu bằng cách sử dụng tệp ‘student_result.csv bằng cách sử dụng gấu trúc.

  • Để hiển thị nhãn hàng, các loại dữ liệu nhãn cột của mỗi & nbsp; Cột và kích thước

  • Để hiển thị hình dạng (số lượng hàng và cột) của tệp CSV.

13. Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các điều sau & nbsp; hoạt động:

  • Để hiển thị adm_no, giới tính và tỷ lệ phần trăm từ ‘student_result.csv.

  • Để hiển thị 5 bản ghi 5 và 5 đầu tiên từ ‘student_result.csv.

14. Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các điều sau & nbsp; hoạt động:

  • Để hiển thị tệp student_result với tên cột mới.

  • Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN trong DataFrame.

15. Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các điều sau & nbsp; hoạt động:

  • Để tạo một tệp trùng lặp cho ‘student_result.csv, chứa adm_no, tên và tỷ lệ phần trăm.

  • Viết tuyên bố bằng gấu trúc để tìm tỷ lệ cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh.

16. Nhập và xuất dữ liệu giữa cơ sở dữ liệu Gandas và MySQL.

17. Tìm tổng của mỗi cột hoặc tìm cột có giá trị trung bình thấp nhất.

18. Xác định vị trí 3 giá trị lớn nhất trong khung dữ liệu.

19. Trừ giá trị trung bình của một hàng từ mỗi phần tử của hàng trong khung dữ liệu.

20. Thay thế tất cả các giá trị âm trong khung dữ liệu bằng 0.

21. Thay thế tất cả các giá trị bị thiếu trong khung dữ liệu bằng 999.

22. Đưa ra một loạt, in tất cả các yếu tố trên phần trăm thứ 75.

23. Tạo một khung dữ liệu bán hàng quý trong đó mỗi hàng chứa danh mục vật phẩm, tên vật phẩm và chi tiêu. Nhóm các hàng theo danh mục và in tổng chi tiêu cho mỗi danh mục.

24. Tạo một khung dữ liệu dựa trên dữ liệu thương mại điện tử và tạo ra thống kê mô tả (trung bình, trung bình, chế độ, tứ phân vị và phương sai)

Ii. Hình dung

25.Given the school result data, analyses the performance of the students on different parameters, e.g subject wise or class wise.

26. Viết một chương trình để vẽ biểu đồ thanh trong Python để hiển thị kết quả của một trường học trong năm năm liên tiếp.

27. Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại.

  • Số lượng học sinh chống lại điểm số trong tất cả 7 môn

  • Hiển thị điểm số cao nhất của mỗi đối tượng

28. Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại.

  • Hiển thị điểm trung bình của từng đối tượng

29. Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại.

  • Số phụ nữ và nam giới

  • Tỷ lệ phần trăm trung bình của nữ và nam

30. Lấy dữ liệu về sự quan tâm của bạn từ một nguồn mở (ví dụ: data.gov.in), tổng hợp và tóm tắt nó. Sau đó vẽ nó bằng cách sử dụng các chức năng âm mưu khác nhau của thư viện matplotlib.

CODING:

  1. Tạo một loạt gấu trúc từ một từ điển của các giá trị và một ndarray.

# Tạo một loạt gấu trúc từ một từ điển các giá trị và một ndarray

Nhập gấu trúc dưới dạng nhập khẩu PD Numpy như NP & NBSP; s = pd.series (np.array ([1,3,4,7,8,8,9])) in (s)
import numpy as np 
s=pd.Series(np.array([1,3,4,7,8,8,9]))
print(s)


# & nbsp; tạo từ điển & nbsp; Từ điển = {'x': 10, 'y': 20, 'z': 30} # & nbsp; tạo một loạt & nbsp; sê -ri = pd.series (từ điển) & nbsp; in (sê -ri) & nbsp;
dictionary = {'X' : 10, 'Y' : 20, 'Z' : 30} #  create a series 
series = pd.Series(dictionary) 
print(series)

 

2. Viết một chương trình gấu trúc để thực hiện các hoạt động số học trên hai loạt gấu trúc.

# Viết một chương trình gấu trúc để thực hiện các hoạt động số học trên hai loạt gấu trúc. , 10]) ds = ds1 + ds2 in ("Thêm hai sê -ri:") in (ds) in ("Subtract Two Series:") = DS1 * DS2 Print (DS) In ("Chuỗi phân chia1 cho series2:") DS = DS1 / DS2 Print (DS)
import pandas as pd
ds1 = pd.Series([3, 6, 9, 12, 15])
ds2 = pd.Series([2, 4, 6, 8, 10])
ds = ds1 + ds2
print("Add two Series:")
print(ds)
print("Subtract two Series:")
ds = ds1 - ds2
print(ds)
print("Multiply two Series:")
ds = ds1 * ds2
print(ds)
print("Divide Series1 by Series2:")
ds = ds1 / ds2
print(ds)

3. Viết một chương trình gấu trúc để thêm một số dữ liệu vào một chuỗi hiện có.

# Viết một chương trình gấu trúc để thêm một số dữ liệu vào một chuỗi hiện có.

Nhập Pandas dưới dạng pd s = pd.series (['s101', 'amjad', 'c.sc.', 'xii - a1', '450']) in ("Chuỗi dữ liệu gốc:") PRIN
s = pd.Series(['S101', 'Amjad', 'C.Sc.', 'XII – A1', '450'])
print("Original Data Series:")
print(s)
print("\nData Series after adding some data:")
new_s = s.append(pd.Series(['90.0', 'PASS']))
print(new_s)

4. Viết một chương trình gấu trúc để chọn các hàng trong đó tỷ lệ phần trăm lớn hơn 70.

# Viết một chương trình gấu trúc để chọn các hàng trong đó tỷ lệ phần trăm lớn hơn 70.Import Pandas là nhập khẩu PD NUMPY là NP
import pandas as pd
import numpy as np

exam_data & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [79,5, 29, 90,5, np.nan, 32, 65, 56, np.nan, 29, 89], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'không', 'có', 'không', 'không', 'có', 'có', 'không', 'không', 'có']} nhãn = [' A ',' b ',' c ',' b ',' e ',' f ',' g ',' h ',' i ',' j ']]]]
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}
labels = ['A', 'B', 'C', 'B', 'E', 'F', 'G', 'H', 'I', 'J']

df = pd.dataframe (exam_data, index = nhãn) in ("số lượng sinh viên tỷ lệ phần trăm nhiều hơn 70:") in (df [df ['perc']> 70]) & nbsp;
print("Number of student whoes percentage more than 70:")
print(df[df['perc'] > 70])

 

5. Viết chương trình gấu trúc để chọn hàng, tỷ lệ phần trăm là từ 70 đến 90 (bao gồm)

# Viết một chương trình gấu trúc để chọn các hàng phần trăm là từ 70 đến 90 (bao gồm) nhập khẩu gấu trúc là nhập khẩu PD NUMPY là NP
import pandas as pd
import numpy as np

exam_data & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [79,5, 29, 90,5, np.nan, 32, 65, 56, np.nan, 29, 89], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'không', 'có', 'không', 'không', 'có', 'có', 'không', 'không', 'có']} nhãn = [' A ',' b ',' c ',' b ',' e ',' f ',' g ',' h ',' i ',' j ']]]]
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}
labels = ['A', 'B', 'C', 'B', 'E', 'F', 'G', 'H', 'I', 'J']

df = pd.dataframe (exam_data, index = nhãn) in ("số lượng sinh viên tỷ lệ phần trăm nhiều hơn 70:") in (df [df ['perc']> 70]) & nbsp;
print("Number of student whoes percentage more than 70:")
print(df[df['perc'].between(70,90)])

5. Viết chương trình gấu trúc để chọn hàng, tỷ lệ phần trăm là từ 70 đến 90 (bao gồm)

# Viết một chương trình gấu trúc để chọn các hàng phần trăm là từ 70 đến 90 (bao gồm) nhập khẩu gấu trúc là nhập khẩu PD NUMPY là NP
import pandas as pd
import numpy as np

df = pd.dataframe (exam_data, index = nhãn) in ("số lượng sinh viên tỷ lệ phần trăm nhiều hơn 70:") in (df [df ['perc']. Giữa (70,90)]))
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}
labels = ['A', 'B', 'C', 'B', 'E', 'F', 'G', 'H', 'I', 'J']

6. Viết một chương trình gấu trúc để thay đổi tỷ lệ phần trăm theo một hàng nhất định của người dùng.
print("\nOriginal data frame:")
print(df)
ch = input("Enter the index of row : ")
per = float(input("Enter percentage to be changed: "))
print('\nChange the percentage in row '+ch+ ' to',per)
df.loc[ch, 'perc'] = per
print(df)

 

# Viết một chương trình gấu trúc để thay đổi tỷ lệ phần trăm theo hàng được cho bởi người dùng.

exam_dic & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [79,5, 29, 90,5, np.nan, 32, 65, 56, np.nan, 29, 89], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'không', 'có', 'không', 'không', 'có', 'có', 'không', 'không', 'có']} nhãn = [' A ',' b ',' c ',' b ',' e ',' f ',' g ',' h ',' i ',' j ']]]]
import pandas as pd
import numpy as np

df = pd.dataFrame (exc đã thay đổi: ")) in ('\ nchange tỷ lệ phần trăm trong hàng'+ ch+ 'thành', per) df.loc [ch, 'perc'] = mỗi in (df) & nbsp;
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}

7. Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho dọc theo các hàng và gán tất cả dữ liệu.

# Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho dọc theo các hàng và gán tất cả dữ liệu.
        'perc': [89.5, 92, 90.5, 91.5, 90],
          'qualify': ['yes', 'yes', 'yes', 'yes', 'yes']}

exam_dic1 & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [79,5, 29, 90,5, np.nan, 32, 65, 56, np.nan, 29, 89], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'không', 'có', 'không', 'không', 'có', 'có', 'không', 'không', 'có']}

exic_data1 = pd.dataFrame (exc
print(exam_data1)
print("-------------------------------------")
print(exam_data2)
print("\nJoin the said two dataframes along rows:")
result_data = pd.concat([exam_data1, exam_data2])
print(result_data)

 

exic_dic2 & nbsp; = {'name': ['parveen', 'ahil', 'ashaz', 'shifin', 'hanash'], & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [89,5, 92, 90,5, 91,5, 90], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'có', 'có', 'có', 'có']}

exic_data2 = pd.dataFrame (exc

in ("DataFrames gốc:") in (excor_data1) in ("--------------------------------------- -") in (exic_data2) in (" \ njoin hai dataFrames đã nói dọc theo các hàng: ") result_data = pd.concat ([exest_data1, exic_data2]) in (result_data) & nbsp;
import numpy as np

df = pd.dataFrame (exc đã thay đổi: ")) in ('\ nchange tỷ lệ phần trăm trong hàng'+ ch+ 'thành', per) df.loc [ch, 'perc'] = mỗi in (df) & nbsp;
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}

7. Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho dọc theo các hàng và gán tất cả dữ liệu.

# Viết một chương trình gấu trúc để tham gia hai DataFrames đã cho dọc theo các hàng và gán tất cả dữ liệu.
        'perc': [89.5, 92, 90.5, 91.5, 90],
          'qualify': ['yes', 'yes', 'yes', 'yes', 'yes']}

exic_data2 = pd.dataFrame (exc

in ("DataFrames gốc:") in (excor_data1) in ("--------------------------------------- -") in (exic_data2) in (" \ njoin hai dataFrames đã nói dọc theo các hàng: ") result_data = pd.concat ([exest_data1, exic_data2], trục = 1) in (result_data) & nbsp;
print(exam_data1)
print("-------------------------------------")
print(exam_data2)
print("\nJoin the said two dataframes along rows:")
result_data = pd.concat([exam_data1, exam_data2],axis=1)
print(result_data)

 

9.

# Viết một chương trình gấu trúc để nối danh sách các từ điển hoặc chuỗi vào một # dataFrame hiện có và hiển thị dữ liệu kết hợp.
import pandas as pd
import numpy as np

exam_dic1 & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , & nbsp; & nbsp; & nbsp; & nbsp; 'Perc': [79,5, 29, 90,5, np.nan, 32, 65, 56, np.nan, 29, 89], & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; 'đủ điều kiện': ['có', 'không', 'có', 'không', 'không', 'có', 'có', 'không', 'không', 'có']}
        'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
          'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}

exic_data1 = pd.dataFrame (exc

s = pd.series (['sukhvir', 54, 'có'], index = ['name', 'perc', 'đủ điều kiện']))


dicts = [{'tên': 'krish', 'perc': 45, 'đủ điều kiện': 'có'}, & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; {'tên': 'kumar', 'perc': 67, 'đủ điều kiện': 'có'}]]
         {'name': 'Kumar', 'perc': 67,'qualify':'yes'}]

print ("DataFrames gốc:") in (exic_data1) in ("\ ndictionary:") in & nbsp; Combined_data.Append (dicts, onvore_index = true, sort = false) in ("\ ncombined dữ liệu:")
print(exam_data1)
print("\nDictionary:")
print(s)
# Add Series
combined_data =  exam_data1.append(s, ignore_index=True, sort=False)
# Add Dictionary
combined_info =  combined_data.append(dicts, ignore_index=True, sort=False)
print("\nCombined Data:")
# Print Combined Data/info
print(combined_info)

 

10. Lập trình chọn hoặc lọc các hàng từ DataFrame dựa trên các giá trị trong các cột trong gấu trúc. (Sử dụng các toán tử quan hệ và logic)

# Chương trình chọn hoặc lọc các hàng từ DataFrame dựa trên các giá trị trong các cột trong gấu trúc. (Sử dụng các toán tử quan hệ và logic)
import pandas as pd
import numpy as np

exam_dic1 & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , 'perc': [79,5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89], 'đủ điều kiện': ['Có', 'không', 'có', 'không ',' không ',' có ',' có ',' không ',' không ',' có ']}
'perc': [79.5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89],
'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}

exic_data1 = pd.dataFrame (exc

s = pd.series (['sukhvir', 54, 'có'], index = ['name', 'perc', 'đủ điều kiện']))
print(exam_data1)
print("\nUse == operator\n")
print(exam_data1.loc[exam_data1['name'] == 'Rohan'])

dicts = [{'tên': 'krish', 'perc': 45, 'đủ điều kiện': 'có'}, & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; {'tên': 'kumar', 'perc': 67, 'đủ điều kiện': 'có'}]]
print(exam_data1.loc[exam_data1['perc'] < 40])

print ("DataFrames gốc:") in (exic_data1) in ("\ ndictionary:") in & nbsp; Combined_data.Append (dicts, onvore_index = true, sort = false) in ("\ ncombined dữ liệu:")
print(exam_data1.loc[exam_data1['qualify'] != 'no'])

10. Lập trình chọn hoặc lọc các hàng từ DataFrame dựa trên các giá trị trong các cột trong gấu trúc. (Sử dụng các toán tử quan hệ và logic)
print(exam_data1.loc[(exam_data1['qualify'] != 'yes') & (exam_data1['perc'] <40)])

# Chương trình chọn hoặc lọc các hàng từ DataFrame dựa trên các giá trị trong các cột trong gấu trúc. (Sử dụng các toán tử quan hệ và logic)

exam_dic1 & nbsp; = {'name': ['Aman', 'Kamal', 'Amjad', 'Rohan', 'Amit', 'Sumit', 'Matthew', 'Kartik', 'Kavita', 'Pooja'] , 'perc': [79,5, 29, 90.5, np.nan, 32, 65, 56, np.nan, 29, 89], 'đủ điều kiện': ['Có', 'không', 'có', 'không ',' không ',' có ',' có ',' không ',' không ',' có ']}

in ("DataFrames gốc:") in (excor_data1) in ("\ nuse == toán tử \ n") in (exic_data1.loc [exic_data1 ['name'] == 'rohan'])
data={'Name':['Aman','Rohit','Deepika','Aman','Deepika','Sohit','Geeta'], 
'Sales':[8500,4500,9200,8500,9200,9600,8400]} 
sales=pd.DataFrame(data) 
# Find duplicate rows 
duplicated = sales[sales.duplicated(keep=False)]
print("duplicate Row:\n",duplicated)

 

& nbsp; print ("\ nuse

print ("\ n sử dụng! = Toán tử \ n") in (exic_data1.loc [exic_data1 ['đủ điều kiện']! = 'không']))
# To create and open a data frame using ‘Student_result.csv’ file using Pandas.
# To display row labels, column labels data types of each  column and the dimensions
# To display the shape (number of rows and columns) of the CSV file.


& nbsp; in ("\ n nhiều điều kiện \ n") in (exic_data1.loc [(excor_data1 ['đủ điều kiện']! = 'có') & (excor_data1 ['perc']]
import csv

11. Lọc ra các hàng dựa trên các tiêu chí khác nhau như các hàng trùng lặp
df = pd.read_csv("student_result.csv")
# Display Name of Columns
print(df.columns)

# Lọc ra các hàng dựa trên các tiêu chí khác nhau như các hàng trùng lặp
print(df.shape)

nhập khẩu gấu trúc dưới dạng PD & NBSP; data = {'name': ['aman', 'rohit', 'Deepika', 'Aman', 'Deepika', 'sohit', 'geeta'], & nbsp; 'Bán hàng': [8500.4500.9200.8500.9200.9600.8400]} & NBSP; sales = pd.dataFrame (dữ liệu) & nbsp; # Tìm các hàng trùng lặp & nbsp; trùng lặp = sales [sales.duplicated (keep = false)] in ("Hàng trùng lặp: \ n", trùng lặp) & nbsp;
print(df.info())

12. Nhập và xuất dữ liệu giữa tệp Pandas và CSV. # Để tạo và mở khung dữ liệu bằng cách sử dụng tệp ‘student_result.csv bằng cách sử dụng gấu trúc. # Để hiển thị các nhãn hàng, các nhãn dữ liệu nhãn của mỗi & nbsp; cột và kích thước # để hiển thị hình dạng (số lượng hàng và cột) của tệp CSV. # To display Adm_No, Gender and Percentage from ‘student_result.csv’ file. # To display the first 5 and last 5 records from ‘student_result.csv’ file.

# Nhập và xuất dữ liệu giữa tệp Pandas và CSV. # Để tạo và mở khung dữ liệu bằng cách sử dụng tệp ‘student_result.csv bằng cách sử dụng gấu trúc. # Để hiển thị các nhãn hàng, các nhãn dữ liệu nhãn của mỗi & nbsp; cột và kích thước # để hiển thị hình dạng (số lượng hàng và cột) của tệp CSV.
# To display Adm_No, Gender and Percentage from ‘student_result.csv’ file.
# To display the first 5 and last 5 records from ‘student_result.csv’ file.

& nbsp; in ("\ n nhiều điều kiện \ n") in (exic_data1.loc [(excor_data1 ['đủ điều kiện']! = 'có') & (excor_data1 ['perc']]
import csv

11. Lọc ra các hàng dựa trên các tiêu chí khác nhau như các hàng trùng lặp
df = pd.read_csv("student_result.csv",usecols = ['ADM_NO','GENDER', 'PERCENTAGE'])

# Lọc ra các hàng dựa trên các tiêu chí khác nhau như các hàng trùng lặp
print(df)

#To Hiển thị 5 bản ghi đầu tiên và 5 bản ghi cuối từ ‘student_result.csv. df1 = pd.read_csv ("student_result.csv") in (df1.head ()) in (df1.tail ())
df1 = pd.read_csv("student_result.csv")
print(df1.head())
print(df1.tail())

14. Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các tác phẩm sau & nbsp; hoạt động: # Để hiển thị tệp student_result với tên cột mới. # Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN trong DataFrame. # To display Student_result file with new column names. # To modify the Percentage of student below 40 with NaN value in dataframe.

# Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các tác phẩm sau & nbsp; hoạt động: # Để hiển thị tệp student_result với tên cột mới. # Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN trong DataFrame.
# To display Student_result file with new column names.
# To modify the Percentage of student below 40 with NaN value in dataframe.

Nhập Pandas dưới dạng nhập khẩu PD Numpy như NP Nhập CSV
import numpy as np
import csv

df = pd.read_csv ("student_result.csv") in (df)
print(df)

#To Hiển thị tệp Student_Result với tên cột mới. df1 = pd.read_csv ("student_result.csv", skiprows = 1,
df1 = pd.read_csv("student_result.csv",skiprows = 1,

Tên = ['Adno', 'sex', 'name', 'eng', 'hin',

'Maths','Sc.','SSt','San','IT','Perc'])

in ("để hiển thị tệp student_result với tên cột mới") in (df1)
print(df1)

# Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN. df2 = pd.read_csv ("student_result.csv") in (df2)
df2 = pd.read_csv("student_result.csv")
print(df2)

In ("Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN.") DF2.LOC [(DF2 ['Tỷ lệ phần trăm']]
df2.loc[(df2['PERCENTAGE'] <40, 'PERCENTAGE')] = np.nan
print(df2)

 

15. # Viết tuyên bố bằng gấu trúc để tìm tỷ lệ cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh. # To create a duplicate file for ‘student_result.csv’ containing Adm_No, Name and Percentage. # Write the statement in Pandas to find the highest percentage and also print the student’s name and percentage.

# Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các tác phẩm sau & nbsp; hoạt động: # Để tạo tệp trùng lặp cho‘ student_result.csv, chứa adm_no, tên và tỷ lệ phần trăm. # Viết tuyên bố bằng gấu trúc để tìm tỷ lệ cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh.
# To create a duplicate file for ‘student_result.csv’ containing Adm_No, Name and Percentage.
# Write the statement in Pandas to find the highest percentage and also print the student’s name and percentage.

Nhập Pandas dưới dạng nhập khẩu PD Numpy như NP Nhập CSV
import numpy as np
import csv

df = pd.read_csv ("student_result.csv") in (df)
df = pd.read_csv("student_result.csv")
df.to_csv('copyStudent_result.csv',columns=['ADM_NO',"STUDENT'S_NAME","PERCENTAGE"])
# Display Copied Dataframe
df2=pd.read_csv("copyStudent_result.csv")
print(df2)

#To Hiển thị tệp Student_Result với tên cột mới. df1 = pd.read_csv ("student_result.csv", skiprows = 1,
df1 = pd.read_csv("student_result.csv")
df1 = df1[["STUDENT'S_NAME",'PERCENTAGE']]
[df1.PERCENTAGE== df1['PERCENTAGE'].max()]
print(df1)

Tên = ['Adno', 'sex', 'name', 'eng', 'hin',

in ("để hiển thị tệp student_result với tên cột mới") in (df1)

# Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN. df2 = pd.read_csv ("student_result.csv") in (df2)
import pandas as pd
import mysql.connector
from sqlalchemy import types, create_engine

In ("Để sửa đổi tỷ lệ phần trăm của học sinh dưới 40 với giá trị NAN.") DF2.LOC [(DF2 ['Tỷ lệ phần trăm']]
dic={
'EMPNO':[7369,7499,7566,7654,7698,7782,7788,7839,7844,7900,7902,7934],
'ENMAE':['JAMES','ADAMS','CLARK','KING','WARD','JONES','ADAMS','SCOTT','FORD',

15. # Viết tuyên bố bằng gấu trúc để tìm tỷ lệ cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh.'MARTIN','TURNER'],
'JOB':['CLERK','CLERK','ANALYST','MANAGER','MANAGER','PRESIDENT','ANALYST',

# Đọc ‘student_result.csv, để tạo khung dữ liệu và thực hiện các tác phẩm sau & nbsp; hoạt động: # Để tạo tệp trùng lặp cho‘ student_result.csv, chứa adm_no, tên và tỷ lệ phần trăm. # Viết tuyên bố bằng gấu trúc để tìm tỷ lệ cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh.'MANAGER','ANALYST','SALESMAN','CLERK'],
'MGR':[7876,7876,7782,7900,7900 ,7900,7782,7876,7900,7782,7900,7876],
'HIREDATE':['2005/02/18','2005/01/04','2001/05/18','2003/04/19','2001/07/02',
'2006/09/21','2007/03/13','2005/03/06', '2007/01/12','2009/07/19','2009/01/05',

# Để tạo một tệp trùng lặp cho ‘student_result.csv, chứa adm_no, tên và tỷ lệ phần trăm. df = pd.read_csv ("student_result.csv") df.to_csv ('copystudent_result.csv', cột = ['adm_no', "student's_name", "phần trăm"] "copystudent_result.csv") in (df2)
'SAL':[11400,19200,29400,60000,15000,95700,13200,36000,36000,34200,15000,18000],
'COMM':[4000,5000,5000,4000,2500,4000,2500,3000 ,3000,2500,2000 ,6000],
'DEPTT':[20,30,20,30,30,10,20,10,30,30,20,10]
}

# Tìm tỷ lệ phần trăm cao nhất và cũng in tên và tỷ lệ phần trăm của học sinh. df1 = pd.read_csv ("student_result.csv") df1 = df1 [["student's_name", 'phần trăm']] [df1.percentage == df1 ['phần trăm']. Max ()]
print('Our DataFrame is:\n',data)

tableName="employeedata"

16. Nhập và xuất dữ liệu giữa cơ sở dữ liệu Pandas và MySQL
sqlEngine = create_engine("mysql+pymysql://root:@localhost/Company")
dbConnection = sqlEngine.connect()

# Nhập và xuất dữ liệu giữa cơ sở dữ liệu Pandas và MySQL
    # Exporting dataframe to SQl
    frame = data.to_sql(tableName, dbConnection, if_exists='fail');

Nhập pymysql nhập khẩu gấu trúc dưới dạng nhập khẩu pd mysql.connector từ các loại nhập khẩu sqlalchemy, created_engine

# Tạo DataFrame Dic = {'Empno': [7369,7499,7566,7654,7698,782,788,7839,7844,7900,7902,7934] Clark ',' King ',' Ward ',' Jones ',' Adams ',' Scott ',' Ford ',

'Blake', 'Martin', 'Turner'], 'Công việc': ['Thư ký', 'Thư ký', 'Nhà phân tích', 'Người quản lý', 'Người quản lý', 'Chủ tịch', 'Nhà phân tích', Nhà phân tích ',

'Thư ký', 'Người quản lý', 'Nhà phân tích', 'Nhân viên bán hàng', 'Thư ký'], 'MGR': [7876.7876.7782.7900.7900, 7900.7782.7876.7900.7782.7900.7876] , 'Được thuê': ['2005/02/18', '2005/01/04', '2001/05/18', '2003/04/19', '2001/07/02', '2006/09 /21 ',' 2007/03/13 ',' 2005/03/06 ',' 2007/01/12 ',' 2009/07/19 ',' 2009/01/05 ',

else:

'2004/11/30'], 'Sal': [11400,19200,29400,60000,15000,95700,13200,36000,36000,34200,15000,18000], 'Comm': [4000,5000,5000, 4000,2500,4000,2500,3000, 3000,2500,2000, 6000], 'Phòng': [20,30,20,30,30,10,20,10,30,30,20,10]}}

finally:

data = pd.dataFrame (DIC) in ('DataFrame của chúng tôi là: \ n', dữ liệu)


# Tạo động cơ sqlalchemy sqlengine = created_engine ("mysql+pymysql: // root:@localhost/company") dbconnection = sqlengine.connect ()

thử: & nbsp; & nbsp; # Xuất DataFrame sang SQL & NBSP; & nbsp; frame = data.to_sql (tablename, dbconnection, if_exist = 'fail');

ngoại trừ valueError là vx:

& nbsp; & nbsp; in (VX)

ngoại trừ ngoại lệ là Ex: & nbsp; & nbsp;
print(dframe)

& nbsp; & nbsp; in (ví dụ)
 

& nbsp; & nbsp; in ("Bảng %s được tạo thành công. \ n" %TableName); & nbsp; & nbsp;

& nbsp; & nbsp; dbconnection.close () & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp;
import pandas as pd 
Pass_Perc ={'Phy': {'2017':95.4,'2018':96.4,'2019':99.2,'2020':97.4},
'Che': {'2017':96.5,'2018':97.4,'2019':100,'2020':99.2}, 
'Maths': {'2017':90.2,'2018':92.6,'2019':97.4,'2020':98.0},
'Eng': {'2017':99.2,'2018':100,'2019':100,'2020':100},
'IP': {'2017':95.6,'2018':100,'2019':100,'2020':100}} 

df=pd.DataFrame(Pass_Perc) 
print(df) 
print() 
print('Column wise sum in datframe is :') 
print(df.sum(axis=0)) 
#  Print mean vaLue of each coLumn 
print() 
print('Column wise mean value are:') 
print(df.mean(axis=0).round(1)) 
#  Returns CoLumn with minimum mean vaLue 
print() 
print('Column with minimum mean value is:') 
print(df.mean(axis=0).idxmin()) 

 

18. Locate the 3 largest values in a data frame.

# Locate the 3 largest values in a data frame.
import pandas as pd 
data={'Name':['Aman','Rohit','Deepika','Kamal','Deva','Ramesh','Adnan'], 
'Sales':[8500,4500,9300,8600,9200,9600,8400]} 
sales=pd.DataFrame(data) 
# Find  3 Largest Value for MarksinlP Column
print(sales.nlargest(3,['Sales']))

19. Subtract the mean of a row from each element of the row in a Data Frame

# Subtract the mean of a row from each element of the row in a Data Frame
import pandas as pd 
Pass_Perc ={'Phy': {'2017':95.4,'2018':96.4,'2019':99.2,'2020':97.4},
'Che': {'2017':96.5,'2018':97.4,'2019':100,'2020':99.2}, 
'Maths': {'2017':90.2,'2018':92.6,'2019':97.4,'2020':98.0},
'Eng': {'2017':99.2,'2018':100,'2019':100,'2020':100},
'IP': {'2017':95.6,'2018':100,'2019':100,'2020':100}} 

df=pd.DataFrame(Pass_Perc) 
print(df) 
print() 

print('Mean of each row is:') 
print(df.mean(axis=1)) 
print() 
print('Datafranie after Subtracting mean value of\
each row from each element of that Row is:')
print(df.sub(df.mean(axis=1), axis=0))      

 

20. Replace all negative values in a data frame with a 0.

# Replace all negative values in a data frame with a 0.

import pandas as pd

data = {'sales1':[10,20,-4,5,-1,15],
'sales2':[20,15,10,-1,12,-2]}

df = pd.DataFrame(data)

print("Data Frame")
print(df)

print('Display DataFrame after replacing every negative value with 0')

df[df
print(df)

 

21. Replace all missing values in a data frame with a 999 

# Replace all missing values in a data frame with a 999 
import pandas as pd
import numpy as np
Srec={'sid':[101,102,103,104,np.nan,106,107,108,109,110],
'sname':['Amit','Sumit',np.nan,'Aman','Rama','Neeta','Amjad','Ram','Ilma','Raja'],
'smarks':[98,67,np.nan,56,38,98,67,np.nan,56,np.nan],
'sgrade':[np.nan,np.nan,'A1','C1','D','A1','B2',np.nan,'B2','A2'],
'remark':['P','P','P','F',np.nan,'P','P','F','P','P'],
'mobile':[9990009991,9990009992,9990009993,np.nan,9990009995,np.nan, 
9990009997,

9990009998, np.nan,9999010000]}      
# Convert the dictionary into DataFrame 
df=pd.DataFrame(Srec)
print("\n- Dataframe Before Replacing NaN with 999-\n") 
print(df)

#Replace missing value with zeros
print("\n-After Replacing missing value with 999-\n")
df=df.fillna(999)
print(df)

 

22. Given a Series, print all the elements that are above the 75th percentile.

# Given a Series, print all the elements that are above the 75th percentile.

import pandas as pd 
import numpy as np 
s=pd.Series(np.array([2,4,5,10,18,20,25]))
print(s) 
res=s.quantile(q=0.75) 
print()
print('75th Percentile of the series is::')
print(res)
print()
print('The elements that above the 75th percentile:')
print(s[s>res])

 

23. Create a Data Frame quarterly sales where each row contains the item category, item name, and expenditure. Group the rows by the category and print the total expenditure per category.

# Create a Data Frame quarterly sales where each row contains the item category, 
#item name, and expenditure. Group the rows by the category and print the total
#expenditure per category.

import pandas as pd 

# initialize list of lists
data = [['CAR','Maruti',1000000],['AC','Hitachi',55000],['AIRCOLLER','Bajaj',12000],
['WASHING MACHINE','LG',15000],['CAR','Ford',7000000],['AC','SAMSUNG',45000],['AIRCOLLER','Symphony',20000],['WASHING MACHINE','Wirlpool',25000]]

Col=['itemcat','itemname','expenditure']
# Create the pandas DataFrame

qrtsales = pd.DataFrame(data,columns=Col)

# print dataframe. 
print (qrtsales)

qs=qrtsales.groupby('itemcat') 
print('Result after Filtering Dataframe') 
print(qs['itemcat','expenditure'].sum())

 

24. Create a data frame based on e-commerce data and generate descriptive statistics (mean, median, mode, quartile, and variance)

# Create a data frame based on ecommerce data and generate descriptive statistics # (mean, median,mode, quartile, and variance)

import pandas as pd 
sales = {'InvoiceNo': [1001,1002,1903,1004,1085,1006,1007],
         'ProductName': ['LCD','AC','Deodrant','leans','Books','Shoes','Jacket'],
         'Quantity': [2,1,2,1,2,1,1], 
         'Price':[65000,55000,500,3000,958,3000,2200]}
df=pd.DataFrame(sales)
print(df)
print("Mean price of Item:", df['Price']. mean ().round (2))
print("Median price of Item:", df['Price']. median ().round (2))
print("Mode of price:\n", df[['Price']]. mode ())
print("Quartile of price:\n",df[['Price']].quantile([.1,.25,.5,.75],axis=0))
print("Variance of Price:\n",df[['Price']].var())

25.

# Đưa ra dữ liệu kết quả của trường, phân tích hiệu suất của học sinh trên các tham số #Different, ví dụ
# x-axis is shows the subject and y -axis
# shows the markers in each subject

# Nhập Pandas và Matplotlib & NBSP; nhập khẩu gấu trúc dưới dạng PD & NBSP; Nhập matplotlib.pyplot như PLT
import pandas as pd 
import matplotlib.pyplot as plt

# Biểu đồ dòng đơn giản với cài đặt nhãn của trục X và Y, # Tiêu đề cho dòng biểu đồ và màu của dòng & nbsp; Chủ đề = ['Vật lý', 'Hóa học', 'Toán học', 'Sinh học', 'Máy tính'] Marks = [80,75,70,78,82] #
# title for chart line and color of line 
subject = ['Physic','Chemistry','Mathematics', 'Biology','Computer']
marks =[80,75,70,78,82]
# To draw line in red colour

plt.plot (chủ đề, nhãn hiệu, 'r', đánh dấu = '*') & nbsp; & nbsp; # Để viết tiêu đề của biểu đồ dòng
# To Write Title of the Line Chart

plt.title ('Marks đạt điểm') # để đặt nhãn ở trục y
# To Put Label At Y Axis

plt.xlabel ('chủ đề') & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; # Để đặt nhãn ở trục x
# To Put Label At X Axis

plt.ylabel ('Marks') & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; & nbsp; plt.show () & nbsp;
plt.show()

 

26. Viết một chương trình để vẽ biểu đồ thanh trong Python để hiển thị kết quả của một trường học trong năm năm liên tiếp. & NBSP;

#Viết một chương trình để vẽ biểu đồ thanh trong Python để hiển thị kết quả của một trường trong năm năm liên tiếp. & NBSP;

Nhập matplotlib.pyplot dưới dạng pl & nbsp;

năm = ['2015', '2016', '2017', '2018', '2019'] # Danh sách các năm & nbsp; p = [98,50,70,25,55,20,90,5,61.50] #list của tỷ lệ phần trăm vượt qua & nbsp; j = ['b', 'g', 'r', 'm', 'c'] # mã màu của biểu đồ thanh & nbsp; pl.bar (năm, p, chiều rộng = 0,2, color = j) # bar () hàm để tạo biểu đồ thanh & nbsp; pl.xlabel ("năm") # nhãn cho trục x & nbsp; pl.ylabel ("pass%") # nhãn cho y-trục & nbsp; pl.show () # hàm để hiển thị biểu đồ thanh & nbsp;
p=[98.50,70.25,55.20,90.5,61.50] #list of pass percentage 
j=['b','g','r','m','c'] # color code of bar charts 
pl.bar(year, p, width=0.2, color=j) # bar( ) function to create the bar chart 
pl.xlabel("year") # label for x-axis 
pl.ylabel("Pass%") # label for y-axis 
pl.show( ) # function to display bar chart 

27. Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại.

• & nbsp; số lượng học sinh chống lại điểm số trong tất cả 7 môn học • & nbsp; hiển thị điểm cao nhất của mỗi môn học & nbsp; •  Show the Highest score of each subject 

# Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với # #Title và Legend.

#• Số lượng học sinh chống lại điểm số trong tất cả 7 môn #• Hiển thị điểm cao nhất của mỗi môn học & NBSP; #• Show the Highest score of each subject 

Nhập matplotlib.pyplot dưới dạng PLT nhập pandas dưới dạng nhập khẩu PD Numpy khi nhập NP CSV
import pandas as pd
import numpy as np
import csv

df = pd.read_csv ("student_result.csv")

#Số lượng sinh viên chống lại điểm số trong tất cả 7 môn

plt.hist ([df ['eng'], df ['tiếng Hindi'], df ['maths'], df ['khoa học'], df ['ssc'], df ['sansk'], df [' Ca ']], color = [' đỏ ',' vàng ',' xanh ',' xanh ',' cam ',' đen ',' hồng ']) plt.title (' số lượng học sinh so với điểm số ') plt .xlabel ('scord') plt.ylabel ('số lượng học sinh') plt.legend (['tiếng Anh', 'tiếng Hindi', 'toán', 'khoa học', 's.sc.', 'tiếng Phạn', ' Ca ']) plt.show ()
plt.title('Number of Students against Scores')
plt.xlabel('Score')
plt.ylabel('Number of Students')
plt.legend(['English', 'Hindi', 'Maths','Science','S.Sc.','Sanskrit','CA'])
plt.show()

# Hiển thị điểm số cao nhất của mỗi môn học. y = ['engg', 'hinndi', 'toán học', 'khoa học', 'ssc', 'tiếng Phạn', 'ca'] chiều rộng = [df ['eng']. Max (), df ['Hindi' ] .max (), df ['maths']. max (), df ['khoa học']. max (), df ['ssc']. max (), df ['sansk']. max (), DF ['CA']. Max ()]
y = ['ENGG','HINNDI','MATHS','SCIENCE','SSC','SANSK','CA']
width = [df['ENG'].max(),df['HINDI'].max(),df['MATHS'].max(),df['SCIENCE'].max(),df['SSC'].max(),df['SANSK'].max(),df['CA'].max()]

plt.figure (figsize = (12,2)) plt.barh (y = y, width = width) plt.title ('điểm trung bình') plt.xlabel ('điểm trung bình') plt.ylabel ('môn học') cho i, v trong liệt kê (chiều rộng): & nbsp; & nbsp; plt.text (v, i, ""
plt.barh(y = y, width = width)
plt.title('Average Scores')
plt.xlabel('Average Score')
plt.ylabel('Subjects')
for i,v in enumerate(width):
    plt.text(v, i, " "+str(round(v,2)), color='blue', va='center', fontweight='bold')
plt.show()

 

28. Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại. • Hiển thị điểm trung bình của từng đối tượng • Show the Average score of each subject

# Đối với các khung dữ liệu được tạo ở trên, phân tích và vẽ biểu đồ phù hợp với tiêu đề và huyền thoại. # • Hiển thị điểm trung bình của từng đối tượng
# • Show the Average score of each subject

Nhập matplotlib.pyplot dưới dạng PLT nhập pandas dưới dạng nhập khẩu PD Numpy khi nhập NP CSV
import pandas as pd
import numpy as np
import csv

df = pd.read_csv ("student_result.csv")

#Số lượng sinh viên chống lại điểm số trong tất cả 7 môn
y = ['ENGG','HINNDI','MATHS','SCIENCE','SSC','SANSK','CA']
width = [df['ENG'].mean(),df['HINDI'].mean(),df['MATHS'].mean(),df['SCIENCE'].mean(),
df['SSC'].mean(),df['SANSK'].mean(),df['CA'].mean()]

plt.hist ([df ['eng'], df ['tiếng Hindi'], df ['maths'], df ['khoa học'], df ['ssc'], df ['sansk'], df [' Ca ']], color = [' đỏ ',' vàng ',' xanh ',' xanh ',' cam ',' đen ',' hồng ']) plt.title (' số lượng học sinh so với điểm số ') plt .xlabel ('scord') plt.ylabel ('số lượng học sinh') plt.legend (['tiếng Anh', 'tiếng Hindi', 'toán', 'khoa học', 's.sc.', 'tiếng Phạn', ' Ca ']) plt.show ()
plt.barh(y = y, width = width)
plt.title('Average Scores')
plt.xlabel('Average Score')
plt.ylabel('Subjects')
for i,v in enumerate(width):
    plt.text(v, i, " "+str(round(v,2)), color='blue', va='center', fontweight='bold')
plt.show()

# Hiển thị điểm số cao nhất của mỗi môn học. y = ['engg', 'hinndi', 'toán học', 'khoa học', 'ssc', 'tiếng Phạn', 'ca'] chiều rộng = [df ['eng']. Max (), df ['Hindi' ] .max (), df ['maths']. max (), df ['khoa học']. max (), df ['ssc']. max (), df ['sansk']. max (), DF ['CA']. Max ()] • Number of Females and Males • Average Percentage of Females and Males

plt.figure (figsize = (12,2)) plt.barh (y = y, width = width) plt.title ('điểm trung bình') plt.xlabel ('điểm trung bình') plt.ylabel ('môn học') cho i, v trong liệt kê (chiều rộng): & nbsp; & nbsp; plt.text (v, i, ""
# with title and legend.
# • Number of Females and Males
# • Average Percentage of Females and Males


Nhập matplotlib.pyplot dưới dạng PLT nhập pandas dưới dạng nhập khẩu PD Numpy khi nhập NP CSV
import pandas as pd
import numpy as np
import csv

df = pd.read_csv ("student_result.csv")


#Số lượng sinh viên chống lại điểm số trong tất cả 7 môn

plt.hist ([df ['eng'], df ['tiếng Hindi'], df ['maths'], df ['khoa học'], df ['ssc'], df ['sansk'], df [' Ca ']], color = [' đỏ ',' vàng ',' xanh ',' xanh ',' cam ',' đen ',' hồng ']) plt.title (' số lượng học sinh so với điểm số ') plt .xlabel ('scord') plt.ylabel ('số lượng học sinh') plt.legend (['tiếng Anh', 'tiếng Hindi', 'toán', 'khoa học', 's.sc.', 'tiếng Phạn', ' Ca ']) plt.show ()

#Number của nữ và nam y = df_gender ['giới tính']. Count (). Keys () width = df_gender ['giới tính']. Count () plt.figure (figsize = (12,2)) plt.barh ( y = y, chiều rộng = chiều rộng) plt.title ('không. của nữ và nam') plt.xlabel ('đếm') plt.ylabel ('giới tính') cho i, v trong liệt kê (chiều rộng): & nbsp; & nbsp; plt.text (v, i, ""
y = df_gender['GENDER'].count().keys()
width = df_gender['GENDER'].count()
plt.figure(figsize = (12,2))
plt.barh(y = y, width = width)
plt.title('No. of Females and Males')
plt.xlabel('Count')
plt.ylabel('Gender')
for i,v in enumerate(width):
    plt.text(v, i, " "+str(v), color='blue', va='center', fontweight='bold')
plt.show()

#Tỷ lệ phần trăm của nữ và nam y = df_gender ['phần trăm']. Mean (). Keys () width = df_gender ['phần trăm']. (y = y, & nbsp; & nbsp; & nbsp; Giới tính ') cho i, v trong liệt kê (chiều rộng): & nbsp; & nbsp; plt.text (v, i, ""
y = df_gender['PERCENTAGE'].mean().keys()
width = df_gender['PERCENTAGE'].mean()
plt.figure(figsize = (12,2))
plt.barh(y = y, 
         width = width)
plt.title('Av Percentage of Female and Males')
plt.xlabel('Av. total Percentage ')
plt.ylabel('Gender')
for i,v in enumerate(width):
    plt.text(v, i, " "+str(round(v,2)), color='blue', va='center', fontweight='bold')
plt.show()

 

Làm cách nào để có được đầu ra đầy đủ trong gấu trúc?

Có 4 phương pháp để in toàn bộ gấu trúc DataFrame:..
Sử dụng phương thức to_String () ..
tùy chọn_context () phương thức ..
set_options () phương thức ..
phương thức to_markdown () ..

Pandas trong Python với ví dụ là gì?

Pandas được định nghĩa là một thư viện nguồn mở cung cấp thao tác dữ liệu hiệu suất cao trong Python.Tên của gấu trúc có nguồn gốc từ dữ liệu bảng điều khiển, có nghĩa là một nền kinh tế lượng từ dữ liệu đa chiều.Nó được sử dụng để phân tích dữ liệu trong Python và được phát triển bởi Wes McKinney vào năm 2008.an open-source library that provides high-performance data manipulation in Python. The name of Pandas is derived from the word Panel Data, which means an Econometrics from Multidimensional data. It is used for data analysis in Python and developed by Wes McKinney in 2008.

Ý bạn là gì về gấu trúc trong lớp Python 12?

Pandas là một gói Python nguồn mở được sử dụng rộng rãi nhất để phân tích dữ liệu/phân tích dữ liệu và các tác vụ học máy.Nó được xây dựng trên đỉnh của một gói khác có tên Numpy, cung cấp hỗ trợ cho các mảng đa chiều.an open source Python package that is most widely used for data science/data analysis and machine learning tasks. It is built on top of another package named Numpy, which provides support for multi-dimensional arrays.

Làm thế nào để bạn tạo một khung dữ liệu trong Python Class 12?

Tạo DataFrame..
Trong khi tạo DataFrame, chúng ta nên nhớ các điểm sau:.
Chúng tôi phải bao gồm Thư viện Python Pandas trong chương trình của chúng tôi ..
Phương thức DataFrame () của Thư viện Pandas được sử dụng để tạo DataFrame ..
DataFrame có thể chấp nhận dữ liệu từ.Danh sách.Từ điển.Tuple.Sợi dây.Loạt.Một khung dữ liệu khác.Mảng numpy ..