Tôi đang cố gắng đọc một tệp CSV đơn giản như bên dưới và đặt nội dung của nó vào một mảng 2D:
"","x","y","sim1","sim2","sim3","sim4","sim5","sim6","sim7","sim8","sim9","sim10","sim11","sim12"
"1",181180,333740,5.56588745117188,6.29487752914429,7.4835410118103,5.75873327255249,6.62183284759521,5.81478500366211,4.85671949386597,5.90418815612793,6.32611751556396,6.99649047851562,6.52076387405396,5.68944215774536
"2",181140,333700,6.36264753341675,6.5217604637146,6.16843748092651,5.55328798294067,7.00429201126099,6.43625402450562,6.17744159698486,6.72836923599243,6.38574266433716,6.81451606750488,6.68060827255249,6.14339065551758
"3",181180,333700,6.16541910171509,6.44704437255859,7.51744651794434,5.46270132064819,6.8890323638916,6.46842670440674,6.07698059082031,6.2140531539917,6.43774271011353,6.21923875808716,6.43355655670166,5.90692138671875
Để làm điều này, tôi sử dụng điều này:
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
Nhưng tôi luôn nhận được tin nhắn này:
"ValueError: could not convert string to float: "1"
Tôi nghĩ rằng vấn đề là với cột đầu tiên của mỗi hàng. Vì vậy, tôi đã cố gắng đọc nó mà không có cột đầu tiên, nhưng tôi không thể tìm ra làm thế nào.
Vì vậy, làm thế nào tôi có thể bỏ qua cột đầu tiên? Có cách nào để đọc tệp này với cột đầu tiên không?
Phương pháp 3: Sử dụng del Mã sau đây cho thấy cách sử dụng chức năng del & nbsp; để thả cột đầu tiên của gấu trúc DataFrame:
# import Pandas library
import pandas as pd
# define example data
interview_dict = {'language': [ 'Python', 'R', 'Scala', 'Java', 'SQL'],
'salary':[130, 110, 85, 95, 77]}
interviews = pd.DataFrame[data=interview_dict]
interviews.head[]
Tài nguyên bổ sung
Các hướng dẫn sau đây giải thích cách thực hiện các hoạt động phổ biến khác trong gấu trúc:
Cách thả các cột trùng lặp trong gấu trúc Cách thả hàng theo chỉ mục trong gấu trúc Cách thả cột theo chỉ mục trong gấu trúc Cách thả các hàng có chứa giá trị cụ thể trong gấu trúc
- Trong ngày hôm nay, hướng dẫn của chúng tôi, chúng tôi sẽ tìm hiểu cách sử dụng Python để loại bỏ cột đầu tiên của khung dữ liệu gấu trúc.
interviews.to_csv['interviews.csv', index=False]
- Giả sử, chúng ta có một khung dữ liệu có một vài cột cũng như một chỉ mục tuần tự:
iv1= pd.read_csv['interviews.csv', index_col = 'language']
iv1.head[]
Ở đây, DataFrame mà chúng tôi vừa tạo:
Xóa cột chỉ mục
Nếu chúng tôi muốn loại bỏ cột chỉ mục [cột ngoài cùng bên trái đầu tiên cho phép dán nhãn cho mỗi hàng trong các hàng dữ liệu], chúng tôi sẽ thực hiện các bước sau:
cols = interviews.columns[0]
iv2 = interviews.drop[columns = cols]
Hoặc cách khác theo nhãn:
cols = ['language']
iv1 = interviews.drop[columns= cols]
Cả hai sẽ hiển thị cùng một kết quả:
Tiếp theo đề xuất học tập
- Một hướng dẫn toàn diện về việc loại bỏ / xóa các cột DataFrame có sẵn ở đây.
- Cũng hãy xem thư viện bài viết dữ liệu toàn diện của chúng tôi.
Bạn có thể sử dụng một trong ba phương thức sau để thả cột đầu tiên vào Pandas DataFrame:
Phương pháp 1: Sử dụng thả
df.drop[columns=df.columns[0], axis=1, inplace=True]
Phương pháp 2: Sử dụng ILOC
df = df.iloc[: , 1:]
Phương pháp 3: Sử dụng del
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
0Mỗi phương pháp tạo ra kết quả tương tự.
Các ví dụ sau đây cho thấy cách sử dụng từng phương thức trong thực tế với các gấu trúc sau đây:
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
1Phương pháp 1: Sử dụng thả
Mã sau đây cho thấy cách sử dụng hàm thả [] để thả cột đầu tiên của gấu trúc DataFrame:drop[] function to drop the first column of the pandas DataFrame:
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
2Lưu ý rằng cột đầu tiên có tên ‘Team, đã bị xóa khỏi DataFrame.
Cũng lưu ý rằng chúng ta phải sử dụng tại chỗ = true cho cột được xóa trong DataFrame gốc.inplace=True for the column to be removed in the original DataFrame.
Phương pháp 2: Sử dụng ILOC
Mã sau đây cho thấy cách sử dụng chức năng ILOC & NBSP; để thả cột đầu tiên của Pandas DataFrame:iloc function to drop the first column of the pandas DataFrame:
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
3Lưu ý rằng cột đầu tiên có tên ‘Team, đã bị xóa khỏi DataFrame.
Cũng lưu ý rằng chúng ta phải sử dụng tại chỗ = true cho cột được xóa trong DataFrame gốc.
Phương pháp 2: Sử dụng ILOCdel function to drop the first column of the pandas DataFrame:
data = np.loadtxt["Data/sim.csv", delimiter=',', skiprows=1]
4Lưu ý rằng cột đầu tiên có tên ‘Team, đã bị xóa khỏi DataFrame.
Cũng lưu ý rằng chúng ta phải sử dụng tại chỗ = true cho cột được xóa trong DataFrame gốc.
Phương pháp 2: Sử dụng ILOC
Mã sau đây cho thấy cách sử dụng chức năng ILOC & NBSP; để thả cột đầu tiên của Pandas DataFrame:
How to Drop
Rows by Index in Pandas
How to Drop Columns by Index in Pandas
How to Drop Rows that Contain Specific Value in Pandas