Hướng dẫn how do you check the accuracy of a decision tree in python? - làm thế nào để bạn kiểm tra độ chính xác của cây quyết định trong python?
Tôi đã viết một chức năng lấy bộ dữ liệu (excel / gandas) và một số giá trị, sau đó dự đoán kết quả với trình phân loại cây quyết định. Tôi đã làm điều đó với Sklearn. Bạn có thể giúp tôi với điều này, tôi đã xem qua web và trang web này nhưng tôi không thể tìm thấy câu trả lời hoạt động. Tôi đã cố gắng làm điều này, nhưng nó không hoạt động: Show
Đây là lỗi mà tôi nhận được:
Đây là mã (tôi đã xóa mã cho độ chính xác) Lựa chọn tính năng hoặc giảm kích thước. .... Cây được tăng cường ..Làm thế nào để bạn xác định độ chính xác trong Python? Thực hiện cây quyết định trong PythonĐối với bất kỳ vấn đề phân tích dữ liệu nào, chúng tôi bắt đầu bằng cách làm sạch bộ dữ liệu và loại bỏ tất cả các giá trị null và thiếu khỏi dữ liệu. Trong trường hợp này, chúng tôi không xử lý dữ liệu sai lầm giúp chúng tôi tiết kiệm bước này. 1. Chúng tôi nhập các thư viện cần thiết để phân tích cây quyết định và rút dữ liệu cần thiết # Load libraries Hãy cùng kiểm tra một vài hàng đầu tiên của bộ dữ liệu này trông như thế nào pima.head() 2. Sau khi tải dữ liệu, chúng tôi hiểu cấu trúc & biến, xác định các biến mục tiêu & tính năng (phụ thuộc & biến độc lập tương ứng) #split dataset in features and target variable 3. Hãy để phân chia dữ liệu thành các bộ đào tạo và thử nghiệm theo tỷ lệ 70:30. # Split dataset into training set and test set Như một thông lệ tiêu chuẩn, bạn có thể theo dõi 70:30 đến 80:20 khi cần thiết. 4. Thực hiện phân tích cây quyết định bằng cách sử dụng Scikit learn # Tạo quyết định Cây phân loại objectClf = Ra quyết định 5. Nhưng chúng ta nên ước tính cách chính xác trình phân loại dự đoán kết quả. Độ chính xác được tính toán bằng cách so sánh các giá trị thiết lập thử nghiệm thực tế và các giá trị dự đoán. # Model Accuracy, how often is the classifier correct?print("Accuracy:",metrics.accuracy_score(y_test, y_pred)) Có vẻ như thuật toán cây quyết định của chúng tôi có độ chính xác là 67,53%. Một giá trị cao này thường được coi là tốt. 6. Bây giờ chúng tôi đã tạo ra một cây quyết định, hãy để xem nó trông như thế nào khi chúng tôi hình dung nó Chức năng xuất khẩu của Scikit-Learn, có thể giúp hình dung cây quyết định. Chúng tôi có thể sử dụng điều này trên sổ ghi chép Jupyter của chúng tôi. Trong trường hợp bạn không sử dụng Jupyter, bạn có thể muốn xem cài đặt các thư viện sau:
from sklearn.tree import export_graphviz Đây có phải là kết quả mà bạn dường như cũng nhận được? Đầu ra PythonBạn sẽ nhận thấy rằng, trong biểu đồ cây quyết định rộng rãi này, mỗi nút nội bộ có một quy tắc quyết định phân tách dữ liệu. Nhưng tất cả những người hữu ích/tinh khiết này? Đo lường sự tạp chất của các nút được tạo ra thông qua phân tích cây quyết địnhGini được gọi là tỷ lệ Gini đo sự tạp chất của nút trong cây quyết định. Người ta có thể cho rằng một nút là thuần túy khi tất cả các bản ghi của nó thuộc cùng một lớp. Các nút như vậy được gọi là các nút lá. Trong kết quả của chúng tôi ở trên, cây quyết định hoàn chỉnh rất khó diễn giải do sự phức tạp của kết quả. Cắt tỉa/rút ngắn cây là điều cần thiết để làm dịu sự hiểu biết của chúng ta về kết quả và tối ưu hóa nó. Tối ưu hóa này có thể được thực hiện theo một trong ba cách:
Trong trường hợp của chúng tôi, chúng tôi sẽ thay đổi độ sâu tối đa của cây như một biến điều khiển để cắt trước. Hãy thử thử max_depth = 3. # Create Decision Tree classifier object Khi cắt trước, độ chính xác của thuật toán cây quyết định tăng lên 77,05%, rõ ràng là tốt hơn so với mô hình trước đó. Tìm hiểu các sinh viên khoa học dữ liệu khácMikiko Bazeley Kỹ sư ML tại MailChimp Đọc truyện Karen Masterson Nhà phân tích dữ liệu tại Verizon Digital Media Services Đọc truyện Karen Masterson Nhà phân tích dữ liệu tại Verizon Digital Media Services Đọc truyện Karen MastersonNhà phân tích dữ liệu tại Verizon Digital Media ServicesSam Fisher Đầu ra PythonBạn sẽ nhận thấy rằng, trong biểu đồ cây quyết định rộng rãi này, mỗi nút nội bộ có một quy tắc quyết định phân tách dữ liệu. Nhưng tất cả những người hữu ích/tinh khiết này? Đo lường sự tạp chất của các nút được tạo ra thông qua phân tích cây quyết định Làm thế nào để bạn tính toán độ chính xác của cây quyết định?Độ chính xác: Số lượng dự đoán chính xác được thực hiện chia cho tổng số dự đoán được thực hiện.The number of correct predictions made divided by the total number of predictions made.
Làm thế nào để bạn kiểm tra độ chính xác của một bộ hồi quy cây quyết định?Có một cách để đo lường độ chính xác của một nhiệm vụ hồi quy. Đó là để biến nó thành một nhiệm vụ phân loại. Cách tiếp cận đầu tiên là thực hiện khoảng dự đoán đầu ra mô hình thay vì một số. Điều này đặc biệt có thể với cây quyết định, nhưng tốt hơn là sử dụng cây quyết định lượng tử.make the model output prediction interval instead of a number. This is especially possible with decision trees, but it's better to use Quantile Decision Trees.
Làm thế nào để chính xác cải thiện cây quyết định trong Python?2.5 Ngoài cây quyết định: Làm thế nào để cải thiện mô hình.. Các mẫu tối thiểu để tách lá.Xác định số lượng điểm dữ liệu tối thiểu cần có tại các nút lá..... Độ sâu tối đa..... Cắt tỉa..... Phương pháp hòa tấu: Rừng ngẫu nhiên..... Lựa chọn tính năng hoặc giảm kích thước..... Cây được tăng cường .. Làm thế nào để bạn xác định độ chính xác trong Python?Độ chính xác cũng có thể được định nghĩa là tỷ lệ của số trường hợp được phân loại chính xác so với tổng số các trường hợp đang được đánh giá.Giá trị tốt nhất của độ chính xác là 1 và giá trị tồi tệ nhất là 0. Trong Python, mã sau đây tính toán độ chính xác của mô hình học máy.Nó cho 0,956 làm đầu ra.the ratio of the number of correctly classified cases to the total of cases under evaluation. The best value of accuracy is 1 and the worst value is 0. In python, the following code calculates the accuracy of the machine learning model. It gives 0.956 as output. |