Hướng dẫn log loss logistic regression python - log mất log hồi quy logistic python
Mất nhật ký, AKA mất logistic hoặc mất chéo. Show Đây là chức năng mất mát được sử dụng trong hồi quy logistic (đa phương thức) và các phần mở rộng của nó như mạng thần kinh, được định nghĩa là khả năng nhật ký tiêu cực của mô hình logistic trả về xác suất \ [L _ {\ log} (y, p) = - (y \ log (p) + (1 - y) \ log (1 - p)) \] Đọc thêm trong Hướng dẫn sử dụng.User Guide. Các tham số: Ma trận chỉ báo giống như Y__TrueArray:y_truearray-like or label indicator matrixNhãn sự thật mặt đất (đúng) cho các mẫu N_Samples. y_predarray giống như phao, hình dạng = (n_samples, n_ classes) hoặc (n_samples,)array-like of float, shape = (n_samples, n_classes) or (n_samples,)Xác suất dự đoán, được trả lại bởi phương thức phân loại dự đoán_proba. Nếu 1.epsfloat, mặc định = 1e-15float, default=1e-15Mất nhật ký không được xác định cho p = 0 hoặc p = 1, do đó xác suất được cắt sang tối đa (EPS, MIN (1 - EPS, P)). Nếu đúng, hãy trả lại tổn thất trung bình trên mỗi mẫu. Nếu không, trả lại tổng của tổn thất mỗi mẫu. sample_weightarray giống như hình dạng (n_samples,), mặc định = không cóarray-like of shape (n_samples,), default=NoneTrọng lượng mẫu. LabelsArray-like, default = nonearray-like, default=NoneNếu không được cung cấp, các nhãn sẽ được suy ra từ y_true. Nếu 2 là 3 và y_pred có hình dạng (n_samples,), các nhãn được coi là nhị phân và được suy ra từ y_true .Mới trong phiên bản 0.18. Returns:lossfloat:lossfloatMất nhật ký, AKA mất logistic hoặc mất chéo. Ghi chú Logarit được sử dụng là logarit tự nhiên (cơ sở-E). Người giới thiệu C.M. Giám mục (2006). Nhận dạng mẫu và học máy. Springer, p. 209. Ví dụ >>> from sklearn.metrics import log_loss >>> log_loss(["spam", "ham", "ham", "spam"], ... [[.1, .9], [.9, .1], [.8, .2], [.35, .65]]) 0.21616... Ví dụ sử dụng ________ 16¶Tôi đã đào tạo một mô hình sử dụng hồi quy logistic và cần đánh giá độ chính xác của nó với tổn thất log. Dưới đây là một số chi tiết về dữ liệu: Các tính năng/ x
Nhãn/ y
Mô hình hồi quy logistic:
Bây giờ tôi cần tính toán 7 cho điều đó.Đây là bộ dữ liệu thử nghiệm riêng của tôi:
Đây là những gì tôi đã thử:
Nhưng nó trả về lỗi này:
Cập nhật: Đây là 8:
Mất nhật ký trong hồi quy logistic là gì?Chức năng mất cho hồi quy logistic Hàm mất cho hồi quy tuyến tính là mất bình phương. Hàm mất cho hồi quy logistic là mất log, được định nghĩa như sau: LOST LOSE = ∑ (x, y) ∈ D - y log (y ′) - (1 - y) log Log Loss = ∑ ( x , y ) ∈ D − y log ( y ′ ) − ( 1 − y ) log
Làm thế nào để bạn sử dụng mất log trong Python?Mất nhật ký có thể được thực hiện trong Python bằng cách sử dụng hàm log_loss () trong scikit-learn. Trong trường hợp phân loại nhị phân, hàm lấy một danh sách các giá trị kết quả thực sự và danh sách các xác suất là đối số và tính toán tổn thất nhật ký trung bình cho các dự đoán.using the log_loss() function in scikit-learn. In the binary classification case, the function takes a list of true outcome values and a list of probabilities as arguments and calculates the average log loss for the predictions.
Chúng ta có thể sử dụng mất nhật ký để hồi quy không?Mất logarit cho biết mức độ xác suất dự đoán gần với giá trị thực thực/tương ứng.Do đó, hóa ra tối đa hóa khả năng tương đương với việc giảm thiểu lỗi bình phương trung bình (MSE), tức là hàm lỗi này được sử dụng rộng rãi trong các vấn đề hồi quy vì một lý do.this error function is widely used in regression problems for a reason.
Mất nhật ký có giống như khả năng đăng nhập không?Mất nhật ký là một bước ngoặt nhẹ đối với một thứ gọi là chức năng khả năng.Trong thực tế, mất nhật ký là -1 * nhật ký của hàm khả năng.. In fact, Log Loss is -1 * the log of the likelihood function. |