Hồi quy OLS Python

LinearRegression phù hợp với một mô hình tuyến tính với các hệ số w = [w1, …, wp] để giảm thiểu tổng bình phương còn lại giữa các mục tiêu được quan sát trong tập dữ liệu và các mục tiêu được dự đoán bởi xấp xỉ tuyến tính

Thông số . fit_intercept bool, mặc định=True

Có tính toán hệ số chặn cho mô hình này hay không. Nếu được đặt thành Sai, sẽ không có phần chặn nào được sử dụng trong tính toán [i. e. dữ liệu dự kiến ​​​​sẽ được tập trung]

copy_X bool, mặc định=True

Nếu Đúng, X sẽ được sao chép;

n_jobs int, mặc định=Không

Số lượng công việc được sử dụng để tính toán. Điều này sẽ chỉ cung cấp khả năng tăng tốc trong trường hợp các vấn đề đủ lớn, đó là nếu thứ nhất là n_targets > 1 và thứ hai là X thưa thớt hoặc nếu positive được đặt thành True. None có nghĩa là 1 trừ khi trong ngữ cảnh. -1 có nghĩa là sử dụng tất cả các bộ xử lý. Xem để biết thêm chi tiết

dương tính bool, mặc định=Sai

Khi được đặt thành True, buộc các hệ số phải dương. Tùy chọn này chỉ được hỗ trợ cho các mảng dày đặc

Mới trong phiên bản 0. 24

Thuộc tính . coef_ mảng hình dạng [n_features, ] hoặc [n_targets, n_features]

Các hệ số ước lượng cho bài toán hồi quy tuyến tính. Nếu nhiều mục tiêu được chuyển trong quá trình điều chỉnh [y 2D], thì đây là mảng 2D có hình dạng [n_mục tiêu, n_tính năng], trong khi nếu chỉ một mục tiêu được chuyển, thì đây là mảng 1D có độ dài n_features

rank_ int

Hạng của ma trận X. Chỉ khả dụng khi X dày đặc

số ít_ mảng hình dạng [min[X, y],]

Giá trị số ít của X. Chỉ khả dụng khi X dày đặc

chặn_ float hoặc mảng hình dạng [n_targets,]

Thuật ngữ độc lập trong mô hình tuyến tính. Đặt thành 0. 0 nếu n_targets > 124

n_features_in_ int

Số lượng các tính năng nhìn thấy trong

Mới trong phiên bản 0. 24

feature_names_in_ ndarray của hình dạng [______125,]

Tên của các tính năng nhìn thấy trong quá trình. Chỉ được xác định khi X có tên đối tượng là tất cả các chuỗi

Mới trong phiên bản 1. 0

Xem thêm

Hồi quy độ dốc giải quyết một số vấn đề của Bình phương nhỏ nhất thông thường bằng cách áp dụng hình phạt đối với kích thước của các hệ số với chính quy hóa l2

Lasso là một mô hình tuyến tính ước tính các hệ số thưa thớt với chuẩn hóa l1

Elastic-Net là một mô hình hồi quy tuyến tính được đào tạo với cả l1 và l2 -norm chính quy hóa các hệ số

ghi chú

Từ quan điểm triển khai, đây chỉ là Bình phương nhỏ nhất thông thường đơn giản [scipy. linalg. lstsq] hoặc Bình phương nhỏ nhất không âm [scipy. tối ưu hóa. nnls] được bọc như một đối tượng dự đoán

ví dụ

>>> import numpy as np
>>> from sklearn.linear_model import LinearRegression
>>> X = np.array[[[1, 1], [1, 2], [2, 2], [2, 3]]]
>>> # y = 1 * x_0 + 2 * x_1 + 3
>>> y = np.dot[X, np.array[[1, 2]]] + 3
>>> reg = LinearRegression[].fit[X, y]
>>> reg.score[X, y]
1.0
>>> reg.coef_
array[[1., 2.]]
>>> reg.intercept_
3.0...
>>> reg.predict[np.array[[[3, 5]]]]
array[[16.]]

phương pháp

[X, y[, sample_weight]]

Phù hợp với mô hình tuyến tính

[[sâu]]

Nhận thông số cho công cụ ước tính này

[X]

Dự đoán bằng mô hình tuyến tính

[X, y[, sample_weight]]

Trả về hệ số xác định của dự đoán

[**thông số]

Đặt các tham số của công cụ ước tính này

phù hợp[X , y , sample_weight=Không có]

Phù hợp với mô hình tuyến tính

Thông số . X {dạng mảng, ma trận thưa thớt} của hình dạng [n_samples, n_features]

Dữ liệu đào tạo

y giống như mảng của hình dạng [n_samples,] hoặc [n_samples, n_targets]

Giá trị mục tiêu. Sẽ được chuyển thành dtype của X nếu cần thiết

sample_weight hình dạng giống như mảng [n_samples,], default=None

Trọng lượng riêng cho từng mẫu

Mới trong phiên bản 0. 17. tham số sample_weight hỗ trợ LinearRegression.

Trả về . bản thân vật

Công cụ ước tính được trang bị

get_params[deep=Đúng]

Nhận thông số cho công cụ ước tính này

Thông số . deep bool, mặc định=True

Nếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính

Trả về . params mệnh lệnh

Tên tham số được ánh xạ tới giá trị của chúng

dự đoán[X]

Dự đoán bằng mô hình tuyến tính

Thông số . X ma trận giống như mảng hoặc thưa thớt, hình dạng [n_samples, n_features]

Mẫu

Trả về . C mảng, hình dạng [n_samples,]

Trả về giá trị dự đoán

điểm[X , y , sample_weight=Không có]

Trả về hệ số xác định của dự đoán

Hệ số xác định \[R^2\] được định nghĩa là \[[1 . Điểm tốt nhất có thể là 1. 0 và nó có thể âm [vì mô hình có thể xấu đi tùy ý]. Một mô hình hằng số luôn dự đoán giá trị mong đợi của n_targets > 17, bỏ qua các tính năng đầu vào, sẽ nhận được điểm số , where \[u\] is the residual sum of squares n_targets > 15 and \[v\] is the total sum of squares n_targets > 16. The best possible score is 1.0 and it can be negative [because the model can be arbitrarily worse]. A constant model that always predicts the expected value of n_targets > 17, disregarding the input features, would get a \[R^2\] là 0. 0.

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Mẫu thử nghiệm. Đối với một số công cụ ước tính, đây có thể là ma trận hạt nhân được tính toán trước hoặc danh sách các đối tượng chung thay vì có hình dạng n_targets > 18, trong đó n_targets > 19 là số lượng mẫu được sử dụng để khớp cho công cụ ước tính

y giống như mảng của hình dạng [n_samples,] hoặc [n_samples, n_outputs]

Giá trị thực cho X

sample_weight hình dạng giống như mảng [n_samples,], default=None

trọng lượng mẫu

Trả về . điểm trôi nổi

\[R^2\] của X1 văn bản. n_targets > 17.

ghi chú

Điểm số \[R^2\] được sử dụng khi gọi n_targets > 13 trên biến hồi quy sử dụng X4 từ phiên bản 0. 23 để phù hợp với giá trị mặc định của. Điều này ảnh hưởng đến phương pháp n_targets > 13 của tất cả các biến hồi quy đa đầu ra [ngoại trừ ].

set_params[**tham số]

Đặt các tham số của công cụ ước tính này

Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như ]. Cái sau có các tham số dạng X9 để có thể cập nhật từng thành phần của một đối tượng lồng nhau

Hồi quy OLS là gì?

Hồi quy bình phương nhỏ nhất thông thường [OLS] là một kỹ thuật phổ biến để ước tính các hệ số của phương trình hồi quy tuyến tính mô tả mối quan hệ giữa một hoặc nhiều biến định lượng độc lập và biến phụ thuộc [đơn giản hoặc .

OLS và hồi quy có giống nhau không?

Cả hồi quy "Hồi quy tuyến tính" và "Bình phương nhỏ nhất thông thường" [OLS] thường được dùng để chỉ cùng một loại mô hình thống kê, nhưng vì những lý do khác nhau . Chúng tôi gọi mô hình là "tuyến tính" vì nó giả định rằng mối quan hệ giữa các biến độc lập và biến phụ thuộc có thể được mô tả bằng một đường thẳng.

Sklearn có sử dụng OLS không?

Hồi quy tuyến tính từ sklearn sử dụng OLS . Chỉ cần nhìn vào mã nguồn. github. com/scikit-learn/scikit-learn/blob/1495f6924/sklearn/…

GLM có giống với OLS không?

Trong ngữ cảnh của các mô hình tuyến tính tổng quát [GLM], OLS được xem là trường hợp đặc biệt của GLM . Trong khuôn khổ này, việc phân phối các thuật ngữ lỗi OLS là bình thường [gaussian] và chức năng liên kết là chức năng nhận dạng.

Chủ Đề