Hướng dẫn negative binomial regression python sklearn - hồi quy nhị thức phủ định python sklearn

classsklearn.linear_model.poissonreatoror (*, alpha = 1.0, fit_intercept = true, max_iter = 100, tol = 0,0001, warm_start = false, verbose = 0) [Nguồn] ¶sklearn.linear_model.PoissonRegressor(*, alpha=1.0, fit_intercept=True, max_iter=100, tol=0.0001, warm_start=False, verbose=0)[source]

Mô hình tuyến tính tổng quát với phân phối Poisson.

Thủy biến này sử dụng chức năng liên kết ‘log.

Đọc thêm trong Hướng dẫn sử dụng.User Guide.

Mới trong phiên bản 0.23.

Tham số: Alphafloat, mặc định = 1:alphafloat, default=1

Hằng số nhân với thuật ngữ hình phạt và do đó xác định cường độ chính quy. alpha = 0 tương đương với các GLM không được tính hóa. Trong trường hợp này, ma trận thiết kế X phải có thứ hạng cột đầy đủ (không có cộng đồng). Các giá trị phải nằm trong phạm vi [0.0, inf).

fit_interceptbool, mặc định = truebool, default=True

Chỉ định nếu một hằng số (a.k.a. sai lệch hoặc chặn) nên được thêm vào bộ dự đoán tuyến tính (x @ coef + chặn).

max_iterint, mặc định = 100int, default=100

Số lần lặp tối đa cho người giải. Các giá trị phải nằm trong phạm vi [1, inf).

tolfloat, mặc định = 1e-4float, default=1e-4

Dừng tiêu chí. Đối với bộ giải LBFGS, phép lặp sẽ dừng khi max{|g_j|, j = 1, ..., d} <= tol trong đó g_j là thành phần thứ J của độ dốc (dẫn xuất) của hàm mục tiêu. Các giá trị phải nằm trong phạm vi (0.0, inf).

warm_startbool, mặc định = falsebool, default=False

Nếu được đặt thành True, hãy sử dụng lại giải pháp của cuộc gọi trước đó thành fit dưới dạng khởi tạo cho ____10 và alpha = 01.

verboseint, mặc định = 0int, default=0

Đối với bộ giải LBFGS, đặt verbose thành bất kỳ số dương nào cho độ mâu thuẫn. Các giá trị phải nằm trong phạm vi alpha = 02.

Thuộc tính: coef_array của hình dạng (n_features,):coef_array of shape (n_features,)

Các hệ số ước tính cho bộ dự đoán tuyến tính (alpha = 03) trong GLM.

intercept_floatfloat

Đánh chặn (a.k.a. Bias) được thêm vào dự đoán tuyến tính.

n_features_in_intint

Số lượng các tính năng nhìn thấy trong quá trình phù hợp.fit.

Mới trong phiên bản 0.24.

tính năng_names_in_ndarray của hình dạng (alpha = 04,)ndarray of shape (alpha = 04,)

Tên của các tính năng nhìn thấy trong quá trình phù hợp. Chỉ được xác định khi X có tên tính năng là tất cả các chuỗi.fit. Defined only when X has feature names that are all strings.

Mới trong phiên bản 1.0.

n_iter_intint

Số lần lặp thực tế được sử dụng trong bộ giải.

Ví dụ

>>> from sklearn import linear_model
>>> clf = linear_model.PoissonRegressor()
>>> X = [[1, 2], [2, 3], [3, 4], [4, 3]]
>>> y = [12, 17, 22, 21]
>>> clf.fit(X, y)
PoissonRegressor()
>>> clf.score(X, y)
0.990...
>>> clf.coef_
array([0.121..., 0.158...])
>>> clf.intercept_
2.088...
>>> clf.predict([[1, 1], [3, 4]])
array([10.676..., 21.875...])

Phương pháp

fit(X, y[, sample_weight])

Phù hợp với một mô hình tuyến tính tổng quát.

alpha = 07([deep])

Nhận tham số cho công cụ ước tính này.

alpha = 08(X)

Dự đoán bằng GLM với Ma trận tính năng X.

alpha = 09(X, y[, sample_weight])

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.

X0(**params)

Đặt các tham số của công cụ ước tính này.

tài sản của Family¶family

Dành: Thuộc tính X1 đã không được dùng trong phiên bản 1.1 và sẽ bị xóa trong 1.3.

Đảm bảo khả năng tương thích ngược cho thời gian khấu hao.

phù hợp (x, y, sample_weight = none) [nguồn] ¶(X, y, sample_weight=None)[source]

Phù hợp với một mô hình tuyến tính tổng quát.

Nhận tham số cho công cụ ước tính này.:X{array-like, sparse matrix} of shape (n_samples, n_features)

Dự đoán bằng GLM với Ma trận tính năng X.

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.array-like of shape (n_samples,)

Đặt các tham số của công cụ ước tính này.

tài sản của Family¶array-like of shape (n_samples,), default=None

Dành: Thuộc tính X1 đã không được dùng trong phiên bản 1.1 và sẽ bị xóa trong 1.3.

Returns:selfobject:selfobject

Đảm bảo khả năng tương thích ngược cho thời gian khấu hao.

phù hợp (x, y, sample_weight = none) [nguồn] ¶(deep=True)[source]

Nhận tham số cho công cụ ước tính này.

Dự đoán bằng GLM với Ma trận tính năng X.:deepbool, default=True

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.

Returns:paramsdict:paramsdict

Đặt các tham số của công cụ ước tính này.

tài sản của Family¶(X)[source]

Dự đoán bằng GLM với Ma trận tính năng X.

Nhận tham số cho công cụ ước tính này.:X{array-like, sparse matrix} of shape (n_samples, n_features)

Samples.

Dự đoán bằng GLM với Ma trận tính năng X.:y_predarray of shape (n_samples,)

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.

Đặt các tham số của công cụ ước tính này.(X, y, sample_weight=None)[source]

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.

Đặt các tham số của công cụ ước tính này.User Guide.

tài sản của Family¶\(D^2 = 1-\frac{D(y_{true},y_{pred})}{D_{null}}\), \(D_{null}\) is the null deviance, i.e. the deviance of a model with intercept alone, which corresponds to \(y_{pred} = \bar{y}\). The mean \(\bar{y}\) is averaged by sample_weight. Best possible score is 1.0 and it can be negative (because the model can be arbitrarily worse).

Nhận tham số cho công cụ ước tính này.:X{array-like, sparse matrix} of shape (n_samples, n_features)

Dự đoán bằng GLM với Ma trận tính năng X.

Tính d^2, tỷ lệ phần trăm của sự lệch lạc giải thích.array-like of shape (n_samples,)

Đặt các tham số của công cụ ước tính này.

tài sản của Family¶array-like of shape (n_samples,), default=None

Dành: Thuộc tính X1 đã không được dùng trong phiên bản 1.1 và sẽ bị xóa trong 1.3.

Returns:scorefloat:scorefloat

Đảm bảo khả năng tương thích ngược cho thời gian khấu hao.

phù hợp (x, y, sample_weight = none) [nguồn] ¶(**params)[source]

Đặt các tham số của công cụ ước tính này.

tài sản của Family¶

Parameters:**paramsdict:**paramsdict

Dành: Thuộc tính X1 đã không được dùng trong phiên bản 1.1 và sẽ bị xóa trong 1.3.

Đảm bảo khả năng tương thích ngược cho thời gian khấu hao.:selfestimator instance

phù hợp (x, y, sample_weight = none) [nguồn] ¶

Tham số: x {mảng giống như ma trận thưa thớt} của hình dạng (n_samples, n_features)

Làm thế nào để bạn thực hiện hồi quy nhị thức âm?

Hình thức của phương trình mô hình cho hồi quy nhị thức âm là giống như đối với hồi quy Poisson. Nhật ký của kết quả được dự đoán với sự kết hợp tuyến tính của các dự đoán: log (daysabs) = chặn + b1 (prog = 2) + b2 (prog = 3) + b3math.log(daysabs) = Intercept + b1(prog=2) + b2(prog=3) + b3math.

Hồi quy nhị thức âm được sử dụng để làm gì?

Hồi quy nhị thức âm được sử dụng để kiểm tra các liên kết giữa các biến dự đoán và các biến gây nhiễu trên biến kết quả đếm khi phương sai của số lượng cao hơn giá trị trung bình của số đếm.

Các giả định của hồi quy nhị thức âm là gì?

Hồi quy nhị thức tiêu cực chia sẻ nhiều giả định phổ biến với hồi quy Poisson, chẳng hạn như tính tuyến tính trong các tham số mô hình, tính độc lập của các quan sát riêng lẻ và các hiệu ứng nhân của các biến độc lập.linearity in model parameters, independence of individual observations, and the multiplicative effects of independent variables.

NB có nghĩa là gì trong Python?

Chúng tôi sẽ được giới thiệu về mô hình hồi quy nhị thức âm (NB).Một mô hình NB có thể cực kỳ hữu ích để dự đoán dữ liệu dựa trên số lượng.Chúng tôi sẽ trải qua một hướng dẫn từng bước về cách tạo, đào tạo và kiểm tra mô hình hồi quy nhị thức âm tính trong Python bằng cách sử dụng lớp StatSmodels GLM.Negative Binomial (NB) regression model. An NB model can be incredibly useful for predicting count based data. We'll go through a step-by-step tutorial on how to create, train and test a Negative Binomial regression model in Python using the GLM class of statsmodels.