Mô hình hỗn hợp chung trăn

Biểu diễn phân phối xác suất mô hình hỗn hợp Gaussian. Lớp này cho phép ước tính các tham số của phân bố hỗn hợp Gaussian

Đọc thêm trong Hướng dẫn sử dụng .

Mới trong phiên bản 0. 18

Thông số . n_components int, mặc định=1

Số thành phần hỗn hợp

covariance_type {'full', 'tied', 'diag', 'spherical'}, default='full'

Chuỗi mô tả loại tham số hiệp phương sai sẽ sử dụng. Phải là một trong

  • 'đầy'. mỗi thành phần có ma trận hiệp phương sai chung của riêng nó

  • 'trói'. tất cả các thành phần chia sẻ cùng một ma trận hiệp phương sai chung

  • 'chẩn đoán'. mỗi thành phần có ma trận hiệp phương sai đường chéo riêng

  • 'hình cầu'. mỗi thành phần có phương sai duy nhất của riêng mình

tol thả nổi, mặc định=1e-3

Ngưỡng hội tụ. Các lần lặp lại EM sẽ dừng khi mức tăng trung bình giới hạn dưới thấp hơn ngưỡng này

reg_covar thả nổi, mặc định=1e-6

Chính quy hóa không âm được thêm vào đường chéo của hiệp phương sai. Cho phép đảm bảo rằng các ma trận hiệp phương sai đều dương

max_iter int, mặc định=100

Số lần lặp EM để thực hiện

n_init int, mặc định=1

Số lần khởi tạo để thực hiện. Kết quả tốt nhất được lưu giữ

init_params {‘kmeans’, ‘k-means++’, ‘random’, ‘random_from_data’}, default=’kmeans’

Phương thức được sử dụng để khởi tạo trọng số, phương tiện và độ chính xác. Chuỗi phải là một trong

  • 'kmeans'. trách nhiệm được khởi tạo bằng cách sử dụng kmeans

  • 'k-có nghĩa là ++'. sử dụng phương thức k-mean++ để khởi tạo

  • 'ngẫu nhiên'. trách nhiệm được khởi tạo ngẫu nhiên

  • 'ngẫu_nhiên_từ_dữ_liệu'. phương tiện ban đầu là các điểm dữ liệu được chọn ngẫu nhiên

Đã thay đổi trong phiên bản v1. 1.

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7 hiện chấp nhận ‘random_from_data’ và ‘k-means++’ làm phương thức khởi tạo.

weights_init hình dạng giống như mảng [n_components, ], default=None

Trọng số ban đầu do người dùng cung cấp. Nếu nó là Không có, các trọng số được khởi tạo bằng phương thức

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7

means_init hình dạng giống như mảng [n_components, n_features], default=None

Phương tiện ban đầu do người dùng cung cấp, Nếu không có, phương tiện được khởi tạo bằng phương pháp

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7

precisions_init giống như mảng, default=None

Độ chính xác ban đầu do người dùng cung cấp [nghịch đảo của ma trận hiệp phương sai]. Nếu nó là Không, các độ chính xác được khởi tạo bằng phương thức 'init_params'. Hình dạng phụ thuộc vào 'covariance_type'

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'

random_state int, thể hiện RandomState hoặc Không, mặc định=Không

Kiểm soát nguồn gốc ngẫu nhiên được cung cấp cho phương thức được chọn để khởi tạo tham số [xem

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7]. Ngoài ra, nó kiểm soát việc tạo các mẫu ngẫu nhiên từ phân phối phù hợp [xem phương pháp
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
0]. Truyền int cho đầu ra có thể lặp lại qua nhiều lệnh gọi hàm. Xem Bảng thuật ngữ .

warm_start bool, mặc định=Sai

Nếu ‘warm_start’ là True, giải pháp của lần khớp cuối cùng được sử dụng để khởi tạo cho lần gọi tiếp theo của fit[]. Điều này có thể tăng tốc độ hội tụ khi phù hợp được gọi nhiều lần đối với các vấn đề tương tự. Trong trường hợp đó, 'n_init' bị bỏ qua và chỉ một lần khởi tạo duy nhất xảy ra trong lần gọi đầu tiên. Xem Bảng thuật ngữ .

dài dòng int, mặc định=0

Bật đầu ra dài dòng. Nếu 1 thì nó in khởi tạo hiện tại và mỗi bước lặp. Nếu lớn hơn 1 thì nó cũng in xác suất nhật ký và thời gian cần thiết cho mỗi bước

verbose_interval int, mặc định=10

Số lần lặp được thực hiện trước lần in tiếp theo

Thuộc tính . trọng số_ hình dạng giống như mảng [n_components,]

Khối lượng của từng thành phần hỗn hợp

means_ hình dạng giống như mảng [n_components, n_features]

Giá trị trung bình của từng thành phần hỗn hợp

hiệp phương sai_ dạng mảng

Hiệp phương sai của từng thành phần hỗn hợp. Hình dạng phụ thuộc vào

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
1

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'

độ chính xác_ dạng mảng

Ma trận độ chụm cho từng thành phần trong hỗn hợp. Ma trận chính xác là nghịch đảo của ma trận hiệp phương sai. Một ma trận hiệp phương sai xác định dương đối xứng nên hỗn hợp Gaussian có thể được tham số hóa tương đương bằng các ma trận chính xác. Lưu trữ ma trận chính xác thay vì ma trận hiệp phương sai giúp tính toán khả năng ghi nhật ký của các mẫu mới tại thời điểm thử nghiệm hiệu quả hơn. Hình dạng phụ thuộc vào

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
1

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'

precisions_cholesky_ dạng mảng

Sự phân hủy khó hiểu của ma trận chính xác của từng thành phần hỗn hợp. Ma trận chính xác là nghịch đảo của ma trận hiệp phương sai. Một ma trận hiệp phương sai xác định dương đối xứng nên hỗn hợp Gaussian có thể được tham số hóa tương đương bằng các ma trận chính xác. Lưu trữ ma trận chính xác thay vì ma trận hiệp phương sai giúp tính toán khả năng ghi nhật ký của các mẫu mới tại thời điểm thử nghiệm hiệu quả hơn. Hình dạng phụ thuộc vào

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
1

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'

converged_ bool

Đúng khi đạt được sự hội tụ trong fit[], Sai nếu không

n_iter_ int

Số bước được sử dụng bởi EM phù hợp nhất để đạt được sự hội tụ

lower_bound_ trôi nổi

Giá trị giới hạn dưới về khả năng đăng nhập [của dữ liệu đào tạo đối với mô hình] phù hợp nhất với EM

n_features_in_ int

Số lượng đối tượng địa lý được xem trong thời gian phù hợp .

Mới trong phiên bản 0. 24

feature_names_in_ ndarray của hình dạng [
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
4,]

Tên của các tính năng đã thấy trong thời gian fit . Chỉ được xác định khi

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
5 có tên đối tượng là tất cả các chuỗi.

Mới trong phiên bản 1. 0

Xem thêm

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
6

Mô hình hỗn hợp Gaussian phù hợp với suy luận biến phân

ví dụ

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
1

phương pháp

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7[X]

Tiêu chí thông tin Akaike cho mô hình hiện tại trên đầu vào X

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
8[X]

Tiêu chí thông tin Bayesian cho mô hình hiện tại trên đầu vào X

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
9[X[, y]]

Ước tính các tham số mô hình với thuật toán EM

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
0[X[, y]]

Ước tính các tham số mô hình bằng X và dự đoán nhãn cho X

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
1[[sâu]]

Nhận thông số cho công cụ ước tính này

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
2[X]

Dự đoán nhãn cho các mẫu dữ liệu trong X bằng mô hình được đào tạo

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
3[X]

Đánh giá tỷ trọng các thành phần cho từng mẫu

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
0[[n_mẫu]]

Tạo các mẫu ngẫu nhiên từ phân phối Gaussian được trang bị

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
5[X[, y]]

Tính toán khả năng ghi nhật ký trung bình trên mỗi mẫu của dữ liệu đã cho X

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
6[X]

Tính khả năng đăng nhập của từng mẫu

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
7[**thông số]

Đặt các tham số của công cụ ước tính này

aic[X][nguồn]

Tiêu chí thông tin Akaike cho mô hình hiện tại trên đầu vào X

Bạn có thể tham khảo phần toán học này để biết thêm chi tiết về công thức của AIC được sử dụng.

Thông số . X mảng hình dạng [n_samples, n_dimensions]

Các mẫu đầu vào

Trả về . aic trôi nổi

càng thấp càng tốt

bic[X][nguồn]

Tiêu chí thông tin Bayesian cho mô hình hiện tại trên đầu vào X

Bạn có thể tham khảo phần toán học này để biết thêm chi tiết về công thức của BIC được sử dụng.

Thông số . X mảng hình dạng [n_samples, n_dimensions]

Các mẫu đầu vào

Trả về . bic trôi nổi

càng thấp càng tốt

phù hợp[X , y=Không có][nguồn]

Ước tính các tham số mô hình với thuật toán EM

Phương pháp phù hợp với mô hình

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
8 lần và đặt các tham số mà mô hình có khả năng lớn nhất hoặc giới hạn dưới. Trong mỗi thử nghiệm, phương pháp lặp lại giữa E-step và M-step trong _______09 lần cho đến khi thay đổi khả năng xảy ra hoặc giới hạn dưới nhỏ hơn _______00, nếu không, _______01 sẽ tăng lên. Nếu
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
2 là
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
3, thì
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
8 sẽ bị bỏ qua và một lần khởi tạo duy nhất được thực hiện trong lần gọi đầu tiên. Sau các cuộc gọi liên tiếp, quá trình đào tạo sẽ bắt đầu từ nơi nó dừng lại

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

y Làm ngơ

Không được sử dụng, trình bày về tính nhất quán của API theo quy ước

Trả về . bản thân vật

Hỗn hợp được trang bị

fit_predict[X , y=Không có][nguồn]

Ước tính các tham số mô hình bằng X và dự đoán nhãn cho X

Phương thức phù hợp với mô hình n_init lần và đặt các tham số mà mô hình có khả năng lớn nhất hoặc giới hạn dưới. Trong mỗi thử nghiệm, phương pháp lặp lại giữa E-step và M-step trong _______09 lần cho đến khi thay đổi khả năng xảy ra hoặc giới hạn dưới nhỏ hơn _______00, nếu không, _______01 sẽ tăng lên. Sau khi khớp, nó dự đoán nhãn có thể xảy ra nhất cho các điểm dữ liệu đầu vào

Mới trong phiên bản 0. 20

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

y Làm ngơ

Không được sử dụng, trình bày về tính nhất quán của API theo quy ước

Trả về . nhãn mảng, hình dạng [n_samples,]

nhãn thành phần

get_params[deep=True][nguồn]

Nhận thông số cho công cụ ước tính này

Thông số . deep bool, mặc định=True

Nếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính

Trả về . params mệnh lệnh

Tên tham số được ánh xạ tới giá trị của chúng

dự đoán[X][nguồn]

Dự đoán nhãn cho các mẫu dữ liệu trong X bằng mô hình được đào tạo

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

Trả về . nhãn mảng, hình dạng [n_samples,]

nhãn thành phần

predict_proba[X][nguồn]

Đánh giá mật độ của các thành phần cho từng mẫu

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

Trả về . resp mảng, hình [n_samples, n_components]

Mật độ của từng thành phần Gaussian cho từng mẫu trong X

mẫu[n_samples=1][nguồn]

Tạo các mẫu ngẫu nhiên từ phân phối Gaussian được trang bị

Thông số . n_samples int, mặc định=1

Số lượng mẫu cần tạo

Trả về . X mảng, hình [n_samples, n_features]

Mẫu được tạo ngẫu nhiên

y mảng, hình dạng [mẫu,]

nhãn thành phần

điểm[X , y=Không có][nguồn]

Tính toán khả năng ghi nhật ký trung bình trên mỗi mẫu của dữ liệu đã cho X

Thông số . X hình dạng giống như mảng [n_samples, n_dimensions]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

y Làm ngơ

Không được sử dụng, trình bày về tính nhất quán của API theo quy ước

Trả về . log_likelihood trôi nổi

Log-likelihood của

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
5 theo mô hình hỗn hợp Gaussian

score_samples[X][nguồn]

Tính khả năng đăng nhập của từng mẫu

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu

Trả về . log_prob mảng, hình dạng [n_samples,]

Khả năng đăng nhập của từng mẫu trong

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
5 theo mô hình hiện tại

set_params[**params][nguồn]

Đặt các tham số của công cụ ước tính này

Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như

[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
10]. Cái sau có các tham số dạng
[n_components,]                        if 'spherical',
[n_features, n_features]               if 'tied',
[n_components, n_features]             if 'diag',
[n_components, n_features, n_features] if 'full'
11 để có thể cập nhật từng thành phần của một đối tượng lồng nhau

Chủ Đề