Biểu diễn phân phối xác suất mô hình hỗn hợp Gaussian. Lớp này cho phép ước tính các tham số của phân bố hỗn hợp Gaussian
Đọc thêm trong Hướng dẫn sử dụng .
Mới trong phiên bản 0. 18
Thông số . n_components int, mặc định=1Số thành phần hỗn hợp
covariance_type {'full', 'tied', 'diag', 'spherical'}, default='full'Chuỗi mô tả loại tham số hiệp phương sai sẽ sử dụng. Phải là một trong
'đầy'. mỗi thành phần có ma trận hiệp phương sai chung của riêng nó
'trói'. tất cả các thành phần chia sẻ cùng một ma trận hiệp phương sai chung
'chẩn đoán'. mỗi thành phần có ma trận hiệp phương sai đường chéo riêng
'hình cầu'. mỗi thành phần có phương sai duy nhất của riêng mình
Ngưỡng hội tụ. Các lần lặp lại EM sẽ dừng khi mức tăng trung bình giới hạn dưới thấp hơn ngưỡng này
reg_covar thả nổi, mặc định=1e-6Chính quy hóa không âm được thêm vào đường chéo của hiệp phương sai. Cho phép đảm bảo rằng các ma trận hiệp phương sai đều dương
max_iter int, mặc định=100Số lần lặp EM để thực hiện
n_init int, mặc định=1Số lần khởi tạo để thực hiện. Kết quả tốt nhất được lưu giữ
init_params {‘kmeans’, ‘k-means++’, ‘random’, ‘random_from_data’}, default=’kmeans’Phương thức được sử dụng để khởi tạo trọng số, phương tiện và độ chính xác. Chuỗi phải là một trong
'kmeans'. trách nhiệm được khởi tạo bằng cách sử dụng kmeans
'k-có nghĩa là ++'. sử dụng phương thức k-mean++ để khởi tạo
'ngẫu nhiên'. trách nhiệm được khởi tạo ngẫu nhiên
'ngẫu_nhiên_từ_dữ_liệu'. phương tiện ban đầu là các điểm dữ liệu được chọn ngẫu nhiên
Đã thay đổi trong phiên bản v1. 1.
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7 hiện chấp nhận ‘random_from_data’ và ‘k-means++’ làm phương thức khởi tạo. weights_init hình dạng giống như mảng [n_components, ], default=None
Trọng số ban đầu do người dùng cung cấp. Nếu nó là Không có, các trọng số được khởi tạo bằng phương thức
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7means_init hình dạng giống như mảng [n_components, n_features], default=None
Phương tiện ban đầu do người dùng cung cấp, Nếu không có, phương tiện được khởi tạo bằng phương pháp
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7precisions_init giống như mảng, default=None
Độ chính xác ban đầu do người dùng cung cấp [nghịch đảo của ma trận hiệp phương sai]. Nếu nó là Không, các độ chính xác được khởi tạo bằng phương thức 'init_params'. Hình dạng phụ thuộc vào 'covariance_type'
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'random_state int, thể hiện RandomState hoặc Không, mặc định=Không
Kiểm soát nguồn gốc ngẫu nhiên được cung cấp cho phương thức được chọn để khởi tạo tham số [xem
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7]. Ngoài ra, nó kiểm soát việc tạo các mẫu ngẫu nhiên từ phân phối phù hợp [xem phương pháp
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'0]. Truyền int cho đầu ra có thể lặp lại qua nhiều lệnh gọi hàm. Xem Bảng thuật ngữ . warm_start bool, mặc định=Sai
Nếu ‘warm_start’ là True, giải pháp của lần khớp cuối cùng được sử dụng để khởi tạo cho lần gọi tiếp theo của fit[]. Điều này có thể tăng tốc độ hội tụ khi phù hợp được gọi nhiều lần đối với các vấn đề tương tự. Trong trường hợp đó, 'n_init' bị bỏ qua và chỉ một lần khởi tạo duy nhất xảy ra trong lần gọi đầu tiên. Xem Bảng thuật ngữ .
dài dòng int, mặc định=0Bật đầu ra dài dòng. Nếu 1 thì nó in khởi tạo hiện tại và mỗi bước lặp. Nếu lớn hơn 1 thì nó cũng in xác suất nhật ký và thời gian cần thiết cho mỗi bước
verbose_interval int, mặc định=10Số lần lặp được thực hiện trước lần in tiếp theo
Khối lượng của từng thành phần hỗn hợp
means_ hình dạng giống như mảng [n_components, n_features]Giá trị trung bình của từng thành phần hỗn hợp
hiệp phương sai_ dạng mảngHiệp phương sai của từng thành phần hỗn hợp. Hình dạng phụ thuộc vào
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'1
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'độ chính xác_ dạng mảng
Ma trận độ chụm cho từng thành phần trong hỗn hợp. Ma trận chính xác là nghịch đảo của ma trận hiệp phương sai. Một ma trận hiệp phương sai xác định dương đối xứng nên hỗn hợp Gaussian có thể được tham số hóa tương đương bằng các ma trận chính xác. Lưu trữ ma trận chính xác thay vì ma trận hiệp phương sai giúp tính toán khả năng ghi nhật ký của các mẫu mới tại thời điểm thử nghiệm hiệu quả hơn. Hình dạng phụ thuộc vào
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'1
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'precisions_cholesky_ dạng mảng
Sự phân hủy khó hiểu của ma trận chính xác của từng thành phần hỗn hợp. Ma trận chính xác là nghịch đảo của ma trận hiệp phương sai. Một ma trận hiệp phương sai xác định dương đối xứng nên hỗn hợp Gaussian có thể được tham số hóa tương đương bằng các ma trận chính xác. Lưu trữ ma trận chính xác thay vì ma trận hiệp phương sai giúp tính toán khả năng ghi nhật ký của các mẫu mới tại thời điểm thử nghiệm hiệu quả hơn. Hình dạng phụ thuộc vào
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'1
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'converged_ bool
Đúng khi đạt được sự hội tụ trong fit[], Sai nếu không
n_iter_ intSố bước được sử dụng bởi EM phù hợp nhất để đạt được sự hội tụ
lower_bound_ trôi nổiGiá trị giới hạn dưới về khả năng đăng nhập [của dữ liệu đào tạo đối với mô hình] phù hợp nhất với EM
n_features_in_ intSố lượng đối tượng địa lý được xem trong thời gian phù hợp .
Mới trong phiên bản 0. 24
feature_names_in_ ndarray của hình dạng [[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'4,]
Tên của các tính năng đã thấy trong thời gian fit . Chỉ được xác định khi
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'5 có tên đối tượng là tất cả các chuỗi.
Mới trong phiên bản 1. 0
Xem thêm
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'6
Mô hình hỗn hợp Gaussian phù hợp với suy luận biến phân
ví dụ
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'1
phương pháp
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7[X]
Tiêu chí thông tin Akaike cho mô hình hiện tại trên đầu vào X
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'8[X]
Tiêu chí thông tin Bayesian cho mô hình hiện tại trên đầu vào X
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'9[X[, y]]
Ước tính các tham số mô hình với thuật toán EM
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'0[X[, y]]
Ước tính các tham số mô hình bằng X và dự đoán nhãn cho X
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'1[[sâu]]
Nhận thông số cho công cụ ước tính này
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'2[X]
Dự đoán nhãn cho các mẫu dữ liệu trong X bằng mô hình được đào tạo
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'3[X]
Đánh giá tỷ trọng các thành phần cho từng mẫu
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'0[[n_mẫu]]
Tạo các mẫu ngẫu nhiên từ phân phối Gaussian được trang bị
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'5[X[, y]]
Tính toán khả năng ghi nhật ký trung bình trên mỗi mẫu của dữ liệu đã cho X
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'6[X]
Tính khả năng đăng nhập của từng mẫu
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'7[**thông số]
Đặt các tham số của công cụ ước tính này
aic[X][nguồn]¶Tiêu chí thông tin Akaike cho mô hình hiện tại trên đầu vào X
Bạn có thể tham khảo phần toán học này để biết thêm chi tiết về công thức của AIC được sử dụng.
Thông số . X mảng hình dạng [n_samples, n_dimensions]Các mẫu đầu vào
Trả về . aic trôi nổicàng thấp càng tốt
bic[X][nguồn]¶Tiêu chí thông tin Bayesian cho mô hình hiện tại trên đầu vào X
Bạn có thể tham khảo phần toán học này để biết thêm chi tiết về công thức của BIC được sử dụng.
Thông số . X mảng hình dạng [n_samples, n_dimensions]Các mẫu đầu vào
Trả về . bic trôi nổicàng thấp càng tốt
phù hợp[X , y=Không có][nguồn]¶Ước tính các tham số mô hình với thuật toán EM
Phương pháp phù hợp với mô hình
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'8 lần và đặt các tham số mà mô hình có khả năng lớn nhất hoặc giới hạn dưới. Trong mỗi thử nghiệm, phương pháp lặp lại giữa E-step và M-step trong _______09 lần cho đến khi thay đổi khả năng xảy ra hoặc giới hạn dưới nhỏ hơn _______00, nếu không, _______01 sẽ tăng lên. Nếu
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'2 là
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'3, thì
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'8 sẽ bị bỏ qua và một lần khởi tạo duy nhất được thực hiện trong lần gọi đầu tiên. Sau các cuộc gọi liên tiếp, quá trình đào tạo sẽ bắt đầu từ nơi nó dừng lạiThông số . X hình dạng giống như mảng [n_samples, n_features]
Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
Không được sử dụng, trình bày về tính nhất quán của API theo quy ước
Trả về . bản thân vậtHỗn hợp được trang bị
fit_predict[X , y=Không có][nguồn]¶Ước tính các tham số mô hình bằng X và dự đoán nhãn cho X
Phương thức phù hợp với mô hình n_init lần và đặt các tham số mà mô hình có khả năng lớn nhất hoặc giới hạn dưới. Trong mỗi thử nghiệm, phương pháp lặp lại giữa E-step và M-step trong _______09 lần cho đến khi thay đổi khả năng xảy ra hoặc giới hạn dưới nhỏ hơn _______00, nếu không, _______01 sẽ tăng lên. Sau khi khớp, nó dự đoán nhãn có thể xảy ra nhất cho các điểm dữ liệu đầu vào
Mới trong phiên bản 0. 20
Thông số . X hình dạng giống như mảng [n_samples, n_features]Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
y Làm ngơKhông được sử dụng, trình bày về tính nhất quán của API theo quy ước
Trả về . nhãn mảng, hình dạng [n_samples,]nhãn thành phần
get_params[deep=True][nguồn]¶Nhận thông số cho công cụ ước tính này
Thông số . deep bool, mặc định=TrueNếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính
Trả về . params mệnh lệnhTên tham số được ánh xạ tới giá trị của chúng
dự đoán[X][nguồn]¶Dự đoán nhãn cho các mẫu dữ liệu trong X bằng mô hình được đào tạo
Thông số . X hình dạng giống như mảng [n_samples, n_features]Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
Trả về . nhãn mảng, hình dạng [n_samples,]nhãn thành phần
predict_proba[X][nguồn]¶Đánh giá mật độ của các thành phần cho từng mẫu
Thông số . X hình dạng giống như mảng [n_samples, n_features]Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
Trả về . resp mảng, hình [n_samples, n_components]Mật độ của từng thành phần Gaussian cho từng mẫu trong X
mẫu[n_samples=1][nguồn]¶Tạo các mẫu ngẫu nhiên từ phân phối Gaussian được trang bị
Thông số . n_samples int, mặc định=1Số lượng mẫu cần tạo
Trả về . X mảng, hình [n_samples, n_features]Mẫu được tạo ngẫu nhiên
y mảng, hình dạng [mẫu,]nhãn thành phần
điểm[X , y=Không có][nguồn]¶Tính toán khả năng ghi nhật ký trung bình trên mỗi mẫu của dữ liệu đã cho X
Thông số . X hình dạng giống như mảng [n_samples, n_dimensions]Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
y Làm ngơKhông được sử dụng, trình bày về tính nhất quán của API theo quy ước
Trả về . log_likelihood trôi nổiLog-likelihood của
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'5 theo mô hình hỗn hợp Gaussianscore_samples[X][nguồn]¶
Tính khả năng đăng nhập của từng mẫu
Thông số . X hình dạng giống như mảng [n_samples, n_features]Danh sách các điểm dữ liệu n_features-chiều. Mỗi hàng tương ứng với một điểm dữ liệu
Trả về . log_prob mảng, hình dạng [n_samples,]Khả năng đăng nhập của từng mẫu trong
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'5 theo mô hình hiện tạiset_params[**params][nguồn]¶
Đặt các tham số của công cụ ước tính này
Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'10]. Cái sau có các tham số dạng
[n_components,] if 'spherical', [n_features, n_features] if 'tied', [n_components, n_features] if 'diag', [n_components, n_features, n_features] if 'full'11 để có thể cập nhật từng thành phần của một đối tượng lồng nhau