Hướng dẫn dùng multinomial python
Đã đăng vào thg 7 21, 2017 2:32 SA 2 phút đọc Bài này mình xin giới thiệu về một kĩ thuật khá cơ bản về classification là Multinomial Naive Bayes. Đây là kĩ thuật thuộc họ phân loại theo xác xuất dựa trên định lí Bayes định lí Bayes Đây là model phân hoạch xác xuất của nó: Còn đây là model tính của Multinomial Naive Bayes: Giải thích cục đó hơi dài, mà Viblo hình như không gõ được công thức toán học, nên nếu muốn tìm hiểu sâu hơn, bạn cứ lên wiki nhé :vMình xin mô tả kĩ thuật tính dựa trên một simple example như sau: Giả sử mình có 5 tài liệu và có những từ như dưới, 4 tài liệu đầu đã được phân loại (c hoặc j), tài liệu thứ 5 là cái mình cần tìm ra loại của nó (c hay là j ?)
Prior: P(c) = 3/4 P(j) = 1/4 Conditional Probabilities: P(Chinese/c) = (5+1)/(8+6) = 6/14 = 3/7 (5 là số term Chinese trong cụm class c, 8 là số lượng term trong phân cụm class c, 6 là số term khác nhau cũng trong c) P(Tokyo/c) = (0+1)/(8+6) = 1/14 P(Japan/c) = (0+1)/(8+6) = 1/14 P(Chinese/j) = (1+1)/(3+6) = 2/9 P(Tokyo/j) = (1+1)/(3+6) = 2/9 P(Japan/j) = (1+1)/(3+6) = 2/9 Cuối cùng chúng ta tính ra được xác xuất để chọn class:
Vậy là chúng ta chọn loại c cho Doc5 Tiếp theo mình có một ví dụ khác sử dụng scikit learn để áp dụng cho nhanh việc phân loại này: File data ở đây là một file csv:
column tweet_text chứa các text và column is_there_an_emotion_directed_at_a_brand_or_product chứa phân loại Negative emotion or Positive emotion. Dựa vào dữ liệu này chúng ta sẽ tìm xem cụm từ "I love my iphone!!!" là Negative emotion or Positive emotion.
Output: "Positive emotion" Dĩ nhiên là nó đưa ra kết quả dựa trên xác xuất mà nó đã được train từ dữ liệu trên. Hy vọng mọi người sẽ hiểu hơn về kĩ thuật này. All rights reserved Chủ đề: Multinomial logistic regressionHướng dẫn dùng logistic regressin pythonTrong trang này:Nội dung chính2. Giới thiệuNhắc lại hai mô hình tuyến tínhMột ví dụ nhỏMô hình Logistic RegressionSigmoid function2. Hàm mất mát và phương pháp tối ... Hướng dẫn dùng regression example pythonTrong bài này, tôi sẽ giới thiệu một trong những thuật toán cơ bản nhất (và đơn giản nhất) của Machine Learning. Đây là một thuật toán Supervised learning có ... Hướng dẫn dùng logisticregression pythonTrong trang này:Nội dung chính2. Giới thiệuNhắc lại hai mô hình tuyến tínhMột ví dụ nhỏMô hình Logistic RegressionSigmoid function2. Hàm mất mát và phương pháp tối ... Hướng dẫn dùng numpy.polyfit pythonHãy để tôi bắt đầu bằng cách nói rằng những gì tôi nhận được có thể không phải là những gì tôi mong đợi và có lẽ bạn có thể giúp tôi ở đây. Tôi ...
|