Thư viện phân tích tình cảm Python

Phân tích tình cảm là quá trình tự động gắn thẻ dữ liệu theo tình cảm của họ, chẳng hạn như tích cực, tiêu cực và trung lập. Phân tích tình cảm cho phép các công ty phân tích dữ liệu trên quy mô lớn, phát hiện thông tin chi tiết và tự động hóa quy trình

Trước đây, phân tích tình cảm thường chỉ giới hạn ở các nhà nghiên cứu, kỹ sư máy học hoặc nhà khoa học dữ liệu có kinh nghiệm về xử lý ngôn ngữ tự nhiên. Tuy nhiên, cộng đồng AI đã xây dựng các công cụ tuyệt vời để dân chủ hóa quyền truy cập vào học máy trong những năm gần đây. Ngày nay, bạn có thể sử dụng phân tích tình cảm với một vài dòng mã và hoàn toàn không cần trải nghiệm máy học. 🤯

Trong hướng dẫn này, bạn sẽ tìm hiểu mọi thứ để bắt đầu phân tích cảm tính bằng Python, bao gồm

Bắt đầu nào. 🚀

1. Phân tích tình cảm là gì?

Phân tích tình cảm là một kỹ thuật xử lý ngôn ngữ tự nhiên giúp xác định tính phân cực của một văn bản nhất định. Có nhiều cách phân tích tình cảm khác nhau, nhưng một trong những kỹ thuật được sử dụng rộng rãi nhất là phân loại dữ liệu thành tích cực, tiêu cực và trung tính. Ví dụ: hãy xem các tweet này đề cập đến @VerizonSupport

  • "kính gửi @verizonsupport, dịch vụ của bạn luôn ổn định 💩 ở dallas. đã đồng hành cùng bạn hơn một thập kỷ và đây là mức thấp nhất mọi thời đại đối với bạn. tôi đang nói không có internet. " → Sẽ được gắn thẻ là "Phủ định"

  • "@verizonsupport tôi đã gửi dm cho bạn" → sẽ được gắn thẻ là "Trung lập"

  • "cảm ơn michelle và cộng sự tại @verizonsupport đã giúp giải quyết vấn đề không hiển thị điện thoại của tôi. đã hủy đơn hàng thành công và đã đặt hàng để nhận hàng ngay hôm nay tại cửa hàng táo trong trung tâm thương mại. " → sẽ được gắn thẻ là "Tích cực"

Phân tích tình cảm cho phép xử lý dữ liệu ở quy mô lớn và theo thời gian thực. Ví dụ: bạn có muốn phân tích hàng nghìn tweet, đánh giá sản phẩm hoặc yêu cầu hỗ trợ không?

Phân tích tình cảm được sử dụng trong nhiều ứng dụng, ví dụ

  • Phân tích các đề cập trên mạng xã hội để hiểu cách mọi người nói về thương hiệu của bạn so với đối thủ cạnh tranh
  • Phân tích phản hồi từ các cuộc khảo sát và đánh giá sản phẩm để nhanh chóng có được thông tin chi tiết về những điều khách hàng thích và không thích về sản phẩm của bạn
  • Phân tích yêu cầu hỗ trợ đến trong thời gian thực để phát hiện những khách hàng tức giận và hành động phù hợp để ngăn chặn tình trạng rời bỏ

2. Cách sử dụng các mô hình phân tích tình cảm được đào tạo trước với Python

Bây giờ chúng ta đã biết phân tích cảm tính là gì, chúng ta đã sẵn sàng chơi với một số mô hình phân tích cảm xúc. 🎉

Trên Hugging Face Hub, chúng tôi đang xây dựng bộ sưu tập mô hình và bộ dữ liệu lớn nhất có sẵn công khai để dân chủ hóa việc học máy 🚀. Trong Hub, bạn có thể tìm thấy hơn 27.000 mô hình được cộng đồng AI chia sẻ với hiệu suất hiện đại trong các tác vụ như phân tích cảm xúc, phát hiện đối tượng, tạo văn bản, nhận dạng giọng nói, v.v. Hub miễn phí sử dụng và hầu hết các kiểu máy đều có tiện ích cho phép kiểm tra chúng trực tiếp trên trình duyệt của bạn

Có hơn 215 mô hình phân tích tình cảm có sẵn công khai trên Hub và việc tích hợp chúng với Python chỉ cần 5 dòng mã

pip install -q transformers
from transformers import pipeline
sentiment_pipeline = pipeline["sentiment-analysis"]
data = ["I love you", "I hate you"]
sentiment_pipeline[data]

Đoạn mã này sử dụng lớp đường ống để đưa ra dự đoán từ các mô hình có sẵn trong Hub. Nó sử dụng mô hình mặc định để phân tích tình cảm để phân tích danh sách các văn bản

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
2 và nó đưa ra các kết quả sau

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]

Bạn có thể sử dụng một mô hình phân tích tình cảm cụ thể phù hợp hơn với ngôn ngữ hoặc trường hợp sử dụng của mình bằng cách cung cấp tên của mô hình. Ví dụ: nếu bạn muốn có một mô hình phân tích tình cảm cho các tweet, bạn có thể chỉ định id mô hình

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]

Bạn có thể kiểm tra các mô hình này bằng dữ liệu của riêng mình bằng sổ ghi chép Colab này

Sau đây là một số mô hình phổ biến cho các mô hình phân tích tình cảm có sẵn trên Hub mà chúng tôi khuyên bạn nên kiểm tra
  • Twitter-roberta-base-sentiment là một mô hình roBERTa được đào tạo trên ~58 triệu tweet và được tinh chỉnh để phân tích tình cảm. Tinh chỉnh là quá trình lấy một mô hình ngôn ngữ lớn được đào tạo trước [e. g. roBERTa trong trường hợp này] và sau đó điều chỉnh nó bằng dữ liệu huấn luyện bổ sung để làm cho nó thực hiện tác vụ tương tự thứ hai [e. g. phân tích tình cảm]
  • Bert-base-multilingual-uncased-sentiment là một mô hình được tinh chỉnh để phân tích cảm tính đối với các bài đánh giá sản phẩm bằng sáu ngôn ngữ. Tiếng Anh, tiếng Hà Lan, tiếng Đức, tiếng Pháp, tiếng Tây Ban Nha và tiếng Ý
  • Distilbert-base-uncased-emotion là một mô hình được tinh chỉnh để phát hiện cảm xúc trong văn bản, bao gồm nỗi buồn, niềm vui, tình yêu, sự tức giận, sợ hãi và bất ngờ

Bạn có muốn thực hiện phân tích tình cảm bằng các ngôn ngữ như tiếng Tây Ban Nha, tiếng Pháp, tiếng Ý hoặc tiếng Đức không? . Bạn có thể xem danh sách đầy đủ các mô hình phân tích tình cảm tại đây và lọc ở bên trái theo ngôn ngữ mà bạn quan tâm

3. Xây dựng mô hình phân tích tình cảm của riêng bạn

Sử dụng các mô hình được đào tạo trước có sẵn công khai trên Hub là một cách tuyệt vời để bắt đầu ngay với phân tích cảm tính. Các mô hình này sử dụng các kiến ​​trúc học sâu như máy biến áp để đạt được hiệu suất cao nhất trong phân tích tình cảm và các nhiệm vụ học máy khác. Tuy nhiên, bạn có thể tinh chỉnh mô hình bằng dữ liệu của riêng mình để cải thiện hơn nữa kết quả phân tích cảm tính và tăng thêm độ chính xác trong trường hợp sử dụng cụ thể của bạn

Trong phần này, chúng ta sẽ xem xét hai cách tiếp cận về cách tinh chỉnh mô hình để phân tích cảm tính với dữ liệu và tiêu chí của riêng bạn. Cách tiếp cận đầu tiên sử dụng API Huấn luyện viên từ 🤗Transformers, một thư viện mã nguồn mở với 50 nghìn sao và hơn 1 nghìn người đóng góp, đồng thời yêu cầu thêm một chút mã hóa và kinh nghiệm. Cách tiếp cận thứ hai dễ dàng và đơn giản hơn một chút, nó sử dụng AutoNLP, một công cụ tự động đào tạo, đánh giá và triển khai các mô hình NLP tiên tiến nhất mà không cần mã hoặc kinh nghiệm ML

Hãy đi sâu vào

a. Tinh chỉnh mô hình với Python

Trong hướng dẫn này, bạn sẽ sử dụng bộ dữ liệu IMBD để tinh chỉnh mô hình DistilBERT để phân tích cảm tính

Bộ dữ liệu IMDB chứa 25.000 bài đánh giá phim được gắn nhãn theo tình cảm để đào tạo một mô hình và 25.000 bài đánh giá phim để thử nghiệm mô hình đó. DistilBERT là phiên bản nhỏ hơn, nhanh hơn và rẻ hơn của BERT. Nó nhỏ hơn 40% so với BERT và chạy nhanh hơn 60% trong khi bảo toàn hơn 95% hiệu suất của BERT. Bạn sẽ sử dụng tập dữ liệu IMDB để tinh chỉnh mô hình DistilBERT có khả năng phân loại đánh giá phim là tích cực hay tiêu cực. Khi bạn đào tạo mô hình, bạn sẽ sử dụng nó để phân tích dữ liệu mới. ⚡️

Chúng tôi đã tạo sổ ghi chép này để bạn có thể sử dụng nó thông qua hướng dẫn này trong Google Colab

1. Kích hoạt GPU và cài đặt phụ thuộc

Bước đầu tiên, hãy thiết lập Google Colab để sử dụng GPU [thay vì CPU] để đào tạo mô hình nhanh hơn nhiều. Bạn có thể thực hiện việc này bằng cách vào menu, nhấp vào 'Thời gian chạy' > 'Thay đổi loại thời gian chạy' và chọn 'GPU' làm Trình tăng tốc phần cứng. Khi bạn thực hiện việc này, bạn nên kiểm tra xem GPU có sẵn trên máy tính xách tay của chúng tôi hay không bằng cách chạy đoạn mã sau

import torch
torch.cuda.is_available[]

Sau đó, cài đặt các thư viện bạn sẽ sử dụng trong hướng dẫn này

!pip install datasets transformers huggingface_hub

Bạn cũng nên cài đặt

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
3 để sử dụng git trong kho lưu trữ mô hình của chúng tôi

!apt-get install git-lfs

2. dữ liệu tiền xử lý

Bạn cần dữ liệu để tinh chỉnh DistilBERT cho phân tích cảm tính. Vì vậy, hãy sử dụng thư viện 🤗Datasets để tải xuống và xử lý trước bộ dữ liệu IMDB để sau đó bạn có thể sử dụng dữ liệu này để đào tạo mô hình của mình

________số 8

IMDB là một tập dữ liệu khổng lồ, vì vậy hãy tạo các tập dữ liệu nhỏ hơn để cho phép đào tạo và thử nghiệm nhanh hơn

small_train_dataset = imdb["train"].shuffle[seed=42].select[[i for i in list[range[3000]]]]
small_test_dataset = imdb["test"].shuffle[seed=42].select[[i for i in list[range[300]]]]

Để xử lý trước dữ liệu của chúng tôi, bạn sẽ sử dụng

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
0

Tiếp theo, bạn sẽ chuẩn bị đầu vào văn bản cho mô hình cho cả hai phần tách của tập dữ liệu của chúng tôi [đào tạo và kiểm tra] bằng cách sử dụng phương pháp bản đồ

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
1

Để tăng tốc độ đào tạo, hãy sử dụng data_collator để chuyển đổi các mẫu đào tạo của bạn thành các tenxơ PyTorch và nối chúng với số lượng chính xác

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
0

3. Đào tạo người mẫu

Bây giờ, quá trình tiền xử lý đã hoàn tất, bạn có thể tiếp tục và huấn luyện mô hình của mình 🚀

Bạn sẽ loại bỏ phần đầu tiền đào tạo của mô hình DistilBERT và thay thế nó bằng phần đầu phân loại được tinh chỉnh để phân tích tình cảm. Điều này cho phép bạn chuyển kiến ​​thức từ DistilBERT sang mô hình tùy chỉnh của mình 🔥

Để đào tạo, bạn sẽ sử dụng , được tối ưu hóa để tinh chỉnh các mẫu Transformers🤗 như DistilBERT, BERT và RoBERTa

Đầu tiên, hãy xác định DistilBERT là mô hình cơ sở của bạn

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
1

Sau đó, hãy xác định các số liệu bạn sẽ sử dụng để đánh giá mức độ tốt của mô hình tinh chỉnh của bạn [độ chính xác và điểm f1]

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
2

Tiếp theo, hãy đăng nhập vào tài khoản Ôm mặt của bạn để bạn có thể quản lý kho mô hình của mình.

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
4 sẽ khởi chạy một tiện ích trong sổ ghi chép của bạn, nơi bạn sẽ cần thêm mã thông báo Hugging Face của mình

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
3

Bạn gần như ở đó. Trước khi đào tạo mô hình của chúng tôi, bạn cần xác định các đối số đào tạo và xác định Trình huấn luyện với tất cả các đối tượng bạn đã xây dựng cho đến thời điểm này

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
4

Bây giờ, đã đến lúc tinh chỉnh mô hình trên bộ dữ liệu phân tích tình cảm. 🙌 Bạn chỉ cần gọi phương thức

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
5 của Huấn luyện viên của bạn

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
5

Và Voila. Bạn đã tinh chỉnh mô hình DistilBERT để phân tích tình cảm. 🎉

Thời gian đào tạo tùy thuộc vào phần cứng bạn sử dụng và số lượng mẫu trong tập dữ liệu. Trong trường hợp của chúng tôi, mất gần 10 phút sử dụng GPU và tinh chỉnh mô hình với 3.000 mẫu. Bạn càng sử dụng nhiều mẫu để đào tạo mô hình của mình thì mô hình sẽ càng chính xác nhưng quá trình đào tạo có thể chậm hơn đáng kể

Tiếp theo, hãy tính toán các số liệu đánh giá để xem mô hình của bạn tốt như thế nào

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
6

Trong trường hợp của chúng tôi, chúng tôi có độ chính xác 88% và điểm f1 89%. Khá tốt cho một mô hình phân tích tình cảm vừa được đào tạo với 3.000 mẫu

4. Phân tích dữ liệu mới với mô hình

Bây giờ bạn đã đào tạo một mô hình để phân tích tình cảm, hãy sử dụng nó để phân tích dữ liệu mới và nhận 🤖 dự đoán. Điều này giải phóng sức mạnh của máy học;

Đầu tiên, hãy tải mô hình lên Hub

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
7

Bây giờ bạn đã đẩy mô hình vào Hub, bạn có thể sử dụng lớp đường dẫn của nó để phân tích hai bài đánh giá phim mới và xem cách mô hình của bạn dự đoán cảm xúc của nó chỉ bằng hai dòng mã 🤯

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
8

Đây là những dự đoán từ mô hình của chúng tôi

[{'label': 'POSITIVE', 'score': 0.9998},
 {'label': 'NEGATIVE', 'score': 0.9991}]
9

Trong bộ dữ liệu IMDB,

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
6 có nghĩa là dương và
specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
7 là âm. Khá tốt. 🔥

b. Đào tạo mô hình tình cảm với AutoNLP

AutoNLP là công cụ đào tạo các mô hình học máy tối tân không cần code. Nó cung cấp giao diện người dùng thân thiện và dễ sử dụng, nơi bạn có thể đào tạo các mô hình tùy chỉnh bằng cách tải lên dữ liệu của mình. AutoNLP sẽ tự động tinh chỉnh các mô hình được đào tạo trước khác nhau với dữ liệu của bạn, đảm nhiệm việc điều chỉnh siêu tham số và tìm mô hình tốt nhất cho trường hợp sử dụng của bạn. Tất cả các mô hình được đào tạo với AutoNLP đều được triển khai và sẵn sàng cho sản xuất

Đào tạo một mô hình phân tích tình cảm bằng AutoNLP cực kỳ dễ dàng và chỉ cần vài cú nhấp chuột 🤯. Thử một lần đi

Bước đầu tiên, hãy lấy một số dữ liệu. Bạn sẽ sử dụng Sentiment140, một bộ dữ liệu phân tích tình cảm phổ biến bao gồm các tin nhắn Twitter được gắn nhãn 3 tình cảm. 0 [tiêu cực], 2 [trung lập] và 4 [tích cực]. Tập dữ liệu khá lớn; . Vì bạn không cần lượng dữ liệu này để bắt đầu sử dụng AutoNLP và huấn luyện các mô hình đầu tiên của mình, chúng tôi đã chuẩn bị một phiên bản nhỏ hơn của tập dữ liệu Sentiment140 với 3.000 mẫu mà bạn có thể tải xuống từ đây. Đây là cách tập dữ liệu trông giống như

Bộ dữ liệu tình cảm 140

Tiếp theo, hãy tạo một dự án mới trên AutoNLP để đào tạo 5 mô hình ứng cử viên

Tạo dự án mới trên AutoNLP

Sau đó, tải tập dữ liệu lên và ánh xạ cột văn bản và cột mục tiêu

Thêm tập dữ liệu vào AutoNLP

Sau khi bạn thêm tập dữ liệu của mình, hãy chuyển đến tab "Đào tạo" và chấp nhận giá để bắt đầu đào tạo mô hình của bạn. Giá AutoNLP có thể thấp tới $10 cho mỗi mô hình

Thêm tập dữ liệu vào AutoNLP

Sau vài phút, AutoNLP đã đào tạo tất cả các mô hình, hiển thị số liệu hiệu suất cho tất cả các mô hình đó

Các mô hình phân tích tình cảm được đào tạo bởi AutoNLP

Mô hình tốt nhất có 77. Độ chính xác 87% 🔥 Khá tốt cho mô hình phân tích tình cảm cho các tweet được đào tạo chỉ với 3.000 mẫu

Tất cả các mô hình này được tự động tải lên Hub và được triển khai để sản xuất. Bạn có thể sử dụng bất kỳ mô hình nào trong số này để bắt đầu phân tích dữ liệu mới ngay lập tức bằng cách sử dụng lớp đường ống dẫn như đã trình bày trong các phần trước của bài đăng này

4. Phân tích Tweets bằng Phân tích tình cảm và Python

Trong phần cuối cùng này, bạn sẽ áp dụng những gì bạn đã học được trong bài đăng này và áp dụng nó vào thực tế với một dự án nhỏ thú vị. phân tích các tweet về NFT bằng phân tích tình cảm

Đầu tiên, bạn sẽ sử dụng Tweepy, một thư viện Python dễ sử dụng để nhận các tweet đề cập đến #NFT bằng API Twitter. Sau đó, bạn sẽ sử dụng mô hình phân tích tình cảm từ 🤗Hub để phân tích các tweet này. Cuối cùng, bạn sẽ tạo một số hình ảnh trực quan để khám phá kết quả và tìm thấy một số thông tin chi tiết thú vị

Bạn có thể sử dụng sổ tay này để làm theo hướng dẫn này. Hãy nhảy vào nó

1. Cài đặt phụ thuộc

Đầu tiên, hãy cài đặt tất cả các thư viện bạn sẽ sử dụng trong hướng dẫn này

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
0

2. Thiết lập thông tin xác thực API Twitter

Tiếp theo, bạn sẽ thiết lập thông tin đăng nhập để tương tác với Twitter API. Trước tiên, bạn cần đăng ký tài khoản nhà phát triển trên Twitter. Sau đó, bạn phải tạo một dự án mới và kết nối một ứng dụng để nhận khóa API và mã thông báo. Bạn có thể làm theo hướng dẫn từng bước này để lấy thông tin đăng nhập của mình

Sau khi bạn có khóa API và mã thông báo, hãy tạo một trình bao bọc với Tweepy để tương tác với API Twitter

3. Tìm kiếm tweet bằng Tweepy

Tại thời điểm này, bạn đã sẵn sàng bắt đầu sử dụng API Twitter để thu thập các tweet 🎉. Bạn sẽ sử dụng Con trỏ Tweepy để trích xuất 1.000 tweet đề cập đến #NFT

4. Chạy phân tích tình cảm trên các tweet

Giờ đây, bạn có thể vận dụng các kỹ năng mới của chúng tôi và chạy phân tích cảm tính trên dữ liệu của mình. 🎉

Bạn sẽ sử dụng một trong các mô hình có sẵn trên Hub được tinh chỉnh để phân tích cảm xúc của các tweet. Giống như trong các phần khác của bài đăng này, bạn sẽ sử dụng lớp đường ống để đưa ra dự đoán với mô hình này

5. Khám phá kết quả phân tích tình cảm

Mọi người đang nói về NFT trên Twitter như thế nào?

Trước tiên, hãy tải kết quả trên một khung dữ liệu và xem ví dụ về các tweet được gắn nhãn cho từng cảm xúc

đầu ra

specific_model = pipeline[model="finiteautomata/bertweet-base-sentiment-analysis"]
specific_model[data]
1

Sau đó, hãy xem bạn nhận được bao nhiêu tweet cho mỗi cảm xúc và hình dung những kết quả này

Thật thú vị, hầu hết các tweet về NFT đều tích cực [56. 1%] và hầu như không có kết quả nào âm
[2. 0%].

Kết quả phân tích tình cảm của các tweet NFT

Cuối cùng, hãy xem những từ nào nổi bật cho mỗi tình cảm bằng cách tạo một đám mây từ

Một số từ liên quan đến các tweet tích cực bao gồm Discord, Ethereum, Join, Mars4 và Shroom

Đám mây từ cho các tweet tích cực

Ngược lại, các từ liên quan đến tweet tiêu cực bao gồm. hỗn loạn cookie, Solana và Opensea NFT

Đám mây từ cho các tweet tiêu cực

Và đó là nó. Chỉ với một vài dòng mã python, bạn đã có thể thu thập các tweet, phân tích chúng bằng phân tích tình cảm và tạo một số hình ảnh trực quan thú vị để phân tích kết quả. Khá tuyệt phải không?

5. kết thúc

Phân tích tình cảm với Python chưa bao giờ dễ dàng hơn thế. Các công cụ như 🤗Transformers và 🤗Hub giúp tất cả các nhà phát triển có thể tiếp cận phân tích tình cảm. Bạn có thể sử dụng các mô hình mã nguồn mở, được đào tạo trước để phân tích cảm tính chỉ trong một vài dòng mã 🔥

Bạn có muốn đào tạo một mô hình tùy chỉnh để phân tích tình cảm với dữ liệu của riêng mình không? . Bạn có thể tinh chỉnh một mô hình bằng cách sử dụng để xây dựng trên các mô hình ngôn ngữ lớn và nhận được kết quả hiện đại. Nếu bạn muốn điều gì đó dễ dàng hơn nữa, bạn có thể sử dụng AutoNLP để huấn luyện các mô hình học máy tùy chỉnh bằng cách tải dữ liệu lên

Nếu bạn có thắc mắc, cộng đồng Ôm Mặt có thể giúp trả lời và/hoặc hưởng lợi từ đó, vui lòng hỏi họ trong diễn đàn Ôm Mặt. Ngoài ra, hãy tham gia máy chủ bất hòa của chúng tôi để nói chuyện với chúng tôi và với cộng đồng Hugging Face

Thư viện Python nào là tốt nhất để phân tích tình cảm?

Đứng đầu danh sách các thư viện Python tốt nhất của chúng tôi để phân tích tình cảm là Pattern , đây là một thư viện Python đa năng có thể xử lý NLP, khai thác dữ liệu, . Mẫu cung cấp một loạt các tính năng, bao gồm tìm so sánh nhất và so sánh.

Thư viện tốt nhất để phân tích tình cảm là gì?

1. NLTK. Nó là viết tắt của Bộ công cụ ngôn ngữ tự nhiên . Đây là thư viện phổ biến nhất cũng như hữu ích nhất để thực hiện Phân tích tình cảm.

Python có tốt cho phân tích tình cảm không?

Python là một trong những công cụ mạnh mẽ nhất khi thực hiện các nhiệm vụ khoa học dữ liệu — nó cung cấp nhiều cách để thực hiện phân tích cảm tính . Những cái phổ biến nhất được liệt kê ở đây. Sử dụng Blob văn bản.

Thư viện Python nào được sử dụng cho NLP?

Bộ công cụ ngôn ngữ tự nhiên, hay NLTK , là một trong những thư viện hàng đầu để phát triển các mô hình Xử lý ngôn ngữ tự nhiên [NLP], khiến nó trở thành lựa chọn tuyệt vời để phân tích cảm tính.

Chủ Đề