Sử dụng python để đo lường sự giống nhau về ngữ nghĩa giữa các câu

Cosine tương tự và mô-đun bộ công cụ nltk được sử dụng trong chương trình này. Để thực hiện chương trình này, nltk phải được cài đặt trong hệ thống của bạn. Để cài đặt mô-đun nltk, hãy làm theo các bước bên dưới –

1. Open terminal[Linux].
2. sudo pip3 install nltk
3. python3
4. import nltk
5. nltk.download[‘all’]

Các chức năng được sử dụng

nltk. token hóa. Nó được sử dụng để mã thông báo. Tokenization là quá trình theo đó một lượng lớn văn bản được chia thành các phần nhỏ hơn được gọi là token.

similarity:  0.2886751345948129
3 tách câu X đã cho thành các từ và trả về danh sách

nltk. kho văn bản. Trong chương trình này, nó được sử dụng để lấy danh sách các từ dừng. Từ dừng là một từ thường được sử dụng [chẳng hạn như “the”, “a”, “an”, “in”]

Dưới đây là triển khai Python -




similarity:  0.2886751345948129
4

similarity:  0.2886751345948129
5

similarity:  0.2886751345948129
6
similarity:  0.2886751345948129
7____58
similarity:  0.2886751345948129
9

similarity:  0.2886751345948129
6
similarity:  0.2886751345948129
0
similarity:  0.2886751345948129
8
similarity:  0.2886751345948129
2

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
4

similarity:  0.2886751345948129
5

similarity:  0.2886751345948129
6
similarity:  0.2886751345948129
7____18

similarity:  0.2886751345948129
9
similarity:  0.2886751345948129
7____531

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
33

similarity:  0.2886751345948129
34
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
36

similarity:  0.2886751345948129
37
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
39

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
41

similarity:  0.2886751345948129
42
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
44____545
similarity:  0.2886751345948129
46

similarity:  0.2886751345948129
47
similarity:  0.2886751345948129
7____549
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
51

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
53

similarity:  0.2886751345948129
54
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
56
similarity:  0.2886751345948129
57
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
34
similarity:  0.2886751345948129
61
similarity:  0.2886751345948129
62
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
65

similarity:  0.2886751345948129
66
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
56
similarity:  0.2886751345948129
57
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
37
similarity:  0.2886751345948129
61
similarity:  0.2886751345948129
62
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
77

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
79

similarity:  0.2886751345948129
80
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
82

________ 557 ________ 558 ________ 559 ________ 586

similarity:  0.2886751345948129
87
similarity:  0.2886751345948129
61
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
91
similarity:  0.2886751345948129
92
similarity:  0.2886751345948129
93
similarity:  0.2886751345948129
94

similarity:  0.2886751345948129
87
similarity:  0.2886751345948129
96____597
similarity:  0.2886751345948129
98
similarity:  0.2886751345948129
93

similarity:  0.2886751345948129
87
similarity:  0.2886751345948129
61
similarity:  0.2886751345948129
58
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
64
similarity:  0.2886751345948129
92
similarity:  0.2886751345948129
93

similarity:  0.2886751345948129
87
similarity:  0.2886751345948129
96____569
similarity:  0.2886751345948129
98
similarity:  0.2886751345948129
93

similarity:  0.2886751345948129
02
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
98

similarity:  0.2886751345948129
3

similarity:  0.2886751345948129
06

similarity:  0.2886751345948129
57
similarity:  0.2886751345948129
08
similarity:  0.2886751345948129
59
similarity:  0.2886751345948129
10
similarity:  0.2886751345948129
11
similarity:  0.2886751345948129
12
similarity:  0.2886751345948129
13

similarity:  0.2886751345948129
14
similarity:  0.2886751345948129
02
similarity:  0.2886751345948129
16
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
18
similarity:  0.2886751345948129
19
similarity:  0.2886751345948129
20

similarity:  0.2886751345948129
21
similarity:  0.2886751345948129
7
similarity:  0.2886751345948129
02_______124
similarity:  0.2886751345948129
25
similarity:  0.2886751345948129
26
similarity:  0.2886751345948129
27
similarity:  0.2886751345948129
28
similarity:  0.2886751345948129
19
similarity:  0.2886751345948129
27
similarity:  0.2886751345948129
31
similarity:  0.2886751345948129
19
similarity:  0.2886751345948129
19
similarity:  0.2886751345948129
34
similarity:  0.2886751345948129
93

Độ tương đồng về ngữ nghĩa được đo lường như thế nào?

Về mặt điện toán, có thể ước tính độ tương tự về ngữ nghĩa bằng cách xác định độ tương tự tô pô, bằng cách sử dụng các bản thể luận để xác định khoảng cách giữa các thuật ngữ/khái niệm .

Sự giống nhau về ngữ nghĩa trong NLP là gì?

Tương tự ngữ nghĩa là nhiệm vụ xác định mức độ giống nhau của hai câu, về ý nghĩa của chúng. Ví dụ này minh họa việc sử dụng SNLI [Stanford Natural Language Inference] Corpus để dự đoán sự giống nhau về ngữ nghĩa của câu với Transformers

Chủ Đề