Làm cách nào để đếm số từ được lặp lại trong python?

từ dừng = ['a', 'về', 'ở trên', 'ngang', 'sau', 'sau đó'] từ dừng += ['một lần nữa', 'chống lại', 'tất cả', 'gần như', 'một mình'

Chuỗi là loại dữ liệu thiết yếu trong bất kỳ ngôn ngữ lập trình nào, kể cả python. Chúng ta cần thực hiện nhiều thao tác khác nhau hay còn gọi là tiền xử lý chuỗi như loại bỏ các khoảng trắng không cần thiết, đếm số từ trong chuỗi, biến chuỗi thành các trường hợp giống nhau (chữ hoa hoặc chữ thường). Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm từ trong một chuỗi trong python.  

Chúng ta sẽ học cách đếm số từ trong một chuỗi. Ví dụ- Chúng tôi có một chuỗi-” Xin chào, đây là một chuỗi. ” Nó có năm từ. Ngoài ra, chúng ta sẽ học cách đếm tần suất của một từ cụ thể trong một chuỗi.  

nội dung

  • Các cách khác nhau trong Python để đếm từ trong Chuỗi
  • 1. Đếm từ bằng cách sử dụng vòng lặp For-
  • 2. Sử dụng split() để đếm từ trong một chuỗi
  • 3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điển
  • 4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count()
  • Phải đọc
  • Sự kết luận

Các cách khác nhau trong Python để đếm từ trong Chuỗi

  • Đếm từ bằng cách sử dụng vòng lặp For-
  • Sử dụng split() để đếm từ trong một chuỗi
  • Đếm tần suất của các từ trong một chuỗi bằng từ điển
  • Đếm tần suất của các từ trong chuỗi Sử dụng Count()

1. Đếm từ bằng cách sử dụng vòng lặp For-

Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. Chúng tôi đếm số khoảng cách giữa hai ký tự.  

def count_words(string):
    # Removing the spaces from start and end
    string1=string.strip()
    # Initializing the count from 1 because we there is no space at the last 
    count=1
    # Iterating through the string
    for i in string1:
    # If we encounter space, increment the count with 1.
        if i==" ":
            count+=1
     
    return count

string="Python is an interpreted, high-level, general-purpose programming language"
print("'{}'".format(string),"has total words:",count_words(string))
string2=" Hi. My name is Ashwini "
print("'{}'".format(string2),"has total words:",count_words(string2))

Làm cách nào để đếm số từ được lặp lại trong python?

Đầu ra-

''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' 
Hi. My name is Ashwini ' has total words: 5 

2. Sử dụng split() để đếm từ trong một chuỗi

Chúng ta có thể sử dụng hàm split() để đếm từ trong chuỗi.  

def word_count(string):
    # Here we are removing the spaces from start and end,
    # and breaking every word whenever we encounter a space
    # and storing them in a list. The len of the list is the
    # total count of words.
    return(len(string.strip().split(" ")))

string="Python is an interpreted, high-level, general-purpose programming language"
print("'{}'".format(string),"has total words:",count_words(string))
string2=" Hi. My name is Ashwini "
print("'{}'".format(string2),"has total words:",word_count(string2))

Đầu ra-

''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' 
Hi. My name is Ashwini ' has total words: 5 

3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điển

def wordFrequency(string):
    # converting the string into lowercase
    string=string.lower()
    # Whenever we encounter a space, break the string
    string=string.split(" ")
    # Initializing a dictionary to store the frequency of words
    word_frequency={}
    # Iterating through the string
    for i in string:
    
    # If the word is already in the keys, increment its frequency
        if i in word_frequency:
            word_frequency[i]+=1
            
    # It means that this is the first occurence of the word
        else:
            word_frequency[i]=1
    return(word_frequency)

string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?" 
print(wordFrequency(string)) 

Đầu ra-

{'woodchuck': 3, 'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'chuck': 2, 'if': 1, 'could': 1, '?': 1} 

4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count()

Count() có thể được sử dụng để đếm số lần một từ xuất hiện trong một chuỗi hoặc nói cách khác, nó được sử dụng để cho biết tần suất xuất hiện của một từ trong chuỗi. Chúng ta chỉ cần chuyển từ trong đối số.   

def return_count(string,word):
    string=string.lower() 
    # In string, what is the count that word occurs
    return string.count(word)

string2="Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?"
return_count(string2,'piper')

Đầu ra-

2

Nếu chúng ta muốn biết số lần mỗi từ xuất hiện, chúng ta có thể tạo một hàm cho điều đó.  

set1=set()
string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?"
string=string.lower()
# splitting the string  whenever we encounter a space
string=string.split(" ")
# iterate through list-string
for i in string:
    # Storing the word and its frequency in the form of tuple in a set
    # Set is used to avoid repetition
    set1.add((i,string.count(i)))
print(set1)

Đầu ra-

________số 8

Nếu chúng ta muốn biết một từ cụ thể xuất hiện bao nhiêu lần trong một chuỗi trong một khoảng thời gian, chúng ta có thể sử dụng các tham số bắt đầu và kết thúc của đếm().  

Ví dụ-

string="Can you can a can as a canner can can a can?"
# if you want to take cases into account remove this line
string=string.lower()
# between index=8 and 17, how many times the word 'can' occurs
print(string.count("can",8,17))

Đầu ra-

''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' 
Hi. My name is Ashwini ' has total words: 5 
0

Phải đọc

  • Cách chuyển chuỗi thành chữ thường trong
  • Cách tính căn bậc hai
  • Đầu vào của người dùng. Hàm nhập (). Đầu vào bàn phím
  • Cuốn sách hay nhất để học Python

Sự kết luận

Trong thời đại hiện nay, dữ liệu rất quan trọng. Và khi thế giới Khoa học dữ liệu đang phát triển nhanh chóng và việc sử dụng python cũng vậy, tiền xử lý dữ liệu là rất quan trọng. Chúng ta cần đếm các từ trong một chuỗi trong python để xử lý trước dữ liệu văn bản và để làm được điều đó, các phương pháp đã thảo luận ở trên là rất quan trọng.