Viết chương trình python để đếm số từ và ký tự trong một chuỗi đã cho

Bạn có thể đếm số từ trong một tệp văn bản bằng Python bằng cách làm theo trình tự các bước mà chúng ta sẽ thảo luận trong hướng dẫn này

Trong hướng dẫn này, chúng ta sẽ học cách đếm số từ trong tệp văn bản, sử dụng các chương trình mẫu Python

Các bước để đếm số từ trong tệp văn bản

Để đếm số từ trong một tệp văn bản, hãy làm theo các bước sau

  1. Mở tệp ở chế độ đọc và xử lý ở chế độ văn bản
  2. Đọc văn bản bằng hàm read[]
  3. Tách văn bản bằng dấu cách. Chúng tôi giả sử rằng các từ trong câu được phân tách bằng ký tự khoảng trắng
  4. Độ dài của danh sách phân chia phải bằng số lượng từ trong tệp văn bản
  5. Bạn có thể tinh chỉnh số lượng bằng cách làm sạch chuỗi trước khi tách hoặc xác thực các từ sau khi tách

ví dụ 1. Đếm Số Từ

Trong ví dụ Python này, chúng ta sẽ đọc một tệp văn bản và đếm số từ trong đó. Xét tệp văn bản sau

Tệp văn bản

Welcome to pythonexamples.org. Here, you will find python programs for all general use cases.

Chương trình Python

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]

đầu ra

Number of words in text file : 14

ví dụ 2. Đếm số từ trong tệp văn bản có nhiều dòng

Trong ví dụ Python này, chúng ta sẽ đọc một tệp văn bản có nhiều dòng và đếm số từ trong đó. Xét tệp văn bản sau

Ký tự dòng mới phân tách các dòng trong tệp văn bản. Dòng mới là một ký tự khoảng trắng và khi chúng ta tách toàn bộ dữ liệu trong tệp văn bản bằng phương thức split[], tất cả các từ trong tất cả các câu đều được tách và trả về dưới dạng một danh sách

File văn bản – dữ liệu. txt

Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
This is another line with some words.

Chương trình Python

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]

đầu ra

Number of words in text file : 21

Tóm lược

Trong hướng dẫn về Ví dụ Python này, chúng ta đã học cách đếm số từ trong Tệp văn bản, với sự trợ giúp của các chương trình ví dụ

Trong ví dụ trên, chúng tôi đã tìm thấy số đếm của

Number of words in text file : 14
6 trong
Number of words in text file : 14
7. Vòng lặp for lặp qua từng ký tự của
Number of words in text file : 14
8 và điều kiện if kiểm tra xem mỗi ký tự của
Number of words in text file : 14
8 có phải là
Number of words in text file : 14
6 không. Giá trị của
Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
This is another line with some words.
1 tăng nếu có sự trùng khớp

Tiếp cận. Để tách từng từ trong chuỗi đã cho, hãy sử dụng phương thức

Number of words: 6
0. Điều này trả về một danh sách chứa tất cả các từ của chuỗi đã cho. Sau đó tìm độ dài của danh sách này với sự trợ giúp của phương thức
Number of words: 6
1 để trả về số từ trong chuỗi đã cho

________số 8

đầu ra

Number of words: 6

Phương pháp 2. Sử dụng biểu thức chính quy

Tiếp cận

  • Number of words: 6
    9 của Python xác định số lượng khớp của một mẫu nhất định trong một chuỗi. Sử dụng đối sánh mẫu ký tự từ đơn giản [“
    file = open["C:\data.txt", "rt"]
    data = file.read[]
    words = data.split[]
    
    print['Number of words in text file :', len[words]]
    10“] để tìm tất cả các chuỗi đại diện cho một từ trong chuỗi đã cho
  • Kết quả là một danh sách các kết quả khớp chứa các từ có trong chuỗi đã cho—độ dài của danh sách là số lần xuất hiện của các từ trong chuỗi đã cho dẫn đến giải pháp
  • cú pháp.
    file = open["C:\data.txt", "rt"]
    data = file.read[]
    words = data.split[]
    
    print['Number of words in text file :', len[words]]
    11

Mã số

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
1

đầu ra

Number of words: 6

Bạn có muốn làm chủ siêu năng lực regex không? . [1] nghiên cứu một chương sách, [2] giải câu đố mật mã và [3] xem video về chương giáo dục

Phương pháp 3. Sử dụng vòng lặp For

Tiếp cận. Ý tưởng ở đây là tìm số lần xuất hiện của ký tự khoảng trắng, ký tự tab và ký tự xuống dòng rồi tìm tổng của chúng để suy ra kết quả. Điều này dựa trên thực tế là việc đếm tổng số từ trong một chuỗi nhất định sẽ trả về số chuỗi con được phân tách bằng dấu cách/tab/dòng mới

Giải trình

  • Khởi tạo bộ đếm sẽ theo dõi số lượng từ trong chuỗi đã cho
  • Sử dụng vòng lặp for để lặp qua tất cả các ký tự của chuỗi đã cho
  • Ngay khi tìm thấy khoảng trắng hoặc tab hoặc ký tự dòng mới, hãy tăng biến bộ đếm
  • Cuối cùng, kiểm tra xem chuỗi đã cho có trống hay không
    • Nếu chuỗi đã cho trống, hiển thị 0 làm đầu ra vì chuỗi không có ký tự nào trong đó
    • Nếu chuỗi không trống, hãy hiển thị kết quả sao cho số lượng từ sẽ được cung cấp bằng cách tăng giá trị tính toán của bộ đếm lên 1. Điều này là do nếu một chuỗi nhất định có ba từ, thì nó sẽ được phân tách bằng hai dấu cách. Do đó, số lượng từ luôn nhiều hơn số lượng khoảng trống trong câu đã cho là một
      • Ví dụ. Cho một chuỗi. "Một hai ba. ” Ở đây số khoảng trắng là hai, trong khi số từ là ba

Mã số

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
5

đầu ra

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
6

Phương pháp 4. sử dụng đếm

Tiếp cận. Phương thức 

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
12 của Python đếm số lần xuất hiện không chồng chéo của một chuỗi con. Do đó, nếu bạn đếm số lần xuất hiện của các ký tự dòng mới, dấu cách và tab có trong chuỗi đã cho với sự trợ giúp của phương thức
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
13, nó sẽ trả về tổng số từ có trong chuỗi đã cho. Lưu ý rằng giá trị được trả về bởi biến đếm sẽ ít hơn một so với tổng số từ trong chuỗi đã cho. Vì vậy, bạn phải thêm một vào giá trị được tính toán trước khi trả lại kết quả

Mã số

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
9

đầu ra

Number of words in text file : 14
0

Giải trình

  • Sử dụng phương thức count[] để tìm số lần xuất hiện của dấu cách, tab và ký tự xuống dòng trong chuỗi. Vì bạn không thể tính toán nội dung của tất cả các ký tự này cùng một lúc trong phương thức
    Number of words: 6
    2; . Sau đó, bạn có thể chỉ cần thêm từng lần xuất hiện để tìm giá trị ròng của lần xuất hiện cùng nhau trong chuỗi đã cho
  • Cuối cùng, kiểm tra xem chuỗi đã cho có trống hay không
    • Nếu chuỗi đã cho trống, hiển thị 0 làm đầu ra vì chuỗi không có ký tự nào trong đó
    • Nếu chuỗi đã cho không trống – hãy trả về đầu ra bằng cách thêm một vào tổng các giá trị được tính bằng phương thức đếm

Phương pháp 5. sử dụng tổng

Tiếp cận. Ý tưởng ở đây tương tự như ý tưởng đã giải thích ở trên. Sự khác biệt duy nhất, trong trường hợp này, là chúng ta đang sử dụng hàm

Number of words: 6
3 để tính toán tổng số kết quả của [ký tự khoảng trắng + ký tự tab + ký tự xuống dòng] trong một dòng mã

Mã số

Number of words in text file : 14
3

đầu ra

Number of words in text file : 14
0

TIDBIT

Tính tổng các số là một trong những nhiệm vụ lặp đi lặp lại mà bạn cần thực hiện lặp đi lặp lại trong các dự án viết mã thực tế của mình. Để giúp bạn hoàn thành nhiệm vụ này một cách ngắn gọn, dễ đọc và hiệu quả, những người tạo ra Python đã thêm hàm 

file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]

print['Number of words in text file :', len[words]]
16 tích hợp sẵn. Nó tính tổng tất cả các phần tử trong danh sách Python — hoặc bất kỳ phần tử lặp nào khác cho vấn đề đó.  

đọc ở đây. Python sum[] – Hướng dẫn minh họa đơn giản

Bài đọc được đề xuất

  • Làm cách nào để đếm số lần xuất hiện của một ký tự trong chuỗi Python?
  • Làm thế nào để đếm nguyên âm trong một chuỗi?

💎Dò web với BeautifulSoup

Một trong những kỹ năng được tìm kiếm nhiều nhất trên Fiverr và Upwork là tìm kiếm trang web. Không tạo ra một sai sót. trích xuất dữ liệu theo chương trình từ các trang web là một kỹ năng sống quan trọng trong thế giới ngày nay được hình thành bởi web và công việc từ xa. Khóa học này hướng dẫn bạn thông tin chi tiết về thư viện BeautifulSoup của Python để tìm kiếm trên web

Shubham Sayon

Tôi là một người tạo nội dung và Blogger Python chuyên nghiệp. Tôi đã xuất bản nhiều bài báo và tạo các khóa học trong một khoảng thời gian. Hiện tại tôi đang làm việc với tư cách là một freelancer toàn thời gian và tôi có kinh nghiệm trong các lĩnh vực như Python, AWS, DevOps và Networking

Làm cách nào để đếm số ký tự trong mỗi từ trong chuỗi bằng Python?

Trong Python, bạn có thể lấy độ dài của chuỗi str [= số ký tự] bằng hàm có sẵn len[] .

Chương trình Python có được sử dụng để đếm số ký tự trong một chuỗi không?

Phương pháp #1. Sử dụng isalpha[] + len[] .

Làm cách nào để đếm số dòng từ và ký tự trong tệp văn bản bằng Python?

Đếm số dòng, từ và chữ cái trong tệp văn bản .
Bộ đếm các dòng được tăng thêm 1
Chuỗi được chia thành các từ bằng cách sử dụng phương pháp tách. Hàm len đếm số từ trong danh sách từ. .
Để bỏ qua ký tự xuống dòng [ '\n' ], chúng tôi xóa ký tự đó bằng phương thức dải

Làm cách nào để đếm số từ trong chuỗi Python bằng vòng lặp for?

Đếm từ bằng cách sử dụng vòng lặp For- Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. .
Sử dụng split[] để đếm từ trong một chuỗi. Chúng ta có thể sử dụng hàm split[] để đếm từ trong chuỗi. .
Đếm tần suất của các từ trong Chuỗi trong Python bằng Từ điển. .
Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count[]

Chủ Đề