Bạn có thể đếm số từ trong một tệp văn bản bằng Python bằng cách làm theo trình tự các bước mà chúng ta sẽ thảo luận trong hướng dẫn này
Trong hướng dẫn này, chúng ta sẽ học cách đếm số từ trong tệp văn bản, sử dụng các chương trình mẫu Python
Các bước để đếm số từ trong tệp văn bản
Để đếm số từ trong một tệp văn bản, hãy làm theo các bước sau
- Mở tệp ở chế độ đọc và xử lý ở chế độ văn bản
- Đọc văn bản bằng hàm read[]
- Tách văn bản bằng dấu cách. Chúng tôi giả sử rằng các từ trong câu được phân tách bằng ký tự khoảng trắng
- Độ dài của danh sách phân chia phải bằng số lượng từ trong tệp văn bản
- Bạn có thể tinh chỉnh số lượng bằng cách làm sạch chuỗi trước khi tách hoặc xác thực các từ sau khi tách
ví dụ 1. Đếm Số Từ
Trong ví dụ Python này, chúng ta sẽ đọc một tệp văn bản và đếm số từ trong đó. Xét tệp văn bản sau
Tệp văn bản
Welcome to pythonexamples.org. Here, you will find python programs for all general use cases.
Chương trình Python
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
đầu ra
Number of words in text file : 14
ví dụ 2. Đếm số từ trong tệp văn bản có nhiều dòng
Trong ví dụ Python này, chúng ta sẽ đọc một tệp văn bản có nhiều dòng và đếm số từ trong đó. Xét tệp văn bản sau
Ký tự dòng mới phân tách các dòng trong tệp văn bản. Dòng mới là một ký tự khoảng trắng và khi chúng ta tách toàn bộ dữ liệu trong tệp văn bản bằng phương thức split[], tất cả các từ trong tất cả các câu đều được tách và trả về dưới dạng một danh sách
File văn bản – dữ liệu. txt
Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
This is another line with some words.
Chương trình Python
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
đầu ra
Number of words in text file : 21
Tóm lược
Trong hướng dẫn về Ví dụ Python này, chúng ta đã học cách đếm số từ trong Tệp văn bản, với sự trợ giúp của các chương trình ví dụ
Trong ví dụ trên, chúng tôi đã tìm thấy số đếm của
Number of words in text file : 14
6 trong Number of words in text file : 14
7. Vòng lặp for lặp qua từng ký tự của Number of words in text file : 14
8 và điều kiện if kiểm tra xem mỗi ký tự của Number of words in text file : 14
8 có phải là Number of words in text file : 14
6 không. Giá trị của Welcome to www.pythonexamples.org. Here, you will find python programs for all general use cases.
This is another line with some words.
1 tăng nếu có sự trùng khớp Tiếp cận. Để tách từng từ trong chuỗi đã cho, hãy sử dụng phương thức
Number of words: 6
0. Điều này trả về một danh sách chứa tất cả các từ của chuỗi đã cho. Sau đó tìm độ dài của danh sách này với sự trợ giúp của phương thức Number of words: 6
1 để trả về số từ trong chuỗi đã cho________số 8đầu ra
Number of words: 6
Phương pháp 2. Sử dụng biểu thức chính quy
Tiếp cận
9 của Python xác định số lượng khớp của một mẫu nhất định trong một chuỗi. Sử dụng đối sánh mẫu ký tự từ đơn giản [“Number of words: 6
10“] để tìm tất cả các chuỗi đại diện cho một từ trong chuỗi đã chofile = open["C:\data.txt", "rt"] data = file.read[] words = data.split[] print['Number of words in text file :', len[words]]
- Kết quả là một danh sách các kết quả khớp chứa các từ có trong chuỗi đã cho—độ dài của danh sách là số lần xuất hiện của các từ trong chuỗi đã cho dẫn đến giải pháp
- cú pháp.
11file = open["C:\data.txt", "rt"] data = file.read[] words = data.split[] print['Number of words in text file :', len[words]]
Mã số
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
1đầu ra
Number of words: 6
Bạn có muốn làm chủ siêu năng lực regex không? . [1] nghiên cứu một chương sách, [2] giải câu đố mật mã và [3] xem video về chương giáo dục
Phương pháp 3. Sử dụng vòng lặp For
Tiếp cận. Ý tưởng ở đây là tìm số lần xuất hiện của ký tự khoảng trắng, ký tự tab và ký tự xuống dòng rồi tìm tổng của chúng để suy ra kết quả. Điều này dựa trên thực tế là việc đếm tổng số từ trong một chuỗi nhất định sẽ trả về số chuỗi con được phân tách bằng dấu cách/tab/dòng mới
Giải trình
- Khởi tạo bộ đếm sẽ theo dõi số lượng từ trong chuỗi đã cho
- Sử dụng vòng lặp for để lặp qua tất cả các ký tự của chuỗi đã cho
- Ngay khi tìm thấy khoảng trắng hoặc tab hoặc ký tự dòng mới, hãy tăng biến bộ đếm
- Cuối cùng, kiểm tra xem chuỗi đã cho có trống hay không
- Nếu chuỗi đã cho trống, hiển thị 0 làm đầu ra vì chuỗi không có ký tự nào trong đó
- Nếu chuỗi không trống, hãy hiển thị kết quả sao cho số lượng từ sẽ được cung cấp bằng cách tăng giá trị tính toán của bộ đếm lên 1. Điều này là do nếu một chuỗi nhất định có ba từ, thì nó sẽ được phân tách bằng hai dấu cách. Do đó, số lượng từ luôn nhiều hơn số lượng khoảng trống trong câu đã cho là một
- Ví dụ. Cho một chuỗi. "Một hai ba. ” Ở đây số khoảng trắng là hai, trong khi số từ là ba
Mã số
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
5đầu ra
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
6Phương pháp 4. sử dụng đếm
Tiếp cận. Phương thức
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
12 của Python đếm số lần xuất hiện không chồng chéo của một chuỗi con. Do đó, nếu bạn đếm số lần xuất hiện của các ký tự dòng mới, dấu cách và tab có trong chuỗi đã cho với sự trợ giúp của phương thức file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
13, nó sẽ trả về tổng số từ có trong chuỗi đã cho. Lưu ý rằng giá trị được trả về bởi biến đếm sẽ ít hơn một so với tổng số từ trong chuỗi đã cho. Vì vậy, bạn phải thêm một vào giá trị được tính toán trước khi trả lại kết quảMã số
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
9đầu ra
Number of words in text file : 14
0Giải trình
- Sử dụng phương thức count[] để tìm số lần xuất hiện của dấu cách, tab và ký tự xuống dòng trong chuỗi. Vì bạn không thể tính toán nội dung của tất cả các ký tự này cùng một lúc trong phương thức
2; . Sau đó, bạn có thể chỉ cần thêm từng lần xuất hiện để tìm giá trị ròng của lần xuất hiện cùng nhau trong chuỗi đã choNumber of words: 6
- Cuối cùng, kiểm tra xem chuỗi đã cho có trống hay không
- Nếu chuỗi đã cho trống, hiển thị 0 làm đầu ra vì chuỗi không có ký tự nào trong đó
- Nếu chuỗi đã cho không trống – hãy trả về đầu ra bằng cách thêm một vào tổng các giá trị được tính bằng phương thức đếm
Phương pháp 5. sử dụng tổng
Tiếp cận. Ý tưởng ở đây tương tự như ý tưởng đã giải thích ở trên. Sự khác biệt duy nhất, trong trường hợp này, là chúng ta đang sử dụng hàm
Number of words: 6
3 để tính toán tổng số kết quả của [ký tự khoảng trắng + ký tự tab + ký tự xuống dòng] trong một dòng mãMã số
Number of words in text file : 14
3đầu ra
Number of words in text file : 14
0TIDBIT
Tính tổng các số là một trong những nhiệm vụ lặp đi lặp lại mà bạn cần thực hiện lặp đi lặp lại trong các dự án viết mã thực tế của mình. Để giúp bạn hoàn thành nhiệm vụ này một cách ngắn gọn, dễ đọc và hiệu quả, những người tạo ra Python đã thêm hàm
file = open["C:\data.txt", "rt"]
data = file.read[]
words = data.split[]
print['Number of words in text file :', len[words]]
16 tích hợp sẵn. Nó tính tổng tất cả các phần tử trong danh sách Python — hoặc bất kỳ phần tử lặp nào khác cho vấn đề đó. đọc ở đây. Python sum[] – Hướng dẫn minh họa đơn giản
Bài đọc được đề xuất
- Làm cách nào để đếm số lần xuất hiện của một ký tự trong chuỗi Python?
- Làm thế nào để đếm nguyên âm trong một chuỗi?
💎Dò web với BeautifulSoup
Một trong những kỹ năng được tìm kiếm nhiều nhất trên Fiverr và Upwork là tìm kiếm trang web. Không tạo ra một sai sót. trích xuất dữ liệu theo chương trình từ các trang web là một kỹ năng sống quan trọng trong thế giới ngày nay được hình thành bởi web và công việc từ xa. Khóa học này hướng dẫn bạn thông tin chi tiết về thư viện BeautifulSoup của Python để tìm kiếm trên web
Shubham Sayon
Tôi là một người tạo nội dung và Blogger Python chuyên nghiệp. Tôi đã xuất bản nhiều bài báo và tạo các khóa học trong một khoảng thời gian. Hiện tại tôi đang làm việc với tư cách là một freelancer toàn thời gian và tôi có kinh nghiệm trong các lĩnh vực như Python, AWS, DevOps và Networking