Hướng dẫn regex split words python - regex chia từ python
Trong bài viết này, sẽ học cách phân chia một chuỗi dựa trên một mẫu biểu thức thông thường trong Python. Phương pháp Pythons Re Module ____ ____10 chia tách chuỗi bằng các lần xuất hiện của mẫu regex, trả về một danh sách chứa các chuỗi con kết quả.split the string by the occurrences of the regex pattern, returning a list containing the resulting substrings. Show
Sau khi đọc bài viết này, bạn sẽ có thể thực hiện các hoạt động phân chia sau bằng Regex trong Python.
Cách sử dụng hàm import re target_string = "My name is maximums and my luck numbers are 12 45 78" # split on white-space word_list = re.split(r"\s+", target_string) print(word_list) # Output ['My', 'name', 'is', 'maximums', 'and', 'my', 'luck', 'numbers', 'are', '12', '45', '78']0Trước khi di chuyển xa hơn, hãy để Lừa xem cú pháp của Phương thức Python, ____ 10 & nbsp; Cú pháp
Mẫu biểu thức chính quy và chuỗi đích là các đối số bắt buộc. 0 và cờ là tùy chọn.
Lưu ý: Nếu chụp dấu ngoặc đơn được sử dụng trong mẫu, thì văn bản của tất cả các nhóm trong mẫu cũng được trả về như một phần của danh sách kết quả.: If capturing parentheses are used in the pattern, then the text of all groups in the pattern is also returned as part of the resulting list. Giá trị trả vềNó chia chuỗi mục tiêu theo mẫu biểu thức chính quy và các trận đấu được trả về dưới dạng danh sách.list. Nếu mẫu được chỉ định không được tìm thấy bên trong chuỗi đích, thì chuỗi không được phân chia theo bất kỳ cách nào, nhưng phương thức chia vẫn tạo ra một danh sách vì đây là cách mà nó thiết kế. Tuy nhiên, danh sách chỉ chứa một phần tử, chính chuỗi đích. Ví dụ regex để chia chuỗi thành từBây giờ, hãy để Lừa xem cách sử dụng 0 với sự trợ giúp của một ví dụ đơn giản. Trong ví dụ này, chúng tôi sẽ phân chia chuỗi mục tiêu ở mỗi ký tự không gian trắng bằng cách sử dụng chuỗi đặc biệt 8. white-space character using the 8 special
sequence.Hãy để thêm Metacharacter 9 vào cuối 8. Bây giờ, mẫu Regex 1 sẽ phân chia chuỗi mục tiêu về sự xuất hiện của một hoặc nhiều ký tự khoảng trắng. Hãy cùng xem bản demo.Thí dụ
Như bạn có thể thấy trong đầu ra, chúng tôi có danh sách các từ được phân tách bằng khoảng trắng. Giới hạn số lượng chia táchTham số 0 của 0 được sử dụng để xác định số lượng phân chia bạn muốn thực hiện.Nói một cách đơn giản, nếu 0 là 2, thì hai lần phân tách sẽ được thực hiện và phần còn lại của chuỗi được trả về làm yếu tố cuối cùng của danh sách.if the 0 is 2, then two splits will be done, and the remainder of the string is returned as the final element of the list.Vì vậy, hãy để một ví dụ đơn giản để phân chia một chuỗi về sự xuất hiện của bất kỳ chữ số nào. Ở đây chúng tôi sẽ sử dụng trình tự đặc biệt 5 phù hợp với bất kỳ ký tự không chữ số nào.Thí dụ
Như bạn có thể thấy trong đầu ra, chúng tôi có danh sách các từ được phân tách bằng khoảng trắng.Giới hạn số lượng chia tách Tham số 0 của 0 được sử dụng để xác định số lượng phân chia bạn muốn thực hiện.Nói một cách đơn giản, nếu 0 là 2, thì hai lần phân tách sẽ được thực hiện và phần còn lại của chuỗi được trả về làm yếu tố cuối cùng của danh sách.Vì vậy, hãy để một ví dụ đơn giản để phân chia một chuỗi về sự xuất hiện của bất kỳ chữ số nào. Ở đây chúng tôi sẽ sử dụng trình tự đặc biệt 5 phù hợp với bất kỳ ký tự không chữ số nào.Regex để phân chia chuỗi với nhiều dấu phân cách
Trong phần này, chúng tôi sẽ học cách sử dụng Regex để phân chia một chuỗi trên nhiều trình phân cách trong Python.Ví dụ: sử dụng phương thức biểu thức thông thường 0, chúng ta có thể chia chuỗi bằng dấu phẩy hoặc không gian.
Với phương pháp Regex 9 meta character to indicate a list of delimiter characters. The 9 matches any single character in brackets. For example, 1 will match either hyphen, comma, semicolon, dot, and a space character.Hãy để một ví dụ đơn giản để phân chia chuỗi bằng dấu gạch nối hoặc bằng dấu phẩy.Ví dụ để phân chia chuỗi bởi hai dấu phân cách Regex để phân chia chuỗi trên năm dấu phân cách Thí dụ
Chia chuỗi của các dấu phân cách và từ cụ thể
Regex chia một chuỗi và giữ các dấu phân cáchNhư tôi đã nói với bạn khi bắt đầu bài viết nếu chụp dấu ngoặc đơn được sử dụng trong mẫu, thì văn bản của tất cả các nhóm trong mẫu cũng được trả lại như một phần của danh sách kết quả. Lưu ý: Bạn đang chụp nhóm bằng cách viết mẫu bên trong ____ 44, ________ 45.: You are capturing the group by writing pattern inside the 4, 5.Nói một cách đơn giản, hãy cẩn thận trong khi sử dụng phương pháp 0 khi mẫu biểu thức chính quy được đặt trong ngoặc đơn để chụp các nhóm. & NBSP; Nếu sử dụng các nhóm chụp, thì văn bản phù hợp cũng được đưa vào danh sách kết quả.Nó rất hữu ích khi bạn muốn giữ các dấu phân cách/dấu phân cách trong danh sách kết quả.
Chuỗi phân tách regex bằng cách bỏ qua trường hợpCó khả năng chuỗi chứa chữ thường và chữ cái trên. Ví dụ: bạn muốn chia một chuỗi trên các ký tự hoặc phạm vi ký tự cụ thể, nhưng bạn không biết liệu ký tự/từ đó là chữ hoa hay chữ thường hay kết hợp cả hai. Tại đây, bạn có thể sử dụng cờ 7 hoặc 6 bên trong phương thức 0 để thực hiện phân tách không nhạy cảm trường hợp.
Chuỗi phân chia () Phương thức so với Regex Split ()Bây giờ, hãy để Lừa nghĩ về phương thức 7 mặc định trong Python, đặc trưng cho các chuỗi. Như bạn có thể biết nhiều nhất, phương thức 7 mặc định chia một chuỗi theo một dấu phân cách cụ thể. Tuy nhiên, xin lưu ý rằng dấu phân cách này là một chuỗi cố định mà bạn xác định bên trong dấu ngoặc đơn của phương thức.Sự khác biệt giữa các phương thức mặc định 7 và các biểu thức thông thường 7 là rất lớn. Có một cách linh hoạt hơn khi sử dụng các biểu thức chính quy được phân chia, có thể chứng minh rất hữu ích trong một số kịch bản và cho các nhiệm vụ cụ thể.
Chia chuỗi phân chia theo các từ trường hợp trênVí dụ: bạn có một chuỗi như là Emma Emma yêu Python và ML, và bạn muốn chia nó bằng các từ chữ hoa để có được kết quả như [‘Xin chào,’ ’thế nào,’ bạn, bạn]
Giải trình
|