Hướng dẫn smallest repeating substring python - chuỗi con lặp lại nhỏ nhất python

Một sửa chữa nhanh chóng cho mô hình này có thể là

[.+?]\1+

Regex của bạn đã thất bại vì nó đã neo chuỗi lặp lại vào đầu và cuối dòng, chỉ cho phép các chuỗi như

[.+?][?=\1]
1 nhưng không phải
[.+?][?=\1]
2. Ngoài ra, độ dài tối thiểu của chuỗi lặp lại phải là 1, không phải 0 [hoặc bất kỳ chuỗi nào sẽ khớp], do đó
[.+?][?=\1]
3 thay vì
[.+?][?=\1]
4.

Trong Python:

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']

Nhưng hãy lưu ý rằng Regex này sẽ chỉ tìm thấy các trận đấu lặp lại không chồng chéo, vì vậy trong ví dụ cuối cùng, giải pháp

[.+?][?=\1]
5 sẽ không được tìm thấy mặc dù đó là chuỗi lặp lại ngắn nhất. Hoặc xem ví dụ này: Ở đây nó không thể tìm thấy
[.+?][?=\1]
6 vì phần
[.+?][?=\1]
7 của
[.+?][?=\1]
6 đầu tiên đã được sử dụng trong trận đấu đầu tiên]:

>>> r.findall["abcabcdabcd"]
['abc']

Ngoài ra, nó có thể trả về một số trận đấu, vì vậy bạn cần tìm một ngắn nhất trong bước thứ hai:

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']

Giải pháp tốt hơn:

Để cho phép động cơ cũng tìm thấy các trận đấu chồng chéo, hãy sử dụng

[.+?][?=\1]

Điều này sẽ tìm thấy một số chuỗi hai lần hoặc hơn, nếu chúng được lặp lại đủ thời gian, nhưng chắc chắn nó sẽ tìm thấy tất cả các chuỗi con lặp lại có thể:

>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']

Do đó, bạn nên sắp xếp các kết quả theo độ dài và trả về cái ngắn nhất:

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'

[.+?][?=\1]
9 [nhờ J. F. Sebastian!] Đảm bảo rằng không có
>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']
0 nào được kích hoạt nếu không có trận đấu nào cả.

Kể từ Python 3.6, dây F là một cách mới tuyệt vời để định dạng chuỗi. Họ không chỉ dễ đọc hơn, súc tích hơn và ít bị lỗi hơn so với các cách định dạng khác, mà chúng còn nhanh hơn!

Đến cuối bài viết này, bạn sẽ tìm hiểu cách thức và lý do bắt đầu sử dụng F-Strings ngay hôm nay.

Nhưng trước tiên, ở đây, cuộc sống như thế nào trước F-String, trở lại khi bạn phải đi bộ đến trường lên dốc cả hai cách trong tuyết.

Chuỗi của trường cũ ở trường học ở Python

Trước Python 3.6, bạn đã có hai cách chính để nhúng các biểu thức python bên trong các chuỗi chữ để định dạng: %-formatting và

>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']
1. Bạn có thể xem cách sử dụng chúng và những hạn chế của chúng là gì.

Tùy chọn số 1: %-Formatting

Đây là OG của định dạng Python và đã có trong ngôn ngữ kể từ khi bắt đầu. Bạn có thể đọc thêm trong các tài liệu Python. Hãy nhớ rằng %-formatting không được khuyến nghị bởi các tài liệu, trong đó có lưu ý sau:

Các hoạt động định dạng được mô tả ở đây thể hiện một loạt các kỳ quặc dẫn đến một số lỗi phổ biến [chẳng hạn như không hiển thị chính xác các bộ dữ liệu và từ điển].

Sử dụng các chuỗi chữ được định dạng mới hơn hoặc giao diện

>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']
1 giúp tránh các lỗi này. Những lựa chọn thay thế này cũng cung cấp các phương pháp tiếp cận mạnh mẽ, linh hoạt và mở rộng hơn để định dạng văn bản. [Nguồn]

Cách sử dụng %-formatting

Các đối tượng chuỗi có hoạt động tích hợp bằng toán tử

>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']
3 mà bạn có thể sử dụng để định dạng chuỗi. Ở đây, những gì trông giống như trong thực tế:

>>>

>>> name = "Eric"
>>> "Hello, %s." % name
'Hello, Eric.'

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

>>>

>>> name = "Eric"
>>> age = 74
>>> "Hello, %s. You are %s." % [name, age]
'Hello Eric. You are 74.'

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

Tại sao %-Formatting là tuyệt vời

>>>

>>> first_name = "Eric"
>>> last_name = "Idle"
>>> age = 74
>>> profession = "comedian"
>>> affiliation = "Monty Python"
>>> "Hello, %s %s. You are %s. You are a %s. You were a member of %s." % [first_name, last_name, age, profession, affiliation]
'Hello, Eric Idle. You are 74. You are a comedian. You were a member of Monty Python.'

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

Tại sao %-Formatting là tuyệt vời

Các ví dụ mã mà bạn vừa thấy ở trên là đủ có thể đọc được. Tuy nhiên, một khi bạn bắt đầu sử dụng một số tham số và chuỗi dài hơn, mã của bạn sẽ nhanh chóng trở nên dễ đọc hơn nhiều. Mọi thứ đang bắt đầu trông hơi lộn xộn rồi:

Thật không may, loại định dạng này không phải là tuyệt vời bởi vì nó là dài dòng và dẫn đến lỗi, như không hiển thị chính xác các bộ dữ liệu hoặc từ điển. May mắn thay, có những ngày tươi sáng phía trước.

Tùy chọn #2: str.format []

Cách hoàn thành công việc mới hơn này đã được giới thiệu trong Python 2.6. Bạn có thể kiểm tra hướng dẫn về các kỹ thuật định dạng chuỗi Python mới hơn để biết thêm thông tin.

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
0

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
1

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
2

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
3

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

Tại sao %-Formatting là tuyệt vời

Các ví dụ mã mà bạn vừa thấy ở trên là đủ có thể đọc được. Tuy nhiên, một khi bạn bắt đầu sử dụng một số tham số và chuỗi dài hơn, mã của bạn sẽ nhanh chóng trở nên dễ đọc hơn nhiều. Mọi thứ đang bắt đầu trông hơi lộn xộn rồi:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
4

Để chèn nhiều hơn một biến, bạn phải sử dụng một bộ biến số của các biến đó. Đây là cách bạn sẽ làm điều đó:

Tại sao %-Formatting là tuyệt vời

Các ví dụ mã mà bạn vừa thấy ở trên là đủ có thể đọc được. Tuy nhiên, một khi bạn bắt đầu sử dụng một số tham số và chuỗi dài hơn, mã của bạn sẽ nhanh chóng trở nên dễ đọc hơn nhiều. Mọi thứ đang bắt đầu trông hơi lộn xộn rồi:

Thật không may, loại định dạng này không phải là tuyệt vời bởi vì nó là dài dòng và dẫn đến lỗi, như không hiển thị chính xác các bộ dữ liệu hoặc từ điển. May mắn thay, có những ngày tươi sáng phía trước.

Dưới đây là một số cách mà F-String có thể làm cho cuộc sống của bạn dễ dàng hơn.

Cú pháp đơn giản

Cú pháp tương tự như cái bạn đã sử dụng với

>>> r = re.compile[r"[.+?][?=\1]"]
>>> r.findall["dabcdbcdbcdd"]
['bcd', 'bcd', 'd']
1 nhưng ít dài dòng hơn. Nhìn vào cách dễ đọc này:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
5

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
6

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

Biểu thức tùy ý

Bởi vì các chuỗi F được đánh giá trong thời gian chạy, bạn có thể đặt bất kỳ và tất cả các biểu thức python hợp lệ trong chúng. Điều này cho phép bạn làm một số điều tiện lợi.

Bạn có thể làm một cái gì đó khá đơn giản, như thế này:

>>>

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

>>>

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
8

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
9

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

>>>

>>> r.findall["abcabcdabcd"]
['abc']
0

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

Biểu thức tùy ý

>>>

>>> r.findall["abcabcdabcd"]
['abc']
1

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

Biểu thức tùy ý

>>>

>>> r.findall["abcabcdabcd"]
['abc']
2

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

>>>

>>> r.findall["abcabcdabcd"]
['abc']
3

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

>>>

>>> r.findall["abcabcdabcd"]
['abc']
4

Nó cũng sẽ có hiệu lực khi sử dụng một chữ cái viết hoa

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
6:

>>>

>>> r.findall["abcabcdabcd"]
['abc']
5

Bạn có yêu F-String chưa? Tôi hy vọng rằng, vào cuối bài viết này, bạn sẽ trả lời

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
7.

Biểu thức tùy ý

Bởi vì các chuỗi F được đánh giá trong thời gian chạy, bạn có thể đặt bất kỳ và tất cả các biểu thức python hợp lệ trong chúng. Điều này cho phép bạn làm một số điều tiện lợi.

Bạn có thể làm một cái gì đó khá đơn giản, như thế này:

Nhưng bạn cũng có thể gọi các chức năng. Đây là một ví dụ:

>>> import re
>>> r = re.compile[r"[.+?]\1+"]
>>> r.findall["cbabababac"]
['ba']
>>> r.findall["dabcdbcdbcdd"]
['bcd']
7

Bạn cũng có tùy chọn gọi trực tiếp một phương thức:

>>>

>>> r.findall["abcabcdabcd"]
['abc']
6

>>>

>>> r.findall["abcabcdabcd"]
['abc']
7

>>>

>>> r.findall["abcabcdabcd"]
['abc']
8

Bạn thậm chí có thể sử dụng các đối tượng được tạo từ các lớp có chuỗi F. Hãy tưởng tượng bạn đã có lớp học sau:

Bạn có thể làm điều này:

Các phương thức
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
8 và
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
9 xử lý cách các đối tượng được trình bày dưới dạng chuỗi, vì vậy bạn sẽ cần đảm bảo rằng bạn bao gồm ít nhất một trong các phương thức đó trong định nghĩa lớp của bạn. Nếu bạn phải chọn một, hãy đi với
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
9 vì nó có thể được sử dụng thay cho
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
8.

Chuỗi được trả về bởi

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
8 là biểu diễn chuỗi không chính thức của một đối tượng và có thể đọc được. Chuỗi được trả về bởi
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
9 là đại diện chính thức và nên không rõ ràng. Gọi
>>> name = "Eric"
>>> "Hello, %s." % name
'Hello, Eric.'
4 và
>>> name = "Eric"
>>> "Hello, %s." % name
'Hello, Eric.'
5 tốt hơn là sử dụng trực tiếp
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
8 và
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
9.

Theo mặc định, các chuỗi F sẽ sử dụng
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
8, nhưng bạn có thể đảm bảo rằng họ sử dụng
>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
9 nếu bạn bao gồm cờ chuyển đổi
>>> name = "Eric"
>>> age = 74
>>> "Hello, %s. You are %s." % [name, age]
'Hello Eric. You are 74.'
0:

Nếu bạn muốn đọc một số cuộc trò chuyện dẫn đến các chuỗi F hỗ trợ các biểu thức python đầy đủ, bạn có thể làm như vậy ở đây.

Multiline F-String

>>>

>>> r.findall["abcabcdabcd"]
['abc']
9

Bạn có thể có chuỗi đa dòng:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
0

Nhưng hãy nhớ rằng bạn cần đặt một

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
3 trước mỗi dòng của một chuỗi đa dòng. Mã sau đây đã giành được công việc:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
1

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
2

Nếu bạn không đặt một

>>> min[r.findall["dabcdbcdbcdd"] or [""], key=len]
'd'
3 trước mỗi dòng riêng lẻ, thì bạn sẽ có các chuỗi thường xuyên, cũ, trong vườn và không sáng bóng, mới, ưa thích.

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
3

Nếu bạn muốn lan truyền các chuỗi trên nhiều dòng, bạn cũng có tùy chọn thoát khỏi sự trở lại với
>>> name = "Eric"
>>> age = 74
>>> "Hello, %s. You are %s." % [name, age]
'Hello Eric. You are 74.'
3:

Nhưng đây là những gì sẽ xảy ra nếu bạn sử dụng

>>> name = "Eric"
>>> age = 74
>>> "Hello, %s. You are %s." % [name, age]
'Hello Eric. You are 74.'
4:

Đọc về hướng dẫn thụt vào trong PEP 8.

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
4

Tốc độ, vận tốc

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
5

Nếu bạn sử dụng cùng một loại dấu ngoặc kép xung quanh các khóa từ điển như bạn làm ở bên ngoài chuỗi F, thì dấu ngoặc kép ở đầu khóa từ điển đầu tiên sẽ được hiểu là kết thúc của chuỗi.

Niềng răng

Để làm cho nẹp xuất hiện trong chuỗi của bạn, bạn phải sử dụng niềng răng đôi:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
6

Lưu ý rằng sử dụng niềng răng ba sẽ dẫn đến việc chỉ có niềng răng đơn trong chuỗi của bạn:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
7

Tuy nhiên, bạn có thể nhận được nhiều niềng răng hơn để hiển thị nếu bạn sử dụng nhiều hơn ba niềng răng:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
8

Dấu gạch chéo ngược

Như bạn đã thấy trước đó, bạn có thể sử dụng dấu gạch chéo ngược trong phần chuỗi của chuỗi F. Tuy nhiên, bạn có thể sử dụng các dấu gạch chéo ngược để thoát khỏi phần biểu thức của chuỗi F:

>>>

>>> r.findall["abcdabcdabcabc"]
['abcd', 'abc']
9

Bạn có thể làm việc xung quanh điều này bằng cách đánh giá biểu thức trước và sử dụng kết quả trong chuỗi F:

>>>

[.+?][?=\1]
0

Đi ra và định dạng!

Bạn vẫn có thể sử dụng các cách định dạng các chuỗi định dạng cũ hơn, nhưng với các chuỗi F, giờ đây bạn có một cách ngắn gọn, dễ đọc hơn và thuận tiện hơn, vừa nhanh hơn và ít bị lỗi hơn. Đơn giản hóa cuộc sống của bạn bằng cách sử dụng F-Strings là một lý do tuyệt vời để bắt đầu sử dụng Python 3.6 nếu bạn đã thực hiện chuyển đổi. [Nếu bạn vẫn đang sử dụng Python 2, đừng quên rằng năm 2020 sẽ sớm ở đây!]

Theo Zen of Python, khi bạn cần quyết định cách làm một cái gì đó, thì ở đây, ở đây sẽ là một cách và tốt nhất là chỉ có một cách để làm điều đó. Mặc dù các chuỗi F không phải là cách duy nhất có thể để bạn định dạng chuỗi, nhưng chúng ở một vị trí tuyệt vời để trở thành một cách rõ ràng để hoàn thành công việc.

Đọc thêm

Nếu bạn muốn đọc một cuộc thảo luận mở rộng về nội suy chuỗi, hãy xem PEP 502. Ngoài ra, bản nháp PEP 536 có thêm một số suy nghĩ về tương lai của F-String.

Để có thêm niềm vui với chuỗi, hãy xem các bài viết sau:

  • Chuỗi Python định dạng các thực tiễn tốt nhất của Dan Bader
  • Giới thiệu thực tế về việc quét web trong Python của Colin Okeefe

Happy Pythoning!

Bài Viết Liên Quan

Chủ Đề