Hướng dẫn remove word from string python regex - xóa từ khỏi chuỗi python regex

Làm cách nào để loại bỏ từ a trong chuỗi này?

Show

We are at a boat sale near a dock.

kết quả

We are at boat sale near dock.

Tôi đã thử:

removed = original.replace(" a", ""), removed = original.replace(" a ", "")

Đã hỏi ngày 13 tháng 10 năm 2015 lúc 4:31Oct 13, 2015 at 4:31

Hướng dẫn remove word from string python regex - xóa từ khỏi chuỗi python regex

Jasonjasonjason

3.27317 Huy hiệu vàng85 Huy hiệu bạc135 Huy hiệu Đồng17 gold badges85 silver badges135 bronze badges

1

Có vẻ như bạn chỉ cần thay thế bằng một không gian.

'We are at a boat sale near a dock.'.replace(" a ", " ")
# Result: We are at boat sale near dock. # 

Tôi không chắc những chuỗi khác mà bạn đang cố gắng thực hiện với điều này nhưng nếu bạn có thể thoát khỏi nó, hãy thử sử dụng chuỗi OP như thế này thay vì

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
0 để có hiệu suất tốt hơn.

Đã trả lời ngày 13 tháng 10 năm 2015 lúc 4:34Oct 13, 2015 at 4:34

Hướng dẫn remove word from string python regex - xóa từ khỏi chuỗi python regex

Tế bào cellgreen màu xanh lá câyGreen Cell

4.5672 Huy hiệu vàng17 Huy hiệu bạc45 Huy hiệu Đồng2 gold badges17 silver badges45 bronze badges

5

Bạn có thể thử bằng cách này bằng cách sử dụng regexp

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 

Trong bảng điều khiển Python

>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'

Đã trả lời ngày 13 tháng 10 năm 2015 lúc 4:46Oct 13, 2015 at 4:46

Hướng dẫn remove word from string python regex - xóa từ khỏi chuỗi python regex

Rajarshi Dasrajarshi DasRajarshi Das

11,5K5 Huy hiệu vàng42 Huy hiệu bạc69 Huy hiệu đồng5 gold badges42 silver badges69 bronze badges

2

Hai bước.

word_a = re.compile(r'\ba\b')
spaces = re.compile(r'\s+')
spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
1 khớp với đầu hoặc kết thúc của một từ, nhưng điều đó một mình sẽ cung cấp cho chúng ta các không gian liên tục, vì vậy chúng tôi thay thế nhiều không gian
 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
2 bằng một không gian.

Đã trả lời ngày 13 tháng 10 năm 2015 lúc 4:50Oct 13, 2015 at 4:50

Hướng dẫn remove word from string python regex - xóa từ khỏi chuỗi python regex

xiaofeng.lixiaofeng.lixiaofeng.li

7.9992 Huy hiệu vàng22 Huy hiệu bạc29 Huy hiệu đồng2 gold badges22 silver badges29 bronze badges

Bạn có thể thử: 1. Sử dụng

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
3

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
  1. Sử dụng biểu thức chính quy và thay thế không gian kép bằng không gian đơn:

    (re.sub (r '\ ba \ b', '', dòng)). Thay thế ("", "")

Đã trả lời ngày 13 tháng 10 năm 2015 lúc 5:23Oct 13, 2015 at 5:23

Harsha Biyaniharsha BiyaniHarsha Biyani

6.9089 Huy hiệu vàng35 Huy hiệu bạc58 Huy hiệu Đồng9 gold badges35 silver badges58 bronze badges

0

Phương pháp này cũng tuân theo một cách tiếp cận tương tự với phương pháp trước. Chúng tôi sẽ bắt đầu bằng cách chia chuỗi thành một danh sách các từ. Trong phương thức này, thay vì sử dụng các bộ để xóa bất kỳ bản sao nào, chúng tôi sẽ tạo một hàm sẽ loại bỏ các từ trùng lặp khỏi danh sách.

  • Ví dụ,
  • def lst_unique (l):
    • A2 = '' .Join (lst_unique (l))
    • Trong ví dụ trên, hàm
      word_a = re.compile(r'\ba\b')
      spaces = re.compile(r'\s+')
      spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
      
      9 đảm bảo rằng mọi yếu tố của danh sách là duy nhất.
    • Sử dụng lớp
      >>> line = """ We are at a boat sale near a dock. """
      >>> line.replace(" a "," ")
      ' We are at boat sale near dock. '
      
      0
    • Lớp
      >>> line = """ We are at a boat sale near a dock. """
      >>> line.replace(" a "," ")
      ' We are at boat sale near dock. '
      
      0 tạo ra một từ điển bằng cách sắp xếp thứ tự của các yếu tố. Chúng tôi lưu trữ các yếu tố làm khóa và kết hợp chúng bằng hàm
      word_a = re.compile(r'\ba\b')
      spaces = re.compile(r'\s+')
      spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
      
      2.
    • Từ bộ sưu tập nhập khẩu đặt hàng
    • A1 = "Xóa wordfrom wordthisword"
  • A2 = '' .Join (OrderedDict ((S, S)
    • Sử dụng chức năng
      >>> line = """ We are at a boat sale near a dock. """
      >>> line.replace(" a "," ")
      ' We are at boat sale near dock. '
      
      3
    • Hàm
      >>> line = """ We are at a boat sale near a dock. """
      >>> line.replace(" a "," ")
      ' We are at boat sale near dock. '
      
      3 tạo ra các mảng từ các mảng hiện có, danh sách bằng cách loại bỏ các phần tử trùng lặp. Chúng ta có thể sử dụng danh sách các từ để tạo ra một mảng các yếu tố duy nhất như vậy. Sau này, chúng tôi sẽ kết hợp các yếu tố bằng cách sử dụng hàm
      word_a = re.compile(r'\ba\b')
      spaces = re.compile(r'\s+')
      spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
      
      2 như được thực hiện trong các phương thức trước.
    • Nhược điểm của phương pháp này là nó sắp xếp phần tử, vì vậy thứ tự ban đầu của chuỗi bị mất.
    • nhập khẩu NUMPY dưới dạng NP
    • a2 = '' .join (mảng)
    • Lớp
      >>> line = """ We are at a boat sale near a dock. """
      >>> line.replace(" a "," ")
      ' We are at boat sale near dock. '
      
      0 tạo ra một từ điển bằng cách sắp xếp thứ tự của các yếu tố. Chúng tôi lưu trữ các yếu tố làm khóa và kết hợp chúng bằng hàm
      word_a = re.compile(r'\ba\b')
      spaces = re.compile(r'\s+')
      spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
      
      2.
  • Trong ví dụ trên, chúng tôi sử dụng hàm
    word_a = re.compile(r'\ba\b')
    spaces = re.compile(r'\s+')
    spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
    
    6 để duy trì thứ tự của các từ trong chuỗi. Chúng tôi sắp xếp nó theo chỉ mục của họ trong danh sách
    word_a = re.compile(r'\ba\b')
    spaces = re.compile(r'\s+')
    spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
    
    7.

Sử dụng

word_a = re.compile(r'\ba\b')
spaces = re.compile(r'\s+')
spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
2 và chức năng do người dùng xác định

def lst_unique (l):

A2 = '' .Join (lst_unique (l))

Trong ví dụ trên, hàm word_a = re.compile(r'\ba\b') spaces = re.compile(r'\s+') spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock')) 9 đảm bảo rằng mọi yếu tố của danh sách là duy nhất.

Sử dụng lớp

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
0

Ví dụ,

A1 = "Xóa Word khỏi điều này"="remove word from this"

a2=a1.replace("word",'')=a1.replace("word",'')

print(a2)    (a2)    

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 7

Các biểu thức chính quy có thể xác định các phần của chuỗi bằng cách sử dụng một mẫu. Hàm

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7 thay thế một chuỗi con đã cho phù hợp với mẫu biểu thức chính quy với một số chuỗi mong muốn.

Chúng ta có thể xác định các từ cụ thể bằng cách sử dụng các biểu thức thông thường và thay thế chúng bằng một chuỗi trống để loại bỏ chúng.

Xem mã bên dưới.

Nhập REre

A1 = "Xóa Word khỏi điều này"="remove word from this"

loại bỏ khỏi điều này=re.compile('(\s*)word(\s*)')

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
6. Theo mặc định, tất cả các lần xuất hiện được thay thế.=p.sub(' ',a1)

print(a2)    (a2)    

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 7

Các biểu thức chính quy có thể xác định các phần của chuỗi bằng cách sử dụng một mẫu. Hàm

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7 thay thế một chuỗi con đã cho phù hợp với mẫu biểu thức chính quy với một số chuỗi mong muốn.. The
>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
1 function returns True or False, based on whether the string starts with a given value or not.

Chúng ta có thể xác định các từ cụ thể bằng cách sử dụng các biểu thức thông thường và thay thế chúng bằng một chuỗi trống để loại bỏ chúng.

Xem mã bên dưới.

Nhập RE="word remove from this"

a2=a1[a1.startswith('word')andlen('word'):]  =a1[a1.startswith('word')andlen('word'):]  

print(a2)(a2)

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7

Ví dụ,

Nhập RE="word remove from this"

a2=a1.removeprefix('word')  =a1.removeprefix('word')  

print(a2)    (a2)    

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7. The
>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
4 function returns True or False, based on whether the string ends with a given value or not.

Các biểu thức chính quy có thể xác định các phần của chuỗi bằng cách sử dụng một mẫu. Hàm

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7 thay thế một chuỗi con đã cho phù hợp với mẫu biểu thức chính quy với một số chuỗi mong muốn.

Xem mã bên dưới.

Nhập RE="remove from this word"

a2=a1[:-(a1.endswith('word')andlen('word'))]  =a1[:-(a1.endswith('word')andlen('word'))]  

print(a2)    (a2)    

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7

Ví dụ,

Nhập RE="remove from this word"

a2=a1.removesuffix('word')=a1.removesuffix('word')

print(a2)    (a2)    

Output:

loại bỏ khỏi điều này

Chúng tôi cũng có thể chỉ định có bao nhiêu lần xuất hiện của một từ chúng tôi muốn thay thế trong hàm. Đối với điều này, chúng ta có thể sử dụng tham số import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 6. Theo mặc định, tất cả các lần xuất hiện được thay thế.

Sử dụng chức năng

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
7

Các biểu thức chính quy có thể xác định các phần của chuỗi bằng cách sử dụng một mẫu. Hàm import re s= "We are at a boat sale near a dock." op = re.sub(r'\ba\b\s+',"",s) op 7 thay thế một chuỗi con đã cho phù hợp với mẫu biểu thức chính quy với một số chuỗi mong muốn.

Chúng ta có thể xác định các từ cụ thể bằng cách sử dụng các biểu thức thông thường và thay thế chúng bằng một chuỗi trống để loại bỏ chúng.

Xem mã bên dưới.

Nhập RE

p = re.compile ('(\ s*) word (\ s*)')="remove word from word this word"

s=set()=set()

a2=''=''

forwordina1.split():wordina1.split():

    ifwordnotins:if wordnotins:

A2 = P.Sub ('', A1)a2=a2+word+' '

        s.add(word)s.add(word)

print(a2)    (a2)    

Output:

Trong ví dụ trên, hàm

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
9 biên dịch một mẫu xác định chuỗi con
>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
0.

Sử dụng hàm

>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
1

Phương thức này có thể loại bỏ Word từ đầu câu. Hàm >>> import re >>> s = 'We are at a boat sale near a dock.' >>> op = re.sub(r'\ba\b\s+',"",s) >>> op 'We are at boat sale near dock.' 1 trả về đúng hay sai, dựa trên việc chuỗi bắt đầu với một giá trị nhất định hay không.

Trong phương thức này, nếu hàm trả về true, chúng ta sẽ cắt chuỗi cho đến khi độ dài của từ được loại bỏ.

A1 = "Từ loại bỏ khỏi cái này"

Sử dụng hàm

>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
3

Xem mã bên dưới.

p = re.compile ('(\ s*) word (\ s*)')="remove word from word this word"

l=a1.split()=a1.split()

A2 = P.Sub ('', A1)=' '.join(sorted(set(l),key= l.index))

print(a2)    (a2)    

Output:

Trong ví dụ trên, hàm

 import re
 s= "We are at a boat sale near a dock."
 op = re.sub(r'\ba\b\s+',"",s)
 op 
9 biên dịch một mẫu xác định chuỗi con
>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
0.

Sử dụng hàm

>>> import re
>>> s = 'We are at a boat sale near a dock.'
>>> op = re.sub(r'\ba\b\s+',"",s)
>>> op
'We are at boat sale near dock.'
1

Phương thức này có thể loại bỏ Word từ đầu câu. Hàm >>> import re >>> s = 'We are at a boat sale near a dock.' >>> op = re.sub(r'\ba\b\s+',"",s) >>> op 'We are at boat sale near dock.' 1 trả về đúng hay sai, dựa trên việc chuỗi bắt đầu với một giá trị nhất định hay không.

Trong phương thức này, nếu hàm trả về true, chúng ta sẽ cắt chuỗi cho đến khi độ dài của từ được loại bỏ.

Ví dụ,

def lst_unique (l):lst_unique(l):

    lst=[]lst=[]

    [lst.append(x)forxinlifxnotinlst][lst.append(x)forxinl ifxnotinlst]

    returnlstreturnlst

A1 = "Xóa từ khỏi từ này"="remove word from word this word"

l=a1.split()=a1.split()

A2 = '' .Join (lst_unique (l)) =' '.join(lst_unique(l))

print(a2)    (a2)    

Output:

Xóa Word khỏi điều này

Trong ví dụ trên, hàm

word_a = re.compile(r'\ba\b')
spaces = re.compile(r'\s+')
spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
9 đảm bảo rằng mọi yếu tố của danh sách là duy nhất.

Sử dụng lớp >>> line = """ We are at a boat sale near a dock. """ >>> line.replace(" a "," ") ' We are at boat sale near dock. ' 0

Lớp

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
0 tạo ra một từ điển bằng cách sắp xếp thứ tự của các yếu tố. Chúng tôi lưu trữ các yếu tố làm khóa và kết hợp chúng bằng hàm
word_a = re.compile(r'\ba\b')
spaces = re.compile(r'\s+')
spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
2.

Ví dụ,

collections.OrderedDictclass">.OrderedDict</code>class">

Từ bộ sưu tập nhập khẩu đặt hàng

A1 = "Xóa wordfrom wordthisword"remove wordfrom wordthisword"

l=a1.split()= a1.split()

A2 = '' .Join (OrderedDict ((S, S)=' '.join(OrderedDict((s,s)forsinl).keys())

print(a2)    (a2)    

Output:

Xóa Word khỏi điều này

Trong ví dụ trên, hàm word_a = re.compile(r'\ba\b') spaces = re.compile(r'\s+') spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock')) 9 đảm bảo rằng mọi yếu tố của danh sách là duy nhất.

Sử dụng lớp

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
0

Lớp

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
0 tạo ra một từ điển bằng cách sắp xếp thứ tự của các yếu tố. Chúng tôi lưu trữ các yếu tố làm khóa và kết hợp chúng bằng hàm
word_a = re.compile(r'\ba\b')
spaces = re.compile(r'\s+')
spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock'))
2.

Từ bộ sưu tập nhập khẩu đặt hàng

numpy.duplicate()function">.duplicate()</code>function">

A1 = "Xóa wordfrom wordthisword"

A1 = "Xóa wordfrom wordthisword"remove wordfrom wordthisword"

l=a1.split()= a1.split()

arr=np.unique(l)=np.unique(l)

A2 = '' .Join (OrderedDict ((S, S)=' '.join(arr)

print(a2)    (a2)    

Output:

Sử dụng chức năng

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
3

Hàm >>> line = """ We are at a boat sale near a dock. """ >>> line.replace(" a "," ") ' We are at boat sale near dock. ' 3 tạo ra các mảng từ các mảng hiện có, danh sách bằng cách loại bỏ các phần tử trùng lặp. Chúng ta có thể sử dụng danh sách các từ để tạo ra một mảng các yếu tố duy nhất như vậy. Sau này, chúng tôi sẽ kết hợp các yếu tố bằng cách sử dụng hàm word_a = re.compile(r'\ba\b') spaces = re.compile(r'\s+') spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock')) 2 như được thực hiện trong các phương thức trước.

Nhược điểm của phương pháp này là nó sắp xếp phần tử, vì vậy thứ tự ban đầu của chuỗi bị mất.

Xem mã bên dưới.

Từ bộ sưu tập nhập khẩu đặt hàng

A1 = "Xóa wordfrom wordthisword"re

A2 = '' .Join (OrderedDict ((S, S)="remove word word word from this"

Sử dụng chức năng

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
3=re.sub(r'\b(\w+)( \1\b)+',r'\1',a1)

print(a2)    (a2)    

Output:

Xóa Word khỏi điều này

Trong ví dụ trên, hàm word_a = re.compile(r'\ba\b') spaces = re.compile(r'\s+') spaces.sub(' ', word_a.sub('', 'We are at a boat sale near a dock')) 9 đảm bảo rằng mọi yếu tố của danh sách là duy nhất.

Sử dụng lớp

>>> line = """ We are at a boat sale near a dock. """
>>> line.replace(" a "," ")
' We are at boat sale near dock. '
0