Hướng dẫn python regex only alphanumeric - python regex chỉ chữ và số

Chỉ nói - không cần regex, thực sự:

text = "907525191737280e , hjjhkj789jkh 2554nagy289 2 8 2 2 7 5 2 working welcome , a dp83640as25 , dp83867 e2 e25"

alnums = [word
          for word in text.split()
          if word.isalnum()]

print(alnums)

Sản lượng này

['907525191737280e', 'hjjhkj789jkh', '2554nagy289', '2', '8', '2', '2', '7', '5', '2', 'working', 'welcome', 'a', 'dp83640as25', 'dp83867', 'e2', 'e25']

Thêm các điều kiện khác nếu cần (ví dụ: độ dài):

alnums = [word
          for word in text.split()
          if word.isalnum() and len(word) > 1]

Mà sẽ mang lại

['907525191737280e', 'hjjhkj789jkh', '2554nagy289', 'working', 'welcome', 'dp83640as25', 'dp83867', 'e2', 'e25']

Tôi đã cố gắng kết hợp với Regex tất cả các ký tự chữ và số, ngoại trừ dấu gạch dưới. Tôi hiện đang sử dụng r"^[a-zA-Z0-9]*", nhưng tôi tự hỏi liệu có thể sử dụng \w và loại trừ _ không.

Nội phân chính

  • Regex chữ và số mà không cần gạch dưới
  • Regex để phù hợp với bất kỳ chuỗi chữ và số nào
  • GREP chữ và dưới
  • Regex cho các chữ cái và dấu gạch dưới
  • Bạn có thể thích:
  • Làm thế nào để bạn viết chữ và số trong regex?
  • Có phải là một nhân vật đặc biệt trong Regex?
  • Có phải là một nhân vật chữ và số?
  • Làm thế nào để bạn nhấn mạnh ở Regex?

Thanks!

Ký tự _ (dấu gạch dưới) trong biểu thức chính quy có nghĩa là tên vùng phải có dấu gạch dưới ngay sau chuỗi chữ và số phù hợp với dấu ngoặc trước. Các . (giai đoạn) khớp với bất kỳ ký tự (một ký tự đại diện).May 22, 2014 at 21:38

Tôi đã cố gắng kết hợp với Regex tất cả các ký tự chữ và số, ngoại trừ dấu gạch dưới. Tôi hiện đang sử dụng r"^[a-zA-Z0-9]*", nhưng tôi tự hỏi liệu có thể sử dụng \w và loại trừ _ không.

Nội phân chính

Regex chữ và số mà không cần gạch dướiMay 22, 2014 at 21:40

Regex để phù hợp với bất kỳ chuỗi chữ và số nào

import re

string = '__comMand__aNnd__conqQuer__'
match = re.search(r'(\w)\1', string, re.IGNORECASE)
print(match.group(1) if match else -1)

# output: m

Regex chữ và số mà không cần gạch dưới

Regex để phù hợp với bất kỳ chuỗi chữ và số nào

GREP chữ và dưới

Khi được hỏi ngày 22 tháng 5 năm 2014 lúc 21:38

Vâng, như vậy: [^\W_]

Regex để phù hợp với bất kỳ chuỗi chữ và số nào

GREP chữ và dưới

Khi được hỏi ngày 22 tháng 5 năm 2014 lúc 21:38

Nếu bạn đang sử dụng JavaScript, không có tùy chọn "dotall", hãy thử [\ s \ s]*. Điều này có nghĩa là "khớp với bất kỳ số lượng ký tự nào là khoảng trắng hoặc không gian trắng" - một cách hiệu quả "khớp với bất kỳ chuỗi nào". Một tùy chọn khác chỉ hoạt động cho JavaScript (và không được nhận ra bởi bất kỳ hương vị regex nào khác) là [^]* cũng phù hợp với bất kỳ chuỗi nào.

Biểu hiện. ^ ((\ d {5}-\ d {4}) | (\ d {5}) | ([a-z] \ d [a-z] \ s \ d [a-z] \ d)) $. Sự mô tả. Biểu thức này phù hợp với ba định dạng khác nhau của mã bưu chính: 5 chữ số của chúng tôi mã zip, 5 chữ số của chúng tôi mã zip + 4 và 6 chữ số mã bưu chính Canada. Cái đầu tiên phải là 5 chữ số. ZIP+4 phải là 5 chữ số số, dấu gạch nối và sau đó là 4 chữ số.

Tìm kiếm với các biểu thức chính quy (regex) Một biểu thức chính quy là một hình thức tìm kiếm nâng cao tìm kiếm các mẫu cụ thể, trái ngược với các thuật ngữ và cụm từ nhất định. Với Regex, bạn có thể sử dụng khớp mẫu để tìm kiếm các chuỗi ký tự cụ thể thay vì xây dựng nhiều truy vấn tìm kiếm theo nghĩa đen.

GREP chữ và dưới

Sử dụng dấu hoa thị với phần mở rộng tệp thay vì tên tệp sẽ hướng dẫn grep. Sử dụng ví dụ trên cho các thông báo lỗi, xem qua tất cả các tệp nhật ký có thể trông như thế này: grep -c 'One \ | hai \ | ba' /var/log/*.log Tìm kiếm đệ quy cho nhiều trận đấu. Sử dụng GREP sẽ chỉ tìm kiếm trong thư mục hiện tại với dấu hoa thị đang được sử dụng.

Các ký tự không phải ASCII bắt đầu ở 0x80 và đi đến 0xFF khi nhìn vào byte. Grep (và gia đình) không thực hiện xử lý unicode để hợp nhất các ký tự đa byte thành một thực thể duy nhất để phù hợp với regex như bạn dường như muốn. Tùy chọn -P trong grep của tôi cho phép sử dụng \ XDD thoát trong các lớp ký tự để thực hiện những gì bạn muốn.

Các ký tự chữ và số: Vì các máy tính (hoặc các đơn vị xử lý trung tâm, là cụ thể) Sử dụng ngôn ngữ máy dưới dạng số để giao tiếp, các lập trình viên máy tính cần viết hướng dẫn của họ bằng cách sử dụng các số thay vì ký tự bảng chữ cái. Để làm điều này, các lập trình viên sử dụng các biểu diễn số của những gì con người xem là ký tự bảng chữ cái.

Regex cho các chữ cái và dấu gạch dưới

[A-ASA-Z0-9]+ Một hoặc nhiều chữ cái hoặc số. Phần mở rộng phải dài ít nhất một ký tự và chỉ chứa các chữ cái và số. Đây là điển hình, nhưng nếu bạn muốn cho phép nhấn mạnh, điều đó cũng có thể được giải quyết. Bạn cũng có thể cung cấp một phạm vi chiều dài {2,3} thay vì một hoặc nhiều + trình mai mối, nếu điều đó phù hợp hơn.

Tham gia Stack Overflow để tìm hiểu, chia sẻ kiến ​​thức và xây dựng sự nghiệp của bạn.

Với một số biến thể tùy thuộc vào động cơ, Regex thường định nghĩa một ký tự từ là chữ cái, chữ số hoặc dấu gạch dưới. Một ranh giới từ \ B phát hiện một vị trí trong đó một bên là một ký tự như vậy và bên kia thì không.


Bạn có thể thích:

  • Ủy quyền nhóm quảng cáo cốt lõi ASP Net
  • Quy tắc mã giả
  • R Áp dụng chức năng cho các cột khung dữ liệu
  • Nhân bản sâu trong Java
  • Cách thay đổi kích thước màn hình trên Windows 10
  • Cách triển khai ứng dụng gốc React
  • C# Cấu trúc dữ liệu Câu hỏi phỏng vấn
  • Hiển thị ngày và giờ hiện tại trong HTML
  • Mã Python khối và thụt lề
  • Chức năng Python Input (): Nhận đầu vào của người dùng làm chuỗi

Làm thế nào để bạn viết chữ và số trong regex?

Regex \ W tương đương với [A-A-Z0-9_], phù hợp với các ký tự chữ và số và dấu gạch dưới.\w is equivalent to [A-Za-z0-9_] , matches alphanumeric characters and underscore.

Có phải là một nhân vật đặc biệt trong Regex?

Regex không nhận ra dấu gạch dưới là nhân vật đặc biệt..

Có phải là một nhân vật chữ và số?

Các ký tự không phải là ký tự là ngoại trừ các ký tự chữ và số. Không gian, dấu hiệu phần trăm, dấu gạch dưới, đường ống, ruột kết, dấu chấm phẩy, vv là các ký tự không phải là số đồngum. Chúng cũng có thể được phân loại là ký tự dấu câu, ký tự biểu tượng, v.v.non-alphanumeric characters. They can be also categorized as punctuation characters, symbol characters, etc.

Làm thế nào để bạn nhấn mạnh ở Regex?

Ký tự _ (dấu gạch dưới) trong biểu thức chính quy có nghĩa là tên vùng phải có dấu gạch dưới ngay sau chuỗi chữ và số phù hợp với dấu ngoặc trước. Các . (giai đoạn) khớp với bất kỳ ký tự (một ký tự đại diện).the zone name must have an underscore immediately following the alphanumeric string matched by the preceding brackets. The . (period) matches any character (a wildcard).