Hướng dẫn dùng pcre regex trong PHP
Regular Expression được dùng để xử lý chuỗi thông qua biểu thức riêng của nó. Để các biểu thức này có thể hoạt động được bạn cần tuân thủ nhiêm ngặt theo các quy tắc viêt biểu thức của Regular. Nếu bạn thấy từ khóa Regular Expression có vẻ lạ lẫm thì hãy nhớ đến khái niệm Regex. Regex là viết tắt của Regular Expression, cái mà chúng ta hay nói với nhau hàng ngày trong các dự án. ^^ Khai báo chuỗi Một chuổi Regex được bắt đầu bằng ký tự "/" và kết thúc cũng bới ký tự "/". Xét một ví dụ đơn giản như sau:
Trong ví dụ trên, $pattern = '/abc/' có ý nghĩa là tìm trong chuỗi $subject có chứa chuỗi 'abc' hay không. Vì chúng ta truyền vào $subject là 'abc' cho nên kết quả thu được sẽ là thông báo có chứa chuỗi. So sánh tuyệt đối Cũng xét ví dụ ở trên, nếu chúng ta truyền vào với giá trị như sau thì điều gì sẽ xảy ra:
Kết quả trả về vẫn là đúng. Bởi vì tách nhỏ chuỗi $subject ra thì bên trong nó vẫn chứa chuỗi 'abc'. Vấn đề đặt ra ở đây là: Bây giờ tôi muốn kiểm tra trong $subject trùng khớp với $pattern hay không thì phải làm thế nào? Trong lập trình, để kiểm tra hai biến có bằng nhau hay không đơn giản chúng ta chỉ cần sử dụng toán tử so sánh '=='. Vậy trong Regex chúng ta phải làm thế nào? Câu trả lời là bạn chỉ cần thêm ký tự '^' và '$' vào đầu và cuối của chuỗi $pattern. Khí đó, khi so sánh sẽ tiến hành so sánh từ đầu tới cuối của chuỗi được truyền vào.
Bây giờ nếu chúng ta thay đổi chuỗi $subject thành 'sframgia01' thì kết quả thu được sẽ là sai. Phạm vi của chuỗi Trong nhiều trường hợp, chúng ta cần so sánh một chuỗi ký tự có thuộc một khoảng giá trị bất kỳ nào không. Như là: chuỗi có phải ký tự in thường, ký tự in hoa, có phải là sô, ... Để làm được điều này chúng ta sử dụng 1 trong 2 phương thức sau:
Ví dụ:
Quy định chiều dài cho chuỗi Để quy định đỗ dài cho chuỗi ta dùng {min,max}. Trong đó, min là chiều dài tối thiểu, max là chiều dài tối đa.
Với $pattern như ví dụ trên. Kết quả trả về là true chỉ khi nào $subject chỉ chứa các ký tự in thường và có chiều dài từ 5 đến 10 ký tự. Regex đại diện cho 1 ký tự Có trường hợp, tối chỉ muốn kiểm tra ký tự cuối cùng xuất hiện trong chuỗi còn những ký tự trước nó không giới hạn phạm vi thì phải viết Regex như thế nào? Regex cung cấp cho chúng ta ký tự '.'. Với ký tự này được khai báo, Regex sẽ chấp nhận bất cứ ký tự nào đc khai báo.
Regex với ký hiệu đặc biệt Giả sử tối muốn kiểm tra chuỗi có chứa dấu . hay không. Nếu cứ làm như trước đây. Chúng ta có:
Kết quả của chương trình này sẽ là True. Bởi vì Regex hiểu dấu . là chấp nhận bất kỳ giá trị nào chứ không phải là yêu cầu kiểm tra trong chuỗi có dấu . hay không. Khi gặp những tình huống tương tự như trên. Hay làm như sau:
Kết quả của chương trình này là false. Vì trong chuỗi $subject không có chứa ký tự '.'. Regex với Or Muốn kiểm tra chuỗi có ký tự A hoặc ký tự B hay không thì làm như sau:
Regex với chiều dài không giới hạn Ta đã biết được muốn xác định chiều dài cho chuỗi thì dùng {min, max}. Tuy nhiên vẫn còn một số cách ngắn gọn hơn nhiều.
Các ký tự Regex đặc biệt Danh sách các ký tự Regex đặc biệt như sau:
Website kiểm tra Regex online Không phải lúc nào chúng ta cần kiểm tra một Regex cũng lại mở code ra gõ lệnh rồi chạy chương trình chờ kết quả trả về. Việc này rất mất thời gian mà lại không cần thiết. Các bạn có thể tìm kiếm một trang kiểm tra regex bất kỳ nào trên google. Có rất nhiều để các bạn lựa chọn. Mình xin giới thiệu Regex online!. Đây là trang mình hay sử dụng nhất. Hãy nhập regex vào ô Regular Expression. Sau khi hoàn thành regex thì hãy nhập chuỗi cần kiểm tra vào ô Test String. Giao diện chính của trang này: Chúc mọi người thành công khi làm việc với Regex. ^^ |