Hướng dẫn javascript regex parse url - url phân tích cú pháp regex của javascript

URL phân tích cú pháp với biểu thức thông thường

Bạn có thể phân tích URL/URI với các biểu thức thông thường.

Ví dụ URL nâng cao trông giống như:

http://login::80/demo/example.cgi?lang=de&foo=bar&empty#position

Regexr cho phân tích URL nâng cao đó là một cái gì đó như:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?

Đúng, thật điên rồ. Nhưng, bạn có thể có được các trường sau từ nó (nhóm):

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment

Giả sử bạn có một số URL và chỉ muốn biết một tên máy chủ:

var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);

Tôi tạo ASLO một bảng đẹp, nơi bạn có thể tìm thấy regexpr cho mọi mục nhập (ở nhóm #1) của chuỗi URL:

| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |

Ngoài ra, bạn có thể phân tích chuỗi truy vấn bằng cách sử dụng

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
1 và lặp lại các trận đấu:

var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);

Bạn có thể dễ dàng kiểm tra regexpr của mình trên http://regexr.com/.

  • " Trước
  • Tiếp theo "

Biểu thức chính quy là các mẫu được sử dụng để phù hợp với kết hợp ký tự trong chuỗi. Trong JavaScript, các biểu thức chính quy cũng là đối tượng. Các mẫu này được sử dụng với các phương pháp

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 và
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
3 của
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
4 và với
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
5,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
6,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
7,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
8,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
9 và
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
0 của
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
7. Chương này mô tả các biểu thức thường xuyên của JavaScript.

Tạo một biểu thức chính quy

Bạn xây dựng một biểu thức chính quy theo một trong hai cách:

  • Sử dụng một biểu thức thông thường theo nghĩa đen, bao gồm một mẫu được bao quanh giữa các dấu gạch chéo, như sau: Biểu thức thông thường theo nghĩa đen cung cấp tổng hợp biểu thức chính quy khi tập lệnh được tải. Nếu biểu thức chính quy không đổi, sử dụng điều này có thể cải thiện hiệu suất.
  • Hoặc gọi hàm hàm tạo của đối tượng
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    4, như sau:

    const re = new RegExp('ab+c');
    

    Sử dụng hàm Constructor cung cấp biên dịch thời gian chạy của biểu thức chính quy. Sử dụng chức năng Constructor khi bạn biết mẫu biểu thức chính quy sẽ thay đổi hoặc bạn không biết mẫu và đang lấy nó từ một nguồn khác, chẳng hạn như đầu vào của người dùng.

Viết một mẫu biểu thức chính quy

Một mẫu biểu thức chính quy bao gồm các ký tự đơn giản, chẳng hạn như

var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
3 hoặc kết hợp các ký tự đơn giản và đặc biệt, chẳng hạn như
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
4 hoặc
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
5. Ví dụ cuối cùng bao gồm dấu ngoặc đơn, được sử dụng làm thiết bị bộ nhớ. Trận đấu được thực hiện với phần này của mẫu được ghi nhớ để sử dụng sau, như được mô tả trong các nhóm sử dụng.

Lưu ý: Nếu bạn đã quen thuộc với các hình thức của một biểu thức thông thường, bạn cũng có thể đọc tờ Cheatese để tìm kiếm nhanh chóng cho một mẫu/cấu trúc cụ thể. If you are already familiar with the forms of a regular expression, you may also read the cheatsheet for a quick lookup for a specific pattern/construct.

Sử dụng các mẫu đơn giản

Các mẫu đơn giản được xây dựng từ các ký tự mà bạn muốn tìm một trận đấu trực tiếp. Ví dụ, mẫu

var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
3 chỉ khớp với các kết hợp ký tự trong các chuỗi chỉ khi chuỗi chính xác
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
7 xảy ra (tất cả các ký tự với nhau và theo thứ tự đó). Một trận đấu như vậy sẽ thành công trong chuỗi
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
8 và
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
9. Trong cả hai trường hợp, trận đấu là với chuỗi con
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
7. Không có khớp trong chuỗi
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
1 bởi vì trong khi nó chứa chuỗi con
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
2, nó không chứa nền tảng chính xác
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
7.

Sử dụng các ký tự đặc biệt

Khi tìm kiếm một trận đấu đòi hỏi một cái gì đó nhiều hơn một trận đấu trực tiếp, chẳng hạn như tìm một hoặc nhiều B hoặc tìm không gian trắng, bạn có thể bao gồm các ký tự đặc biệt trong mẫu. Ví dụ: để khớp với một

| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
4 theo sau là 0 hoặc nhiều
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
5 sau đó là
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
6, bạn sẽ sử dụng mẫu
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
4:
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
8 sau
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
5 có nghĩa là "0 hoặc nhiều hơn các mục trước của mục trước." Trong chuỗi
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
0, mẫu này sẽ khớp với bộ nền
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
1.

Các trang sau cung cấp danh sách các ký tự đặc biệt khác nhau phù hợp với từng danh mục, cùng với các mô tả và ví dụ.

Xác nhận

Các xác nhận bao gồm các ranh giới, chỉ ra sự khởi đầu và kết thúc của các dòng và từ, và các mẫu khác chỉ ra theo một cách nào đó mà một trận đấu là có thể (bao gồm cả hướng trước, nhìn về phía sau và các biểu thức có điều kiện).

Các lớp nhân vật

Phân biệt các loại ký tự khác nhau. Ví dụ, phân biệt giữa các chữ cái và chữ số.

Nhóm và backreferences

Nhóm nhóm nhiều mẫu nói chung và các nhóm thu thập cung cấp thêm thông tin bài hát khi sử dụng mẫu biểu thức chính quy để khớp với chuỗi. BackReferences đề cập đến một nhóm đã bị bắt trước đó trong cùng một biểu thức chính quy.

Định lượng

Chỉ ra số lượng ký tự hoặc biểu thức để khớp.

Tài sản Unicode thoát ra

Phân biệt dựa trên các thuộc tính ký tự unicode, ví dụ, các chữ cái trên và chữ cái, ký hiệu toán học và dấu câu.

Nếu bạn muốn xem tất cả các ký tự đặc biệt có thể được sử dụng trong các biểu thức thông thường trong một bảng, hãy xem phần sau:

Trốn thoát

Nếu bạn cần sử dụng bất kỳ ký tự đặc biệt nào theo nghĩa đen (ví dụ thực sự tìm kiếm

var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
2), bạn phải thoát khỏi nó bằng cách đặt dấu gạch chéo ngược của nó. Chẳng hạn, để tìm kiếm
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
4, sau đó là
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
2 sau đó là
| URL entry name    | Example               | Regular Expression              |
| ----------------- | --------------------- | ------------------------------- |
| Protocol          | http                  | ([^ :]*):\/\/                   |
| Login             | admin                 | \/\/([^:]*):[^@]*(?=@)          |
| Password          | 12345                 | \/\/[^:]*:([^@]*)(?=@)          |
| Host name         | www.example.org       | (?:@|\/\/)([^/:]{1,})           |
| Domain parts      | www, example, org     | (?:@|\/\/|\.)([^./:]*)(?=[./:]) |
| Port              | 80                    | :(\d*)\/[^/]                    |
| Path              | /demo/example.cgi     | \/\/([^/][^? ]*)\??             |
| File name         | example.cgi           | ([^?/]*(?!\/))\?                |
| Query string      | lang=de&foo=bar&empty | \?((?:[^=&# ]*=?[^&# ]*&?)*)    |
| Fragment/position | position              | #([^ ]*)                        |
5, bạn sẽ sử dụng
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
6 - dấu gạch chéo ngược "thoát ra"
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
2, làm cho nó theo nghĩa đen thay vì đặc biệt.

Tương tự, nếu bạn đang viết một biểu thức thông thường theo nghĩa đen và cần phải kết hợp một dấu gạch chéo ("/"), bạn cần thoát khỏi điều đó (nếu không, nó sẽ chấm dứt mẫu). Chẳng hạn, để tìm kiếm chuỗi "/ví dụ/" Theo sau là một hoặc nhiều ký tự chữ cái, bạn sẽ sử dụng ____ 58, các dấu gạch chéo ngược trước mỗi lần cắt làm cho chúng theo nghĩa đen.

Để phù hợp với một dấu gạch chéo ngược theo nghĩa đen, bạn cần thoát khỏi dấu gạch chéo ngược. Chẳng hạn, để khớp với chuỗi "C: \" trong đó "C" có thể là bất kỳ chữ cái nào, bạn sẽ sử dụng

var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
9 - dấu gạch chéo ngược đầu tiên thoát khỏi chữ cái sau đó, do đó, biểu thức tìm kiếm một dấu gạch chéo ngược.

Nếu sử dụng hàm tạo

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
4 với một chuỗi theo nghĩa đen, hãy nhớ rằng dấu gạch chéo ngược là một lối thoát trong các chuỗi chữ, vì vậy để sử dụng nó trong biểu thức thông thường, bạn cần thoát nó ở cấp độ theo nghĩa đen.
var myQueryString = "lang=de&foo=bar&empty";

function parseQueryString(theQueryString) {
    var Expr = /([^=&# ]*)=?([^&# ]*)&?/g,
        QueryEntries = {},
        match;
    
    // If no match left it returns ["", undefinied, undefinied], 
    // ["", "", ""] or null - depends on JavaScript engine/web browser.
    // There is litte trick: "" and null is like false, so only check for [""].
    while((match = Expr.exec(theQueryString)) && match[0]) {
        QueryEntries[match[1]] = match[2] || '';
    }
    return QueryEntries;
}

var myQueryEntries = parseQueryString(myQueryString);

console.log(myQueryEntries);
6 và
const re = new RegExp('ab+c');
2 Tạo cùng một biểu thức, tìm kiếm "A" theo nghĩa đen "*" theo sau là "B".

Nếu chuỗi thoát chưa phải là một phần trong mẫu của bạn, bạn có thể thêm chúng bằng cách sử dụng

const re = new RegExp('ab+c');
3:

function escapeRegExp(string) {
  return string.replace(/[.*+?^${}()|[\]\\]/g, '\\$&'); // $& means the whole matched string
}

"G" sau khi biểu thức thông thường là một tùy chọn hoặc cờ thực hiện tìm kiếm toàn cầu, nhìn vào toàn bộ chuỗi và trả về tất cả các trận đấu. Nó được giải thích chi tiết dưới đây trong tìm kiếm nâng cao với cờ.

Tại sao điều này không được xây dựng trong JavaScript? Có một đề xuất để thêm một chức năng như vậy vào regexp.

Sử dụng dấu ngoặc đơn

Điểm dừng xung quanh bất kỳ phần nào của mẫu biểu thức chính quy gây ra một phần của chuỗi con phù hợp được ghi nhớ. Sau khi nhớ, phần phụ có thể được thu hồi cho việc sử dụng khác. Xem các nhóm và backrefer để biết thêm chi tiết.

Sử dụng các biểu thức chính quy trong JavaScript

Các biểu thức chính quy được sử dụng với các phương pháp

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
4
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
3 và
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 và với các phương thức
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
1
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
5,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
7,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
9 và
var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";

function getHostname(theURL) {
    var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
        match = Expr.exec(theURL);
    if(match && match[0]) {
        return match[4]; // #4th group of RegExpr
    }
}

var myHostname = getHostname(myURL);

console.log(myHostname);
0.

Khi bạn muốn biết liệu một mẫu được tìm thấy trong một chuỗi, hãy sử dụng các phương thức

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
3 hoặc
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
9; Để biết thêm thông tin (nhưng thực hiện chậm hơn) sử dụng các phương thức
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 hoặc
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
5. Nếu bạn sử dụng
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 hoặc
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
5 và nếu trận đấu thành công, các phương thức này sẽ trả về một mảng và các thuộc tính cập nhật của đối tượng biểu thức chính quy được liên kết và cả đối tượng biểu thức chính quy được xác định trước,
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
4. Nếu trận đấu không thành công, phương thức
#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 trả về
const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
0 (ép buộc thành
const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
1).

Trong ví dụ sau, tập lệnh sử dụng phương thức

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 để tìm khớp trong một chuỗi.

const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');

Nếu bạn không cần truy cập các thuộc tính của biểu thức thông thường, một cách khác để tạo

const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
3 là với tập lệnh này:

const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]

(Xem bằng cách sử dụng cờ tìm kiếm toàn cầu với

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
2 để biết thêm thông tin về các hành vi khác nhau.)

Nếu bạn muốn xây dựng biểu thức thông thường từ một chuỗi, nhưng một giải pháp khác là tập lệnh này:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
0

Với các tập lệnh này, trận đấu thành công và trả về mảng và cập nhật các thuộc tính được hiển thị trong bảng sau.

Như được hiển thị trong dạng thứ hai của ví dụ này, bạn có thể sử dụng một biểu thức chính quy được tạo bằng trình khởi tạo đối tượng mà không cần gán nó cho một biến. Tuy nhiên, nếu bạn làm, mọi sự xuất hiện là một biểu thức chính quy mới. Vì lý do này, nếu bạn sử dụng biểu mẫu này mà không gán nó cho một biến, sau đó bạn không thể truy cập các thuộc tính của biểu thức thông thường đó. Ví dụ: giả sử bạn có tập lệnh này:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
1

Tuy nhiên, nếu bạn có tập lệnh này:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
2

Sự xuất hiện của

const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
5 trong hai câu lệnh là các đối tượng biểu thức chính quy khác nhau và do đó có các giá trị khác nhau cho thuộc tính
const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
6 của chúng. Nếu bạn cần truy cập các thuộc tính của biểu thức chính quy được tạo bằng trình khởi tạo đối tượng, trước tiên bạn nên gán nó cho một biến.

Tìm kiếm nâng cao với cờ

Biểu thức chính quy có các cờ tùy chọn cho phép chức năng như tìm kiếm toàn cầu và tìm kiếm không nhạy cảm trường hợp. Những lá cờ này có thể được sử dụng riêng biệt hoặc cùng nhau theo bất kỳ thứ tự nào, và được bao gồm như một phần của biểu thức thông thường.

Để bao gồm một lá cờ có biểu thức thông thường, hãy sử dụng cú pháp này:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
3

hoặc

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
4

Lưu ý rằng các cờ là một phần không thể thiếu của biểu thức chính quy. Họ không thể được thêm hoặc loại bỏ sau này.

Ví dụ,

const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
7 tạo ra một biểu thức chính quy tìm kiếm một hoặc nhiều ký tự theo sau là một không gian và nó tìm kiếm sự kết hợp này trong suốt chuỗi.

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
5

Bạn có thể thay thế dòng:

with:

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
6

và nhận được kết quả tương tự.

Cờ

const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
8 được sử dụng để chỉ định rằng một chuỗi đầu vào đa dòng nên được coi là nhiều dòng. Nếu cờ
const myRe = /d(b+)d/g;
const myArray = myRe.exec('cdbbdbsbz');
8 được sử dụng,
const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
0 và
const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
1 khớp khi bắt đầu hoặc kết thúc bất kỳ dòng nào trong chuỗi đầu vào thay vì bắt đầu hoặc kết thúc toàn bộ chuỗi.

Sử dụng cờ tìm kiếm toàn cầu với Exec ()

Phương thức

const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
2 với cờ
const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
3 trả về mỗi trận đấu và vị trí của nó lặp đi lặp lại.

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
7

Ngược lại, phương thức

const myArray = /d(b+)d/g.exec('cdbbdbsbz');
// similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
// 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
// while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
4 trả về tất cả các trận đấu cùng một lúc, nhưng không có vị trí của chúng.

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
8

Sử dụng các biểu thức chính quy Unicode

Cờ "U" được sử dụng để tạo các biểu thức chính quy "unicode"; Đó là, các biểu thức thường xuyên hỗ trợ khớp với văn bản Unicode. Điều này chủ yếu được thực hiện thông qua việc sử dụng các Escapes thuộc tính Unicode, chỉ được hỗ trợ trong các biểu thức chính quy "Unicode".

Ví dụ: biểu thức chính quy sau đây có thể được sử dụng để khớp với một "từ" unicode tùy ý: từ ":

Có một số khác biệt khác giữa các biểu thức chính quy Unicode và Nonicode mà người ta nên biết:

  • Các biểu thức chính quy của Unicode không hỗ trợ cái gọi là "thoát khỏi danh tính"; Đó là, các mô hình không cần phải bỏ qua một dấu gạch chéo ngược và bị bỏ qua một cách hiệu quả. Ví dụ:
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    5 là một biểu thức chính quy hợp lệ khớp với chữ 'A', nhưng
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    6 thì không.
  • Giá đỡ xoăn cần phải được thoát ra khi không được sử dụng làm định lượng. Ví dụ:
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    7 là một biểu thức chính quy hợp lệ khớp với giá đỡ của khung '{', nhưng
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    8 không - thay vào đó, giá đỡ nên được thoát ra và
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    9 nên được sử dụng thay thế.
  • Nhân vật
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    00 được giải thích khác nhau trong các lớp ký tự. Cụ thể, đối với các biểu thức chính quy Unicode,
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    00 được hiểu là một
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    00 theo nghĩa đen (và không phải là một phần của phạm vi) chỉ khi nó xuất hiện ở đầu hoặc cuối của lớp ký tự. Ví dụ:
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    03 là một biểu thức chính quy hợp lệ khớp với ký tự từ,
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    00 hoặc
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    05, nhưng
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    06 là một biểu thức chính quy không hợp lệ, vì
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    07 đến
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    05 không phải là một phạm vi ký tự được xác định rõ.

Các biểu thức chính quy của Unicode cũng có hành vi thực thi khác nhau là tốt.

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
09 chứa nhiều lời giải thích hơn về điều này.

Ví dụ

Lưu ý: Một số ví dụ cũng có sẵn trong: Several examples are also available in:

  • Các trang tham chiếu cho
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    2,
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    3,
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    5,
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    6,
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    9,
    #1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
    
    7,
    var myURL = "http://www.example.org/demo/example.cgi?lang=de&foo=bar&empty";
    
    function getHostname(theURL) {
        var Expr = /([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?/g,
            match = Expr.exec(theURL);
        if(match && match[0]) {
            return match[4]; // #4th group of RegExpr
        }
    }
    
    var myHostname = getHostname(myURL);
    
    console.log(myHostname);
    0
  • Các bài viết hướng dẫn: Các lớp nhân vật, xác nhận, nhóm và backrefer, định lượng, tài sản Unicode thoát khỏi

Sử dụng các ký tự đặc biệt để xác minh đầu vào

Trong ví dụ sau, người dùng dự kiến ​​sẽ nhập số điện thoại. Khi người dùng nhấn nút "Kiểm tra", tập lệnh sẽ kiểm tra tính hợp lệ của số. Nếu số là hợp lệ (khớp với chuỗi ký tự được chỉ định bởi biểu thức chính quy), tập lệnh hiển thị một thông báo cảm ơn người dùng và xác nhận số. Nếu số không hợp lệ, tập lệnh thông báo cho người dùng rằng số điện thoại không hợp lệ.

Biểu thức chính quy tìm kiếm:

  1. Sự khởi đầu của dòng dữ liệu:
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    0
  2. tiếp theo là ba ký tự số
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    18 hoặc
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    19 Một dấu ngoặc trái
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    20, tiếp theo là ba chữ số
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    18, sau đó là dấu ngoặc đơn gần
  3. tiếp theo là một dấu gạch ngang, chém về phía trước hoặc dấu thập phân trong một nhóm bắt giữ
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    24
  4. tiếp theo là ba chữ số
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    18
  5. tiếp theo là trận đấu được ghi nhớ trong nhóm (đầu tiên) bị bắt
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    26
  6. tiếp theo là bốn chữ số
    ([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
    
    27
  7. theo sau là kết thúc dòng dữ liệu:
    const myArray = /d(b+)d/g.exec('cdbbdbsbz');
    // similar to 'cdbbdbsbz'.match(/d(b+)d/g); however,
    // 'cdbbdbsbz'.match(/d(b+)d/g) outputs [ "dbbd" ]
    // while /d(b+)d/g.exec('cdbbdbsbz') outputs [ 'dbbd', 'bb', index: 1, input: 'cdbbdbsbz' ]
    
    1

HTML

([^ :]*):\/\/(?:([^:]*):([^@]*)@|)([^/:]{1,}):?(\d*)?(\/[^? ]*)\??((?:[^=&# ]*=?[^&# ]*&?)*)#?([^ ]*)?
9

JavaScript

#1 Protocol, #2 Login, #3 Password, #4 Host name, #5 Port, #6 Path, #7 Query, #8 Fragment
0

Kết quả

REGEXR

Một công cụ trực tuyến để tìm hiểu, xây dựng và kiểm tra các biểu thức thường xuyên.

REGEX TESTER

Một trình xây dựng/trình xây dựng regex trực tuyến

Hướng dẫn tương tác Regex

Một hướng dẫn tương tác trực tuyến, gian lận, & sân chơi.

REGEX Visualizer

Một người thử nghiệm trực quan trực tuyến.

  • " Trước
  • Tiếp theo "