Làm cách nào để lấy giá trị tham số URL trong HTML?

Mặc dù chúng là một tài sản vô giá trong tay của các chuyên gia SEO dày dạn kinh nghiệm, nhưng các chuỗi truy vấn thường đưa ra những thách thức nghiêm trọng đối với thứ hạng trang web của bạn

Trong hướng dẫn này, chúng tôi sẽ chia sẻ các vấn đề SEO phổ biến nhất cần chú ý khi làm việc với các tham số URL

  • Tham số URL là gì?
  • Cách sử dụng tham số URL (có ví dụ)
    • Tham số URL hoạt động như thế nào?
    • Ví dụ về chuỗi truy vấn URL
    • Khi nào tham số URL trở thành vấn đề SEO?
  • Cách quản lý tham số URL để SEO tốt
    • Kiểm tra ngân sách thu thập dữ liệu của bạn
    • Liên kết nội bộ nhất quán
    • Chuẩn hóa một phiên bản của URL
    • Chặn trình thu thập thông tin qua Disallow
    • Di chuyển tham số URL sang URL tĩnh
  • Sử dụng Công cụ Tham số URL của Semrush
  • Kết hợp các tham số URL vào Chiến lược SEO của bạn

Tham số URL là gì?

Tham số URL (còn được gọi là “chuỗi truy vấn” hoặc “tham số truy vấn URL”) là các phần tử được chèn vào URL của bạn để giúp bạn lọc và sắp xếp nội dung hoặc theo dõi thông tin trên trang web của mình

Để xác định tham số URL, hãy tham khảo phần URL xuất hiện sau dấu chấm hỏi (?). Các tham số URL được tạo bằng một khóa và một giá trị, được phân tách bằng dấu bằng (=). Nhiều tham số sau đó được phân tách bằng dấu và (&)

Chuỗi URL có tham số trông như thế này

Làm cách nào để lấy giá trị tham số URL trong HTML?

https//www. miền. com/page?key1=value1&key2=value2

Làm cách nào để lấy giá trị tham số URL trong HTML?

Key1. tên biến đầu tiên 
Key2. tên biến thứ hai
Giá trị1. giá trị thuộc tính đầu tiên
Giá trị2. giá trị thuộc tính thứ hai
?. chuỗi truy vấn bắt đầu
=. dấu tách giá trị
&. dấu tách tham số

Cách sử dụng tham số URL (có ví dụ)

Thông số URL thường được sử dụng để sắp xếp nội dung trên một trang, giúp người dùng điều hướng sản phẩm trong cửa hàng trực tuyến dễ dàng hơn. Các chuỗi truy vấn này cho phép người dùng sắp xếp một trang theo các bộ lọc cụ thể và chỉ xem một số mục nhất định trên mỗi trang

Làm cách nào để lấy giá trị tham số URL trong HTML?

Các chuỗi truy vấn của tham số theo dõi phổ biến như nhau. Chúng thường được các nhà tiếp thị kỹ thuật số sử dụng để theo dõi lưu lượng truy cập đến từ đâu, vì vậy họ có thể theo dõi chiến lược xã hội, chiến dịch quảng cáo hoặc bản tin của mình

Tham số URL hoạt động như thế nào?

Theo Google Developers, có hai loại tham số URL

1. Thông số sửa đổi nội dung (đang hoạt động). các tham số sẽ sửa đổi nội dung hiển thị trên trang

  • e. g. để đưa người dùng trực tiếp đến một sản phẩm cụ thể có tên là 'xyz'

http. //miền. com?productid=xyz

2. Tham số theo dõi (thụ động) để theo dõi nâng cao. các tham số sẽ truyền thông tin — tôi. e. nó đến từ mạng nào, chiến dịch hoặc nhóm quảng cáo nào, v.v. — nhưng sẽ không thay đổi nội dung trên trang.  

  • e. g. để theo dõi lưu lượng truy cập từ bản tin của bạn

https. //www. miền. com/?utm_source=bản tin&utm_medium=email

  • e. g. để thu thập dữ liệu chiến dịch với các URL tùy chỉnh

https. //www. miền. com/?utm_source=twitter&utm_medium=tweet&utm_campaign=summer-sale

Việc quản lý có vẻ khá đơn giản, nhưng có một cách đúng và một cách không đúng để sử dụng các tham số URL mà chúng tôi sẽ thảo luận ngay sau một số ví dụ

Ví dụ về chuỗi truy vấn URL

Các cách sử dụng phổ biến cho tham số URL bao gồm

Làm cách nào để lấy giá trị tham số URL trong HTML?

Khi nào tham số URL trở thành vấn đề SEO?

Hầu hết các lời khuyên thân thiện với SEO cho cấu trúc URL đều đề xuất tránh xa các tham số URL càng nhiều càng tốt. Điều này là do các tham số URL dù hữu ích đến đâu, chúng có xu hướng làm chậm trình thu thập dữ liệu web

Các tham số URL thụ động, có cấu trúc kém không thay đổi nội dung trên trang có thể tạo ra vô số URL có nội dung không độc đáo.  

Các sự cố SEO phổ biến nhất do tham số URL gây ra là

1. Nội dung trùng lặp. Vì mỗi URL được các công cụ tìm kiếm coi là một trang độc lập nên nhiều phiên bản của cùng một trang được tạo bởi một tham số URL có thể được coi là nội dung trùng lặp. Điều này là do một trang được sắp xếp lại theo tham số URL thường rất giống với trang gốc, trong khi một số tham số có thể trả về cùng một nội dung như trang gốc

2. Mất ngân sách thu thập dữ liệu. Giữ cấu trúc URL đơn giản là một phần của những điều cơ bản để tối ưu hóa URL. Các URL phức tạp với nhiều tham số tạo ra nhiều URL khác nhau trỏ đến nội dung giống hệt nhau (hoặc tương tự). Theo Google Developers, trình thu thập thông tin có thể quyết định tránh “lãng phí” băng thông khi lập chỉ mục tất cả nội dung trên trang web, đánh dấu nội dung đó là chất lượng thấp và chuyển sang nội dung tiếp theo.  

3. ăn thịt từ khóa. Các phiên bản được lọc của URL gốc nhắm mục tiêu cùng một nhóm từ khóa. Điều này dẫn đến các trang khác nhau cạnh tranh cho cùng một thứ hạng, điều này có thể khiến trình thu thập dữ liệu quyết định rằng các trang được lọc không mang lại bất kỳ giá trị thực nào cho người dùng

4. Tín hiệu xếp hạng pha loãng. Với nhiều URL trỏ đến cùng một nội dung, các liên kết và lượt chia sẻ trên mạng xã hội có thể trỏ đến bất kỳ phiên bản được tham số hóa nào của trang. Điều này có thể gây nhầm lẫn hơn nữa cho trình thu thập thông tin, những người sẽ không hiểu trang nào trong số các trang cạnh tranh sẽ được xếp hạng cho truy vấn tìm kiếm

5. Khả năng đọc URL kém. Khi tối ưu hóa cấu trúc URL, chúng tôi muốn URL đơn giản và dễ hiểu. Một chuỗi mã và số dài hầu như không phù hợp với hóa đơn. URL được tham số hóa hầu như không thể đọc được đối với người dùng. Khi được hiển thị trong SERPs hoặc trong bản tin hoặc trên phương tiện truyền thông xã hội, URL được tham số hóa có vẻ là spam và không đáng tin cậy, khiến người dùng ít có khả năng nhấp vào và chia sẻ trang hơn

Cách quản lý tham số URL để SEO tốt

Phần lớn các vấn đề SEO nói trên chỉ ra một nguyên nhân chính. thu thập dữ liệu và lập chỉ mục tất cả các URL được tham số hóa. Nhưng may mắn thay, các quản trị viên web không bất lực trước việc tạo ra vô số URL mới thông qua các tham số

Cốt lõi của việc xử lý tham số URL tốt là chúng tôi tìm cách gắn thẻ phù hợp

Xin lưu ý. Các vấn đề về SEO phát sinh khi các URL chứa tham số hiển thị nội dung trùng lặp, không duy nhất, tôi. e. những thứ được tạo bởi các tham số URL thụ động. Những liên kết này — và chỉ những liên kết này — không được lập chỉ mục

Kiểm tra ngân sách thu thập dữ liệu của bạn

Ngân sách thu thập dữ liệu của bạn là số trang mà bot sẽ thu thập dữ liệu trên trang web của bạn trước khi chuyển sang trang tiếp theo. Mỗi trang web có ngân sách thu thập dữ liệu khác nhau và bạn phải luôn đảm bảo ngân sách của mình không bị lãng phí

Thật không may, việc có nhiều URL có giá trị thấp, có thể thu thập dữ liệu — chẳng hạn như các URL được tham số hóa được tạo từ điều hướng theo khía cạnh — là một sự lãng phí ngân sách thu thập dữ liệu

Liên kết nội bộ nhất quán

Nếu trang web của bạn có nhiều URL dựa trên tham số, thì điều quan trọng là phải báo hiệu cho trình thu thập thông tin biết trang nào không được lập chỉ mục và liên kết nhất quán đến trang tĩnh, không có tham số.  

Ví dụ: đây là một vài URL được tham số hóa từ một cửa hàng giày trực tuyến.  

Làm cách nào để lấy giá trị tham số URL trong HTML?

Trong trường hợp này, hãy cẩn thận và chỉ liên kết nhất quán với trang tĩnh chứ không bao giờ với các phiên bản có tham số. Bằng cách này, bạn sẽ tránh gửi các tín hiệu không nhất quán đến các công cụ tìm kiếm về phiên bản của trang để lập chỉ mục

Chuẩn hóa một phiên bản của URL

Sau khi bạn quyết định trang tĩnh nào sẽ được lập chỉ mục, hãy nhớ chuẩn hóa nó. Thiết lập các thẻ chuẩn trên các URL được tham số hóa, tham chiếu URL ưa thích.  

Nếu bạn tạo thông số để giúp người dùng điều hướng trang đích của cửa hàng trực tuyến dành cho giày, thì tất cả các biến thể URL phải bao gồm thẻ chuẩn xác định trang đích chính là trang chuẩn. Ví dụ

Làm cách nào để lấy giá trị tham số URL trong HTML?

  • /giày/phụ nữ-giày/
  • /shoes/women-shoes?color=blue
  • /shoes/women-shoes?type=giày cao gót

Trong trường hợp này, ba URL ở trên "có liên quan" đến trang đích giày nữ không được tham số hóa. Điều này sẽ gửi tín hiệu đến trình thu thập thông tin rằng chỉ trang đích chính mới được lập chỉ mục chứ không phải các URL được tham số hóa.  

Chặn trình thu thập thông tin qua Disallow

Các tham số URL dùng để sắp xếp và lọc có khả năng tạo ra các URL vô tận với nội dung không phải là duy nhất. Bạn có thể chọn chặn trình thu thập thông tin truy cập vào các phần này trên trang web của mình bằng cách sử dụng thẻ không cho phép

Chặn các trình thu thập dữ liệu, như Googlebot, thu thập dữ liệu nội dung trùng lặp được tham số hóa có nghĩa là kiểm soát những gì chúng có thể truy cập trên trang web của bạn thông qua rô bốt. txt. Rô bốt. txt được bot kiểm tra trước khi thu thập dữ liệu trang web, do đó đây là một điểm tuyệt vời để bắt đầu khi tối ưu hóa các URL được tham số hóa của bạn.  

Các robot sau. txt sẽ không cho phép bất kỳ URL nào có dấu chấm hỏi

không cho phép. /*?thẻ=*

Thẻ không cho phép này sẽ chặn tất cả các tham số URL khỏi bị các công cụ tìm kiếm thu thập dữ liệu. Trước khi chọn tùy chọn này, hãy đảm bảo rằng không có phần nào khác trong cấu trúc URL của bạn sử dụng tham số, nếu không các tham số đó cũng sẽ bị chặn

Bạn có thể cần phải tự mình thực hiện thu thập thông tin để tìm tất cả các URL chứa dấu chấm hỏi (?)

Di chuyển tham số URL sang URL tĩnh

Điều này rơi vào cuộc thảo luận rộng hơn về URL động và tĩnh. Viết lại các trang động thành trang tĩnh giúp cải thiện cấu trúc URL của trang web

Tuy nhiên, đặc biệt nếu các URL được tham số hóa hiện được lập chỉ mục, bạn không chỉ nên dành thời gian để viết lại các URL mà còn chuyển hướng các trang đó đến các vị trí tĩnh mới tương ứng của chúng.  

Nhà phát triển của Google cũng đề xuất.  

  • xóa các tham số không cần thiết, nhưng duy trì một URL có giao diện động
  • tạo nội dung tĩnh tương đương với nội dung động ban đầu
  • giới hạn việc ghi lại động/tĩnh ở những thứ sẽ giúp bạn loại bỏ các tham số không cần thiết

Sử dụng Công cụ Tham số URL của Semrush

Như đã rõ, việc xử lý các tham số URL là một nhiệm vụ phức tạp và bạn có thể cần một số trợ giúp về việc này. Khi thiết lập kiểm toán trang web với Semrush, bạn có thể đỡ đau đầu bằng cách xác định sớm tất cả các tham số URL để tránh bị thu thập thông tin.  

Trong cài đặt công cụ Kiểm tra trang web, bạn sẽ tìm thấy một bước chuyên dụng (Xóa tham số URL), nơi bạn có thể liệt kê các tham số mà URL cần bỏ qua trong quá trình thu thập thông tin (UTM, trang, ngôn ngữ, v.v. ) 
 
Điều này hữu ích vì như chúng tôi đã đề cập trước đây, không phải tất cả các URL được tham số hóa đều cần được thu thập thông tin và lập chỉ mục. Các tham số sửa đổi nội dung thường không gây ra nội dung trùng lặp và các vấn đề SEO khác nên việc lập chỉ mục chúng sẽ tăng thêm giá trị cho trang web của bạn.

Nếu bạn đã thiết lập dự án trong Semrush, bạn vẫn có thể thay đổi cài đặt tham số URL của mình bằng cách nhấp vào biểu tượng bánh răng

Kết hợp các tham số URL vào Chiến lược SEO của bạn

Các URL được tham số hóa giúp sửa đổi hoặc theo dõi nội dung dễ dàng hơn, do đó, bạn nên kết hợp chúng khi cần. Bạn cần cho trình thu thập dữ liệu web biết khi nào nên và khi nào không nên lập chỉ mục các URL cụ thể bằng các tham số và đánh dấu phiên bản của trang có giá trị nhất.  

Hãy dành thời gian của bạn và quyết định những URL được tham số hóa nào không nên được lập chỉ mục. Theo thời gian, trình thu thập dữ liệu web sẽ hiểu rõ hơn cách điều hướng và đánh giá các trang trên trang web của bạn

Làm cách nào để lấy tham số URL trong HTML?

Khi bạn muốn truy cập các thông số của một phiên bản URL như myUrl , bạn có thể sử dụng myUrl. searchParams. nhận($PARAM_NAME) .

Làm cách nào tôi có thể lấy tham số từ chuỗi URL?

Các tham số từ một chuỗi URL có thể được truy xuất trong PHP bằng cách sử dụng các hàm parse_url() và parse_str() . Ghi chú. URL trang và các tham số được phân tách bằng dấu ? . hàm parse_url(). Hàm parse_url() được sử dụng để trả về các thành phần của URL bằng cách phân tích cú pháp URL đó.

Cách lấy tham số truy vấn trong HTML?

Tham số truy vấn là một tập hợp các tham số đã xác định được đính kèm ở cuối url. Chúng là phần mở rộng của URL được sử dụng để giúp xác định nội dung hoặc hành động cụ thể dựa trên dữ liệu được truyền. Để nối các tham số truy vấn vào cuối URL, a '? ' được thêm ngay sau một tham số truy vấn .