Trình phân tích css BeautifulSoup

Trong bài viết này, chúng ta sẽ thảo luận về cách tìm thẻ bằng CSS bằng BeautifulSoup. Chúng tôi được cung cấp một tài liệu HTML, chúng tôi cần tìm và trích xuất các thẻ từ tài liệu bằng lớp CSS

ví dụ

HTML Document:


     Geeksforgeeks 


    
Extract this tag
Output:
Extract this tag

Mô-đun bắt buộc

  • bs4. Nó là một thư viện python được sử dụng để cạo dữ liệu từ HTML, XML và các ngôn ngữ đánh dấu khác.
    Đảm bảo rằng bạn đã cài đặt pip trên hệ thống của mình.
    Chạy lệnh sau trong terminal để cài đặt thư viện này-
pip install bs4
or
pip install beautifulsoup4

Tiếp cận

  • Nhập thư viện bs4
  • Tạo tài liệu HTML
  • Phân tích nội dung thành một đối tượng BeautifulSoup
  • Tìm kiếm theo lớp CSS –  Tên của thuộc tính CSS, “lớp”, là một từ dành riêng trong Python. Trình biên dịch đưa ra lỗi cú pháp nếu lớp được sử dụng làm đối số từ khóa. Chúng ta có thể tìm kiếm lớp CSS bằng cách sử dụng đối số từ khóa class_
    Chúng ta có thể truyền class_ một chuỗi, một biểu thức chính quy, một hàm hoặc True.
  • find_all[] với đối số từ khóa class_ được sử dụng để tìm tất cả các thẻ có lớp CSS đã cho
    Nếu chúng tôi chỉ cần tìm một thẻ thì chúng tôi sẽ sử dụng find[]

Chủ Đề