Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Tôi hiện đang có một danh sách một danh sách trong Python, với tất cả các giá trị hàng bảng.

Bây giờ tôi muốn, hãy nghỉ ở cuối mỗi dòng dữ liệu và sử dụng các tiêu đề bảng làm khóa. Tôi không chắc làm thế nào để thể hiện tốt nhất dữ liệu bảng trong từ điển. Nhưng yêu cầu duy nhất của tôi là tôi có thể truy vấn nó theo tiêu đề bảng và hàng (tiêu đề hàng là giá trị đầu tiên trong mỗi hàng).

Cho bảng ...

First Name
Last Name
Function
John Smith
Jane Doe

Tôi đã bao gồm colspan, các lớp, vv trong bảng đơn giản hóa của tôi trong trường hợp chúng rất hữu ích.

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)

Với Python ở trên, tôi có thể nhận được

[u'John',
 u'Smith',
 u'Jane',
 u'Doe']

tôi muốn có được

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }

Hoặc một cái gì đó thuộc loại, vì vậy tôi có thể truy vấn từ điển cho dữ liệu.

Selenium là công cụ kiểm tra phần mềm tự động hóa có được trang web, thực hiện các hành động khác nhau hoặc lấy dữ liệu từ trang web. Nó được phát triển chủ yếu để giảm bớt công việc thử nghiệm bằng cách tự động hóa các ứng dụng web. Ngày nay, ngoài việc được sử dụng để thử nghiệm, nó cũng có thể được sử dụng để làm cho công việc tẻ nhạt trở nên thú vị. Bạn có biết rằng với sự trợ giúp của Selenium, bạn cũng có thể trích xuất dữ liệu từ bảng trên trang web không? Câu trả lời là có, chúng ta có thể dễ dàng loại bỏ dữ liệu bảng từ trang web. Những gì bạn cần làm để cạo dữ liệu bảng từ trang web được giải thích trong bài viết này. is the automation software testing tool that obtains the website, performs various actions, or obtains the data from the website. It was chiefly developed for easing the testing work by automating the web applications. Nowadays, apart from being used for testing, it can also be used for making tedious work interesting. Do you know that with the help of Selenium, you can also extract data from the table on the website? The answer is Yes, we can easily scrap the table data from the website. What you need to do in order to scrape table data from the website is explained in this article.

Cách tiếp cận được tuân theo: & nbsp;

Chúng ta hãy xem xét chương trình HTML đơn giản chỉ chứa các bảng để hiểu cách tiếp cận của việc cạo bảng từ trang web.

HTML

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
0

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
2
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
4
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
8
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
0
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
1
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
0
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
4
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
4
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
0
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
8
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
4
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
5
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
1
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
9
rows=1+len(driver.find_elements_by_xpath("Specify the altered path"))
0
driver.get("Specify the path of the website")
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
9
rows=1+len(driver.find_elements_by_xpath("Specify the altered path"))
6
driver.get("Specify the path of the website")
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
driver.get("Specify the path of the website")
1
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
cols=len(driver.find_elements_by_xpath("Specify the altered path"))
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

Các

driver.get("Specify the path of the website")
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
print(value, end='       ')  
   print() 
4
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
python run.py
8
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
1
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
04
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text
7
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

driver.get("Specify the path of the website")
3
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
driver.get("Specify the path of the website")
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
cols=len(driver.find_elements_by_xpath("Specify the altered path"))
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
8
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
4
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
4
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
0
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
5
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
2
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
3

Đầu ra trình duyệt:

Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Selenium là công cụ kiểm tra phần mềm tự động hóa có được trang web, thực hiện các hành động khác nhau hoặc lấy dữ liệu từ trang web. Nó được phát triển chủ yếu để giảm bớt công việc thử nghiệm bằng cách tự động hóa các ứng dụng web. Ngày nay, ngoài việc được sử dụng để thử nghiệm, nó cũng có thể được sử dụng để làm cho công việc tẻ nhạt trở nên thú vị. Bạn có biết rằng với sự trợ giúp của Selenium, bạn cũng có thể trích xuất dữ liệu từ bảng trên trang web không? Câu trả lời là có, chúng ta có thể dễ dàng loại bỏ dữ liệu bảng từ trang web. Những gì bạn cần làm để cạo dữ liệu bảng từ trang web được giải thích trong bài viết này.

Cách tiếp cận được tuân theo: & nbsp;

  • Chúng ta hãy xem xét chương trình HTML đơn giản chỉ chứa các bảng để hiểu cách tiếp cận của việc cạo bảng từ trang web.

HTML

  • def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    8
    def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    1
    [u'John',
     u'Smith',
     u'Jane',
     u'Doe']
    
    0
    [u'John',
     u'Smith',
     u'Jane',
     u'Doe']
    
    1
    [u'John',
     u'Smith',
     u'Jane',
     u'Doe']
    
    0
    def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    3
driver.get("Specify the path of the website")
  • def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    8
    def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    1
      {
      "First Name": "John",
      "LastName": "Smith"
      },
      {
      "First Name": "Jane",
      "Last Name": "Doe"
      }
    
    4
      {
      "First Name": "John",
      "LastName": "Smith"
      },
      {
      "First Name": "Jane",
      "Last Name": "Doe"
      }
    
    5
      {
      "First Name": "John",
      "LastName": "Smith"
      },
      {
      "First Name": "Jane",
      "Last Name": "Doe"
      }
    
    6
      {
      "First Name": "John",
      "LastName": "Smith"
      },
      {
      "First Name": "Jane",
      "Last Name": "Doe"
      }
    
    7
    def get_test_data(driver):
        table = driver.find_element_by_xpath("//table")
        rawdata = []
        for td in table.find_elements_by_tag_name('td'):
            rawdata.append(td.text)
        pprint(rawdata)
    
    3
rows=1+len(driver.find_elements_by_xpath("Specify the altered path"))

Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Các/html/body/table/tbody/tr[1] then, altered xpath will be /html/body/table/tbody/tr What needs to be done here is to remove the index value of table row. 

Thực hiện theo các bước dưới đây: Remember to add 1 to the row’s value for the table header as it was not included while calculating the table rows.

  • Khi bạn đã tạo tệp HTML, bạn có thể làm theo các bước dưới đây và trích xuất dữ liệu từ bảng từ trang web của riêng bạn.
cols=len(driver.find_elements_by_xpath("Specify the altered path"))

Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Đầu tiên, khai báo trình điều khiển web/html/body/table/tbody/tr[1]/td[1] then, altered xpath will be /html/body/table/tbody/tr/td What needs to be done here is to remove the index value of table row and table data.

  • Ngoài ra, lấy dữ liệu từ mỗi cột của thân bảng
for r in range(2, rows+1):
     for p in range(1, cols+1):
           value = driver.find_element_by_xpath("Specify the altered path").text

Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Ở đây, XPath bị thay đổi có nghĩa là nếu XPath của cột hiển thị đầu ra vinayak là/html/body/bảng/t có [Gian+str (r)+,]/td [Hồi+str (p)+ dữ liệu tương ứng./html/body/table/tbody/tr[1]/td[1] then, altered xpath will be /html/body/table/tbody/tr[“+str(r)+”]/td[“+str(p)+”] What needs to be done here is to add the str(r) and str(p) for the index value of table row and table data respectively.

  • Cuối cùng, in dữ liệu của bảng
print(value, end='       ')  
   print() 

Làm thế nào để cạo dữ liệu bàn từ trang web trong selenium?the website in Selenium?

Như chúng ta đã thấy cách tiếp cận được theo dõi để trích xuất dữ liệu bảng trong khi sử dụng công cụ tự động hóa selen. Bây giờ, hãy để Lừa xem ví dụ hoàn chỉnh cho dữ liệu bảng loại bỏ từ trang web. Chúng tôi sẽ sử dụng trang web này để trích xuất dữ liệu bảng của nó trong chương trình đã cho dưới đây.this website to extract its table data in the given below program.

Python

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
26
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
27
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
28
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
29

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
26
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
31
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
28
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
33

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
34
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
36

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
37
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
38
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
40
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
41

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
42

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
43
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
44
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
41

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
46
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
48
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
49
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
50
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
51

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
37
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
53
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
54

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
55
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
50
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
51

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
37
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
60
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
54

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
62
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
63

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
62
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
65

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
62
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
67
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
68
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
49
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
70
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
41

Is

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
37
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
72
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
84
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
74
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
75
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
67
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
48__

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
94
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
96

Các

  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
9
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
62
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
12
  {
  "First Name": "John",
  "LastName": "Smith"
  },
  {
  "First Name": "Jane",
  "Last Name": "Doe"
  }
6
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
14
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
41

def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
37
def get_test_data(driver):
    table = driver.find_element_by_xpath("//table")
    rawdata = []
    for td in table.find_elements_by_tag_name('td'):
        rawdata.append(td.text)
    pprint(rawdata)
62
[u'John',
 u'Smith',
 u'Jane',
 u'Doe']
18

Hơn nữa, chạy mã Python bằng cách sử dụng:

python run.py

Output:

Hướng dẫn python selenium table to dictionary - bảng selen của python vào từ điển

Đầu ra trình duyệt:

https://media.geeksforgeeks.org/wp-content/uploads/20210301201615/final_603cfdc65fe116002f258803_500447.mp4