Minidom Python ghi XML vào tệp ví dụ

Ngôn ngữ đánh dấu mở rộng, thường được gọi là XML là ngôn ngữ được thiết kế đặc biệt để dễ hiểu bởi cả con người và máy tính. Ngôn ngữ xác định một bộ quy tắc được sử dụng để mã hóa tài liệu ở định dạng cụ thể. Trong bài viết này, các phương pháp đã được mô tả để đọc và ghi các tệp XML trong python

Ghi chú. Nói chung, quá trình đọc dữ liệu từ tệp XML và phân tích các thành phần logic của nó được gọi là Phân tích cú pháp. Do đó, khi chúng ta đề cập đến việc đọc một tệp xml, chúng ta đang đề cập đến việc phân tích cú pháp tài liệu XML.  

Trong bài viết này, chúng ta sẽ xem xét hai thư viện có thể được sử dụng cho mục đích phân tích cú pháp xml. họ đang

  • BeautifulSoup được sử dụng cùng với trình phân tích cú pháp lxml xml
  • thư viện cây nguyên tố.  

Sử dụng BeautifulSoup cùng với trình phân tích cú pháp lxml

Với mục đích đọc và ghi tệp xml, chúng tôi sẽ sử dụng thư viện Python có tên BeautifulSoup. Để cài đặt thư viện, gõ lệnh sau vào terminal.   

pip install beautifulsoup4

Beautiful Soup hỗ trợ trình phân tích cú pháp HTML có trong thư viện chuẩn của Python, nhưng nó cũng hỗ trợ một số trình phân tích cú pháp Python của bên thứ ba. Một là trình phân tích cú pháp lxml [được sử dụng để phân tích cú pháp các tài liệu XML/HTML]. lxml có thể được cài đặt bằng cách chạy lệnh sau trong bộ xử lý lệnh của Hệ điều hành của bạn.   

pip install lxml

Đầu tiên chúng ta sẽ học cách đọc từ một tệp XML. Chúng tôi cũng sẽ phân tích dữ liệu được lưu trữ trong đó. Sau này chúng ta sẽ học cách tạo một tệp XML và ghi dữ liệu vào đó.  

Đọc dữ liệu từ tệp XML

Có hai bước cần thiết để phân tích tệp xml. -

  • Tìm thẻ
  • Trích xuất từ ​​​​các thẻ

Thí dụ

Tệp XML được sử dụng.  

Python3




pip install lxml
6
pip install lxml
7
pip install lxml
8
pip install lxml
9

 

 

pip install lxml
0

pip install lxml
1

pip install lxml
2

pip install lxml
3______10
pip install lxml
1
pip install lxml
2
pip install lxml
3
pip install lxml
4
pip install lxml
5

pip install lxml
6
pip install lxml
7____18
pip install lxml
9

 

pip install lxml
60

pip install lxml
61

pip install lxml
62

pip install lxml
63
pip install lxml
8
pip install lxml
65
pip install lxml
66
pip install lxml
67

 

pip install lxml
68

pip install lxml
69

pip install lxml
70
pip install lxml
8
pip install lxml
72____673
pip install lxml
67

 

pip install lxml
75
pip install lxml
76

 

pip install lxml
77

pip install lxml
78

pip install lxml
79
pip install lxml
8
pip install lxml
81
pip install lxml
82
pip install lxml
83
pip install lxml
84
pip install lxml
85
pip install lxml
86
pip install lxml
87

 

pip install lxml
75
pip install lxml
89

 

pip install lxml
90

pip install lxml
91

pip install lxml
92

pip install lxml
93
pip install lxml
8
pip install lxml
95
pip install lxml
96
pip install lxml
67

 

pip install lxml
75
pip install lxml
99

ĐẦU RA

Viết một tệp XML

Viết một tệp xml là một quy trình nguyên thủy, lý do là vì các tệp xml không được mã hóa theo một cách đặc biệt. Lúc đầu, việc sửa đổi các phần của tài liệu xml yêu cầu một người phải phân tích cú pháp qua nó. Trong đoạn mã dưới đây, chúng tôi sẽ sửa đổi một số phần của tài liệu xml đã nói ở trên.  

Thí dụ.  

Python3




pip install lxml
6
pip install lxml
7
pip install lxml
8
pip install lxml
9

 

pip install lxml
04

pip install lxml
3______10
pip install lxml
1
pip install lxml
2
pip install lxml
3
pip install lxml
4
pip install lxml
5

pip install lxml
6
pip install lxml
7____18
pip install lxml
9

 

pip install lxml
16

pip install lxml
17

pip install lxml
18

pip install lxml
19
pip install lxml
8
pip install lxml
65
pip install lxml
22
pip install lxml
67

 

pip install lxml
24

pip install lxml
25

pip install lxml
26

pip install lxml
27

pip install lxml
28
pip install lxml
29
pip install lxml
30
pip install lxml
31
pip install lxml
82
pip install lxml
83
pip install lxml
84
pip install lxml
85
pip install lxml
86
pip install lxml
37

pip install lxml
6
pip install lxml
39____696
pip install lxml
01
pip install lxml
8
pip install lxml
03

 

 

pip install lxml
04

pip install lxml
05

pip install lxml
75
pip install lxml
07

đầu ra

Sử dụng Elementree

Mô-đun Elementree cung cấp cho chúng tôi rất nhiều công cụ để thao tác với các tệp XML. Phần hay nhất về nó là nó được đưa vào thư viện tích hợp sẵn của Python. Do đó, người ta không phải cài đặt bất kỳ mô-đun bên ngoài nào cho mục đích. Do định dạng xml vốn là định dạng dữ liệu phân cấp nên việc biểu diễn nó bằng cây sẽ dễ dàng hơn rất nhiều. Mô-đun cung cấp ElementTree cung cấp các phương thức để biểu diễn toàn bộ tài liệu XML dưới dạng một cây duy nhất.  

Trong các ví dụ sau, chúng ta sẽ xem xét các phương pháp rời rạc để đọc và ghi dữ liệu vào và từ các tệp XML.   

Đọc tệp XML

Để đọc một tệp XML bằng ElementTree, trước tiên, chúng tôi nhập lớp ElementTree được tìm thấy bên trong thư viện xml, dưới tên ET [quy ước chung]. Sau đó chuyển tên tệp của tệp xml tới ElementTree. parse[], để cho phép phân tích cú pháp tệp xml của chúng tôi. Sau đó, lấy gốc [thẻ cha] của tệp xml của chúng tôi bằng getroot[]. Sau đó, hiển thị [in] thẻ gốc của tệp xml của chúng tôi [cách không rõ ràng]. Sau đó hiển thị các thuộc tính của thẻ phụ của thẻ cha của chúng tôi bằng root[0]. thuộc tính. root[0] cho thẻ đầu tiên của root gốc và thuộc tính để nhận các thuộc tính của nó. Sau đó, chúng tôi hiển thị văn bản kèm theo trong thẻ phụ thứ nhất của thẻ phụ thứ 5 của thẻ gốc

Thí dụ.   

Python3




pip install lxml
08

pip install lxml
09

pip install lxml
8
pip install lxml
11

 

pip install lxml
12

pip install lxml
13

pip install lxml
14

pip install lxml
15
pip install lxml
8
pip install lxml
17____12
pip install lxml
67

 

pip install lxml
20

pip install lxml
21

pip install lxml
22
pip install lxml
8
pip install lxml
24

 

pip install lxml
25

pip install lxml
26

pip install lxml
27

pip install lxml
75
pip install lxml
29

 

pip install lxml
30

pip install lxml
31

pip install lxml
75
pip install lxml
33
pip install lxml
34
pip install lxml
35

 

pip install lxml
36

pip install lxml
37

pip install lxml
38

pip install lxml
75
pip install lxml
33
pip install lxml
41
pip install lxml
42
pip install lxml
34
pip install lxml
44

đầu ra

Viết tệp XML

Bây giờ, chúng ta sẽ xem xét một số phương thức có thể được sử dụng để ghi dữ liệu trên tài liệu xml. Trong ví dụ này, chúng tôi sẽ tạo một tệp xml từ đầu.  

Để làm tương tự, trước tiên, chúng ta tạo thẻ gốc [cha] dưới tên cờ vua bằng lệnh ET. Yếu tố ['cờ vua']. Tất cả các thẻ sẽ nằm bên dưới thẻ này, tôi. e. khi một thẻ gốc đã được xác định, các phần tử con khác có thể được tạo bên dưới nó. Sau đó, chúng tôi đã tạo một thẻ con/phần tử con có tên là Mở bên trong thẻ cờ vua bằng cách sử dụng lệnh ET. Phần tử con[]. Sau đó, chúng tôi đã tạo thêm hai thẻ phụ bên dưới thẻ Mở có tên là E4 và D4. Sau đó, chúng tôi đã thêm các thuộc tính vào các thẻ E4 và D4 bằng cách sử dụng set[], một phương thức được tìm thấy bên trong SubElement[], được sử dụng để xác định các thuộc tính cho một thẻ. Sau đó, chúng tôi đã thêm văn bản giữa các thẻ E4 và D4 bằng cách sử dụng văn bản thuộc tính được tìm thấy bên trong hàm SubElement. Cuối cùng, chúng tôi đã chuyển đổi kiểu dữ liệu của nội dung mà chúng tôi đang tạo từ 'xml. cây etree. Yếu TốCây. Phần tử' thành đối tượng byte, sử dụng lệnh ET. tostring[] [mặc dù tên hàm là tostring[] trong một số triển khai nhất định, nó chuyển đổi kiểu dữ liệu thành `byte` chứ không phải `str`]. Cuối cùng, chúng tôi đã xóa dữ liệu vào một tệp có tên gameofsquares. xml được mở ở chế độ `wb` để cho phép ghi dữ liệu nhị phân vào đó. Cuối cùng, chúng tôi đã lưu dữ liệu vào tệp của mình

Chủ Đề