Hướng dẫn python binary diff - khác biệt nhị phân python

Trong Python, tôi cần in một khác nhau của hai tệp nhị phân. Tôi đã nhìn vào difflib.Differ mà rất nhiều.

Nội phân chính

  • Lớp DIRCMP
  • Làm cách nào để so sánh hai tệp nhị phân trong Python?
  • Làm cách nào để so sánh hai tệp nhị phân?
  • Làm cách nào để so sánh hai tệp trong Python?
  • Diff có hoạt động trên các tệp nhị phân không?

Nội phân chính

  • Lớp DIRCMP
  • Làm cách nào để so sánh hai tệp nhị phân trong Python?
  • Làm cách nào để so sánh hai tệp nhị phân?
  • Làm cách nào để so sánh hai tệp trong Python?
  • Diff có hoạt động trên các tệp nhị phân không?

Tuy nhiên, khác nhau giả định các dòng văn bản và do đó, đầu ra không liệt kê chỉ số byte và chênh lệch giá trị hex.

Những gì tôi cần là đầu ra có những gì byte khác nhau, làm thế nào byte khác nhau, các giá trị hex thực tế của hai byte.

Trong Python, làm thế nào để bạn so sánh hai tệp nhị phân (đầu ra: Chỉ số Byte Diff, các giá trị hex của hai byte)?

Tôi đã làm một cái gì đó như:

# /usr/bin/env python2
import difflib
x = open('/path/to/file1', 'r').read()
y = open('/path/to/file2', 'r').read()
print '\n'.join(difflib.Differ().compare(x, y))

Nhưng điều này không xuất ra chỉ số byte nơi sự khác biệt. Và nó không in các giá trị hex.

Mã nguồn: lib/filecmp.py Lib/filecmp.py


Mô-đun filecmp xác định các chức năng để so sánh các tệp và thư mục, với các đánh đổi thời gian/chính xác tùy chọn khác nhau. Để so sánh các tệp, hãy xem thêm mô -đun difflib.

Mô -đun filecmp xác định các chức năng sau:

________ 6 ________ 7 (f1, f2, nông = true) ¶(f1, f2, shallow=True)

So sánh các tệp có tên F1 và F2, trả về True nếu chúng có vẻ bằng, False khác.

Nếu nông là đúng và chữ ký

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
0 (loại tệp, kích thước và thời gian sửa đổi) của cả hai tệp là giống hệt nhau, các tệp được coi là bằng nhau.

Mặt khác, các tệp được coi là khác nhau nếu kích thước hoặc nội dung của chúng khác nhau.

Lưu ý rằng không có chương trình bên ngoài nào được gọi từ chức năng này, mang lại cho nó tính di động và hiệu quả.

Hàm này sử dụng bộ đệm cho các so sánh trong quá khứ và kết quả, với các mục bộ đệm được vô hiệu hóa nếu thông tin ____10 cho tệp thay đổi. Toàn bộ bộ đệm có thể được xóa bằng

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
2.

________ 6 ________ 14 (dir1, dir2, phổ biến, nông cạn = true) ¶(dir1, dir2, common, shallow=True)

So sánh các tệp trong hai thư mục DIR1 và DIR2 có tên được đưa ra bởi Common.

Trả về ba danh sách tên tệp: khớp, không phù hợp, lỗi. Trận đấu chứa danh sách các tệp khớp, không phù hợp chứa tên của các tệp don và lỗi liệt kê tên của các tệp không thể so sánh. Các tệp được liệt kê trong các lỗi nếu chúng không tồn tại trong một trong các thư mục, người dùng thiếu quyền đọc chúng hoặc nếu không thể so sánh được vì một số lý do khác.

Tham số nông có cùng ý nghĩa và giá trị mặc định như đối với

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
5.

Ví dụ:

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
6 sẽ so sánh
>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
7 với
>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
8 và
>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
9 với difflib.Differ0. difflib.Differ1 và difflib.Differ2 mỗi người sẽ ở trong một trong ba danh sách được trả lại.

________ 6 ________ 24 ()()

Xóa bộ nhớ cache FileCmp. Điều này có thể hữu ích nếu một tệp được so sánh rất nhanh sau khi được sửa đổi đến nỗi nó nằm trong độ phân giải MTIME của hệ thống tập tin cơ bản.

Mới trong phiên bản 3.4.

Lớp DIRCMP

Lớp ________ 6 ________ 26 (a, b, bỏ qua = không, ẩn = không) ¶(a, b, ignore=None, hide=None)

Xây dựng một đối tượng so sánh thư mục mới, để so sánh các thư mục a và b. Bỏ qua là danh sách các tên để bỏ qua và mặc định là difflib.Differ7. Hide là danh sách các tên để ẩn và mặc định là difflib.Differ8.

Lớp difflib.Differ9 so sánh các tệp bằng cách thực hiện các so sánh nông như được mô tả cho

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
5.

Lớp difflib.Differ9 cung cấp các phương pháp sau:

________ 32 ()()

In (đến filecmp3) so sánh giữa a và b.

________ 34 ()()

In một so sánh giữa A và B và các thư mục con ngay lập tức.

________ 35 ()()

In một so sánh giữa A và B và các thư mục con chung (đệ quy).

Lớp difflib.Differ9 cung cấp một số thuộc tính thú vị có thể được sử dụng để có được nhiều thông tin khác nhau về các cây thư mục được so sánh.

Lưu ý rằng thông qua các móc filecmp7, tất cả các thuộc tính được tính toán một cách lười biếng, do đó không có hình phạt tốc độ nếu chỉ sử dụng các thuộc tính nhẹ để tính toán được sử dụng.

________ 38¶

Thư mục a.

________ 39¶

Thư mục b.

________ 40¶

Các tệp và thư mục con trong A, được lọc bằng cách ẩn và bỏ qua.

________ 41¶

Các tệp và thư mục con trong B, được lọc bằng cách ẩn và bỏ qua.

________ 42¶

Các tập tin và thư mục con trong cả a và b.

________ 43¶

Tập tin và thư mục con chỉ trong a.

________ 44¶

Các tập tin và thư mục con chỉ trong b.

________ 45¶

Các thư mục con trong cả a và b.

________ 46¶

Các tập tin trong cả a và b.

________ 47¶

Tên trong cả A và B, sao cho loại khác nhau giữa các thư mục hoặc tên mà

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 
0 báo cáo lỗi.

________ 49¶

Các tệp giống hệt nhau trong cả A và B, sử dụng toán tử so sánh tệp lớp.

________ 50¶

Các tệp trong cả A và B, có nội dung khác nhau tùy theo toán tử so sánh tệp lớp.

________ 51¶

Các tệp trong cả A và B, nhưng không thể so sánh được.

________ 52¶

Một tên ánh xạ từ điển trong các trường hợp filecmp3 đến difflib.Differ9 (hoặc các trường hợp myDircMP nếu trường hợp này thuộc loại myDircmp, một lớp con là difflib.Differ9).

Thay đổi trong phiên bản 3.10: Các mục trước đó luôn là các trường hợp ____29. Bây giờ các mục là cùng loại với bản thân, nếu bản thân là một lớp con của difflib.Differ9.Previously entries were always difflib.Differ9 instances. Now entries are the same type as self, if self is a subclass of difflib.Differ9.

________ 6 ________ 59¶

Mới trong phiên bản 3.4.

Danh sách các thư mục bị bỏ qua bởi difflib.Differ9 theo mặc định.

Dưới đây là một ví dụ đơn giản hóa việc sử dụng thuộc tính filecmp.1 để tìm kiếm đệ quy thông qua hai thư mục để hiển thị các tệp khác nhau:

>>> from filecmp import dircmp
>>> def print_diff_files(dcmp):
...     for name in dcmp.diff_files:
...         print("diff_file %s found in %s and %s" % (name, dcmp.left,
...               dcmp.right))
...     for sub_dcmp in dcmp.subdirs.values():
...         print_diff_files(sub_dcmp)
...
>>> dcmp = dircmp('dir1', 'dir2') 
>>> print_diff_files(dcmp) 

Làm cách nào để so sánh hai tệp nhị phân trong Python?

Dưới đây so sánh x và y và sau đó chúng ta nhìn vào đầu ra:..

d = Difflib. Khác nhau ().

e = d. So sánh (x, y) #set đầu ra so sánh với một biến ..

Đối với i trong phạm vi (0, len (e)):.

nếu tôi. startswith ("-"): #nếu char bắt đầu với "-" không phải là một trận đấu ..

in (I + "chỉ mục là khác nhau").

Làm cách nào để so sánh hai tệp nhị phân?

Sử dụng lệnh CMP để kiểm tra xem hai tệp có giống nhau byte hay không. Lệnh CMP không liệt kê các khác biệt như lệnh Diff. Tuy nhiên, nó rất tiện lợi cho việc kiểm tra nhanh về việc hai tệp có giống nhau hay không (đặc biệt hữu ích cho các tệp dữ liệu nhị phân).. The command cmp does not list differences like the diff command. However it is handy for a fast check of whether two files are the same or not (especially useful for binary data files).

Làm cách nào để so sánh hai tệp trong Python?

Cách tiếp cận..

Mở cả hai tệp ở chế độ đọc ..

Danh sách lưu trữ các chuỗi ..

Bắt đầu so sánh cả hai tệp với phương thức trợ giúp của giao lộ () cho các chuỗi chung ..

So sánh cả hai tệp cho sự khác biệt bằng cách sử dụng trong khi vòng lặp ..

Đóng cả hai tệp ..

Diff có hoạt động trên các tệp nhị phân không?

Bạn cũng có thể buộc Diff coi tất cả các tệp là tệp nhị phân và chỉ báo cáo xem chúng có khác nhau hay không (nhưng không phải là như thế nào). Sử dụng tùy chọn `--Brief 'cho việc này. Trong các hệ điều hành phân biệt giữa các tệp văn bản và nhị phân, Diff thường đọc và ghi tất cả dữ liệu dưới dạng văn bản., and report only whether they differ (but not how). Use the `--brief' option for this. In operating systems that distinguish between text and binary files, diff normally reads and writes all data as text.

Tải thêm tài liệu liên quan đến bài viết Hướng dẫn python binary diff - khác biệt nhị phân python