Python đọc số byte nhất định
Tệp nhị phân là tệp không phải là tệp văn bản bình thường. Thí dụ. Một tập tin hình ảnh. Các tệp này cũng được lưu trữ dưới dạng một chuỗi byte trong đĩa cứng máy tính. Các loại tệp nhị phân này không thể được mở ở chế độ bình thường và đọc dưới dạng văn bản Show
Bạn có thể đọc tệp nhị phân bằng cách mở tệp ở chế độ nhị phân bằng cách sử dụng 9Khi làm việc với các vấn đề như phân loại hình ảnh trong Machine learning, bạn có thể cần mở tệp ở chế độ nhị phân và đọc byte để tạo mô hình ML. Trong tình huống này, bạn có thể mở tệp ở chế độ nhị phân và đọc tệp dưới dạng byte. Trong trường hợp này, việc giải mã byte thành các ký tự liên quan sẽ không được thực hiện. Mặt khác, khi bạn mở một tệp bình thường ở chế độ đọc thông thường, các byte sẽ được giải mã thành chuỗi hoặc các ký tự liên quan khác dựa trên mã hóa tệp Nếu bạn vội vàng Bạn có thể mở tệp bằng phương thức 0 bằng cách chuyển tham số 1 để mở tệp ở chế độ nhị phân và đọc tệp byte 2 mở tệp nhị phân ở chế độ đọc 3– Để chỉ định mở tệp ở chế độ đọcb – Để chỉ định đó là tệp nhị phân. Sẽ không có nỗ lực giải mã byte thành chuỗi nào. Thí dụ Ví dụ dưới đây đọc tệp một byte tại một thời điểm và in byte
Nếu bạn muốn hiểu chi tiết, hãy đọc tiếp… Trong hướng dẫn này, bạn sẽ học cách đọc tệp nhị phân theo nhiều cách khác nhau Mục lục
Đọc tệp nhị phân theo từng byteTrong phần này, bạn sẽ học cách đọc từng byte tệp nhị phân và in nó. Đây là một trong những cách nhanh nhất để đọc tệp nhị phân Tệp được mở bằng phương pháp 0 và chế độ được đề cập là “rb” có nghĩa là mở tệp ở chế độ đọc và biểu thị đó là tệp nhị phân. Trong trường hợp này, việc giải mã byte thành chuỗi sẽ không được thực hiện. Nó sẽ chỉ được đọc dưới dạng byteVí dụ dưới đây cho thấy cách tệp được đọc từng byte bằng phương pháp 5Giá trị tham số 1 đảm bảo một byte được đọc trong mỗi lần gọi phương thức 6Thí dụ
đầu ra
Python đọc tệp nhị phân thành mảng byteTrong phần này, bạn sẽ học cách đọc các tệp nhị phân thành một mảng byte Đầu tiên, tệp được mở ở chế độ “ 7“Một mảng byte có tên là 8 được khởi tạo bằng phương thức 9Sau đó, tệp được đọc từng byte một bằng cách sử dụng 40 và được thêm vào mảng byte bằng toán tử 41. Mỗi byte được thêm vào 42Cuối cùng, bạn có thể in 42 để hiển thị các byte được đọcThí dụ 4đầu ra 9Python đọc tệp nhị phân thành mảng có nhiều mảngTrong phần này, bạn sẽ học cách đọc tệp nhị phân thành một mảng NumPy Đầu tiên, 44 để nhập thư viện 45Sau đó chỉ định kiểu dữ liệu là 46 cho đối tượng 47 bằng cách sử dụng 48Tiếp theo, mở tệp nhị phân ở chế độ đọc Bây giờ, hãy tạo mảng NumPy bằng phương thức 49 bằng đối tượng 47Tham số là đối tượng tệp và kiểu dữ liệu được khởi tạo dưới dạng byte. Điều này sẽ tạo ra một mảng byte NumPy 91Thí dụ 8đầu ra 9
45 và các byte được inĐọc tệp nhị phân từng dòngTrong phần này, bạn sẽ học cách đọc tệp nhị phân theo từng dòng Bạn có thể đọc từng dòng tệp bằng cách sử dụng phương thức 93 có sẵn trong đối tượng tệpMỗi dòng sẽ được lưu trữ dưới dạng một mục trong danh sách. Danh sách này có thể được lặp lại để truy cập từng dòng của tệp Phương pháp 94 được sử dụng để xóa khoảng trắng ở đầu và cuối dòng trong khi in dòngThí dụ 3đầu ra 4Đọc tệp nhị phân đầy đủ trong một lầnTrong phần này, bạn sẽ học cách đọc tệp nhị phân trong một lần chụp Bạn có thể làm điều này bằng cách chuyển 95 đến phương thức 96. Thao tác này sẽ đọc toàn bộ tệp nhị phân trong một lần chụp như hình bên dướiThí dụ 7đầu ra 0Python đọc tệp nhị phân và chuyển đổi sang AsciiTrong phần này, bạn sẽ học cách đọc tệp nhị phân và chuyển đổi sang ASCII bằng thư viện binascii. Điều này sẽ chuyển đổi tất cả các byte thành ký tự ASCII Đọc tệp dưới dạng nhị phân như đã giải thích trong phần trước Tiếp theo, sử dụng phương pháp 97. Điều này sẽ chuyển đổi các byte thành 98 và trả về giá trị 98Sau đó, bạn có thể in cái này để kiểm tra các ký tự 98Thí dụ 1đầu ra 2Đọc tệp nhị phân vào khung dữ liệuTrong phần này, bạn sẽ học cách đọc tệp nhị phân vào pandas dataframe Trước tiên, bạn cần đọc tệp nhị phân thành một 81. Bởi vì không có phương pháp nào để đọc trực tiếp tệp nhị phân tới 82Khi bạn có 81, thì bạn có thể tạo một khung dữ liệu với 81Truyền dữ liệu mảng NumPy vào 85. Sau đó, bạn sẽ có khung dữ liệu với các byte được đọc từ tệp nhị phânThí dụ 3đầu ra 4Đây là cách bạn có thể đọc tệp nhị phân bằng NumPy và sử dụng mảng NumPy đó để tạo khung dữ liệu gấu trúc Với mảng NumPy, bạn cũng có thể đọc các byte vào từ điển Đọc tiêu đề bỏ qua tệp nhị phânTrong phần này, bạn sẽ học cách đọc tệp nhị phân, bỏ qua dòng tiêu đề trong tệp nhị phân. Một số tệp nhị phân sẽ có tiêu đề ASCII trong đó Phương thức bỏ qua tiêu đề này có thể hữu ích khi đọc các tệp nhị phân có tiêu đề ASCII Bạn có thể sử dụng phương thức 93 có sẵn trong đối tượng Tệp và chỉ định [1. ] như một tham số bổ sung. Điều này có nghĩa là dòng từ chỉ mục 1 sẽ được đọcDòng tiêu đề ASCII 0 sẽ bị bỏ qua Thí dụ 5đầu ra 6Đọc tệp nhị phân bằng PickleTrong phần này, bạn sẽ học cách đọc các tệp nhị phân trong python bằng Pickle Điều này thực sự phức tạp vì không thể đọc được tất cả các loại tệp nhị phân trong chế độ này. Bạn có thể gặp sự cố khi chọn tệp nhị phân. Vì lỗi khóa tải không hợp lệ có thể xảy ra Do đó không nên sử dụng phương pháp này Thí dụ 7đầu ra 8Phần kết luậnĐọc tệp nhị phân là một chức năng quan trọng. Ví dụ: đọc byte của tệp hình ảnh rất hữu ích khi bạn đang làm việc với các vấn đề phân loại hình ảnh. Trong trường hợp này, bạn có thể đọc tệp hình ảnh dưới dạng nhị phân và đọc các byte để tạo mô hình Trong hướng dẫn này, bạn đã học các phương pháp khác nhau có sẵn để đọc các tệp nhị phân trong python và các thư viện khác nhau có sẵn trong đó Hàm nào đọc một số byte từ tệp và trả về dưới dạng chuỗi?Phương thức read() trả về số byte đã chỉ định từ tệp. Mặc định là -1 có nghĩa là toàn bộ tập tin.
Read() hoạt động như thế nào trong Python?read() trong Python được sử dụng để đọc tối đa n byte từ tệp được liên kết với bộ mô tả tệp đã cho . Nếu đã đến cuối tệp trong khi đọc byte từ bộ mô tả tệp đã cho, os. phương thức read() sẽ trả về một đối tượng byte trống cho tất cả các byte còn lại được đọc.
Làm cách nào để đọc dữ liệu nhị phân trong Python?Hàm open() mở tệp ở định dạng văn bản theo mặc định. Để mở tệp ở định dạng nhị phân, hãy thêm 'b' vào tham số chế độ . Do đó, chế độ "rb" mở tệp ở định dạng nhị phân để đọc, trong khi chế độ "wb" mở tệp ở định dạng nhị phân để ghi. Không giống như tệp văn bản, tệp nhị phân không thể đọc được bằng con người. |