Làm cách nào để bạn trích xuất văn bản từ hình ảnh bằng công cụ tesseract ocr và python?
Hãy tưởng tượng trường hợp trích xuất thông tin văn bản từ nhiều nguồn khác nhau cho dự án hiện tại mà bạn đang thực hiện, các nguồn khác nhau mà bạn có thể tìm thấy dữ liệu văn bản để trích xuất là gì? . Nhưng nếu bạn có thể trích xuất dữ liệu văn bản từ hình ảnh thì sao? . Tính năng này được sử dụng trên hầu hết các phần mềm hiện đại như Google Lens, Microsoft Math Calculator, v.v. Nhưng chúng ta có thể sử dụng nó cho mục đích riêng của mình không? . Python cùng với tesseract-OCR có thể được sử dụng để nhận dạng và trích xuất dữ liệu văn bản từ hình ảnh và chuyển đổi nó thành chuỗi. Ở đây chúng tôi sẽ triển khai OCR bằng python Show
Tesseract-OCR là gì?Tesseract-OCR là một trong những công cụ Nhận dạng ký tự quang học mạnh nhất đang được điều hành bởi Google. Nó là một công cụ miễn phí mã nguồn mở hỗ trợ tất cả các loại hệ điều hành bao gồm Windows, Linux, macOS, v.v. Nó được xây dựng bằng nhiều chiến lược khác nhau như Thị giác máy tính, Học máy, Xử lý ngôn ngữ tự nhiên. Tesseract-OCR hỗ trợ tất cả các loại tệp hình ảnh bao gồm JPG, PNG, JPEG, BMP, JFIF. khiến nó trở thành một trong những công cụ OCR tốt nhất Chúng ta có thể sử dụng OCR ở đâu?OCR có thể hữu ích trong nhiều trường hợp như
Cài đặt tesseract-OCR và pytesseractVì mục đích này, chúng tôi yêu cầu một mô-đun có tên "pytesseract" là trình bao bọc cho tesseract-OCR. Bạn có thể chỉ cần cài đặt pytesseract và tesseract-OCR bằng cách sử dụng pip
Nếu bạn đang sử dụng hệ thống Windows, bạn sẽ cần cài đặt tesseract. tập tin exe riêng biệt. cài đặt nó từ liên kết này Sau khi cài đặt thành công, đã đến lúc vào phần mã hóa Ở đây, chúng tôi có một tệp hình ảnh đơn giản. Bây giờ chúng ta sẽ chèn hình ảnh này vào mã để trích xuất văn bản được viết dưới dạng chuỗi.
Trước tiên, chúng tôi đã nhập mô-đun "pytesseract" và khởi tạo đường dẫn nơi mô-đun tesseract được cài đặt (Lưu ý rằng mô-đun tesseract được cài đặt trong hệ thống của bạn có thể ở một đường dẫn khác). Sau đó, tên và vị trí của hình ảnh của chúng tôi được chỉ định để chương trình có thể xác định nó. Cuối cùng, chúng tôi đã nhận được kết quả chính xác "Chào mừng bạn đến với PyCodeMates". Bạn có thể thắc mắc về sự dễ dàng triển khai Nhận dạng ký tự quang học của riêng mình trong ít nhất 5 dòng mã python. Nhưng nếu bạn muốn tìm hiểu thêm về điều này thì đây là một số tài liệu tham khảo Đọc văn bản từ hình ảnh bằng Tesseract Cải thiện bài viết Lưu bài viết Thích bài viết
Cải thiện bài viết Lưu bài viết Pytesseract hay Python-tesseract là công cụ Nhận dạng ký tự quang học (OCR) dành cho python. Nó sẽ đọc và nhận dạng văn bản trong hình ảnh, biển số xe, v.v. Ở đây, chúng tôi sẽ sử dụng gói tesseract để đọc văn bản từ hình ảnh đã cho. Chủ yếu, 3 bước đơn giản có liên quan ở đây như hình dưới đây. -
Thực hiệnMã python sau thể hiện Bản địa hóa văn bản và đoán chính xác văn bản được viết trong hình ảnh. Python3python tesseract.py --image Images/OCR.png2 python tesseract.py --image Images/OCR.png3 python tesseract.py --image Images/OCR.png4 python tesseract.py --image Images/OCR.png5 python tesseract.py --image Images/OCR.png4 python tesseract.py --image Images/OCR.png7 python tesseract.py --image Images/OCR.png4 python tesseract.py --image Images/OCR.png9 python tesseract.py --image Images/OCR.png0 python tesseract.py --image Images/OCR.png1 python tesseract.py --image Images/OCR.png4 python tesseract.py --image Images/OCR.png3
python tesseract.py --image Images/OCR.png4 python tesseract.py --image Images/OCR.png5 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png7 python tesseract.py --image Images/OCR.png8 python tesseract.py --image Images/OCR.png9 python tesseract.py --image Images/OCR.png20 python tesseract.py --image Images/OCR.png21 python tesseract.py --image Images/OCR.png20 _______423____424____26 python tesseract.py --image Images/OCR.png26 python tesseract.py --image Images/OCR.png20 _______423____429____26____431 python tesseract.py --image Images/OCR.png32 python tesseract.py --image Images/OCR.png8 python tesseract.py --image Images/OCR.png34 python tesseract.py --image Images/OCR.png20 python tesseract.py --image Images/OCR.png36 python tesseract.py --image Images/OCR.png20 python tesseract.py --image Images/OCR.png23 python tesseract.py --image Images/OCR.png39 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png41 python tesseract.py --image Images/OCR.png20 python tesseract.py --image Images/OCR.png23 python tesseract.py --image Images/OCR.png29 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png46 python tesseract.py --image Images/OCR.png32 python tesseract.py --image Images/OCR.png48____26____450 python tesseract.py --image Images/OCR.png51
python tesseract.py --image Images/OCR.png52 python tesseract.py --image Images/OCR.png53 python tesseract.py --image Images/OCR.png6______455 python tesseract.py --image Images/OCR.png56 python tesseract.py --image Images/OCR.png57
python tesseract.py --image Images/OCR.png58 python tesseract.py --image Images/OCR.png59 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png41
python tesseract.py --image Images/OCR.png42 python tesseract.py --image Images/OCR.png43 python tesseract.py --image Images/OCR.png44 python tesseract.py --image Images/OCR.png45 python tesseract.py --image Images/OCR.png46 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png41 python tesseract.py --image Images/OCR.png70 python tesseract.py --image Images/OCR.png71 python tesseract.py --image Images/OCR.png72 python tesseract.py --image Images/OCR.png73 python tesseract.py --image Images/OCR.png20 python tesseract.py --image Images/OCR.png75 python tesseract.py --image Images/OCR.png76 python tesseract.py --image Images/OCR.png77 python tesseract.py --image Images/OCR.png46 python tesseract.py --image Images/OCR.png43 python tesseract.py --image Images/OCR.png44 python tesseract.py --image Images/OCR.png45____446 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png45 python tesseract.py --image Images/OCR.png70 _______471____448____449 python tesseract.py --image Images/OCR.png32 python tesseract.py --image Images/OCR.png71 python tesseract.py --image Images/OCR.png92 python tesseract.py --image Images/OCR.png93 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png95____496 python tesseract.py --image Images/OCR.png97 python tesseract.py --image Images/OCR.png98 python tesseract.py --image Images/OCR.png99 python tesseract.py --image Images/OCR.png00 python tesseract.py --image Images/OCR.png6 python tesseract.py --image Images/OCR.png02 python tesseract.py --image Images/OCR.png03 python tesseract.py --image Images/OCR.png04 python tesseract.py --image Images/OCR.png05 python tesseract.py --image Images/OCR.png06 python tesseract.py --image Images/OCR.png07
python tesseract.py --image Images/OCR.png08 python tesseract.py --image Images/OCR.png09 python tesseract.py --image Images/OCR.png10 python tesseract.py --image Images/OCR.png11 python tesseract.py --image Images/OCR.png09 python tesseract.py --image Images/OCR.png13____214 python tesseract.py --image Images/OCR.png15____473____432 Bây giờ, hãy làm theo các bước dưới đây để đọc thành công Văn bản từ một hình ảnh.
ví dụ 1 Thực hiện lệnh bên dưới để xem Đầu ra python tesseract.py --image Images/OCR.png0 Chúng tôi có Hình ảnh gốc được hiển thị Tiêu đề Chúng tôi có hình ảnh thang độ xám được hiển thị. (P. png) p đầu ra ví dụ 2 Thực hiện lệnh bên dưới để xem Đầu ra python tesseract.py --image Images/OCR.png Chúng tôi có Hình ảnh gốc được hiển thị OCR Chúng tôi có hình ảnh thang độ xám được hiển thị. (P. png) p đầu ra Ghi chú cá nhân của tôi arrow_drop_up Tiết kiệm Vui lòng Đăng nhập để nhận xét.Python có thể đọc văn bản từ hình ảnh không?Thư viện Python
. Tức là nó sẽ nhận dạng và “đọc” chữ nhúng trong hình ảnh. Python-tesseract is an optical character recognition (OCR) tool for python. That is, it will recognize and “read” the text embedded in images.
Sự khác biệt giữa Tesseract và Pytesseract là gì?Tesserocr là một trình bao bọc Python xung quanh API Tesseract C++. Trong khi đó Pytesseract là trình bao bọc cho CLI tesseract-ocr . Do đó, với Tesserocr, bạn có thể tải mô hình ngay từ đầu hoặc chương trình của mình và chạy mô hình một cách riêng biệt (ví dụ: trong các vòng lặp để xử lý video).
Cái nào có thể được sử dụng trích xuất văn bản từ hình ảnh?OCR là viết tắt của Nhận dạng ký tự quang học . Đó là một công nghệ nhận dạng văn bản trong một hình ảnh kỹ thuật số.
Tesseract có thể đọc JPG không?Định dạng tệp đầu vào
. Bao gồm các. TIFF (ưu tiên) JPG. Tesseract will only take image files for input. These include: TIFF (preferred) JPG. |