Làm cách nào để bạn trích xuất văn bản từ hình ảnh bằng công cụ tesseract ocr và python?

Hãy tưởng tượng trường hợp trích xuất thông tin văn bản từ nhiều nguồn khác nhau cho dự án hiện tại mà bạn đang thực hiện, các nguồn khác nhau mà bạn có thể tìm thấy dữ liệu văn bản để trích xuất là gì? . Nhưng nếu bạn có thể trích xuất dữ liệu văn bản từ hình ảnh thì sao? . Tính năng này được sử dụng trên hầu hết các phần mềm hiện đại như Google Lens, Microsoft Math Calculator, v.v. Nhưng chúng ta có thể sử dụng nó cho mục đích riêng của mình không? . Python cùng với tesseract-OCR có thể được sử dụng để nhận dạng và trích xuất dữ liệu văn bản từ hình ảnh và chuyển đổi nó thành chuỗi. Ở đây chúng tôi sẽ triển khai OCR bằng python


Tesseract-OCR là gì?

Tesseract-OCR là một trong những công cụ Nhận dạng ký tự quang học mạnh nhất đang được điều hành bởi Google. Nó là một công cụ miễn phí mã nguồn mở hỗ trợ tất cả các loại hệ điều hành bao gồm Windows, Linux, macOS, v.v. Nó được xây dựng bằng nhiều chiến lược khác nhau như Thị giác máy tính, Học máy, Xử lý ngôn ngữ tự nhiên. Tesseract-OCR hỗ trợ tất cả các loại tệp hình ảnh bao gồm JPG, PNG, JPEG, BMP, JFIF. khiến nó trở thành một trong những công cụ OCR tốt nhất

Chúng ta có thể sử dụng OCR ở đâu?

OCR có thể hữu ích trong nhiều trường hợp như

  1. Trích xuất dữ liệu văn bản từ hình ảnh giúp tạo dữ liệu cho máy học và khoa học dữ liệu
  2. Chuyển đổi từ viết tay thành văn bản kỹ thuật số
  3. Lấy thông tin từ hộ chiếu và tài liệu

Cài đặt tesseract-OCR và pytesseract

Vì mục đích này, chúng tôi yêu cầu một mô-đun có tên "pytesseract" là trình bao bọc cho tesseract-OCR. Bạn có thể chỉ cần cài đặt pytesseract và tesseract-OCR bằng cách sử dụng pip


$ pip install pytesseract tesseract


Nếu bạn đang sử dụng hệ thống Windows, bạn sẽ cần cài đặt tesseract. tập tin exe riêng biệt. cài đặt nó từ liên kết này


Sau khi cài đặt thành công, đã đến lúc vào phần mã hóa


Ở đây, chúng tôi có một tệp hình ảnh đơn giản.  


lời chào. png
Bây giờ chúng ta sẽ chèn hình ảnh này vào mã để trích xuất văn bản được viết dưới dạng chuỗi.

import pytesseract


# Path were tesseract is installed

pytesseract.pytesseract.tesseract_cmd = 'C:/Users/Tesseract-OCR/Tesseract' 


# Converting image to string

image_to_text = str[pytesseract.image_to_string[r'C:/users/91759/Desktop/greeting.png']]


print[image_to_text]



Output:


Welcome to PyCodeMates


Trước tiên, chúng tôi đã nhập mô-đun "pytesseract" và khởi tạo đường dẫn nơi mô-đun tesseract được cài đặt [Lưu ý rằng mô-đun tesseract được cài đặt trong hệ thống của bạn có thể ở một đường dẫn khác]. Sau đó, tên và vị trí của hình ảnh của chúng tôi được chỉ định để chương trình có thể xác định nó. Cuối cùng, chúng tôi đã nhận được kết quả chính xác "Chào mừng bạn đến với PyCodeMates". Bạn có thể thắc mắc về sự dễ dàng triển khai Nhận dạng ký tự quang học của riêng mình trong ít nhất 5 dòng mã python. Nhưng nếu bạn muốn tìm hiểu thêm về điều này thì đây là một số tài liệu tham khảo

Đọc văn bản từ hình ảnh bằng Tesseract

Cải thiện bài viết

Lưu bài viết

Thích bài viết

  • Cập nhật lần cuối. 01 tháng 12 năm 2022

  • Đọc
  • Bàn luận
  • Thực tiễn
  • Video
  • khóa học
  • Cải thiện bài viết

    Lưu bài viết

    Pytesseract hay Python-tesseract là công cụ Nhận dạng ký tự quang học [OCR] dành cho python. Nó sẽ đọc và nhận dạng văn bản trong hình ảnh, biển số xe, v.v. Ở đây, chúng tôi sẽ sử dụng gói tesseract để đọc văn bản từ hình ảnh đã cho.
     

    Chủ yếu, 3 bước đơn giản có liên quan ở đây như hình dưới đây. -

    • Đang tải Hình ảnh được lưu từ máy tính hoặc tải xuống bằng trình duyệt và sau đó tải tương tự. [Mọi hình ảnh có văn bản]
    • Nhị phân hóa hình ảnh [Chuyển đổi hình ảnh thành nhị phân]
    • Sau đó chúng tôi sẽ chuyển hình ảnh qua hệ thống OCR

    Thực hiện

    Mã python sau thể hiện Bản địa hóa văn bản và đoán chính xác văn bản được viết trong hình ảnh.
     

    Python3




    python  tesseract.py --image Images/OCR.png
    2

    python  tesseract.py --image Images/OCR.png
    3

    python  tesseract.py --image Images/OCR.png
    4
    python  tesseract.py --image Images/OCR.png
    5

    python  tesseract.py --image Images/OCR.png
    4
    python  tesseract.py --image Images/OCR.png
    7

    python  tesseract.py --image Images/OCR.png
    4
    python  tesseract.py --image Images/OCR.png
    9

    python  tesseract.py --image Images/OCR.png
    0
    python  tesseract.py --image Images/OCR.png
    1
    python  tesseract.py --image Images/OCR.png
    4
    python  tesseract.py --image Images/OCR.png
    3

     

    python  tesseract.py --image Images/OCR.png
    4

    python  tesseract.py --image Images/OCR.png
    5
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    7

    python  tesseract.py --image Images/OCR.png
    8
    python  tesseract.py --image Images/OCR.png
    9
    python  tesseract.py --image Images/OCR.png
    20
    python  tesseract.py --image Images/OCR.png
    21
    python  tesseract.py --image Images/OCR.png
    20

    _______423____424____26

    python  tesseract.py --image Images/OCR.png
    26
    python  tesseract.py --image Images/OCR.png
    20

    _______423____429____26____431

    python  tesseract.py --image Images/OCR.png
    32

    python  tesseract.py --image Images/OCR.png
    8
    python  tesseract.py --image Images/OCR.png
    34
    python  tesseract.py --image Images/OCR.png
    20
    python  tesseract.py --image Images/OCR.png
    36
    python  tesseract.py --image Images/OCR.png
    20

    python  tesseract.py --image Images/OCR.png
    23
    python  tesseract.py --image Images/OCR.png
    39
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    41
    python  tesseract.py --image Images/OCR.png
    20

    python  tesseract.py --image Images/OCR.png
    23
    python  tesseract.py --image Images/OCR.png
    29
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    46
    python  tesseract.py --image Images/OCR.png
    32

    python  tesseract.py --image Images/OCR.png
    48____26____450
    python  tesseract.py --image Images/OCR.png
    51

     

    python  tesseract.py --image Images/OCR.png
    52

    python  tesseract.py --image Images/OCR.png
    53
    python  tesseract.py --image Images/OCR.png
    6______455
    python  tesseract.py --image Images/OCR.png
    56
    python  tesseract.py --image Images/OCR.png
    57

     

    python  tesseract.py --image Images/OCR.png
    58

    python  tesseract.py --image Images/OCR.png
    59
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    41

     

    python  tesseract.py --image Images/OCR.png
    42

    python  tesseract.py --image Images/OCR.png
    43
    python  tesseract.py --image Images/OCR.png
    44
    python  tesseract.py --image Images/OCR.png
    45
    python  tesseract.py --image Images/OCR.png
    46
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    41
    python  tesseract.py --image Images/OCR.png
    70

    python  tesseract.py --image Images/OCR.png
    71
    python  tesseract.py --image Images/OCR.png
    72
    python  tesseract.py --image Images/OCR.png
    73
    python  tesseract.py --image Images/OCR.png
    20
    python  tesseract.py --image Images/OCR.png
    75
    python  tesseract.py --image Images/OCR.png
    76
    python  tesseract.py --image Images/OCR.png
    77
    python  tesseract.py --image Images/OCR.png
    46

    python  tesseract.py --image Images/OCR.png
    43
    python  tesseract.py --image Images/OCR.png
    44
    python  tesseract.py --image Images/OCR.png
    45____446
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    45
    python  tesseract.py --image Images/OCR.png
    70

    _______471____448____449

    python  tesseract.py --image Images/OCR.png
    32

    python  tesseract.py --image Images/OCR.png
    71

    python  tesseract.py --image Images/OCR.png
    92

    python  tesseract.py --image Images/OCR.png
    93
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    95____496
    python  tesseract.py --image Images/OCR.png
    97
    python  tesseract.py --image Images/OCR.png
    98

    python  tesseract.py --image Images/OCR.png
    99

    python  tesseract.py --image Images/OCR.png
    00
    python  tesseract.py --image Images/OCR.png
    6
    python  tesseract.py --image Images/OCR.png
    02
    python  tesseract.py --image Images/OCR.png
    03
    python  tesseract.py --image Images/OCR.png
    04

    python  tesseract.py --image Images/OCR.png
    05

    python  tesseract.py --image Images/OCR.png
    06
    python  tesseract.py --image Images/OCR.png
    07

     

    python  tesseract.py --image Images/OCR.png
    08

    python  tesseract.py --image Images/OCR.png
    09
    python  tesseract.py --image Images/OCR.png
    10
    python  tesseract.py --image Images/OCR.png
    11

    python  tesseract.py --image Images/OCR.png
    09
    python  tesseract.py --image Images/OCR.png
    13____214

    python  tesseract.py --image Images/OCR.png
    15____473____432

    Bây giờ, hãy làm theo các bước dưới đây để đọc thành công Văn bản từ một hình ảnh.  

    • Lưu mã và hình ảnh mà bạn muốn đọc văn bản trong cùng một tệp
    • Mở dấu nhắc lệnh. Chuyển đến vị trí lưu tệp mã và hình ảnh
    • Thực hiện lệnh bên dưới để xem Đầu ra

    ví dụ 1

    Thực hiện lệnh bên dưới để xem Đầu ra

    python  tesseract.py --image Images/OCR.png
    0

    Chúng tôi có Hình ảnh gốc được hiển thị

    Tiêu đề

    Chúng tôi có hình ảnh thang độ xám được hiển thị. [P. png]

    p

    đầu ra

    ví dụ 2

    Thực hiện lệnh bên dưới để xem Đầu ra

    python  tesseract.py --image Images/OCR.png

    Chúng tôi có Hình ảnh gốc được hiển thị

    OCR

    Chúng tôi có hình ảnh thang độ xám được hiển thị. [P. png]

    p

    đầu ra


    Ghi chú cá nhân của tôi arrow_drop_up

    Tiết kiệm

    Vui lòng Đăng nhập để nhận xét.

    Python có thể đọc văn bản từ hình ảnh không?

    Thư viện Python . Tức là nó sẽ nhận dạng và “đọc” chữ nhúng trong hình ảnh. Python-tesseract is an optical character recognition [OCR] tool for python. That is, it will recognize and “read” the text embedded in images.

    Sự khác biệt giữa Tesseract và Pytesseract là gì?

    Tesserocr là một trình bao bọc Python xung quanh API Tesseract C++. Trong khi đó Pytesseract là trình bao bọc cho CLI tesseract-ocr . Do đó, với Tesserocr, bạn có thể tải mô hình ngay từ đầu hoặc chương trình của mình và chạy mô hình một cách riêng biệt [ví dụ: trong các vòng lặp để xử lý video].

    Cái nào có thể được sử dụng trích xuất văn bản từ hình ảnh?

    OCR là viết tắt của Nhận dạng ký tự quang học . Đó là một công nghệ nhận dạng văn bản trong một hình ảnh kỹ thuật số.

    Tesseract có thể đọc JPG không?

    Định dạng tệp đầu vào . Bao gồm các. TIFF [ưu tiên] JPG. Tesseract will only take image files for input. These include: TIFF [preferred] JPG.

    Chủ Đề