Kuidas kasutada Tesseract OCR-i Java

Autor: Judy Howell
Loomise Kuupäev: 2 Juuli 2021
Värskenduse Kuupäev: 9 Mai 2024
Anonim
Kuidas kasutada Tesseract OCR-i Java - Artiklid
Kuidas kasutada Tesseract OCR-i Java - Artiklid

Sisu

Tesseract'i optilised märgituvastusraamatukogud pakuvad arendajatele võimalust skannida dokumente ja teksti pilti. Neid kasutatakse piltide salvestamiseks dokumentidest, mida te enam paberil ei vaja. Neid saab kasutada Java-süsteemis, luues iga märgi jaoks kontrollsilmukad ja kirjutades failid. Tesseracti raamatukogude kasutamiseks peate OCR-funktsioonide jaoks lisama Java-nimeruumi.


Juhised

Tesseracti raamatukogud võimaldavad kasutajatel oma dokumente skannida (John Foxx / Stockbyte / Getty Images)
  1. Paremklõpsake Java-faili, mida soovite OCR-dokumendi loomiseks kasutada. Klõpsake "Ava" ja valige enda valitud Java-redaktor.

  2. Lisage faili ülaosas OCR-raamatukogu nimeruumi. Kopeerige ja kleepige järgmine kood lähtefaili:

    com.touch.robot.imagecomparison.tesseractocr

  3. Looge kood, mis vastutab failide märkide skaneerimise eest. Näiteks loob järgmine kood failis iga märgi kaudu silmuseid ja kirjutab need pildifaili:

    (I = 1; {i} <{read} +1; i = {i}) on väärtuste kogum, mis on defineeritud järgmiselt: +1) {Typeline "{_TOCR_LINE {i}}"}

  4. Klõpsake redaktori nupul „Salvesta“ ja klõpsake Java-kompilaatoris koodi käivitamiseks „Run“.