Kuidas kasutada Tesseract OCR-i Java

Sisu

Juhised

Tesseract'i optilised märgituvastusraamatukogud pakuvad arendajatele võimalust skannida dokumente ja teksti pilti. Neid kasutatakse piltide salvestamiseks dokumentidest, mida te enam paberil ei vaja. Neid saab kasutada Java-süsteemis, luues iga märgi jaoks kontrollsilmukad ja kirjutades failid. Tesseracti raamatukogude kasutamiseks peate OCR-funktsioonide jaoks lisama Java-nimeruumi.

Juhised

Tesseracti raamatukogud võimaldavad kasutajatel oma dokumente skannida (John Foxx / Stockbyte / Getty Images)

Paremklõpsake Java-faili, mida soovite OCR-dokumendi loomiseks kasutada. Klõpsake "Ava" ja valige enda valitud Java-redaktor.
Lisage faili ülaosas OCR-raamatukogu nimeruumi. Kopeerige ja kleepige järgmine kood lähtefaili:

com.touch.robot.imagecomparison.tesseractocr
Looge kood, mis vastutab failide märkide skaneerimise eest. Näiteks loob järgmine kood failis iga märgi kaudu silmuseid ja kirjutab need pildifaili:

(I = 1; {i} <{read} +1; i = {i}) on väärtuste kogum, mis on defineeritud järgmiselt: +1) {Typeline "{_TOCR_LINE {i}}"}
Klõpsake redaktori nupul „Salvesta“ ja klõpsake Java-kompilaatoris koodi käivitamiseks „Run“.