Whatsapp

gImageReader – I-extract ang Text mula sa Mga Larawan at PDF sa Linux

Anonim

gImageReader ay isang libre at open-source na PDF reader na may kakayahang mag-extract ng text mula sa mga larawan at PDF. Ito ay binuo bilang isang simpleng Gtk/Qt front-end sa Tesseract-OCR, isang open-source na OCR engine para sa pagkilala ng mga text at pattern sa mga dokumento at larawan gamit angArtificial Intelligence

Sa sarili nitong, ang Tesseract ay isang command-line na tool na pinaghihigpitan sa paggamit ng mga user ng Linux na pamilyar sa kanilang mga terminal. Salamat sa gImageReader, maaari na ngayong samantalahin ng lahat ang kahusayan ng OCR ng makina.

gImageReader gumagana sa pamamagitan ng pag-scan ng mga text mula sa PDF o picture file sa alinman sa ilang mga wika na sinusuportahan nito salamat sa pagkakaroon ng mga Unicode na character . Nagtatampok ito ng simple at maayos na nako-customize na user interface kung saan maaari kang magsagawa ng spellcheck at mga gawain sa pagsasalin.

Mga Tampok sa gImageReader

gImageReader ay madaling gamitin at sumusuporta sa pagtatrabaho sa mga soft copy na dokumento pati na rin ang mga snapshot ng na-upload na media hal. mga screenshot. Mayroon ka ring opsyon na piliin ang lugar ng text kung saan ka interesado at dagdagan lamang ang text na kailangan mo. Sa huli, gImagereader ay gumagana bilang parehong PDF reader at text extraction tool. Mga kalokohan.

I-install ang gImageReader sa Linux

Upang magamit ang gImageReader sa kabuuan nito, dapat mong manual na i-install ang Tesseract language pack para maayos mong masuri ang mga larawan at file.Ang package ay tinatawag na 'Tesseract-ocr-eng' at available ito mula sa software manager sa Debianat Fedora distro.

Kung gumagamit ka ng Ubuntu, maaari mo lamang idagdag ang PPAat patakbuhin ang install command gamit ang mga command sa ibaba:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt update
$ sudo apt install giimagereader

Sa Debian, Fedora, at OpenSUSE i-install ito mula sa manager ng package.

$ sudo apt install giimagereader
$ sudo dnf i-install ang giimagereader
$ sudo zypper i-install ang giimagereader

Huwag pakiramdam na naiiwan ka kung tumatakbo ka Arch Linux o alinman sa mga derivatives nito. Nasaklaw ka ng AUR. At kung mas gugustuhin mong muling buuin ang app mula sa pinagmulan, ang mga tagubilin ay nasa GitHub repository Wiki link nito.

Ikaw ba ay isa sa kumuha ng naka-print na teksto mula sa mga larawan? Maaari ka ring kumuha ng mga snapshot ng mga napiling lugar gamit ang iyong telepono at i-upload ang mga ito sa iyong laptop. Ang mas cool pa ay ang multi-language na suporta nito – na bagama't hindi perpekto, isa na sa mga pinakamahusay na opsyon sa komunidad sa ngayon.

Ang

gImageReader ay kabilang sa pinakamahusay na mga PDF reader sa open-source na mundo lalo na sa kakayahan nitong OCR kaya subukan at tingnan lamang kung paano mo ito nagustuhan.

As usual, welcome kang ibahagi sa amin ang iyong mga karanasan sa app kung mayroon ka man. At para magdagdag ng iba pang mungkahi sa comments section sa ibaba.