WhatsApp

gImageReader – Estrai testo da immagini e PDF in Linux

Anonim

gImageReader è un lettore PDF gratuito e open-source con la possibilità di estrarre testo da immagini e PDF. È costruito come un semplice front-end Gtk/Qt per Tesseract-OCR, un motore OCR open-source per riconoscere testi e modelli in documenti e immagini utilizzandoIntelligenza artificiale

Di per sé, Tesseract è uno strumento a riga di comando limitato all'uso da parte di utenti Linux che hanno familiarità con i propri terminali. Grazie a gImageReader, ora tutti possono sfruttare l'efficienza dell'OCR del motore.

gImageReader funziona scansionando testi da file PDF o immagini in una qualsiasi delle diverse lingue supportate grazie all'esistenza di caratteri Unicode . È dotato di un'interfaccia utente personalizzabile semplice e ben organizzata attraverso la quale è possibile eseguire attività di controllo ortografico e traduzione.

Funzionalità di gImageReader

gImageReader è facile da usare e supporta il lavoro con documenti in formato elettronico e istantanee di media caricati, ad es. screenshot. Hai anche la possibilità di selezionare l'area di testo che ti interessa e aggiungere solo il testo che ti serve. In definitiva, gImagereader funziona sia come lettore PDF che come strumento di estrazione del testo. Cose stupide.

Installa gImageReader su Linux

Per utilizzare gImageReader al massimo, devi installare manualmente Tesseract language pack in modo da poter analizzare correttamente immagini e file.Il pacchetto si chiama 'Tesseract-ocr-eng' ed è disponibile dal software manager in Debiane Fedora distro.

Se utilizzi Ubuntu, puoi semplicemente aggiungere PPAed esegui il comando di installazione utilizzando i seguenti comandi:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt update
$ sudo apt installa gimagereader

On Debian, Fedora e OpenSUSE installalo dal gestore pacchetti.

$ sudo apt install gimagereader
$ sudo dnf installa gimagereader
$ sudo zypper installa gimagereader

Non sentirti escluso se utilizzi Arch Linux o uno dei suoi derivati. Il AUR ti ha coperto. E se preferisci ricostruire l'app dal sorgente, le istruzioni sono nel suo collegamento Wiki al repository GitHub.

Sei uno che estrae il testo stampato dalle immagini? Puoi persino scattare istantanee di aree selezionate con il tuo telefono e caricarle sul tuo laptop. Ciò che è ancora più interessante è il suo supporto multilingue, che sebbene non sia perfetto, è già una delle migliori opzioni nella community in questo momento.

gImageReader è tra i migliori lettori di PDF nel mondo open-source soprattutto con la sua capacità OCR quindi provalo e guarda come ti piace.

Come al solito, puoi condividere con noi le tue esperienze con l'app, se ne hai. E per aggiungere altri suggerimenti nella sezione commenti qui sotto.