Riconoscimento ottico dei caratteri La tecnologia (OCR) consente di modificare il testo in un'immagine grafica o in un documento scansionato. È ampiamente utilizzato per convertire libri e documenti in file elettronici, per computerizzare un sistema di archiviazione in un ufficio o per pubblicare il testo su un sito web.
L'OCR consente di modificare il testo, cercare una parola o una frase e applicare tecniche come la traduzione automatica, la sintesi vocale e il text mining.
Microsoft Office include Microsoft Document Imaging OCR, tuttavia esistono anche altre alternative freeware che fanno anche il lavoro, incluso il software applicativo fornito con lo scanner o il dispositivo all-in-one. In sostanza, per eseguire la scansione e quindi convertire un'immagine in testo utilizzando OCR, è necessario seguire i passaggi standard:
- Posizionare il documento sul letto dello scanner.
- Sul computer, utilizzare il software applicativo dello scanner e l'OCR come tipo.
- Seleziona l'area desiderata per eseguire una scansione OCR e controlla l'anteprima.
- Scansione e quindi salvare il file di testo, ed è possibile modificare lo stesso in qualsiasi applicazione di elaborazione testi.
È anche possibile scegliere di installare un'applicazione per eseguire l'OCR al posto del programma predefinito dello scanner.
FreeOCR può scansionare dalla maggior parte degli scanner TWAIN e WIA e può anche aprire le immagini TIFF PDF e multipagina scansionate. OCR gratuito include il motore OCR di Tesseract compilato da Windows, noto anche come GUI Tesseract. FreeOCR è gratuito, anche per uso commerciale. FreeOCR richiede.NET Framework v2.0. FreeOCR v4 sarà presto rilasciato.
Esistono diversi servizi online gratuiti sul Web che consentono di eseguire un OCR su un'immagine o un documento scansionato all'interno del browser.
- NewOCR.com è un servizio OCR online gratuito. NewOCR.com analizza il testo in qualsiasi file di immagine che carichi e quindi converte il testo dall'immagine in testo. Il servizio offre upload illimitati e analisi del layout (riconoscimento di testo a più colonne). Il servizio amichevole non richiede registrazione e supporta 29 lingue, sebbene il sito sia piuttosto semplice e amatoriale. Il servizio accetta qualsiasi JPEG, PNG, GIF, BMP e TIFF multipagina fino a 5 MB e documenti PDF multipagina fino a 20 MB.
- Free-OCR.com è un altro strumento OCR online gratuito. Puoi caricare i tuoi file immagine (JPG, GIF, TIFF BMP o PDF) non più grandi di 2 MB, non più larghi o superiori a 5000 pixel e c'è un limite di 10 caricamenti di immagini all'ora. Free-OCR può gestire immagini con testo a più colonne e supporta anche 29 lingue. Una strana limitazione è che richiede solo la prima pagina di un documento PDF mentre esegue l'OCR.
- Il servizio OCR online gratuito consente di riconoscere testo e caratteri dai documenti scansionati PDF (compresi i file multipagina), le fotografie e le immagini acquisite dalla fotocamera digitale. Consente agli utenti di selezionare 32 lingue per riconoscere documenti multilingue e convertirli direttamente in diversi formati come PDF, DOC, XLS, RTF, HTML e TXT. È possibile scegliere di memorizzare i file OCR online nell'area di lavoro protetta o scaricarli sul PC.
Sono sicuro che questa lista non è esaustiva. Perché non aggiungi più servizi e applicazioni come commenti a questo post, se ne sai di più?