OCR — Estrattore di testo da immagine
Trascina un'immagine ed estrai il testo — italiano (oltre a inglese, portoghese o spagnolo) — senza caricare nulla da nessuna parte.
Cosa fa questo strumento
Il riconoscimento ottico dei caratteri (OCR) trasforma il testo all'interno di un'immagine — uno screenshot, la foto di un contratto, una lavagna fotografata, uno scontrino digitalizzato, la pagina di un libro — di nuovo in testo selezionabile, copiabile e ricercabile. Trascina l'immagine, scegli la lingua e il testo riconosciuto appare in pochi secondi, pronto da incollare nel tuo documento o nelle tue note. L'immagine e il testo riconosciuto non lasciano mai il tuo dispositivo — niente upload, niente copia del file conservata su un server di terze parti, niente log. Questa garanzia di privacy è importante perché i documenti che si passano più spesso a un OCR sono proprio quelli che non dovresti incollare in uno strumento online qualunque: documenti d'identità, passaporti, contratti, moduli medici, buste paga, lettere fiscali, screenshot di app interne. Scegli la lingua che corrisponde all'immagine (inglese, portoghese o spagnolo) — l'accuratezza del riconoscimento crolla bruscamente se si usa il modello sbagliato. L'output è modificabile in loco: puoi correggere le classiche confusioni dell'OCR (0 vs O, 1 vs l vs I, m vs rn) prima di copiare o scaricare. Facoltativamente, abilita l'affidabilità per parola in modo che ogni parola sia etichettata con quanto il motore ne è certo — utile per individuare rapidamente quali parti di una scansione di bassa qualità richiedono ancora un occhio umano.
Come usarlo
- Trascina l'immagine — Funzionano meglio gli screenshot e le scansioni pulite. Anche le foto di documenti vanno bene se l'illuminazione è uniforme e la fotocamera tenuta dritta.
- Scegli la lingua — Abbinala alla lingua del testo nell'immagine. Ogni modello viene scaricato una volta sola e messo in cache. Modelli sbagliati restituiscono risultati senza senso.
- Estrai — Clicca su Estrai testo. La prima esecuzione scarica il motore e il modello linguistico — le esecuzioni successive nella stessa lingua sono rapide.
- Modifica, copia, scarica — La casella di output è modificabile. Correggi eventuali errori, poi copia o scarica come file .txt.
Come funziona l'OCR (in 200 parole)
L'OCR moderno funziona in cinque passaggi. Per primo, l'immagine viene binarizzata — trasformata in puro bianco e nero così il motore può distinguere l'inchiostro dallo sfondo a prescindere dal colore della carta o dalle ombre. In secondo luogo, i pixel connessi vengono raggruppati in forme, poi in parole e righe seguendo il flusso di lettura naturale della pagina. Terzo, ogni parola viene segmentata in singoli caratteri candidati. Quarto, questi candidati vengono dati in pasto a una rete neurale addestrata specificamente sulla lingua scelta, ed è per questo che è così importante scegliere la lingua giusta: la stessa forma di lettera può essere la corrispondenza più probabile in inglese e una lettera completamente diversa in portoghese o spagnolo. Quinto, un modello linguistico guarda l'intera parola nel contesto e sceglie la lettura più plausibile da un dizionario di forme comuni — è quello che intercetta confusioni come uficio silenziosamente corretto in ufficio. Il punteggio di affidabilità per parola è la certezza autoriportata dal motore per ogni parola; punteggi molto alti sono quasi sempre corretti, punteggi bassi sono dove dovresti dare un'occhiata all'originale.
Cosa funziona bene, cosa no
Ottimo: screenshot puliti di PDF, scansioni ben illuminate di pagine dattiloscritte, catture di schermo di articoli, pagine di libri stampati fotografate dritte. Discreto: pagine stampate fotografate con luce uniforme, scansioni leggermente storte (sotto i 5°), scontrini in buono stato, segnaletica scattata da angolazioni moderate. Scarso: scrittura a mano (il motore è addestrato sullo stampato, non sul corsivo), pagine molto ruotate o deformate, foto in scarsa luminosità, JPEG molto compressi e pieni di rumore, font decorativi o stilizzati, testo molto piccolo (sotto i 10 pixel di altezza). Per immagini difficili, aumenta la risoluzione prima di eseguire l'OCR — pixel nitidi e ben illuminati contano molto più della dimensione del file, e un ritaglio largo 1500 pixel di solito batte un originale 4K sfocato.