OCR — Extrator de Texto de Imagem
Solte uma imagem e tire o texto dela — inglês, português ou espanhol — sem upload.
O que esta ferramenta faz
OCR (Reconhecimento Óptico de Caracteres) transforma o texto dentro de uma imagem — uma captura de tela, um contrato fotografado, um quadro branco, uma nota fiscal digitalizada, uma página de livro — de volta em texto selecionável, copiável e pesquisável. Solte a imagem, escolha o idioma e o texto reconhecido aparece em segundos, pronto para colar no seu documento ou anotações. A imagem e o texto reconhecido nunca saem do seu dispositivo — não há upload, nem cópia do arquivo em servidor de terceiros, nem registro. Essa garantia de privacidade importa porque os documentos que mais costumam ir para o OCR são exatamente os que ninguém deveria colar num site qualquer: RGs, passaportes, contratos, formulários médicos, holerites, cartas da Receita, capturas de aplicativos internos. Escolha o idioma certo da imagem (inglês, português ou espanhol) — a precisão cai feio com o modelo errado. A saída é editável na hora: você pode corrigir as confusões clássicas de OCR (0 vs O, 1 vs l vs I, m vs rn) antes de copiar ou baixar. Opcionalmente, ative a confiança por palavra para que cada termo seja marcado com o nível de certeza do mecanismo — ótimo para identificar rapidamente as partes de um scan ruim que ainda precisam de olho humano.
Como usar
- Solte a imagem — Capturas e scans limpos funcionam melhor. Fotos de documentos servem se a iluminação for uniforme e a câmera reta.
- Escolha o idioma — Combine com o idioma do texto. Cada modelo é baixado uma vez e fica em cache. Modelos errados resultam em lixo.
- Extraia — Clique em Extrair texto. A primeira execução baixa engine + modelo — execuções seguintes do mesmo idioma são rápidas.
- Edite, copie, baixe — A caixa de saída é editável. Corrija o que for preciso, depois copie ou baixe como .txt.
Como o OCR funciona (em 200 palavras)
O OCR moderno funciona em cinco passos. Primeiro, a imagem é binarizada — transformada em preto-e-branco puro para que o mecanismo distinga tinta de fundo, independentemente da cor do papel ou de sombras. Segundo, os pixels conectados são agrupados em formas, depois em palavras e linhas, seguindo o fluxo natural de leitura da página. Terceiro, cada palavra é segmentada em candidatos individuais de caractere. Quarto, esses candidatos passam por uma rede neural treinada especificamente no idioma escolhido — é por isso que escolher o idioma certo importa tanto: a mesma forma de letra pode ser a combinação mais provável em inglês e uma letra completamente diferente em português ou espanhol. Quinto, um modelo de linguagem olha a palavra inteira no contexto e escolhe a leitura mais plausível a partir de um dicionário de formas comuns — é isso que pega confusões como ofice sendo silenciosamente corrigido para office. A pontuação de confiança por palavra é a certeza autoavaliada do mecanismo; pontuações muito altas quase sempre estão corretas, pontuações baixas são onde dar uma olhada no original.
O que funciona bem, o que não
Ótimo: capturas de PDF limpas, scans bem iluminados de páginas digitadas, capturas de tela de artigos, páginas de livro fotografadas de frente. OK: fotos de páginas impressas com luz uniforme, scans levemente tortos (até 5°), notas em bom estado, placas tiradas em ângulo moderado. Ruim: caligrafia (o mecanismo é treinado em impressão, não em cursiva), páginas muito giradas ou amassadas, fotos em pouca luz, JPEGs muito comprimidos cheios de ruído, fontes decorativas, texto muito pequeno (menos de cerca de 10 pixels de altura). Para imagens difíceis, aumente a resolução antes do OCR — pixels nítidos e bem iluminados valem muito mais que tamanho de arquivo, e um recorte de 1500 pixels de largura costuma vencer um original 4K borrado.
EN
PT
ES