PK Systems PK Systems
Ferramentas de Imagem

OCR — Extrator de Texto de Imagem

Solte uma imagem e tire o texto dela — inglês, português ou espanhol — sem upload.

OCR — Extrator de Texto de Imagem

Solte uma imagem aqui ou clique para escolher PNG, JPG, WebP, BMP — máximo 12 MB

O reconhecimento roda localmente — sua imagem não sai do navegador.

Status

O que esta ferramenta faz

OCR (Reconhecimento Óptico de Caracteres) transforma o texto dentro de uma imagem — uma captura de tela, um contrato fotografado, um quadro branco, uma nota fiscal digitalizada, uma página de livro — de volta em texto selecionável, copiável e pesquisável. Solte a imagem, escolha o idioma e o texto reconhecido aparece em segundos, pronto para colar no seu documento ou anotações. A imagem e o texto reconhecido nunca saem do seu dispositivo — não há upload, nem cópia do arquivo em servidor de terceiros, nem registro. Essa garantia de privacidade importa porque os documentos que mais costumam ir para o OCR são exatamente os que ninguém deveria colar num site qualquer: RGs, passaportes, contratos, formulários médicos, holerites, cartas da Receita, capturas de aplicativos internos. Escolha o idioma certo da imagem (inglês, português ou espanhol) — a precisão cai feio com o modelo errado. A saída é editável na hora: você pode corrigir as confusões clássicas de OCR (0 vs O, 1 vs l vs I, m vs rn) antes de copiar ou baixar. Opcionalmente, ative a confiança por palavra para que cada termo seja marcado com o nível de certeza do mecanismo — ótimo para identificar rapidamente as partes de um scan ruim que ainda precisam de olho humano.

Como usar

  1. Solte a imagem — Capturas e scans limpos funcionam melhor. Fotos de documentos servem se a iluminação for uniforme e a câmera reta.
  2. Escolha o idioma — Combine com o idioma do texto. Cada modelo é baixado uma vez e fica em cache. Modelos errados resultam em lixo.
  3. Extraia — Clique em Extrair texto. A primeira execução baixa engine + modelo — execuções seguintes do mesmo idioma são rápidas.
  4. Edite, copie, baixe — A caixa de saída é editável. Corrija o que for preciso, depois copie ou baixe como .txt.

Como o OCR funciona (em 200 palavras)

O OCR moderno funciona em cinco passos. Primeiro, a imagem é binarizada — transformada em preto-e-branco puro para que o mecanismo distinga tinta de fundo, independentemente da cor do papel ou de sombras. Segundo, os pixels conectados são agrupados em formas, depois em palavras e linhas, seguindo o fluxo natural de leitura da página. Terceiro, cada palavra é segmentada em candidatos individuais de caractere. Quarto, esses candidatos passam por uma rede neural treinada especificamente no idioma escolhido — é por isso que escolher o idioma certo importa tanto: a mesma forma de letra pode ser a combinação mais provável em inglês e uma letra completamente diferente em português ou espanhol. Quinto, um modelo de linguagem olha a palavra inteira no contexto e escolhe a leitura mais plausível a partir de um dicionário de formas comuns — é isso que pega confusões como ofice sendo silenciosamente corrigido para office. A pontuação de confiança por palavra é a certeza autoavaliada do mecanismo; pontuações muito altas quase sempre estão corretas, pontuações baixas são onde dar uma olhada no original.

O que funciona bem, o que não

Ótimo: capturas de PDF limpas, scans bem iluminados de páginas digitadas, capturas de tela de artigos, páginas de livro fotografadas de frente. OK: fotos de páginas impressas com luz uniforme, scans levemente tortos (até 5°), notas em bom estado, placas tiradas em ângulo moderado. Ruim: caligrafia (o mecanismo é treinado em impressão, não em cursiva), páginas muito giradas ou amassadas, fotos em pouca luz, JPEGs muito comprimidos cheios de ruído, fontes decorativas, texto muito pequeno (menos de cerca de 10 pixels de altura). Para imagens difíceis, aumente a resolução antes do OCR — pixels nítidos e bem iluminados valem muito mais que tamanho de arquivo, e um recorte de 1500 pixels de largura costuma vencer um original 4K borrado.

Perguntas frequentes

Minha imagem é enviada?
Não. O OCR roda totalmente no seu dispositivo. Sua imagem e o texto reconhecido nunca saem do navegador, nunca vão para nossos servidores, e não são armazenados, indexados, registrados ou compartilhados. As únicas chamadas de rede são os downloads únicos do mecanismo de reconhecimento e do modelo de idioma na primeira vez; depois a página funciona mesmo offline.
Por que a primeira execução é lenta?
Na primeira vez que você roda OCR num idioma, o navegador baixa o modelo (~10 MB). As execuções seguintes reaproveitam o arquivo em cache e começam de cara.
Posso fazer OCR de manuscrito?
O modelo de reconhecimento é treinado principalmente em texto impresso. Letras de forma bem nítidas às vezes funcionam; cursiva ou bagunçada vira lixo. OCR de manuscrito é um problema bem mais difícil — mecanismos open-source no navegador ainda não resolvem isso de forma confiável, e preferimos não te dar resultado nenhum a te dar resultado errado.
Por que confunde 0/O e l/1?
Esses caracteres são visualmente idênticos em muitas fontes — até humanos precisam de contexto para distinguir. O mecanismo usa modelo de linguagem para enviesar a escolha, mas erra às vezes. O modo confiança destaca exatamente onde dar uma olhada.
Posso adicionar mais idiomas?
Atualmente expomos os três de maior demanda do site (inglês, português, espanhol), já que cada modelo de idioma tem cerca de 10 MB. Se precisar de outro idioma, entre em contato e a gente avalia adicionar.
O resultado está quase certo, mas com vários errinhos.
Alguns erros de reconhecimento são normais em imagens imperfeitas. A caixa de saída é editável justamente por isso — corrija os erros óbvios e depois copie ou baixe. Para textos longos, cole no seu editor e passe um corretor para limpar o resto.