OCR — Extractor de Texto desde Imagen
Suelta una imagen y saca su texto — inglés, portugués o español — sin subir nada.
Qué hace esta herramienta
El OCR (Reconocimiento Óptico de Caracteres) convierte el texto dentro de una imagen — una captura, un contrato fotografiado, una pizarra, un ticket escaneado, la página de un libro — en texto seleccionable, copiable y buscable. Suelta la imagen, elige el idioma y el texto reconocido aparece en segundos, listo para pegar en tu documento o notas. La imagen y el texto reconocido nunca salen de tu dispositivo — sin subida, sin copia de tu archivo en un servidor de terceros, sin registros. Esa garantía de privacidad importa porque los documentos que la gente pasa por OCR son justo los que no deberías pegar en un sitio cualquiera: DNIs, pasaportes, contratos, formularios médicos, nóminas, cartas de Hacienda, capturas de aplicaciones internas. Elige el idioma que coincida con tu imagen (inglés, portugués o español) — la precisión se hunde con el modelo equivocado. La salida es editable al momento: puedes corregir las confusiones clásicas del OCR (0 vs O, 1 vs l vs I, m vs rn) antes de copiar o descargar. Opcionalmente, activa la confianza por palabra para que cada término aparezca etiquetado con la certeza del motor — perfecto para detectar rápido qué partes de un escaneo malo necesitan todavía un ojo humano.
Cómo usarlo
- Suelta la imagen — Capturas y escaneos limpios funcionan mejor. Las fotos de documentos también valen si la luz es uniforme y la cámara está recta.
- Elige el idioma — Que coincida con el idioma de la imagen. Cada modelo se descarga una vez y queda en caché. Modelos equivocados dan basura.
- Extrae — Pulsa Extraer texto. La primera ejecución descarga motor + modelo — las siguientes en el mismo idioma son rápidas.
- Edita, copia, descarga — El cuadro de salida es editable. Corrige lo que haga falta y luego copia o descarga como .txt.
Cómo funciona el OCR (en 200 palabras)
El OCR moderno funciona en cinco pasos. Primero, la imagen se binariza — se convierte en blanco y negro puro para que el motor distinga la tinta del fondo, sin importar el color del papel ni las sombras. Segundo, los píxeles conectados se agrupan en formas y luego en palabras y líneas, siguiendo el flujo natural de lectura. Tercero, cada palabra se segmenta en candidatos individuales de carácter. Cuarto, esos candidatos pasan por una red neuronal entrenada específicamente en el idioma elegido — y por eso elegir el idioma correcto importa tanto: la misma forma de letra puede ser la coincidencia más probable en inglés y una letra distinta en portugués o español. Quinto, un modelo de lenguaje mira la palabra completa en su contexto y escoge la lectura más plausible de un diccionario de formas comunes — eso es lo que pilla las confusiones del estilo ofice corrigiéndose silenciosamente a office. La puntuación de confianza por palabra es la propia certeza del motor; las puntuaciones muy altas casi siempre son correctas, las bajas son donde conviene mirar el original.
Qué funciona bien y qué no
Excelente: capturas de PDF limpias, escaneos bien iluminados de páginas mecanografiadas, capturas de artículos, páginas de libro fotografiadas de frente. OK: fotos de páginas impresas con luz uniforme, escaneos ligeramente torcidos (hasta 5°), tickets en buen estado, carteles fotografiados con ángulo moderado. Mal: caligrafía (el motor está entrenado en imprenta, no en cursiva), páginas muy giradas o arrugadas, fotos con poca luz, JPEG muy comprimidos con ruido, fuentes decorativas, texto muy pequeño (menos de unos 10 píxeles de alto). Para imágenes difíciles, sube la resolución antes del OCR — los píxeles nítidos y bien iluminados importan mucho más que el peso del archivo, y un recorte de 1500 píxeles de ancho suele superar a un original 4K borroso.
EN
PT
ES