Herramientas de imagen

OCR — Extractor de Texto desde Imagen

Suelta una imagen y saca su texto — inglés, portugués o español — sin subir nada.

Suelta una imagen aquí o haz clic para elegir

Suelta una imagen aquí o haz clic para elegir PNG, JPG, WebP, BMP — máx. 12 MB

El reconocimiento corre localmente — tu imagen no sale del navegador.

Estado

Qué hace esta herramienta

El OCR (Reconocimiento Óptico de Caracteres) convierte el texto dentro de una imagen — una captura, un contrato fotografiado, una pizarra, un ticket escaneado, la página de un libro — en texto seleccionable, copiable y buscable. Suelta la imagen, elige el idioma y el texto reconocido aparece en segundos, listo para pegar en tu documento o notas. La imagen y el texto reconocido nunca salen de tu dispositivo — sin subida, sin copia de tu archivo en un servidor de terceros, sin registros. Esa garantía de privacidad importa porque los documentos que la gente pasa por OCR son justo los que no deberías pegar en un sitio cualquiera: DNIs, pasaportes, contratos, formularios médicos, nóminas, cartas de Hacienda, capturas de aplicaciones internas. Elige el idioma que coincida con tu imagen (inglés, portugués o español) — la precisión se hunde con el modelo equivocado. La salida es editable al momento: puedes corregir las confusiones clásicas del OCR (0 vs O, 1 vs l vs I, m vs rn) antes de copiar o descargar. Opcionalmente, activa la confianza por palabra para que cada término aparezca etiquetado con la certeza del motor — perfecto para detectar rápido qué partes de un escaneo malo necesitan todavía un ojo humano.

Cómo usarlo

Suelta la imagen — Capturas y escaneos limpios funcionan mejor. Las fotos de documentos también valen si la luz es uniforme y la cámara está recta.
Elige el idioma — Que coincida con el idioma de la imagen. Cada modelo se descarga una vez y queda en caché. Modelos equivocados dan basura.
Extrae — Pulsa Extraer texto. La primera ejecución descarga motor + modelo — las siguientes en el mismo idioma son rápidas.
Edita, copia, descarga — El cuadro de salida es editable. Corrige lo que haga falta y luego copia o descarga como .txt.

Cómo funciona el OCR (en 200 palabras)

El OCR moderno funciona en cinco pasos. Primero, la imagen se binariza — se convierte en blanco y negro puro para que el motor distinga la tinta del fondo, sin importar el color del papel ni las sombras. Segundo, los píxeles conectados se agrupan en formas y luego en palabras y líneas, siguiendo el flujo natural de lectura. Tercero, cada palabra se segmenta en candidatos individuales de carácter. Cuarto, esos candidatos pasan por una red neuronal entrenada específicamente en el idioma elegido — y por eso elegir el idioma correcto importa tanto: la misma forma de letra puede ser la coincidencia más probable en inglés y una letra distinta en portugués o español. Quinto, un modelo de lenguaje mira la palabra completa en su contexto y escoge la lectura más plausible de un diccionario de formas comunes — eso es lo que pilla las confusiones del estilo ofice corrigiéndose silenciosamente a office. La puntuación de confianza por palabra es la propia certeza del motor; las puntuaciones muy altas casi siempre son correctas, las bajas son donde conviene mirar el original.

Qué funciona bien y qué no

Excelente: capturas de PDF limpias, escaneos bien iluminados de páginas mecanografiadas, capturas de artículos, páginas de libro fotografiadas de frente. OK: fotos de páginas impresas con luz uniforme, escaneos ligeramente torcidos (hasta 5°), tickets en buen estado, carteles fotografiados con ángulo moderado. Mal: caligrafía (el motor está entrenado en imprenta, no en cursiva), páginas muy giradas o arrugadas, fotos con poca luz, JPEG muy comprimidos con ruido, fuentes decorativas, texto muy pequeño (menos de unos 10 píxeles de alto). Para imágenes difíciles, sube la resolución antes del OCR — los píxeles nítidos y bien iluminados importan mucho más que el peso del archivo, y un recorte de 1500 píxeles de ancho suele superar a un original 4K borroso.

Preguntas frecuentes

¿Se sube mi imagen?

No. El OCR corre íntegramente en tu dispositivo. Tu imagen y el texto reconocido nunca salen del navegador, nunca llegan a nuestros servidores y no se almacenan, indexan, registran ni comparten. Las únicas llamadas de red son las descargas puntuales del motor de reconocimiento y del modelo de idioma la primera vez; después la página funciona incluso sin conexión.

¿Por qué la primera ejecución es lenta?

La primera vez que ejecutas OCR para un idioma, el navegador descarga el modelo (~10 MB). Las siguientes reutilizan el archivo cacheado y arrancan al instante.

¿Puedo OCR-ear escritura a mano?

El modelo de reconocimiento está entrenado mayormente en texto impreso. La letra de imprenta limpia a veces funciona; cursiva o desordenada da basura. El OCR de escritura a mano es un problema bastante más difícil — los motores open-source para navegador todavía no lo manejan con fiabilidad, y preferimos no darte resultado a darte uno equivocado.

¿Por qué confunde 0/O y l/1?

Esos caracteres son visualmente idénticos en muchas fuentes — incluso un humano necesita contexto para distinguirlos. El motor usa un modelo de lenguaje para inclinar la elección, pero a veces falla. El modo confianza señala con precisión dónde revisar.

¿Puedo añadir más idiomas?

Por ahora exponemos los tres con más demanda del sitio (inglés, portugués, español), ya que cada modelo de idioma pesa unos 10 MB. Si necesitas otro idioma, ponte en contacto y lo valoramos.

El resultado está casi bien pero con errores menores.

Algunos errores de reconocimiento son normales en imágenes imperfectas. La caja de salida es editable precisamente por eso — corrige los errores obvios y luego copia o descarga. Para textos largos, pega en tu editor y pasa un corrector para limpiar el resto.

OCR — Extractor de Texto desde Imagen