PK Systems PK Systems
Herramientas de texto

Extractor de Texto

Saca todos los correos, URLs, teléfonos, hashtags, menciones, fechas y direcciones IPv4 de un bloque de texto desordenado — al instante.

Extractor de Texto

Correos 0
URLs 0
Teléfonos 0
Hashtags 0
Menciones 0
Fechas 0
Direcciones IPv4 0

Qué hace esta herramienta

Pega cualquier texto — un hilo de correos, un log de chat, un sitio que copiaste, un CSV, un stack trace — y el extractor saca los fragmentos estructurados por ti. Cada categoría tiene su propia tarjeta con un conteo y un botón de copiar, así puedes tomar solo los correos (o solo las URLs) sin escarbar el resto. Funciona igual de bien con fragmentos pequeños y con logs de varios megabytes.

Cómo usar el extractor

Pega tu texto. Cada tarjeta de categoría a la derecha se actualiza mientras escribes, mostrando lo que se encontró. Activa Quitar duplicados para conservar una copia de cada valor único (útil para correos y URLs en hilos largos). Activa Ordenar alfabéticamente si quieres los resultados en un orden previsible en lugar del orden del texto. Haz clic en Copiar en cualquier tarjeta para llevar solo esa categoría al portapapeles.

Qué reconoce cada patrón

Correos: cualquier cosa tipo local@dominio.tld con TLD de al menos 2 letras. URLs: empieza con http://, https:// o www.. Teléfonos: internacional, con +, paréntesis, guiones, puntos y espacios opcionales — mínimo 7 dígitos para evitar capturar códigos postales. Hashtags / menciones: #tag / @usuario con letras/dígitos/guion bajo. Fechas: ISO, con barras (US/EU) y formas con nombre del mes. IPv4: cuartetos con cada octeto entre 0 y 255.

Patrones y ejemplos

Categoría Qué reconoce
Correosjane@example.com, support+sales@acme.co.uk
URLshttps://example.com/path?q=1, www.acme.io
Teléfonos+1 (415) 555-0123, +44 20 7946 0958
Hashtags#launch, #summer2026
Menciones@nasa, @jane.doe
Fechas2026-05-06, 06/05/2026, May 6, 2026
Direcciones IPv4192.168.1.1, 10.0.0.255

Preguntas frecuentes

¿Encontrará todos los correos en mi texto?
Sí para cualquier formato razonable de correo — local@dominio.tld con TLD de 2+ letras, más puntos, guiones, signos de más y porcentajes en la parte local. Las formas ofuscadas como jane (at) example dot com no coinciden — reemplaza por @ literal antes si necesitas extraerlas.
¿Se detectan teléfonos internacionales?
Sí. El patrón permite + opcional, código de país, paréntesis y cualquier mezcla de espacios, puntos y guiones. Los números deben tener al menos 7 dígitos para considerarse teléfono, lo que filtra códigos postales, números de orden y versiones.
¿Por qué se ignoran los hashtags cortos?
El patrón requiere al menos 2 caracteres después del # para reducir ruido. Los hashtags de un solo carácter como #1 suelen ser numeración, marcador de nota o número de sección, no etiquetas reales. Si necesitas capturarlos, usa la herramienta de búsqueda regex con un patrón propio.
¿Qué formatos de fecha se reconocen?
ISO (2026-05-06), con barras (06/05/2026 o 05/06/2026), con guiones, y estilos con nombre del mes como May 6, 2026. El extractor no intenta adivinar el orden US/EU — captura la subcadena tal como aparece y deja la desambiguación a ti.
¿Los duplicados se quitan por defecto?
Sí — es la solicitud más común, sobre todo para correos y URLs en hilos largos. Apaga Quitar duplicados si necesitas conteo de frecuencia o el orden original. Para correos, la deduplicación no distingue mayúsculas (porque la parte local es técnicamente sensible, pero las direcciones suelen tratarse como iguales en minúsculas).
¿Mi texto sale del navegador?
No. Toda la extracción es regex que corre localmente. Puedes confirmarlo con DevTools > Network — escribir no dispara peticiones. Seguro para logs de chat, datos de cliente, documentos internos, cualquier cosa sensible.