PK Systems PK Systems
Strumenti di testo

Estrattore di testo

Estrai email, URL, numeri di telefono, hashtag, menzioni, date e indirizzi IPv4 da un blocco di testo disordinato — all'istante.

Estrattore di testo

Email 0
URL 0
Numeri di telefono 0
Hashtag 0
Menzioni 0
Date 0
Indirizzi IPv4 0

Cosa fa questo strumento

Inserisci qualsiasi testo — un thread email, una chat, un sito web che hai copiato, un CSV, uno stack trace — e l'estrattore tira fuori frammenti strutturati per te. Ogni categoria ha la sua scheda con conteggio e pulsante di copia, così puoi prendere solo le email (o solo gli URL) senza dover cercare nel resto. Funziona altrettanto bene su brevi snippet e su log di diversi megabyte.

Come usare l'estrattore

Incolla il tuo testo. Ogni scheda di categoria a destra si aggiorna mentre digiti, mostrando ciò che è stato trovato. Attiva Rimuovi duplicati per tenere una sola copia di ciascun valore univoco (utile per email e URL da un thread lungo). Attiva Ordina alfabeticamente se vuoi i risultati in un ordine prevedibile invece che nell'ordine del sorgente. Clicca su Copia in qualsiasi scheda per portare solo quella categoria negli appunti.

Cosa riconoscono i pattern

Email: qualsiasi cosa nel formato local@dominio.tld con TLD di almeno 2 lettere. URL: iniziano con http://, https:// o www.. Telefoni: internazionali, con + opzionale, parentesi, trattini, punti, spazi — minimo 7 cifre per evitare di catturare CAP. Hashtag / menzioni: #tag / @nome standard con lettere/cifre/underscore. Date: ISO, con barre (US/EU) e formati con nome del mese. IPv4: quattro numeri puntati con ogni ottetto validato tra 0 e 255.

Pattern ed esempi

Categoria Cosa cattura
Emailjane@example.com, support+sales@acme.co.uk
URLhttps://example.com/path?q=1, www.acme.io
Numeri di telefono+1 (415) 555-0123, +44 20 7946 0958
Hashtag#launch, #summer2026
Menzioni@nasa, @jane.doe
Date2026-05-06, 06/05/2026, May 6, 2026
Indirizzi IPv4192.168.1.1, 10.0.0.255

Domande frequenti

Trova ogni email nel mio testo?
Sì per qualsiasi formato email ragionevole — local@dominio.tld con TLD di 2 o più lettere, più punti, trattini, segni più e percentuali nella parte locale. Forme offuscate come jane (at) example dot com non corrisponderanno — incollale prima con il @ letterale se ti servono.
Vengono rilevati i numeri di telefono internazionali?
Sì. Il pattern accetta un + opzionale, prefisso internazionale, parentesi e qualsiasi mix di spazi, punti e trattini. I numeri devono avere almeno 7 cifre per essere considerati telefonici, il che esclude cose come CAP, numeri d'ordine e stringhe di versione.
Perché gli hashtag corti vengono ignorati?
Il pattern richiede almeno 2 caratteri dopo il # per ridurre il rumore. Gli hashtag a singolo carattere come #1 sono di solito impaginazioni, marcatori di nota a piè di pagina o numeri di sezione, non veri tag. Se ti servono, usa lo strumento di ricerca regex con un pattern personalizzato.
Quali formati di data riconosce?
ISO (2026-05-06), forme con barra (06/05/2026 o 05/06/2026), forme con trattini e stili con il nome del mese come 6 maggio 2026. L'estrattore non prova a indovinare l'ordine US o EU — cattura la sotto-stringa così come appare, lasciando a te la disambiguazione.
I duplicati vengono rimossi di default?
Sì — è la richiesta più comune, soprattutto per email e URL in thread lunghi. Disattiva Rimuovi duplicati se ti serve un conteggio di frequenza o l'ordine originale. Per le email, la deduplicazione è case-insensitive (perché tecnicamente la parte locale è case-sensitive ma gli indirizzi vengono di solito trattati come identici quando convertiti in minuscolo).
Il mio testo lascia il browser?
No. Tutta l'estrazione è matching regex che gira in locale sulla tua macchina. Puoi confermarlo con DevTools > Network — digitando nell'input non parte alcuna richiesta. Sicuro per chat log, dati clienti, documenti interni, qualsiasi cosa sensibile.