PK Systems PK Systems
Teksttools

Tekst-extractor

Haal elk e-mailadres, URL, telefoonnummer, hashtag, mention, datum en IPv4-adres uit een blok rommelige tekst — direct.

Tekst-extractor

E-mails 0
URL's 0
Telefoonnummers 0
Hashtags 0
Vermeldingen 0
Datums 0
IPv4-adressen 0

Wat doet deze tool

Plak willekeurige tekst — een e-mailthread, een chatlog, een gekopieerde website, een CSV, een stacktrace — en de extractor haalt er gestructureerde fragmenten uit. Elke categorie heeft een eigen kaart met aantal en kopieerknop, zodat je alleen de e-mails (of alleen de URL's) kunt pakken zonder door de rest te ploegen. Werkt even goed op kleine fragmenten als op logs van meerdere megabytes.

Hoe gebruik je de extractor

Plak je tekst. Elke categoriekaart rechts wordt bijgewerkt terwijl je typt en toont wat er gevonden is. Schakel Duplicaten verwijderen aan om één kopie van elke unieke waarde te houden (handig voor e-mails en URL's uit een lange thread). Schakel Alfabetisch sorteren aan voor een voorspelbare volgorde in plaats van bronvolgorde. Klik op Kopiëren op een kaart om alleen die categorie naar je klembord te sturen.

Wat de patronen herkennen

E-mails: alles dat past bij local@domain.tld met minimaal een 2-letter-TLD. URL's: begint met http://, https:// of www.. Telefoons: internationaal, met optionele +, haakjes, streepjes, punten, spaties — minimaal 7 cijfers om postcodes uit te sluiten. Hashtags / mentions: standaard #tag / @handle met letters/cijfers/underscores. Datums: ISO, met schuine streep (US/EU) en met maandnaam. IPv4: dotted quads waarbij elk octet tussen 0-255 is.

Patronen en voorbeelden

Categorie Wat het herkent
E-mailsjane@example.com, support+sales@acme.co.uk
URL'shttps://example.com/path?q=1, www.acme.io
Telefoonnummers+1 (415) 555-0123, +44 20 7946 0958
Hashtags#launch, #summer2026
Vermeldingen@nasa, @jane.doe
Datums2026-05-06, 06/05/2026, May 6, 2026
IPv4-adressen192.168.1.1, 10.0.0.255

Veelgestelde vragen

Vindt het elk e-mailadres in mijn tekst?
Ja, voor elk redelijk e-mailformaat — local@domain.tld met een TLD van 2+ letters, plus punten, streepjes, plustekens en procentteken in het lokale deel. Verhulde vormen als jan (at) voorbeeld punt nl matchen niet — plak ze eerst met een echte @ als je ze eruit wilt.
Worden internationale telefoonnummers herkend?
Ja. Het patroon staat een optionele +, landcode, haakjes en elke mix van spaties, punten en streepjes toe. Nummers moeten minstens 7 cijfers hebben om als telefoon-achtig te tellen — dat filtert postcodes, bestelnummers en versiestrings uit.
Waarom worden korte hashtags genegeerd?
Het patroon vereist minstens 2 tekens na de # om ruis laag te houden. Hashtags van één teken zoals #1 zijn meestal paginering, voetnootmarkers of sectienummers, geen echte tags. Als je ze toch wilt vangen, gebruik je de regex-tool met een eigen patroon.
Welke datumformaten pikt het op?
ISO (2026-05-06), met schuine streep (06/05/2026 of 05/06/2026), met streepjes en met maandnaam zoals 6 mei 2026. De extractor probeert geen US-vs-EU-volgorde te raden — hij vangt de substring zoals die staat en laat het vertalen aan jou.
Worden duplicaten standaard verwijderd?
Ja — dat is het meest gevraagde, vooral voor e-mails en URL's in lange threads. Schakel Duplicaten verwijderen uit als je een frequentietelling of de oorspronkelijke volgorde wilt. Voor e-mails is ontdubbelen hoofdletter-ongevoelig (technisch zijn lokale delen hoofdlettergevoelig, maar adressen worden meestal als gelijk beschouwd in lowercase).
Verlaat mijn tekst de browser?
Nee. Alle extractie is regex-matching die lokaal op je apparaat draait. Bevestig dit met DevTools > Network — typen levert geen requests op. Veilig voor chatlogs, klantgegevens, interne documenten, alles wat gevoelig is.