PK Systems PK Systems
Text-Tools

Text-Extraktor

Extrahieren Sie E-Mails, URLs, Telefonnummern, IP-Adressen, Hashtags oder eigene Regex-Treffer aus jedem Text.

Text-Extraktor

E-Mails 0
URLs 0
Telefonnummern 0
Hashtags 0
Erwähnungen 0
Daten 0
IPv4-Adressen 0

Was dieses Tool macht

Wirf beliebigen Text hinein – einen E-Mail-Verlauf, ein Chatprotokoll, eine kopierte Website, eine CSV, einen Stack-Trace – und der Extraktor zieht strukturierte Fragmente heraus. Jede Kategorie bekommt eine eigene Karte mit Anzahl und Kopier-Button, sodass du nur die E-Mails (oder nur die URLs) greifen kannst, ohne den Rest zu durchforsten. Funktioniert gleichermaßen gut bei kleinen Schnipseln und bei mehreren Megabyte großen Logs.

So nutzt du den Extraktor

Füge deinen Text ein. Jede Kategoriekarte rechts aktualisiert sich beim Tippen und zeigt, was gefunden wurde. Aktiviere Duplikate entfernen, um nur eine Kopie jedes eindeutigen Werts zu behalten (nützlich für E-Mails und URLs aus einem langen Verlauf). Aktiviere Alphabetisch sortieren, wenn du die Ergebnisse in einer vorhersehbaren Reihenfolge statt in der Quellreihenfolge willst. Klicke auf Kopieren einer beliebigen Karte, um nur diese Kategorie in die Zwischenablage zu legen.

Was die Muster erkennen

E-Mails: alles, was zu local@domain.tld passt, mit mindestens 2-buchstabiger TLD. URLs: beginnen mit http://, https:// oder www.. Telefonnummern: international, mit optionalem +, Klammern, Bindestrichen, Punkten, Leerzeichen – mindestens 7 Ziffern, um Postleitzahlen auszuschließen. Hashtags / Erwähnungen: Standard #tag / @handle mit Buchstaben/Ziffern/Unterstrichen. Daten: ISO, mit Schrägstrichen (US/EU) und Monatsnamen-Formen. IPv4: punktgetrennte Quadrupel mit jedem Oktett auf 0–255 validiert.

Muster und Beispiele

Kategorie Was es erkennt
E-Mailsjane@example.com, support+sales@acme.co.uk
URLshttps://example.com/path?q=1, www.acme.io
Telefonnummern+1 (415) 555-0123, +44 20 7946 0958
Hashtags#launch, #summer2026
Erwähnungen@nasa, @jane.doe
Daten2026-05-06, 06/05/2026, May 6, 2026
IPv4-Adressen192.168.1.1, 10.0.0.255

Häufig gestellte Fragen

Findet es jede E-Mail in meinem Text?
Ja, für jedes vernünftige E-Mail-Format – local@domain.tld mit einer 2+ Buchstaben langen TLD plus Punkten, Bindestrichen, Plus- und Prozentzeichen im lokalen Teil. Verschleierte Formen wie jane (at) example dot com passen nicht – füge sie zuerst mit dem literalen @ ein, falls du sie herausziehen willst.
Werden internationale Telefonnummern erkannt?
Ja. Das Muster erlaubt ein optionales +, Ländervorwahl, Klammern und jede Mischung aus Leerzeichen, Punkten und Bindestrichen. Nummern müssen mindestens 7 Ziffern haben, um als telefonähnlich zu gelten, was Dinge wie Postleitzahlen, Bestellnummern und Versionsstrings ausfiltert.
Warum werden kurze Hashtags ignoriert?
Das Muster verlangt mindestens 2 Zeichen nach dem #, um Rauschen zu reduzieren. Einzeichen-Hashtags wie #1 sind meist Paginierung, Fußnotenmarker oder Abschnittsnummern, keine echten Tags. Wenn du sie erfassen musst, nutze das Regex-Find-Tool mit einem eigenen Muster.
Welche Datumsformate erkennt es?
ISO (2026-05-06), Schrägstrich-Formen (06/05/2026 oder 05/06/2026), Bindestrich-Formen und Monatsnamen-Stile wie May 6, 2026. Der Extraktor versucht nicht, US- vs. EU-Reihenfolge zu erraten – er erfasst die Teilzeichenfolge, wie sie erscheint, und überlässt dir die Zuordnung.
Werden Duplikate standardmäßig entfernt?
Ja – das ist die häufigste Anfrage, besonders bei E-Mails und URLs in langen Verläufen. Schalte Duplikate entfernen aus, wenn du eine Häufigkeitszählung oder die Originalreihenfolge brauchst. Bei E-Mails wird die Deduplizierung ohne Berücksichtigung der Groß-/Kleinschreibung durchgeführt (da E-Mail-Lokalanteile technisch case-sensitive sind, Adressen in Kleinschreibung aber meist als identisch behandelt werden).
Verlässt mein Text den Browser?
Nein. Die gesamte Extraktion ist Regex-Matching, das lokal auf deinem Rechner läuft. Du kannst es in DevTools > Netzwerk bestätigen – beim Tippen ins Eingabefeld werden keine Anfragen ausgelöst. Sicher für Chatprotokolle, Kundendaten, interne Dokumente, alles Sensible.