PK Systems PK Systems
Outils texte

Extracteur de texte

Extrayez instantanément chaque e-mail, URL, numéro de téléphone, hashtag, mention, date et adresse IPv4 d'un texte en vrac.

Extracteur de texte

E-mails 0
URL 0
Numéros de téléphone 0
Hashtags 0
Mentions 0
Dates 0
Adresses IPv4 0

Ce que fait cet outil

Déposez n'importe quel texte — un fil d'e-mails, un journal de chat, un site web copié, un CSV, une stack trace — et l'extracteur isole pour vous des fragments structurés. Chaque catégorie a sa propre carte avec un compteur et un bouton de copie, pour récupérer juste les e-mails (ou juste les URL) sans fouiller dans le reste. Fonctionne aussi bien sur de petits extraits que sur des logs de plusieurs mégaoctets.

Comment utiliser l'extracteur

Collez votre texte. Chaque carte de catégorie sur la droite se met à jour pendant que vous tapez et affiche ce qui a été trouvé. Activez Supprimer les doublons pour ne garder qu'une copie de chaque valeur unique (utile pour des e-mails et URL extraits d'un long fil). Activez Trier par ordre alphabétique pour avoir les résultats dans un ordre prévisible plutôt que dans l'ordre source. Cliquez sur Copier sur n'importe quelle carte pour mettre uniquement cette catégorie dans votre presse-papiers.

Ce que les motifs reconnaissent

E-mails : tout ce qui correspond à local@domaine.tld avec un TLD d'au moins 2 lettres. URL : commence par http://, https:// ou www.. Téléphones : internationaux, avec +, parenthèses, tirets, points, espaces optionnels — minimum 7 chiffres pour ne pas attraper de codes postaux. Hashtags / mentions : #tag / @pseudo standards, avec lettres/chiffres/underscores. Dates : ISO, à barres (US/EU) et formes avec nom de mois. IPv4 : quadruplets pointés avec chaque octet validé entre 0 et 255.

Motifs et exemples

Catégorie Ce qui est capturé
E-mailsjane@example.com, support+sales@acme.co.uk
URLhttps://example.com/path?q=1, www.acme.io
Numéros de téléphone+1 (415) 555-0123, +44 20 7946 0958
Hashtags#launch, #summer2026
Mentions@nasa, @jane.doe
Dates2026-05-06, 06/05/2026, May 6, 2026
Adresses IPv4192.168.1.1, 10.0.0.255

Questions fréquentes

Va-t-il trouver tous les e-mails de mon texte ?
Oui pour tout format d'e-mail raisonnable — local@domaine.tld avec un TLD de 2 lettres ou plus, plus points, tirets, plus et signes pour cent dans la partie locale. Les formes obfusquées comme jane (chez) example point com ne matcheront pas — collez-les avec le @ littéral d'abord si vous voulez les sortir.
Les numéros internationaux sont-ils détectés ?
Oui. Le motif autorise un + optionnel, un indicatif pays, des parenthèses et un mélange d'espaces, points et tirets. Les numéros doivent avoir au moins 7 chiffres pour être considérés comme téléphone, ce qui filtre les codes postaux, numéros de commande et chaînes de version.
Pourquoi les hashtags courts sont-ils ignorés ?
Le motif exige au moins 2 caractères après le # pour limiter le bruit. Les hashtags d'un seul caractère comme #1 sont en général de la pagination, des appels de note ou des numéros de section, pas de vrais tags. Pour les capturer, utilisez l'outil de recherche regex avec un motif personnalisé.
Quels formats de date sont reconnus ?
ISO (2026-05-06), formes à barres (06/05/2026 ou 05/06/2026), formes à tirets, et styles avec nom de mois comme 6 mai 2026. L'extracteur n'essaie pas de deviner l'ordre US ou EU — il capture la sous-chaîne telle qu'elle apparaît, en vous laissant désambiguïser.
Les doublons sont-ils retirés par défaut ?
Oui — c'est la demande la plus fréquente, surtout pour les e-mails et les URL dans de longs fils. Désactivez Supprimer les doublons si vous avez besoin d'un comptage de fréquence ou de l'ordre d'origine. Pour les e-mails, la déduplication est insensible à la casse (puisque la partie locale est techniquement sensible mais qu'en pratique on traite les adresses comme identiques en minuscules).
Mon texte sort-il du navigateur ?
Non. Toute l'extraction est du regex matching qui tourne localement sur votre machine. Vérifiez avec DevTools > Réseau — taper dans le champ ne déclenche aucune requête. Sûr pour des journaux de chat, des données client, des documents internes, tout contenu sensible.