PK Systems PK Systems
Strumenti di testo

Removedor di HTML

Incolla qualsiasi HTML e ottieni testo semplice, pulito e leggibile — tag rimossi, entità decodificate, spazi sistemati.

Removedor di HTML

Testo semplice

Cosa fa questo strumento

Incolla un blocco di HTML — preso direttamente dal codice sorgente di una pagina, da un template di email, dall'esportazione di un CMS rich-text o da una pagina che hai copiato con la formattazione — e ottieni testo semplice e leggibile in uscita. I tag a livello di blocco diventano a capo, <br> diventa una nuova riga, i tag di ancoraggio possono opzionalmente conservare le loro URL tra parentesi, e le entità con nome/numeriche (&amp;, &#x2014;) vengono decodificate nei caratteri reali.

Come usare il removedor di HTML

Incolla il tuo HTML nel campo di input. L'output in testo semplice si aggiorna mentre digiti. Usa Mantieni URL dei link per preservare gli href delle <a> tra parentesi dopo il testo del link — utile per versioni stampabili degli articoli. Compatta spazi extra riduce le sequenze di spazi e righe vuote che provengono da HTML indentato, e Rifila rimuove gli spazi iniziali e finali da tutto l'output. Clicca su Copia per portare il risultato negli appunti.

Quando usare questo strumento

Pulire contenuti incollati da una pagina web (che spesso arrivano con <span> sparsi e stili in linea), preparare il copy di una newsletter da una bozza HTML, generare alt-text da blocchi di contenuto rich-text, o semplicemente verificare il contenuto leggibile di uno snippet di markup. L'output è adatto ovunque serva testo semplice: email solo testo, output da terminale, descrizioni per motori di ricerca o analisi della lunghezza del contenuto.

Esempi

Input Output
<p>Hello <b>world</b></p>Hello world
Line one<br>Line twoLine one
Line two
<ul><li>A</li><li>B</li></ul>A
B
<a href="x.com">Site</a>Site (x.com)
&amp; &quot;& "

Domande frequenti

Rimuove tutti i tag?
Sì — ogni tag HTML viene rimosso. I tag a livello di blocco (<p>, <div>, <li>, intestazioni, ecc.) diventano a capo, così le interruzioni di paragrafo vengono preservate. Anche <br> diventa un a capo. <script>, <style> e tag simili hanno il loro contenuto scartato del tutto, che è quasi sempre quello che si vuole.
Le entità HTML vengono decodificate?
Sì. Sia le entità nominate (&amp;, &quot;, &mdash;, &ndash;, &hellip;, ecc.) sia quelle numeriche (&#8211;, &#x2014;) vengono convertite nei caratteri reali. Quindi &amp; diventa &, &mdash; diventa un vero trattino lungo.
Cosa fa Mantieni URL dei link?
Quando è attivo, <a href="https://example.com">sito</a> diventa sito (https://example.com) invece di solo sito. Utile per la stampa o ovunque il lettore non possa cliccare. Quando è disattivato, viene mantenuto solo il testo visibile e la URL viene scartata.
Come vengono gestiti gli spazi?
Per impostazione predefinita, le sequenze di spazi/tab vengono compattate in singoli spazi, e tre o più righe vuote diventano due. Ogni riga viene anche ripulita degli spazi finali. Disattiva Compatta spazi extra per vedere esattamente cosa è uscito dal parser, con le interruzioni di riga originali dell'HTML sorgente preservate.
Posso incollare un'intera pagina HTML?
Sì. I blocchi <script>, <style>, <noscript>, <template> e <iframe> hanno il loro contenuto scartato, quindi l'output è la copia leggibile della pagina — più o meno quello che vedrebbe uno screen reader o un motore di ricerca. Per pagine molto grandi, la conversione si conclude comunque nel browser senza un round-trip al server.
Il mio HTML viene caricato da qualche parte?
No. Il removedor di HTML gira interamente nel tuo browser usando regex su stringhe — niente rendering del DOM, niente fetch, niente upload. Sicuro per template di email interne, articoli in bozza o qualsiasi markup che non vuoi far uscire.