PK Systems PK Systems
Web e marketing

Encoder e decoder di entità HTML

Converti caratteri da e verso entità HTML — nominate, decimali o esadecimali, tutti i caratteri speciali o solo i cinque non sicuri. Round-trip sicuro.

Encoder e decoder di entità HTML

Codifica &, <, >, ", '. Ideale per il contenuto degli attributi e degli elementi HTML.

Codificato

Cosa sono le entità HTML?

Le entità HTML sono le sequenze di escape che permettono di inserire in un documento i caratteri con significato speciale per l'HTML — <, >, &, ", ' — senza che il parser li interpreti come markup. Esistono in tre varianti: nominate (&amp;), numeriche decimali (&#38;) e numeriche esadecimali (&#x26;). Tutte e tre vengono decodificate identicamente dai browser; la differenza è quanto sono leggibili nel sorgente.

Come usare questo strumento

Scegli Codifica per fare l'escape del testo prima di incollarlo nell'HTML, o Decodifica per riportare le entità ai caratteri originali. Scegli Nominata per un output leggibile (&copy;), Decimale o Esadecimale per ambienti legacy che non riconoscono le entità nominate. Imposta l'Ambito a cinque non sicuri per il normale escape HTML; passa a tutti non ASCII se la tua destinazione è un contesto solo ASCII come un vecchio motore di template di email. Il pulsante Inverti scambia il lato codificato e decodificato così puoi fare un round-trip e confermare che nulla si sia perso.

Nominata vs numerica — quale scegliere?

Le entità nominate si leggono meglio nel sorgente — &copy; dice al prossimo sviluppatore che è un simbolo di copyright; &#169; no. Sono anche leggermente più compatte per i caratteri comuni. Le entità numeriche, d'altro canto, sono universali: ogni codepoint Unicode ne ha una, mentre la tabella delle entità nominate è fissata ai 252 nomi forniti da HTML5. Usa le nominate per i cinque comuni più una manciata di preferiti tipografici (&mdash;, &hellip;, &copy;); ricorri alle numeriche quando incontri un carattere senza nome canonico.

I cinque caratteri da escapare sempre

Carattere Nominato Decimale Esadecimale Quando usarlo
<&lt;&#60;&#x3C;Sempre nel contenuto degli elementi; altrimenti il parser pensa che stia iniziando un tag.
>&gt;&#62;&#x3E;Meno critico, ma escapalo per simmetria e per evitare casi limite con browser vecchi.
&&amp;&#38;&#x26;Sempre — è l'inizio di ogni entità, lasciarlo nudo confonde il parser.
"&quot;&#34;&#x22;Dentro i valori di attributi tra virgolette doppie.
'&apos;&#39;&#x27;Dentro i valori di attributi tra apici singoli. Usa l'entità numerica in HTML4 — &apos; è diventata standard solo in HTML5.

Domande frequenti

Devo codificare ogni carattere?
No. L'HTML moderno è UTF-8, quindi lettere accentate, emoji e script non latini possono stare nel sorgente così come sono. Devi solo escapare i cinque caratteri con significato strutturale: &, <, >, ", '. La modalità tutti non ASCII esiste per i sistemi legacy non puliti UTF-8.
Le entità HTML sono uguali alla codifica URL?
No. La codifica URL (%20 per lo spazio) è per gli URL; le entità HTML (&amp;) sono per l'HTML. Sono meccanismi di escape diversi applicati a livelli diversi. Dentro un href potresti avere bisogno di entrambi: codifica in percent l'URL, poi codifica in HTML l'ampersand se è in un attributo.
&apos; funziona in HTML4?
Non in modo affidabile. &apos; è stata introdotta come entità nominata standard in HTML5; le specifiche più vecchie la definiscono solo in XML. Per la massima portabilità nei contesti legacy, usa la forma numerica &#39;.
Cosa gestisce la modalità Decodifica?
Entrambe le forme numeriche (decimale &#38;, esadecimale &#x26;) più l'intero set di entità nominate HTML5 — oltre 2.200 nomi. La decodifica è un superset stretto dell'encoder.
Questo strumento invia il mio testo da qualche parte?
No. Codifica e decodifica girano entrambe nel tuo browser. Apri DevTools > Network e non vedrai partire alcuna richiesta mentre digiti. È sicuro incollare copy sensibile nell'input.
In cosa differisce da encodeURIComponent di JavaScript?
Livello completamente diverso. encodeURIComponent codifica in percent per gli URL (café diventa caf%C3%A9). La codifica delle entità HTML produce caf&#233; o caf&eacute;. Usa quella giusta per il contesto giusto — e il nostro URL parser se invece devi ispezionare la codifica URL.