Encoder e decoder di entità HTML
Converti caratteri da e verso entità HTML — nominate, decimali o esadecimali, tutti i caratteri speciali o solo i cinque non sicuri. Round-trip sicuro.
Cosa sono le entità HTML?
Le entità HTML sono le sequenze di escape che permettono di inserire in un documento i caratteri con significato speciale per l'HTML — <, >, &, ", ' — senza che il parser li interpreti come markup. Esistono in tre varianti: nominate (&), numeriche decimali (&) e numeriche esadecimali (&). Tutte e tre vengono decodificate identicamente dai browser; la differenza è quanto sono leggibili nel sorgente.
Come usare questo strumento
Scegli Codifica per fare l'escape del testo prima di incollarlo nell'HTML, o Decodifica per riportare le entità ai caratteri originali. Scegli Nominata per un output leggibile (©), Decimale o Esadecimale per ambienti legacy che non riconoscono le entità nominate. Imposta l'Ambito a cinque non sicuri per il normale escape HTML; passa a tutti non ASCII se la tua destinazione è un contesto solo ASCII come un vecchio motore di template di email. Il pulsante Inverti scambia il lato codificato e decodificato così puoi fare un round-trip e confermare che nulla si sia perso.
Nominata vs numerica — quale scegliere?
Le entità nominate si leggono meglio nel sorgente — © dice al prossimo sviluppatore che è un simbolo di copyright; © no. Sono anche leggermente più compatte per i caratteri comuni. Le entità numeriche, d'altro canto, sono universali: ogni codepoint Unicode ne ha una, mentre la tabella delle entità nominate è fissata ai 252 nomi forniti da HTML5. Usa le nominate per i cinque comuni più una manciata di preferiti tipografici (—, …, ©); ricorri alle numeriche quando incontri un carattere senza nome canonico.
I cinque caratteri da escapare sempre
| Carattere | Nominato | Decimale | Esadecimale | Quando usarlo |
|---|---|---|---|---|
< | < | < | < | Sempre nel contenuto degli elementi; altrimenti il parser pensa che stia iniziando un tag. |
> | > | > | > | Meno critico, ma escapalo per simmetria e per evitare casi limite con browser vecchi. |
& | & | & | & | Sempre — è l'inizio di ogni entità, lasciarlo nudo confonde il parser. |
" | " | " | " | Dentro i valori di attributi tra virgolette doppie. |
' | ' | ' | ' | Dentro i valori di attributi tra apici singoli. Usa l'entità numerica in HTML4 — ' è diventata standard solo in HTML5. |
Domande frequenti
Devo codificare ogni carattere?
&, <, >, ", '. La modalità tutti non ASCII esiste per i sistemi legacy non puliti UTF-8.Le entità HTML sono uguali alla codifica URL?
%20 per lo spazio) è per gli URL; le entità HTML (&) sono per l'HTML. Sono meccanismi di escape diversi applicati a livelli diversi. Dentro un href potresti avere bisogno di entrambi: codifica in percent l'URL, poi codifica in HTML l'ampersand se è in un attributo.' funziona in HTML4?
' è stata introdotta come entità nominata standard in HTML5; le specifiche più vecchie la definiscono solo in XML. Per la massima portabilità nei contesti legacy, usa la forma numerica '.Cosa gestisce la modalità Decodifica?
&, esadecimale &) più l'intero set di entità nominate HTML5 — oltre 2.200 nomi. La decodifica è un superset stretto dell'encoder.Questo strumento invia il mio testo da qualche parte?
In cosa differisce da encodeURIComponent di JavaScript?
encodeURIComponent codifica in percent per gli URL (café diventa caf%C3%A9). La codifica delle entità HTML produce café o café. Usa quella giusta per il contesto giusto — e il nostro URL parser se invece devi ispezionare la codifica URL.