Codificador e Decodificador de Entidades HTML
Converte caracteres em entidades HTML — nomeadas, decimais ou hex, todos os especiais ou apenas os cinco perigosos. Round-trip seguro.
O que são entidades HTML?
Entidades HTML são as sequências de escape que permitem usar caracteres com significado especial no HTML — <, >, &, ", ' — sem que o parser interprete como marcação. Vêm em três sabores: nomeadas (&), numéricas decimais (&) e numéricas hex (&). Os três são decodificados de forma idêntica pelos navegadores; a diferença é a legibilidade no código-fonte.
Como usar a ferramenta
Escolha Codificar para escapar texto antes de colar no HTML, ou Decodificar para reverter entidades de volta aos caracteres originais. Selecione Nomeada para saída legível (©), Decimal ou Hex para ambientes legados que não reconhecem entidades nomeadas. Configure Escopo em cinco perigosos para escape HTML padrão; mude para todos não-ASCII se o destino é só ASCII, como engines antigas de template de e-mail. O botão Trocar inverte os lados codificado e decodificado para você fazer round-trip e confirmar que nada se perdeu.
Nomeada vs. numérica — qual escolher?
Entidades nomeadas leem melhor no código — © deixa claro que é o símbolo de copyright; © não. Também são um pouco mais compactas para caracteres comuns. Entidades numéricas, por outro lado, são universais: todo codepoint Unicode tem uma, enquanto a tabela de nomeadas é fixa nas 252 do HTML5. Use nomeadas para os cinco comuns mais alguns favoritos de tipografia (—, …, ©); apele para a numérica quando bater num caractere sem nome canônico.
Os cinco caracteres que sempre escapamos
| Caractere | Nomeada | Decimal | Hex | Quando usar |
|---|---|---|---|---|
< | < | < | < | Sempre em conteúdo de elemento; senão o parser pensa que uma tag começa. |
> | > | > | > | Menos crítico, mas escape por simetria e para evitar quirks de navegadores antigos. |
& | & | & | & | Sempre — começa toda entidade, deixar bare confunde o parser. |
" | " | " | " | Em valores de atributo com aspas duplas. |
' | ' | ' | ' | Em valores de atributo com aspas simples. Use a entidade numérica em HTML4 — ' só virou padrão no HTML5. |
Perguntas frequentes
Preciso codificar todo caractere?
&, <, >, ", '. O modo todos não-ASCII existe para sistemas legados que não lidam bem com UTF-8.Entidades HTML são iguais a URL encoding?
%20 para espaço) é para URLs; entidades HTML (&) são para HTML. São mecanismos diferentes em camadas diferentes. Dentro de um href, talvez você precise dos dois: percent-encode a URL e depois HTML-encode o ampersand se ele estiver num atributo.' funciona em HTML4?
' entrou como entidade nomeada padrão no HTML5; versões anteriores só definiam em XML. Para máxima portabilidade em contextos legados, use a forma numérica '.O que o modo Decodificar trata?
&, hex &) e o conjunto completo de entidades nomeadas do HTML5 — mais de 2.200 nomes. Decodificar é um superconjunto estrito do codificador.A ferramenta envia meu texto para algum lugar?
Em que ela difere de encodeURIComponent do JavaScript?
encodeURIComponent faz percent-encoding para URLs (café vira caf%C3%A9). Entidade HTML produz café ou café. Use a certa para o contexto certo — e nosso analisador de URL se quiser inspecionar URL encoding.
EN
PT
ES