PK Systems PK Systems
Web e marketing

Codificador e Decodificador de Entidades HTML

Converte caracteres em entidades HTML — nomeadas, decimais ou hex, todos os especiais ou apenas os cinco perigosos. Round-trip seguro.

Codificador e Decodificador de Entidades HTML

Codifica &, <, >, ", '. Ideal para conteúdo de elemento e atributo HTML.

Codificado

O que são entidades HTML?

Entidades HTML são as sequências de escape que permitem usar caracteres com significado especial no HTML — <, >, &, ", ' — sem que o parser interprete como marcação. Vêm em três sabores: nomeadas (&amp;), numéricas decimais (&#38;) e numéricas hex (&#x26;). Os três são decodificados de forma idêntica pelos navegadores; a diferença é a legibilidade no código-fonte.

Como usar a ferramenta

Escolha Codificar para escapar texto antes de colar no HTML, ou Decodificar para reverter entidades de volta aos caracteres originais. Selecione Nomeada para saída legível (&copy;), Decimal ou Hex para ambientes legados que não reconhecem entidades nomeadas. Configure Escopo em cinco perigosos para escape HTML padrão; mude para todos não-ASCII se o destino é só ASCII, como engines antigas de template de e-mail. O botão Trocar inverte os lados codificado e decodificado para você fazer round-trip e confirmar que nada se perdeu.

Nomeada vs. numérica — qual escolher?

Entidades nomeadas leem melhor no código — &copy; deixa claro que é o símbolo de copyright; &#169; não. Também são um pouco mais compactas para caracteres comuns. Entidades numéricas, por outro lado, são universais: todo codepoint Unicode tem uma, enquanto a tabela de nomeadas é fixa nas 252 do HTML5. Use nomeadas para os cinco comuns mais alguns favoritos de tipografia (&mdash;, &hellip;, &copy;); apele para a numérica quando bater num caractere sem nome canônico.

Os cinco caracteres que sempre escapamos

Caractere Nomeada Decimal Hex Quando usar
<&lt;&#60;&#x3C;Sempre em conteúdo de elemento; senão o parser pensa que uma tag começa.
>&gt;&#62;&#x3E;Menos crítico, mas escape por simetria e para evitar quirks de navegadores antigos.
&&amp;&#38;&#x26;Sempre — começa toda entidade, deixar bare confunde o parser.
"&quot;&#34;&#x22;Em valores de atributo com aspas duplas.
'&apos;&#39;&#x27;Em valores de atributo com aspas simples. Use a entidade numérica em HTML4 — &apos; só virou padrão no HTML5.

Perguntas frequentes

Preciso codificar todo caractere?
Não. HTML moderno é UTF-8, então letras acentuadas, emoji e scripts não-Latinos podem ficar no fonte como estão. Você só precisa escapar os cinco com significado estrutural: &, <, >, ", '. O modo todos não-ASCII existe para sistemas legados que não lidam bem com UTF-8.
Entidades HTML são iguais a URL encoding?
Não. URL encoding (%20 para espaço) é para URLs; entidades HTML (&amp;) são para HTML. São mecanismos diferentes em camadas diferentes. Dentro de um href, talvez você precise dos dois: percent-encode a URL e depois HTML-encode o ampersand se ele estiver num atributo.
&apos; funciona em HTML4?
Não com confiança. &apos; entrou como entidade nomeada padrão no HTML5; versões anteriores só definiam em XML. Para máxima portabilidade em contextos legados, use a forma numérica &#39;.
O que o modo Decodificar trata?
As duas formas numéricas (decimal &#38;, hex &#x26;) e o conjunto completo de entidades nomeadas do HTML5 — mais de 2.200 nomes. Decodificar é um superconjunto estrito do codificador.
A ferramenta envia meu texto para algum lugar?
Não. Codificar e decodificar rodam no navegador. Abra DevTools > Network e nenhuma requisição é feita enquanto você digita. É seguro colar conteúdo sensível.
Em que ela difere de encodeURIComponent do JavaScript?
Camada totalmente diferente. encodeURIComponent faz percent-encoding para URLs (café vira caf%C3%A9). Entidade HTML produz caf&#233; ou caf&eacute;. Use a certa para o contexto certo — e nosso analisador de URL se quiser inspecionar URL encoding.