PK Systems PK Systems
Ferramentas de texto

Removedor de HTML

Cole qualquer HTML e obtenha texto plano, limpo e legível — tags removidas, entidades decodificadas, espaços ajustados.

Removedor de HTML

Texto plano

O que esta ferramenta faz

Cole um pedaço de HTML — direto do código-fonte de uma página, de um modelo de e-mail, da exportação de um CMS ou de uma página que você copiou com formatação — e obtenha texto plano legível do outro lado. Tags de bloco viram quebra de linha, <br> vira nova linha, tags de âncora podem opcionalmente preservar suas URLs entre parênteses, e entidades nomeadas/numéricas (&amp;, &#x2014;) são decodificadas em caracteres de verdade.

Como usar o removedor

Cole seu HTML no campo de entrada. A saída em texto plano atualiza enquanto você digita. Use Manter URLs dos links para preservar os hrefs das tags <a> entre parênteses depois do texto do link — útil para versões impressas. Compactar espaços extras reduz sequências de espaços e linhas em branco vindas de HTML indentado, e Aparar remove espaços do início e do fim do texto. Clique em Copiar para colocar o resultado no clipboard.

Quando usar esta ferramenta

Limpar conteúdo colado de uma página web (que costuma vir com <span> avulsos e estilos inline), preparar copy de newsletter a partir de um rascunho HTML, gerar alt-text de blocos ricos, ou simplesmente verificar o conteúdo legível de um trecho de markup. A saída serve onde for preciso texto plano: e-mails sem formatação, terminal, descrições para mecanismos de busca ou análise de tamanho.

Exemplos

Entrada Saída
<p>Hello <b>world</b></p>Hello world
Line one<br>Line twoLine one
Line two
<ul><li>A</li><li>B</li></ul>A
B
<a href="x.com">Site</a>Site (x.com)
&amp; &quot;& "

Perguntas frequentes

Remove todas as tags?
Sim — toda tag HTML é removida. Tags de bloco (<p>, <div>, <li>, títulos, etc.) viram quebras de linha, então as quebras de parágrafo são preservadas. <br> também vira quebra. <script>, <style> e similares têm seu conteúdo descartado por inteiro, que é quase sempre o que você quer.
As entidades HTML são decodificadas?
Sim. Entidades nomeadas (&amp;, &quot;, &mdash;, &ndash;, &hellip; etc.) e numéricas (&#8211;, &#x2014;) viram os caracteres reais. Ou seja, &amp; vira &, &mdash; vira um travessão de verdade.
O que faz Manter URLs dos links?
Quando ativo, <a href="https://example.com">site</a> vira site (https://example.com) em vez de só site. Útil para impressão ou onde o leitor não pode clicar. Quando desligado, só o texto visível é mantido e a URL é descartada.
Como os espaços em branco são tratados?
Por padrão, sequências de espaços/tabs viram espaço único e três ou mais linhas em branco viram duas. Cada linha também tem o espaço final aparado. Desligue Compactar espaços extras para ver exatamente o que saiu do parser, com as quebras originais do HTML preservadas.
Posso colar uma página HTML inteira?
Sim. Blocos <script>, <style>, <noscript>, <template> e <iframe> têm o conteúdo descartado, então a saída é o texto legível da página — aproximadamente o que um leitor de tela ou um buscador veria. Para páginas muito grandes, a conversão ainda termina no seu navegador, sem ida ao servidor.
Meu HTML é enviado para algum lugar?
Não. O removedor roda inteiramente no seu navegador usando regex em strings — sem renderização de DOM, sem fetch, sem upload. Seguro para modelos internos de e-mail, rascunhos de artigo ou qualquer markup que você não quer vazar.