Pular para o conteúdo

Remover tags HTML com SED

Dica publicada em Shell Script / Expressões Regulares
Fábio Berbert de Paula fabio
Hits: 4.806 Categoria: Shell Script Subcategoria: Expressões Regulares
  • Indicar
  • Impressora
  • Denunciar

Remover tags HTML com SED

Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:



ou



note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:

echo 'Link aqui
' | sed 's/<[^>]*>//g'

Link aqui

Onde:
  • /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
  • //g = substitua todas as ocorrências do padrão acima por nada

Simples assim!

Como fazer diff entre duas imagens

Convertendo vídeo OGV (vídeo/OGG) para AVI/MPEG/MP4

Carteira de Bitcoin Electrum no Linux

Como ordenar arquivos por tamanho

SQL: Combinando INSERT + SELECT para duplicação de registros

Screen (janelas) no modo shell?

Expressão regular para validar um IP

Extraindo seu endereço IP com shell script (egrep + awk)

Múltiplas expressões no SED

Eliminando linhas de comentário ou linhas em branco no Linux

#1 Comentário enviado por maurixnovatrento em 14/06/2020 - 21:09h

Essas instruções com sed estão cada vez melhores.

___________________________________
Conhecimento não se Leva para o Túmulo.

Contribuir com comentário

Entre na sua conta para comentar.