Program för att extrahera text mellan HTML-taggar?

Här diskuteras programmering och utveckling
ubot
Inlägg: 4613
Blev medlem: 04 jan 2008, 14:03
OS: Ubuntu
Utgåva: 24.04 Noble Numbat LTS

Program för att extrahera text mellan HTML-taggar?

Inlägg av ubot »

Jag behöver komma åt texten mellan HTML-taggar i koden till webbsidor. Problemet är att grep/sed/awk inte riktigt klarar att klippa ut texten mellan taggarna om taggarna ligger på olika rader. Därför undrar jag om det kanske finns något annat smidigt program för att plocka ut innehåller mellan taggar. Jag har fått tipset om xmlstarlet, men ror bara att det fungerar med XML-taggar/kod? Finns det något smart sätt att hämta text mellan taggar som går att använda i ett bash-skript?
Användarvisningsbild
dmz
Inlägg: 3292
Blev medlem: 29 jul 2008, 19:42
OS: Arch Linux

Re: Program för att extrahera text mellan HTML-taggar?

Inlägg av dmz »

Inte felsäkert, men kanske räcker för ditt ändamål;

perl -pe 's/<.*>//g'
ǁ A: Because it obfuscates the reading.
ǁ Q: Why is top posting so bad?
Skriv svar

Återgå till "Programmering och webbdesign"