Sida 1 av 1
Behöver plocka viss text från en textfil
Postat: 18 jun 2007, 20:37
av Barre
Tjo...
Sitter och gäspar, och behöver lite hjälp
Har diverse html filer som jag behöver "klippa" ut länkar ifrån.
Hur skall jag gå tillväga?
Antar att awk är ett sätt, men hur skall syntaxen se ut?
SV: Behöver plocka viss text från en textfil
Postat: 19 jun 2007, 09:18
av per9000
python + beautiful soup är ett hett tips. Kul om man vill bygga en egen krälare till exempel.
http://www.crummy.com/software/BeautifulSoup/
Annars kan man kan få ut dem med regular expressions (fast jag är dålig på reg.exp.). Kanske sed kan göra det med en ful/fin oneliner om man har rätt reg-exp.
/Per
SV: Behöver plocka viss text från en textfil
Postat: 19 jun 2007, 11:14
av Lars
Ett första försök, någon kan säkert förbättra det:
Kod: Markera allt
grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'
SV: Behöver plocka viss text från en textfil
Postat: 21 jun 2007, 11:31
av Barre
Lars skrev:
Ett första försök, någon kan säkert förbättra det:
Kod: Markera allt
grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'
Tack... sed var det jag var ute efter.....
