Sida 1 av 1

Behöver plocka viss text från en textfil

Postat: 18 jun 2007, 20:37
av Barre
Tjo...

Sitter och gäspar, och behöver lite hjälp :)

Har diverse html filer som jag behöver "klippa" ut länkar ifrån.
Hur skall jag gå tillväga?
Antar att awk är ett sätt, men hur skall syntaxen se ut?

SV: Behöver plocka viss text från en textfil

Postat: 19 jun 2007, 09:18
av per9000
python + beautiful soup är ett hett tips. Kul om man vill bygga en egen krälare till exempel.
http://www.crummy.com/software/BeautifulSoup/

Annars kan man kan få ut dem med regular expressions (fast jag är dålig på reg.exp.). Kanske sed kan göra det med en ful/fin oneliner om man har rätt reg-exp.

/Per

SV: Behöver plocka viss text från en textfil

Postat: 19 jun 2007, 11:14
av Lars
Ett första försök, någon kan säkert förbättra det:

Kod: Markera allt

grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'

SV: Behöver plocka viss text från en textfil

Postat: 21 jun 2007, 11:31
av Barre
Lars skrev: Ett första försök, någon kan säkert förbättra det:

Kod: Markera allt

grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'
Tack... sed var det jag var ute efter..... :)