Behöver plocka viss text från en textfil

Här diskuterar vi skal, kommandon och klassiska linuxverktyg.
Användarvisningsbild
Barre
Inlägg: 2298
Blev medlem: 13 dec 2006, 10:23
OS: Ubuntu
Ort: Stockholm
Kontakt:

Behöver plocka viss text från en textfil

Inlägg av Barre »

Tjo...

Sitter och gäspar, och behöver lite hjälp :)

Har diverse html filer som jag behöver "klippa" ut länkar ifrån.
Hur skall jag gå tillväga?
Antar att awk är ett sätt, men hur skall syntaxen se ut?
________________________________________________________________
twitter @ BarreGargamel
blogg @ Gargamel.NU
Användarvisningsbild
per9000
Inlägg: 931
Blev medlem: 07 maj 2007, 11:06
OS: Ubuntu
Utgåva: 23.04 Lunar Lobster
Ort: Västerås
Kontakt:

SV: Behöver plocka viss text från en textfil

Inlägg av per9000 »

python + beautiful soup är ett hett tips. Kul om man vill bygga en egen krälare till exempel.
http://www.crummy.com/software/BeautifulSoup/

Annars kan man kan få ut dem med regular expressions (fast jag är dålig på reg.exp.). Kanske sed kan göra det med en ful/fin oneliner om man har rätt reg-exp.

/Per
--
Per Erik Strandberg
Yet Another IT Consultant
Lars
Inlägg: 6191
Blev medlem: 14 jan 2007, 19:31
OS: Ubuntu
Utgåva: 22.10 Kinetic Kudu
Ort: Stockholm

SV: Behöver plocka viss text från en textfil

Inlägg av Lars »

Ett första försök, någon kan säkert förbättra det:

Kod: Markera allt

grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'
Användarvisningsbild
Barre
Inlägg: 2298
Blev medlem: 13 dec 2006, 10:23
OS: Ubuntu
Ort: Stockholm
Kontakt:

SV: Behöver plocka viss text från en textfil

Inlägg av Barre »

Lars skrev: Ett första försök, någon kan säkert förbättra det:

Kod: Markera allt

grep href index.html | sed -e 's/.*href="\([^"]*\)".*/\1/'
Tack... sed var det jag var ute efter..... :)
________________________________________________________________
twitter @ BarreGargamel
blogg @ Gargamel.NU
Skriv svar

Återgå till "Terminalforum"