Sida 2 av 2
Re: All text på en rad? [LÖST]
Postat: 27 sep 2009, 16:38
av dmz
Gnu Sed har numera;
-i[SUFFIX], --in-place[=SUFFIX]
edit files in place (makes backup if extension supplied)
Re: All text på en rad?
Postat: 27 sep 2009, 16:39
av ubot
Konservburk skrev:ubot skrev:Frågan är varför så många säger att sed/grep/awk inte är bra för att extrahera innehåll mellan html/xml-taggar? Vad är det som kan gå fel om man gör så som jag har gjort nu, dvs lägger hela koden på en enda rad och sedan klipper ut allt mellan vissa taggar?
Problemet är att det kan finnas en massa specialfall som man lätt missar om man inte tänker på det ordentligt. Ingenting som inte går att lösa dock.
Vad händer om taggarna blandar stora och små bokstäver, olika för start- och sluttaggen?
<Html>...</htML>
Vad händer om det finns mellanrum i taggarna?
< html >...</html >
Vad händer om taggarna innehåller argument?
<html arg="hej">...</html>
Vad händer om sluttaggen saknas?
<html>...
Vad händer om det finns flera likadana taggpar på rad?
<html>...</html>...<html>...</html>
Vad händer om det finns flera likadana nästlade taggpar?
<html>...<html>...</html>...</html>
Det finns säkert ännu fler konstigheter man kan behöva se upp med.
Ok, det har du ju rätt i. I mitt fall är det framförallt flera likadana taggar på rad som är ett problem (jag behöver bara första) samt om sluttaggen saknas. Jag tror att alla andra problem går att lösa ganska enkelt, tex med grep -i löser man väl skillnaden mellan stora och små bokstäver i taggarna?
Re: All text på en rad? [LÖST]
Postat: 27 sep 2009, 16:42
av Konservburk
dmz skrev:Gnu Sed har numera;
-i[SUFFIX], --in-place[=SUFFIX]
edit files in place (makes backup if extension supplied)
Rent tekniskt så skapas fortfarande en temporär fil som sedan får ersätta orginalet i efterhand. Skillanden blir att sed tar hand om den biten.