Ben al een tijdje bezig om een stuk (oude) html code te rippen met sed om het uiteindelijk in een db te stoppen... Het is bijna gelukt... maar ik zie toch liever een nettere oplossing
output van `cat code.txt`
<font color=white> </font><font color=aqua>Drink bier <a href="bier.html"></font><font color=yellow>128</a></font>
de bedoeling is dat ik deze uitkomst krijg:
Drink bier; bier.html; 128;
(spaties voor of na de ; maken niet uit)
ik doe het no zo maar het kan vast veel handiger:
cat code.txt | sed 's/<font[^>]*>//g' | sed 's/<\/font[^>]*>/;/g' | sed 's/<a href="/;/g' | sed 's/"[^a]*>/ /g' | sed 's/<[^>]*>//g'
output:
;bier. ;bier.html ;128;
;wijn ;wijn.html ;112;
;koffie ;koffie.html ;111;
etc...
output van `cat code.txt`
<font color=white> </font><font color=aqua>Drink bier <a href="bier.html"></font><font color=yellow>128</a></font>
de bedoeling is dat ik deze uitkomst krijg:
Drink bier; bier.html; 128;
(spaties voor of na de ; maken niet uit)
ik doe het no zo maar het kan vast veel handiger:
cat code.txt | sed 's/<font[^>]*>//g' | sed 's/<\/font[^>]*>/;/g' | sed 's/<a href="/;/g' | sed 's/"[^a]*>/ /g' | sed 's/<[^>]*>//g'
output:
;bier. ;bier.html ;128;
;wijn ;wijn.html ;112;
;koffie ;koffie.html ;111;
etc...