Hi,
Ik wil graag van alle img tags van een html document het src attribuut uitlezen. Dus als ik bijv. <img src="mysite.com/images/pietje.gif" /> heb, wil ik mysite.com/images/pietje.gif als resultaat hebben. Ik heb nog niet zoveel ervaring met regular expressions maar ben tot het volgende gekomen:
(<img\s.*src\s*=\s*)("|')(.*)(\2[^<]*>)
Deze regular expression geeft de goede urls terug, maar als er twee img tags op een regel staan, neemt ie ook de tussenliggende karakters mee. Dus:
<img src="plaatje1.gif" /> hier nog wat tekst <img src="plaatje2.gif" /> wordt gezien als 1 match en volgens mij heeft dat te maken met mijn het gebruikt van \s.*. Helaas is mijn ervaring met regular expressions gering en hoop ik dat iemand mij hiermee kan helpen.
Alvast bedankt!
Ik wil graag van alle img tags van een html document het src attribuut uitlezen. Dus als ik bijv. <img src="mysite.com/images/pietje.gif" /> heb, wil ik mysite.com/images/pietje.gif als resultaat hebben. Ik heb nog niet zoveel ervaring met regular expressions maar ben tot het volgende gekomen:
(<img\s.*src\s*=\s*)("|')(.*)(\2[^<]*>)
Deze regular expression geeft de goede urls terug, maar als er twee img tags op een regel staan, neemt ie ook de tussenliggende karakters mee. Dus:
<img src="plaatje1.gif" /> hier nog wat tekst <img src="plaatje2.gif" /> wordt gezien als 1 match en volgens mij heeft dat te maken met mijn het gebruikt van \s.*. Helaas is mijn ervaring met regular expressions gering en hoop ik dat iemand mij hiermee kan helpen.
Alvast bedankt!