Hallo iedereen,
RegEx. Ik begin hier eindelijk iets van te snappen maar ben er nog niet helemaal uit. Hetgeen wat ik uiteindelijk wil bereiken is een XML(rss feed) bestand maken die zijn gegevens dmv mijn ASPscriptje uit een HTML pagina krijgt.
Nu staat de informatie die in de XML pagina moet komen in een HTML bestand. Deze HTML pagina lees ik uit via Microsoft.XMLHTTP object en zet die gehele pagina in een variabel.
En nu loop ik vast. Ik moet de waarden (de link, de titel en de tekst) tussen de tags uit me HTML elk in een aparte variabele zien te zetten.
(test.html)
Dit kan met regex. Maar hoe wat en waarom....... ik loop vast. Hieronder mijn code tot nu toe:
(test.asp)
Iemand die mij zou kunnen helpen met dit probleem? Op internet kom ik niet verder. De uitleg is voor mij gewoon niet duidelijk. Hoe kan ik een goede patroon maken voor RegEx? Hoe krijg ik de goede waarden terug?
Bij voorbaat HEEL erg bedankt.
RegEx. Ik begin hier eindelijk iets van te snappen maar ben er nog niet helemaal uit. Hetgeen wat ik uiteindelijk wil bereiken is een XML(rss feed) bestand maken die zijn gegevens dmv mijn ASPscriptje uit een HTML pagina krijgt.
Nu staat de informatie die in de XML pagina moet komen in een HTML bestand. Deze HTML pagina lees ik uit via Microsoft.XMLHTTP object en zet die gehele pagina in een variabel.
En nu loop ik vast. Ik moet de waarden (de link, de titel en de tekst) tussen de tags uit me HTML elk in een aparte variabele zien te zetten.
(test.html)
HTML:
1
2
3
4
5
6
| <div class="titelvlak"> <a href="/intranet/content.jsp?objectid=38396">titel</a> </div> <div class="briefingtekstvlak"> tekst </div> |
Dit kan met regex. Maar hoe wat en waarom....... ik loop vast. Hieronder mijn code tot nu toe:
(test.asp)
ASP:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
| Dim StrHTML, RegEx Const REGEX_PATTERN = "<div \b[^>]*>(.*?)</div>" '<<<< HELP!!! Set RegEx = New RegExp Function GetHTML(strURL) on error resume next Dim objXMLHTTP, strReturn Set objXMLHTTP = Server.CreateObject("Microsoft.XMLHTTP") objXMLHTTP.Open "GET", strURL, False objXMLHTTP.Send strReturn = objXMLHTTP.responseText Set objXMLHTTP = Nothing GetHTML = strReturn End Function With RegEx .Pattern = REGEX_PATTERN .IgnoreCase = true .Global = True End With StrHTML = GetHtml("http://localhost/html.html") Set expressionmatch = RegEx.Execute(StrHTML) '<<<< HELP!!! |
Iemand die mij zou kunnen helpen met dit probleem? Op internet kom ik niet verder. De uitleg is voor mij gewoon niet duidelijk. Hoe kan ik een goede patroon maken voor RegEx? Hoe krijg ik de goede waarden terug?
Bij voorbaat HEEL erg bedankt.