[ASP] Externe Website HTML Parsen

Pagina: 1
Acties:

  • Coolhva
  • Registratie: Juni 2003
  • Laatst online: 29-12-2024

Coolhva

Dr. Zero Trust

Topicstarter
Wij (de zaak) hebben een website online staan en die is zeer @#$@#$@#.
Als je wilt scrollen in de product lijst moet je op een stom plaatje gaan staan en dan scrolt de pagina heel langzaam naar beneden (je weet wel een table in een layer, DHTML).

Als ik een prijs moet opzoeken dan ben ik zo een paar min bezig.

Nu heb ik al de hoofdgroepen van de website eraf gehaald en lokaal op onze server in een ASP pagina gezet (copy paste) maar nu wil ik ook de product artikelen van onze internet site "rippen" zodat ik dit in eigen format kan laten zien.

Dus eigenlijk wat ik wil is de html pagina ophalen en dan een gedeelte van die html pagina laten zien op de site.

Ik heb gezocht op google en op GOT maar is nog niet echt iets uitgekomen waar ik iets aan heb. Alleen de code om een HTML pagina op te halen:

code:
1
2
3
4
5
6
function gragURL(strURL)    {
    var objHTTP = new ActiveXObject("ASPHTTP.Conn");
    objHTTP.Url = strURL; strResponse = new String(objHTTP.GetURL());
    
    return strResponse;
}


Maar nu nog het parse gedeelte (dus dat ik vanaf een bepaald punt tot een ander punt de code eruit haal).

Het gaat om onze site http://www.allvision.nl .
Iemand dit al voorhanden gehad en opgelost?

  • gorgi_19
  • Registratie: Mei 2002
  • Laatst online: 10:01

gorgi_19

Kruimeltjes zijn weer op :9

Door middel van Regular Expressions filteren.. :) Maar erhm.. Als het je eigen zaak is, dan maak je toch een webservice aan? :?

[ Voor 45% gewijzigd door gorgi_19 op 30-01-2004 11:14 ]

Digitaal onderwijsmateriaal, leermateriaal voor hbo


  • Coolhva
  • Registratie: Juni 2003
  • Laatst online: 29-12-2024

Coolhva

Dr. Zero Trust

Topicstarter
Wij werken met een kassa pakket die ook de website genereerd. En jah, daar kan ik weinig aan klooien. Ik kan geen directe verbinding leggen met de producten in het kassa systeem. Vandaar dat ik het doe via de website.

En de baas vind de website mooi ;-).

Ik heb het al werkend met wat geklooi maar de code is om te huilen. Iemand een idee om het beter en sneller te maken?

Functie om pagina van de website te rippen:
code:
1
2
3
4
5
6
7
8
9
10
11
<%
Response.AddHeader "pragma","no-cache"
Response.CacheControl = "no-cache"

Function getPage( strPage ) 
Set http_obj = server.CreateObject("Microsoft.XMLHTTP") 
http_obj.open "GET", strPage , false 
http_obj.send 
getPage = http_obj.responseText 
End Function
%>


Code om het te strippen weer te geven:
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
<% If Request.QueryString("page") <> "" Then

'Eerste gedeelte weghalen
VarPage1 = Split(getPage("http://www.allvision.nl/hardware/" & Request.QueryString("page")),_
"<!-- InstanceBeginEditable name=""content"" -->",-1)
'Tweede gedeelte weghalen
VarPage2 = Split(VarPage1(1),"<!-- InstanceEndEditable -->",-1)
'Nu nog even de linkjes werkend maken
VarOutput = Replace(VarPage2(0), "./", "prijslijst.asp?page=")
'De htmlcode wat aanpassen
VarOutput = Replace(VarOutput, "class=""product""", "")
'Nu de info op het scherm weer laten geven
Response.Write(VarOutput)

Else

'Eerste gedeelte weghalen
VarPage1 = Split(getPage("http://www.allvision.nl/hardware/prijslijst.htm"),_
"<!-- InstanceBeginEditable name=""content"" -->",-1)
'Tweede gedeelte weghalen
VarPage2 = Split(VarPage1(1),"<!-- InstanceEndEditable -->",-1)
'Nu nog even de linkjes werkend maken
VarOutput = Replace(VarPage2(0), "./", "prijslijst.asp?page=")
'De htmlcode wat aanpassen
VarOutput = Replace(VarOutput, "class=""product""", "")
'Nu de info op het scherm weer laten geven
Response.Write(VarOutput)

End If %>


Dus zoals je zit is het niet zo mooi ;-(......maar het werkt ;-).

[ Voor 28% gewijzigd door Coolhva op 30-01-2004 11:59 ]