Toon posts:

[ASP] Strippen content externe website

Pagina: 1
Acties:

Verwijderd

Topicstarter
Voor een portal, waar voornamelijk nieuws gebruikt wordt van 1 bepaalde website, zou het handig zijn (en wenselijk) als ik een script schrijf waarbij ik de artikelen van deze (externe) website strip van deze betreffende site en deze vervolgens in de database van de portal zet.

De personen welke de content bijhouden zouden dan bijvoorbeeld dagelijks in hun admin tool in kunnen loggen waarbij ze op artikelen kunnen scannen (waar dan eerder genoemd scenario zou moeten geschieden) en vervolgens per artikel kunnen "approven" of "declinen". Approven zou het artikel op actief zetten en op de portal zichtbaar maken. Declinen zou het artikel uit de database moeten verwijderen, of iets dergelijks.

Om alles te maken lijkt me vrij duidelijk, het enige waar ik weinig info over kan vinden en ook niet weet hoe ik moet beginnen is het strippen van content van een externe website, dit in ASP. Iemand enig idee of dat mogelijk is, watvoor functies hiervoor vereist zijn of iemand die hier toevallig ervaring mee heeft? B.v.d.

  • P_de_B
  • Registratie: Juli 2003
  • Niet online
Nou je zou eens kunnen beginnen met het XMLHTTP object. Verder is er denk ik genoeg te vinden als je de goede zoekterm maar weet: [google=screen scraping asp]

Hou je wel rekening met het feit dat je toestemming van de externe site moet hebben?

Oops! Google Chrome could not find www.rijks%20museum.nl


  • j_du_pee
  • Registratie: Maart 2000
  • Laatst online: 23-09-2024

j_du_pee

du pain, du vin, du pee

met het xmlhttp component kun je externe pagina's fetchen, en met regular expressions kun je goed texten strippen ;)

kaart != map && bottel != fles
Wacht op antwoord


Verwijderd

Topicstarter
Screen Scraping. Daar was ik zelf nooit opgekomen, bedankt tot zover. Ik ga daar even wat zaken over lezen. Toestemming van de externe site is er overigens.