Toon posts:

[VB.Net] Text automatisch afhalen van een site

Pagina: 1
Acties:
  • 525 views sinds 30-01-2008
  • Reageer

Verwijderd

Topicstarter
Ik zou graag een programmatje schrijven die automatisch het laatste nieuws van tweakers afprint, als je voorbeeld uw computer opstart.
Ik heb gebruik gemaakt van een webbrowser en visible op false geplaatst.
Graag had ik dan de tekst overgenomen van de webbrowser en deze in word geplaatst en dan afgeprint.

Visual Basic:
1
2
3
4
5
6
7
8
9
10
11
12
        Dim app As New Microsoft.Office.Interop.Word.Application
        Dim txtNieuws As String
        'System.Diagnostics.Process.Start("http://www.tweakers.net/nieuws")
        Me.mwbrBrowser1.Navigate("http://www.tweakers.net/nieuws")

        app.Selection.TypeText(Text:=txtNieuws)
        app.Visible = False

        app.PrintOut(FileName:="", Copies:=1, Pages:="", _
            ManualDuplexPrint:=False, Collate:=True, Background:=True, _
            PrintToFile:= False, PrintZoomColumn:=0, PrintZoomRow:=0, _
            PrintZoomPaperWidth:=0, PrintZoomPaperHeight:=0)


Maar de vraag is, hoe neem ik de text uit de webbrowser. Ik heb al alle eigenschappen overlopen van een webbrowser maar niets gevonden.
Of weet iemand een ander manier??

[ Voor 12% gewijzigd door Verwijderd op 19-07-2005 22:20 ]


  • vso
  • Registratie: Augustus 2001
  • Niet online

vso

tja...

rss feeder ?

wat je ook kan doen is ipv de een browser gebruiken is de source naar een text file dumpen
dus je gebruikt een ander middel om data binnen te halen bv telnet .. er is met behulp van telnet en de juiste RFC een script te maken die voor jou de text in een text file dumpt

je moet niet denken van hoe maak ik het zelf maar hoe werkt een webbrowser ...

voorbeeld:
telnet:www.een-webpagina.com:80
en dan met de juiste codes (zie rfc) kan je de webpagina opvragen

Tja vanalles


  • FireWood
  • Registratie: Augustus 2003
  • Laatst online: 20:14
Nog mooier: rechtstreeks verbinding maken via TCP/IP protocol naar de webserver toe.

Via telnet is een beetje non-go voor mij(en ik denk voor vele anderen).

In msdn saat de api wel uitgelegd.

Trouwens in de sample directory van .Net(indien je deze mee hebt laten kopieeren) staat een voorbeeld hoe je een verbinding opzet naar een server toe

Noobs don't use "F1", Pro's do, but they can't find the information they needed


Verwijderd

Topicstarter
vso schreef op dinsdag 19 juli 2005 @ 22:26:
rss feeder ?

wat je ook kan doen is ipv de een browser gebruiken is de source naar een text file dumpen
dus je gebruikt een ander middel om data binnen te halen bv telnet .. er is met behulp van telnet en de juiste RFC een script te maken die voor jou de text in een text file dumpt

je moet niet denken van hoe maak ik het zelf maar hoe werkt een webbrowser ...

voorbeeld:
telnet:www.een-webpagina.com:80
en dan met de juiste codes (zie rfc) kan je de webpagina opvragen
Nee eigenlijk geen rss feeder.
De applicatie zou enkel moeten de pagina's afprinten van het nieuws van tweakers.
Het schijnt dat Visual Studio 2005 Beta Experience Kit, de webbrowser een nieuwe eigenschap heeft, zodat je de tekst kan ophalen.
Maar ik wacht nog steeds achter die cd

  • OZ-Gump
  • Registratie: November 2002
  • Laatst online: 14-05-2024

OZ-Gump

terug van weggeweest

Kun je niet gewoon de RSS feed gebruiken van tweakers? En ik kan me er iets bij voorstellen dat het niet de bedoeling is zomaar geautomatiseerd gegevens van een internetpagina te gaan rippen. Men maakt die pagina niet voor niks en zal dus ook graag de bezoekers hebben. Denk aan reclameinkomsten etc.

Ik vraag me het nut af van jouw applicatie ten opzichte van een RSS feeder. Kun je dat eens toelichten?

Overigens: ik ken afdrukken of uitprinten, maar afprinten? ;)

My personal website


Verwijderd

Topicstarter
OZ-Gump schreef op woensdag 20 juli 2005 @ 09:01:
Kun je niet gewoon de RSS feed gebruiken van tweakers? En ik kan me er iets bij voorstellen dat het niet de bedoeling is zomaar geautomatiseerd gegevens van een internetpagina te gaan rippen. Men maakt die pagina niet voor niks en zal dus ook graag de bezoekers hebben. Denk aan reclameinkomsten etc.

Ik vraag me het nut af van jouw applicatie ten opzichte van een RSS feeder. Kun je dat eens toelichten?

Overigens: ik ken afdrukken of uitprinten, maar afprinten? ;)
Het lijkt me vrij handig om 's morgens waneer je uw computer opstart, het laatste nieuws wordt afgeprint. Zodat je deze kan lezen bij uw ochtendkoffie ;-)
Voor mij is het plezanter om op bladeren te lezen dan op een computerscherm, en aangezien ik zal werken met een webbrowser zal het geen invloed hebben op het aantal bezoekers.

  • Serpie
  • Registratie: Maart 2005
  • Laatst online: 05-02 21:24
h.edink schreef op dinsdag 19 juli 2005 @ 22:45:
Nog mooier: rechtstreeks verbinding maken via TCP/IP protocol naar de webserver toe.

Via telnet is een beetje non-go voor mij(en ik denk voor vele anderen).

In msdn saat de api wel uitgelegd.

Trouwens in de sample directory van .Net(indien je deze mee hebt laten kopieeren) staat een voorbeeld hoe je een verbinding opzet naar een server toe
Dit is verreweg de mooiste oplossing voor het doel, een HTTP voorbeeld staat ook bij de beschrijving van de Socket class:
http://msdn.microsoft.com...cketssocketclasstopic.asp

  • P_de_B
  • Registratie: Juli 2003
  • Niet online
Ik snap inderdaad niet waarom je niet de rss feed gebruikt. Die is daar speciaal voor bedoeld. Je haalt nu allerlei opmaak informatie van de t.net website ook op.

Wat jij wilt wordt ook wel 'screen scraping' genoemd. Misschien dat je met die term nog wat meer informatie kunt vinden. Er zijn wel complete voorbeelden voor het .Net framework. Dat heeft ingebouwde functionaliteit voor dit met de System.Net klasse.

Oops! Google Chrome could not find www.rijks%20museum.nl


  • Woy
  • Registratie: April 2000
  • Niet online

Woy

Moderator Devschuur®
Serpie schreef op woensdag 20 juli 2005 @ 09:25:
[...]


Dit is verreweg de mooiste oplossing voor het doel, een HTTP voorbeeld staat ook bij de beschrijving van de Socket class:
http://msdn.microsoft.com...cketssocketclasstopic.asp
In plaats van gebruik maken van sockets kun je dan beter gebruik maken van de WebRequest classes die er zijn. Hoef je je tenminste niet druk te maken over het HTTP Protocol.

Voor de rest lijkt mij voor dit doel de RSS stream idd de uitkomst. Je kan dan zelf wel zorgen dat het op een voor jou handige manier uitgeprint wordt.

“Build a man a fire, and he'll be warm for a day. Set a man on fire, and he'll be warm for the rest of his life.”


Verwijderd

Topicstarter
Ok thanks guys, kdenk dan ook dat ik de RSS Stream zal gebruiken
Pagina: 1