[LWP/wget] problemen met binnenhalen website

Pagina: 1
Acties:

  • gepebril
  • Registratie: November 2001
  • Laatst online: 28-03-2023
Hallo,

Sinds een paar jaar lepel ik websites naar binnen om gegevens uit te halen. Tot op heden ging dit heel goed in Perl met use LWP::Simple;
Echter als ik nu de website http://www.nospang.com wil binnenhalen met
code:
1
wget http://www.nospang.com


of

code:
1
2
3
4
5
#!/usr/bin/perl
use LWP::Simple;

$web_URL        = "http://www.nospang.com/";
$web_Page       = get($web_URL);


Dan krijg ik alleen het eerste gedeelte van de website binnen, niet alles. Weet dat er vroeger een probleem was met websites die frames bevatten, echter deze website bevat deze niet. Welk bash/Perl tooltje dien ik hier voor succesvol te gebruiken. Alvast bedankt.

Albert

  • Confusion
  • Registratie: April 2001
  • Laatst online: 01-03-2024

Confusion

Fallen from grace

gepebril schreef op donderdag 10 september 2009 @ 03:27:
Dan krijg ik alleen het eerste gedeelte van de website binnen, [..]
Wat in vredesnaam bedoel je met 'het eerste gedeelte van de website'? Je krijgt een HTML document zonder body tag, met een embedded javascript dat redirect naar nospang.org.

Wie trösten wir uns, die Mörder aller Mörder?


  • gepebril
  • Registratie: November 2001
  • Laatst online: 28-03-2023
Aha,

Super bedankt!, denk dat het gisteren te laat was en ik over de .org heen gekeken heb.

Mvgr,

Albert