Ik heb een html pagina waarin een lijst met adressen en websites van bibliotheken staan. Iedere bibliotheek begint met <div class = "maplabel", en eindigt met </div>. Nu wil ik graag alle bibliotheken (inclusief de html code die er om heen staat) eruit strippen. Dus schreef ik deze code:
Voor alle duidelijkheid: in wel.HTML staat dus bijvoorbeeld ergens <div class = "maplabel">(adresgegevens_bibliotheek1)</div><div class = "maplabel">(adresgegevens_bibliotheek2)</div>, etc. Ik wil dus alleen die code, zonder de rest van de HTML pagina.
Maar, wat ik ook probeer, ik krijg alleen iedere keer de adresgegevens van de eerste bibliotheek! Dat zou niet zo moeten zijn wat ik begreep van diverse perl sites, omdat ik nu @placelink gebruik in plaats van $placelink...
Weet iemand wat ik fout doe?
Perl:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| my $browser = LWP::UserAgent->new; open LOGFILE, ">>biebwel.txt"; my $finalurl = "http://localhost/bieb/wel.HTML"; my $result = $browser->get($finalurl); my $root = HTML::TreeBuilder->new_from_content($result->content); my @placelink = new HTML::ElementRaw; @placelink = $root->look_down( _tag => 'div', 'class' => 'maplabel')->as_HTML; print @placelink; if(@placelink) { my $finallink = join("", @placelink); print $finalurl."\n"; print LOGFILE $finallink; print LOGFILE "\n"; } close LOGFILE; |
Voor alle duidelijkheid: in wel.HTML staat dus bijvoorbeeld ergens <div class = "maplabel">(adresgegevens_bibliotheek1)</div><div class = "maplabel">(adresgegevens_bibliotheek2)</div>, etc. Ik wil dus alleen die code, zonder de rest van de HTML pagina.
Maar, wat ik ook probeer, ik krijg alleen iedere keer de adresgegevens van de eerste bibliotheek! Dat zou niet zo moeten zijn wat ik begreep van diverse perl sites, omdat ik nu @placelink gebruik in plaats van $placelink...
Weet iemand wat ik fout doe?
It might sound as if I have no clue what I'm doing, but I actually have a vague idea.