Ik ben bezig geweest om de nieuwsheadlines van nu.nl te parsen via de PHP commando's 'xml_parse_.....'. Mijn script heeft voor 2 weken succesvol gelopen, en nu opeens krijg ik:
XML Error: not well-formed (invalid token) at line 83
Ik heb werkelijk geen flauw idee waar het aan ligt, de XML-file zit er prima uit en ik kan opzich niet overtollige of verkeerde geplaatste aanhalingstekens o.i.d. vinden. Hier is het script waarmee ik de URL parse:
Na dit script ga ik aan de gang met het verwerken, maar dat is niet interresant hier, omdat dit script hierboven de fout genereerd en gewoon stand-alone kan draaien. Ik heb ook nog geprobeerd om target encoding te wijzigen, maar alle encodings slaan niet aan. Iemand een idee?
XML Error: not well-formed (invalid token) at line 83
Ik heb werkelijk geen flauw idee waar het aan ligt, de XML-file zit er prima uit en ik kan opzich niet overtollige of verkeerde geplaatste aanhalingstekens o.i.d. vinden. Hier is het script waarmee ik de URL parse:
PHP:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
| /* LAUNCH CURL */ $url = "http://nu.nl/deeplink_xml/"; $curl = curl_init(); $request = 'GET' . "\r\n"; curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $raw_dat = curl_exec ($curl); curl_close ($curl); /* PARSE RESULTS */ $parser = xml_parser_create(); xml_parser_set_option($parser,XML_OPTION_SKIP_WHITE,1); xml_parser_set_option($parser,XML_OPTION_CASE_FOLDING,0); xml_parse_into_struct($parser,$raw_dat,&$d_ar,&$i_ar) or print_error(); xml_parser_free($parser); |
Na dit script ga ik aan de gang met het verwerken, maar dat is niet interresant hier, omdat dit script hierboven de fout genereerd en gewoon stand-alone kan draaien. Ik heb ook nog geprobeerd om target encoding te wijzigen, maar alle encodings slaan niet aan. Iemand een idee?
R&D professional