Hoi,
ik zit met volgend probleem:
ik heb een XML file die iso-8859-1 ge-encode is
ik wil de data van de xml in een mysql database steken en maak hiervoor een xml parser in php.
Bij de endElementHandler van deze parser doe ik dan de insert in de database.
Ik gebruik PHP5 dus de encoding van de XML-file wordt automatisch gedetecteerd. Ik maak dus zo mijn parser aan:
Dit gaat allemaal goed, totdat er een ë of ä of een ander speciaal karakter geparsed wordt. Dit speciaal karakter komt er wel goed uit maar alles wat ervoor staat, is er afgekapt.
Als er in de XML-file 'xxxxäyyyy' staat komt het eruit als 'äyyyy'.
Weet iemand hoe dit komt? Ik heb me al suf liggen zoeken...
thx
ik zit met volgend probleem:
ik heb een XML file die iso-8859-1 ge-encode is
ik wil de data van de xml in een mysql database steken en maak hiervoor een xml parser in php.
Bij de endElementHandler van deze parser doe ik dan de insert in de database.
Ik gebruik PHP5 dus de encoding van de XML-file wordt automatisch gedetecteerd. Ik maak dus zo mijn parser aan:
PHP:
1
2
3
4
| $xml_parser = xml_parser_create(); xml_parser_set_option($xml_parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); xml_parser_set_option($xml_parser,XML_OPTION_SKIP_WHITE,1); xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, FALSE); |
Dit gaat allemaal goed, totdat er een ë of ä of een ander speciaal karakter geparsed wordt. Dit speciaal karakter komt er wel goed uit maar alles wat ervoor staat, is er afgekapt.
Als er in de XML-file 'xxxxäyyyy' staat komt het eruit als 'äyyyy'.
Weet iemand hoe dit komt? Ik heb me al suf liggen zoeken...
thx