[PHP] xml_parser kapt alles voor gekke tekens af

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

Anoniem: 138552

Topicstarter
Hoi,

Ik heb een xml parser die werkt met element handlers en data handlers. Nu is het de bedoeling dat die een xml_file inleest en in een mysql db records wegschrijft. Dit lukt aardig maar als er in bepaalde velden gekke tekens staan zoals ë, ä, dan kapt ie alles ervoor af.

vb als er "dit kan je in België zien" staat, dan komt in de db "ë zien" te staan.

Nu heb ik al vanalles geprobeerd, utf_decode, xml_parser_set_option($xml_parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); enzoverder maar dit helpt allemaal niet.

Weet iemand een oplossing?

thx

Acties:
  • 0 Henk 'm!

  • djc
  • Registratie: December 2001
  • Laatst online: 28-07-2022

djc

Welke versie van PHP en welke versie van sablotron heb je? Ik meen me te herinneren dat die optie pas in een vrij nieuwe Sablotron-versie ondersteund werd. Je MySQL-versie zou trouwens ook helpen.

Het is in ieder geval (duh) een probleem met je character encoding, maar de vraag is of dat probleem aan de input-kant of aan de output-kant (je DB-queries) ligt.

Rustacean


Acties:
  • 0 Henk 'm!

Anoniem: 138552

Topicstarter
Manuzhai schreef op dinsdag 07 maart 2006 @ 11:15:
Welke versie van PHP en welke versie van sablotron heb je? Ik meen me te herinneren dat die optie pas in een vrij nieuwe Sablotron-versie ondersteund werd. Je MySQL-versie zou trouwens ook helpen.

Het is in ieder geval (duh) een probleem met je character encoding, maar de vraag is of dat probleem aan de input-kant of aan de output-kant (je DB-queries) ligt.
Hey, de php is 5.1.2 en de MySQL 5.0.18... greets

Acties:
  • 0 Henk 'm!

  • Mr. Bondt
  • Registratie: Februari 2005
  • Laatst online: 10-06 10:11
Ik heb zelf ook zo'n probleem gehad met xml's, en ik heb het kunnen oplossen met utf_decode en utf_encode op de goede plaatsen.
Ik gebruik PHP 5.0.5 en MySQL 4.1.14.

Succes.

Acties:
  • 0 Henk 'm!

  • George
  • Registratie: Maart 2006
  • Laatst online: 02-03 19:22
Op welke "collation" staat de tabel waar je het in wilt spugen ?

-George.


Acties:
  • 0 Henk 'm!

Anoniem: 138552

Topicstarter
GIsmael schreef op dinsdag 07 maart 2006 @ 17:15:
Op welke "collation" staat de tabel waar je het in wilt spugen ?
hij staat op latin1_swedish_ci. Groetjes

Acties:
  • 0 Henk 'm!

  • BasieP
  • Registratie: Oktober 2000
  • Laatst online: 22-07-2024
Mr. Bondt schreef op dinsdag 07 maart 2006 @ 11:50:
Ik heb zelf ook zo'n probleem gehad met xml's, en ik heb het kunnen oplossen met utf_decode en utf_encode op de goede plaatsen.
Ik gebruik PHP 5.0.5 en MySQL 4.1.14.

Succes.
offtopic:
ervaring mee ;)

[ Voor 4% gewijzigd door BasieP op 08-03-2006 09:26 ]

This message was sent on 100% recyclable electrons.


Acties:
  • 0 Henk 'm!

Anoniem: 138552

Topicstarter
Ondertussen krijg ik de vreemde karakters wel goed, maar hij kapt dus alles wat er voor staat af...

Acties:
  • 0 Henk 'm!

Anoniem: 138552

Topicstarter
even ter info

het XML bestand is ISO-8859-1 ge-encode

Acties:
  • 0 Henk 'm!

Anoniem: 88197

Anoniem: 138552 schreef op woensdag 08 maart 2006 @ 09:37:
Ondertussen krijg ik de vreemde karakters wel goed, maar hij kapt dus alles wat er voor staat af...
Wat is nu precies je code? Druk anders de query even af die je doet om de records te inserten.

Acties:
  • 0 Henk 'm!

  • BasieP
  • Registratie: Oktober 2000
  • Laatst online: 22-07-2024
met boland

een programma is geen zwart gat met input en output
een programma kan je debuggen.

waarschijnlijk heeft het wel met character encoding te maken, maar als je zegt dat je daar alles al mee geprobeerd heb geloven we je natuurlijk.

This message was sent on 100% recyclable electrons.


Acties:
  • 0 Henk 'm!

Anoniem: 84954

Probeer eens met iconv de codepage om te zetten.

Acties:
  • 0 Henk 'm!

  • George
  • Registratie: Maart 2006
  • Laatst online: 02-03 19:22
Het lijkt mij een probleem van de parser, daar je zelf aangeeft dat voorgaande tekens gewoon worden getrashed.
Misschien kun je stapsgewijs de parser door een kleiner/ander stuk tekst laten lopen ?

-George.

Pagina: 1