Toon posts:

[XML] Java Xerces SAX set encoding?

Pagina: 1
Acties:

Verwijderd

Topicstarter
Hallo,

Ik krijg van een programma een XML file die niet start met <?xml version="1.0" encoding="iso-8859-1"?> met als gevolg iedere keer een

Error parsing:An invalid XML character (Unicode: 0x1b2cf4) was found in the element content of the document.

als er een 'vreemde' karakter in de xml data voorkomt. Wanneer ik handmatig de
<?xml version="1.0" encoding="iso-8859-1"?> regel aan het begin van de XML file plaats is er echter niets aan de hand. Dit lijkt mij echter geen oplossing.
Is er iets in Xerces SAX parser waarmee ik runtime de xml encoding die hij moet gebruiken kan instellen? Ik heb naar de functie setEncoding() gekeken maar op een of andere manier werkt deze niet.
Heeft iemand hier een oplossing voor?

  • momania
  • Registratie: Mei 2000
  • Laatst online: 09:02

momania

iPhone 30! Bam!

Die regel hoort daar toch gewoon bij een standaard xml file :?

Neem je whisky mee, is het te weinig... *zucht*


  • Rickets
  • Registratie: Augustus 2001
  • Niet online

Rickets

Finger and a shift

Nee, dat hoeft niet :)
XML documents should begin with an XML declaration which specifies the version of XML being used
Heb je dit gezien bij setEncoding?
The encoding must be a string acceptable for an XML encoding declaration (see section 4.3.3 of the XML 1.0 recommendation).

This method has no effect when the application provides a character stream

[ Voor 40% gewijzigd door Rickets op 19-01-2004 11:06 ]

If some cunt can fuck something up, that cunt will pick the worst possible time to fucking fuck it up, because that cunt’s a cunt.


Verwijderd

Topicstarter
mmmm.. lekker is dat.
Dus zal ik toch iedere keer voordat ik de file inlees de file kopieren met de <?xml .. ervoor.
Zoiets zal toch wel vaker voorkomen?