[Python] Verkeerd geencodeerde data inlezen

Pagina: 1
Acties:

  • Deddiekoel
  • Registratie: Maart 2000
  • Laatst online: 12-11-2025

Deddiekoel

Gadget nerd

Topicstarter
Ik heb het volgende probleem. Ik krijg ergens data binnen dat naar een .xml bestand wordt geschreven. Dit bestand wordt weggeschreven als ANSI meen ik. Het probleem is dat als er speciale tekens in de data staan dat het bestand niet wil parsen. Als ik het bestand open in notepad en daar opsla als unicode dan parsed het bestand wel. Dit wil ik nu automatiseren met Python.
Wat ik wil doen is het bestand inlezen en wegschrijven als UTF-8. Maar ik loop nu vast op het inlezen van de data. Als ik het inlees en print dan zie dat de speciale tekens vervormd worden weergegeven. Maar als ik met de .encode('UTF8') methode het probeer naar UTF-8 om te zetten krijg ik deze error:
code:
1
2
3
4
Traceback (most recent call last):
  File "C:\temp\convert.py", line 28, in ?
    OutputFileFP.write(Content.encode('UTF8'))
UnicodeError: UTF-8 decoding error: unexpected code byte

Ik ben verder echt een Python n00b. Iemand enig idee hoe ik dit kan oplossen?

[ Voor 3% gewijzigd door Deddiekoel op 24-03-2005 17:27 ]

Verlanglijstje: Switch 2, PS5 Pro Most wanted: Switch 2