Altijd fijn, file encodings...
Ik heb een tekst bestand, dat UTF-8 encoded zou moeten zijn. Uit mijn terminal:
test.txt: UTF-8 Unicode text, with CRLF line terminators
Alles wel, als ik de file via vim bekijk (ik heb UTF-8 als preferred encoding in mijn vimrc staan) zie ik netjes alle diakrieten.
Echter, nu heb ik een Java tooltje geschreven dat heel simpel de file inleest en de content output naar stdout. Ik start mijn tool met -Dfile.encoding=UTF-8, maar toch komen de diakritische tekens niet goed over.
Zo wordt é getoond als √© en â als √¢
Niet een combinatie die mij bekend voorkomt bij encoding problemen. Iemand een idee?
Ik heb een tekst bestand, dat UTF-8 encoded zou moeten zijn. Uit mijn terminal:
test.txt: UTF-8 Unicode text, with CRLF line terminators
Alles wel, als ik de file via vim bekijk (ik heb UTF-8 als preferred encoding in mijn vimrc staan) zie ik netjes alle diakrieten.
Echter, nu heb ik een Java tooltje geschreven dat heel simpel de file inleest en de content output naar stdout. Ik start mijn tool met -Dfile.encoding=UTF-8, maar toch komen de diakritische tekens niet goed over.
Zo wordt é getoond als √© en â als √¢
Niet een combinatie die mij bekend voorkomt bij encoding problemen. Iemand een idee?