Toon posts:

iso-8859-1 vs windows-1252, apps houden zich er niet aan

Pagina: 1
Acties:
  • 100 views sinds 30-01-2008
  • Reageer

Verwijderd

Topicstarter
Voorbeeld: de hex-waarden 0x93 en 0x94 zijn zgn. smart quotes in de windows-1252 encoding ( en ). Maar in iso-8859-1 is er voor die hex-waarden geen overeenkomstig karakter. Iets dergelijks geldt voor het euro symbool, in windows-1252 encoding wordt dat opgeslagen als 0x80, maar die hex-waarde heeft in iso-8859-1 encoding geen karakter.

Maar, browsers (getest in Firefox, Opera 7 en IE6) tonen een .txt-bestand met die hex-waarden en met expliciet als encoding iso-8859-1 gekozen toch de quotes en het euro symbool. Correct zou zijn een vraagteken of blokje of anderszins een aanduiding dat er geen karakter is voor die hex-waarde met de gebruikte encoding.

En, als je in Dreamweaver een euro symbool invoegt (direct in de code view, dus geen entity) en de encoding van het bestand op iso-8859-1 zet, dan slaat dreamweaver toch de hex-waarde 0x80 op. Beter zou zijn ditaan te kondigen (bijv: "de huidige encoding voorziet niet in dit teken, kies iso-8859-15, windows-1252 of utf-8").

Conclusie: sommige software kiest er bewust voor om zich niet aan de door gebruiker gewenste encoding te houden, het zij bij het opslaan van documenten, hetzij bij het tonen ervan. Mijn expliciete keuzes werden 'overruled' door een (wellicht praktischer) keuze voor window-1252 encoding.

Mis ik nu iets, of klopt mijn veronderstelling? Ik vindt dit dus lastig, encoding is bij mijn werk echt een issue, en ik moet zeker weten 'wat voor vlees ik in de pan heb' .

Verwijderd

hamvraag: met welke encoding serveer je (hhtp headers)

Verwijderd

Topicstarter
Gewoon een lokaal bestand direct openen. Van te voren heb ik gechecked welke hex-waarden het bestand bevat (0x80 0x93 0x94). En het betreft ook het opslaan van bestanden (in dit geval door Dreamweaver).

  • Vinnienerd
  • Registratie: Juli 2000
  • Laatst online: 17:42
Unicode? Anyone?

Verwijderd

Topicstarter
Ja, graag. :) Helaas is de realiteit dat Word bijvoorbeeld toch nog liever kiest voor windows-1252.

Maar dat is nu even niet het punt, mijn vraag is: het bovengenoemde gedrag is toch zeker incorrect? Ik moet helaas jongleren met divers aangeleverd spul in diverse encoding. Als ik een bestand open en ik iso-8859-1 expliciet selecteer als encoding voor het huidige document, dan ben ik niet tevreden met het feit dat de browsers dan rustig 0x80 als euro-symbool tonen want dat is niet juist. Toch?

Omgekeerd ben ik niet tevreden als ik in Dreamweaver aangeef dat ik iso-8859-1 encoding wil gebruiken voor het document, dat Dreamweaver dan het euro-symbool als 0x80 wegschrijft, want ook dat is niet juist. Toch?

Verwijderd

dreamweaver kijkt naar mijn weten alleen naar meta elementen, pi's en bom, als je die niet hebt zal ie wel wat aannemen denk ik

Verwijderd

Topicstarter
Ja dreamweaver kijkt eerst naar de instellingen, daar kun je aangeven wat de default is. Maar zodra je een specificatie in het document geeft, bijvoorbeeld door een meta-tag http-equiv="contenttype" dan zal dreamweaver die info gebruiken om het bestand op te slaan. Maar als ik dus iso-8859-1 opgeef (ik heb het dit topic eerder gezegd) dan is het toch zeker niet correct het euro-symbool als 0x80 op te slaan?
Pagina: 1