Voorbeeld: de hex-waarden 0x93 en 0x94 zijn zgn. smart quotes in de windows-1252 encoding (“ en ”). Maar in iso-8859-1 is er voor die hex-waarden geen overeenkomstig karakter. Iets dergelijks geldt voor het euro symbool, in windows-1252 encoding wordt dat opgeslagen als 0x80, maar die hex-waarde heeft in iso-8859-1 encoding geen karakter.
Maar, browsers (getest in Firefox, Opera 7 en IE6) tonen een .txt-bestand met die hex-waarden en met expliciet als encoding iso-8859-1 gekozen toch de quotes en het euro symbool. Correct zou zijn een vraagteken of blokje of anderszins een aanduiding dat er geen karakter is voor die hex-waarde met de gebruikte encoding.
En, als je in Dreamweaver een euro symbool invoegt (direct in de code view, dus geen entity) en de encoding van het bestand op iso-8859-1 zet, dan slaat dreamweaver toch de hex-waarde 0x80 op. Beter zou zijn ditaan te kondigen (bijv: "de huidige encoding voorziet niet in dit teken, kies iso-8859-15, windows-1252 of utf-8").
Conclusie: sommige software kiest er bewust voor om zich niet aan de door gebruiker gewenste encoding te houden, het zij bij het opslaan van documenten, hetzij bij het tonen ervan. Mijn expliciete keuzes werden 'overruled' door een (wellicht praktischer) keuze voor window-1252 encoding.
Mis ik nu iets, of klopt mijn veronderstelling? Ik vindt dit dus lastig, encoding is bij mijn werk echt een issue, en ik moet zeker weten 'wat voor vlees ik in de pan heb' .
Maar, browsers (getest in Firefox, Opera 7 en IE6) tonen een .txt-bestand met die hex-waarden en met expliciet als encoding iso-8859-1 gekozen toch de quotes en het euro symbool. Correct zou zijn een vraagteken of blokje of anderszins een aanduiding dat er geen karakter is voor die hex-waarde met de gebruikte encoding.
En, als je in Dreamweaver een euro symbool invoegt (direct in de code view, dus geen entity) en de encoding van het bestand op iso-8859-1 zet, dan slaat dreamweaver toch de hex-waarde 0x80 op. Beter zou zijn ditaan te kondigen (bijv: "de huidige encoding voorziet niet in dit teken, kies iso-8859-15, windows-1252 of utf-8").
Conclusie: sommige software kiest er bewust voor om zich niet aan de door gebruiker gewenste encoding te houden, het zij bij het opslaan van documenten, hetzij bij het tonen ervan. Mijn expliciete keuzes werden 'overruled' door een (wellicht praktischer) keuze voor window-1252 encoding.
Mis ik nu iets, of klopt mijn veronderstelling? Ik vindt dit dus lastig, encoding is bij mijn werk echt een issue, en ik moet zeker weten 'wat voor vlees ik in de pan heb' .