Hopelijk staat dit in het goede forum (anders SA).
Hieronder een klein stuk uit een verslag. Volgens mij klopt het op zich wel, maar het is mij nog niet helemaal duidelijk waarom UCS nu de standaard karakterset voor HTML is. Volgens mij worden charsets meestal aangegeven in HTTP Content-type header met bijvoorbeeld:
Zo zijn toch ISO 8859-1 en UTF-8 veelgebruikte standaarden? Of kun je zeggen dat UTF de manier is om Unicode (= equivalent aan de karakterset zoals die in ISO 10646 staat) te encoderen?
Mijn tekst:
http://www.w3.org/TR/html4/charset.html
http://www.joelonsoftware.com/articles/Unicode.html
http://www.unicode.org/standard/principles.html
http://webrichtlijnen.ove...oductie/karaktercodering/
Hieronder een klein stuk uit een verslag. Volgens mij klopt het op zich wel, maar het is mij nog niet helemaal duidelijk waarom UCS nu de standaard karakterset voor HTML is. Volgens mij worden charsets meestal aangegeven in HTTP Content-type header met bijvoorbeeld:
code:
of in de header van het HTML-bestand:1
| Content-type: text/html; charset=utf-8 |
code:
1
| <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> |
Zo zijn toch ISO 8859-1 en UTF-8 veelgebruikte standaarden? Of kun je zeggen dat UTF de manier is om Unicode (= equivalent aan de karakterset zoals die in ISO 10646 staat) te encoderen?
Mijn tekst:
Bronnen:De ASCII karakterset is niet voldoende voor een wereldwijd informatie systeem zoals het web, zodat HTML de meer complete karakterset Universal Character Set (UCS) gebruikt die gedefineerd wordt in ISO 10646. In eerdere versies van HTML was ISO 8859-1 de standaard. ISO 10646 definieert een repertoire van duizenden karakters gebruikt door gemeenschappen over de hele wereld. Elke versie van de Unicode Standard is verenigbaar met en gesynchroniseerd aan de corresponderende versie van ISO 10646. UTF-8 is één van de manieren om Unicode correct te encoderen, omdat zij elke codepositie correct opslaat en weergeeft. ISO 8859-1 is minder geschikt, omdat het niet alle codeposities correct opslaat en weergeeft, alhoewel het voor westerse talen weinig problemen oplevert.
http://www.w3.org/TR/html4/charset.html
http://www.joelonsoftware.com/articles/Unicode.html
http://www.unicode.org/standard/principles.html
http://webrichtlijnen.ove...oductie/karaktercodering/
[ Voor 3% gewijzigd door X-Lars op 13-12-2004 16:56 ]