[html] welke charset?

Pagina: 1
Acties:
  • 120 views sinds 30-01-2008
  • Reageer

Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
Ik ben een hele tijd aan het prutsen geweest om Apache zo ver te krijgen dat hij via .htaccess de HTML encoding charset automatisch veranderd maar ik ben nu nog niet tevreden.

Wat is het geval; Ik probeer Europese talen (waaronder Engels, Duits, Nederlands, Frans etc.) te combineren met Japans. Hiervoor zocht ik de oplossing in Unicode (UTF-8). Echter het blijkt dat UTF-8 de Japanse characters niet goed weergeeft en ook nog eens Europese speciale characters verstoort.

Weet iemand een andere charset die wél beide talen correct weergeeft :?

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13


Acties:
  • 0 Henk 'm!

  • begintmeta
  • Registratie: November 2001
  • Niet online

begintmeta

Moderator General Chat
Hier (utf-8 testpaginatje) (samenvattend: staat er wel een geschikt lettertypebestand in de browserinstellingen voor UTF-8) en met google kun je misschien nog wat meer info vinden, op mijn computer wordt het allemaal goed weergegeven.

Kun je misschien wat meer info over de gebruikte lettertypen, browsers en besturingssystemen geven?

[ Voor 40% gewijzigd door begintmeta op 17-06-2004 17:15 ]


Acties:
  • 0 Henk 'm!

Verwijderd

http://www.campusprogram....ikipedia/u/ut/utf_16.html

probeer eens een versie van utf-16 (big-endian & little endian). Probeer ook eens te spelen met de verschillende character encoding settings in firefox, om te kijken of er eentje tussen zit die de pagina goed weergeeft.

Acties:
  • 0 Henk 'm!

Verwijderd

utf-16 is gewoon een meer gecompliceerde vorm van utf-8, dus het lijkt me niet dat dat de oplossing is. Het heeft meer te maken voor welke karaktersets IE ondersteuning heeft.

(utf-8 is trouwens altijd handig)

Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
begintmeta schreef op 17 juni 2004 @ 16:53:
Hier (utf-8 testpaginatje) (samenvattend: staat er wel een geschikt lettertypebestand in de browserinstellingen voor UTF-8) en met google kun je misschien nog wat meer info vinden, op mijn computer wordt het allemaal goed weergegeven.

Kun je misschien wat meer info over de gebruikte lettertypen, browsers en besturingssystemen geven?
de fonts zijn vrij standaard:
Verdana, Arial, Helvetica, sans-serif
(waarbij Verdana standaard wordt gebruikt)

browsers:
MSIE & FireFox 0.8

besturingssystemen:
WinXP.

de meta-tags in de html bestanden zijn goed, dat wordt namelijk automatisch geselecteerd doro PHP-BB.

[ Voor 12% gewijzigd door ScuL op 17-06-2004 18:11 ]

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13


Acties:
  • 0 Henk 'm!

  • Freak_NL
  • Registratie: Juli 2000
  • Laatst online: 22-08 14:17
Controleer eens of de HTTP header met "Content-Type" wel wordt verstuurd door de webserver? Je wilt zoiets ontvangen:
code:
1
Content-Type: text/html; charset=UTF-8

UTF-8 werkt doorgaans perfect met elk bestaand alphabet, daar is het Unicode voor. :)

Japanse karakters worden sowieso niet weergegeven met Verdana of Arial, je web browser valt terug naar andere lettertypen zoals Kochi Gothic. Maak eens een kleine test pagina op je webserver met een linkje hier?

Acties:
  • 0 Henk 'm!

Verwijderd

Zoiets? (is al van een tijdje terug btw)

Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
Freak_NL schreef op 17 juni 2004 @ 19:15:
Controleer eens of de HTTP header met "Content-Type" wel wordt verstuurd door de webserver? Je wilt zoiets ontvangen:
code:
1
Content-Type: text/html; charset=UTF-8

UTF-8 werkt doorgaans perfect met elk bestaand alphabet, daar is het Unicode voor. :)

Japanse karakters worden sowieso niet weergegeven met Verdana of Arial, je web browser valt terug naar andere lettertypen zoals Kochi Gothic. Maak eens een kleine test pagina op je webserver met een linkje hier?
De HTTP-header die door Apache wordt verstuurd kan ik inregelen in het .htaccess bestand.
Als ik hem op UTF-8 zet, wordt hij dus ook daadwerkelijk als UTF-8 verstuurd. Ik heb hem er alleen nu even niet opgezet omdat mijn forumgebruikers er last van ondervinden. Het staat nu dus weer als ISO (latijns).

Dit is een voorbeeld van een topic waarin het fout gaat.
http://www.globalhardstyle.com/forum/viewtopic.php?t=1201
deze post: http://www.globalhardstyl...viewtopic.php?p=7183#7183

Als je de source bekijkt zie je dat SHIFT_JIS wordt meegestuurd in de meta-headers.

En Anne, bedankt voor het linkje dat is inderdaad wat ik wil.

[ Voor 4% gewijzigd door ScuL op 17-06-2004 19:52 ]

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13


Acties:
  • 0 Henk 'm!

Verwijderd

Ah. Ik heb het wel is eerder gezegd. Maar je charset zomaar veranderen betekent _niet_, nee echt _niet_, dat je data ook gelijk op de juiste wijze gecodeerd is. _NIET_.

Je zult dus ten eerste een manier moeten vinden om je oude data terug te zetten. (Ik krijg trouwens een iso-8859-* charset daar.)

Daarna moet je ervoor zorgen dat je _elke_ pagina met UTF-8 in de header serveert. Dus input _en_ output. Eventueel kun je aan elk formulier 'accept-charset="utf-8"' toevoegen, hoewel browsers dat automatisch al honereren (het kan echter zijn dat sommige dat wellicht niet doen, las ik vandaag...).

Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
Verwijderd schreef op 17 juni 2004 @ 20:04:
Ah. Ik heb het wel is eerder gezegd. Maar je charset zomaar veranderen betekent _niet_, nee echt _niet_, dat je data ook gelijk op de juiste wijze gecodeerd is. _NIET_.

Je zult dus ten eerste een manier moeten vinden om je oude data terug te zetten.
dat zou verklaren waarom bestaande onderwerpen niet correct worden weergegeven.
als ik het dus op UTF-8 zet en dan een nieuw onderwerp maak zal wel alles goed moeten werken :?
(Ik krijg trouwens een iso-8859-* charset daar.)
klopt de .htaccess staat nu gewoon op 8859-1 om te voorkomen dat het gros (Europese) gebruikers last ondervinden van corrupte letters.
Daarna moet je ervoor zorgen dat je _elke_ pagina met UTF-8 in
de header serveert. Dus input _en_ output. Eventueel kun je aan elk formulier 'accept-charset="utf-8"' toevoegen, hoewel browsers dat automatisch al honereren (het kan echter zijn dat sommige dat wellicht niet doen, las ik vandaag...).
elke pagina zo serveren is niet het probleem, ik kan het op 2 plaatsen forceren.
1 in de language files, en 2 in de HTTP-header via htaccess.

nu moet ik dus alleen een manier zien te vinden om de gehele PHPBB-database te converteren naar UTF-8 .. en vervolgens dus de language files en .htaccess bewerken.

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13


Acties:
  • 0 Henk 'm!

  • BetuweKees
  • Registratie: Januari 2003
  • Laatst online: 15-07 20:53

BetuweKees

Flipje uit Tiel

let ook even op dat je bij je form altijd enctype="multipart/form-data" gebruikt, anders is de kans groot dat de utt-8 chars niet goed bij je cgi script aankomen..

Through meditation I program my heart to beat breakbeats and hum basslines on exhalation -Blackalicious || *BetuweKees was AFK; op de fiets richting China en verder


Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
hm ik vind de oplossing van de gehele database omzetten en dergelijk toch wat omslachtig
(volgens mij kan het niet eens 1,2,3)

dus ik heb nu de volgende oplossing gevonden!

Ik heb : AddDefaultCharset op 'off' gezet in .htaccess

Nu stuurt de webserver niet meer standaard een geforceerde ISO-codering naar de browser, waardoor de browser zélf de codering uit de meta tag haalt!

Die stond in het geval van Japans al op SHIFT_JIS, dus Japanners die nu inloggen krijgen alles keurig in SHIFT_JIS. Een Nederlander ziet echter een hoop garble, afhankelijk van hoe de Japanners het hebben ingevoerd.

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13


Acties:
  • 0 Henk 'm!

Verwijderd

Dat is dus de meest erge oplossing die je kunt bedenken. Gebruik liever eentje die werkt voor nieuwe posts dan en archiveer de oude posts ergens.

Acties:
  • 0 Henk 'm!

  • ScuL
  • Registratie: Januari 2000
  • Laatst online: 03:12
da's geen optie :{

wat is er erg aan de oplossing dan.... het feit dat het niet door elkaar gebruikt kan worden?
dat maakt op zich niet uit want de taal-keuze van de gebruiker bepaalt de charset.

[ Voor 85% gewijzigd door ScuL op 17-06-2004 20:41 ]

ProMods ETS2 uitbreiding - Mijn tijdszone is UTC+13

Pagina: 1