Toon posts:

[WEB] een russische variant maken van een website

Pagina: 1
Acties:

Verwijderd

Topicstarter
ik maak een site in het russisch.
De gegevens worden uit een access db gehaald. Ik krijg de teksten aangeleverd in een word bestand. Als ik de inhoud van word kopieer in een textfield van access gaat het goed. In Access krijg ik gewoon russisch te zien. Als ik vervolgens de site ga bekijken die de gegevens uit Access haalt worden het allemaal ?????????

Ik heb het volgende gedefinieerd in HTML: <meta http-equiv="Content-Type" Content="Text/html; charset=iso-8859-5">

Ik heb ook een stukje tekst van een russische site gehaald (uit de source). In HTML wordt dat weergegeven in de harde code (hexidecimaal)
Maar als ik een stukje russisch kopieer uit word en in HTML plak worden het weer ???????????

Als HTML editor gebruik ik HomeSite....

Iemand een idee / tip??

  • HunterPro
  • Registratie: Juni 2001
  • Niet online
heb je de karakterset wel geinstalleerd? Doet de russische site het ook in je browser? :)

  • André
  • Registratie: Maart 2002
  • Laatst online: 20-02 09:23

André

Analytics dude

Tip: zet _alles_ om in UTF-8 en er zouden geen problemen meer moeten zijn.

Verwijderd

Topicstarter
ja, russische sites worden in het russisch weergegeven. Mijn encoding staat op autoselect en de site waar ik nu mee bezig ben staat dan op Cyrillic (ISO)....

  • JHS
  • Registratie: Augustus 2003
  • Laatst online: 04-01 15:49

JHS

Splitting the thaum.

Let er op dat headers de meta declaratie overruled, afaik :) .

DM!


  • Soultaker
  • Registratie: September 2000
  • Laatst online: 21-02 03:42
Eerst eens onderzoeken of de source codering wel klopt. Dump je HTML pagina (op de server, of met een client die géén translatie doet, zoals fetch of wget) eens en bekijk de inhoud met een hex editor. Als het goed is is het een 1-byte codering met alle cyrillische karakters boven de 128.
Verwijderd schreef op vrijdag 12 mei 2006 @ 15:39:
Ik heb ook een stukje tekst van een russische site gehaald (uit de source). In HTML wordt dat weergegeven in de harde code (hexidecimaal)
Dit stuk kan ik niet volgen. Je haalt een stukje tekst van een site (hoe? met het Windows klembord?) en dan ...?
JHS schreef op vrijdag 12 mei 2006 @ 15:48:
Let er op dat headers de meta declaratie overruled, afaik :) .
Maar als de browser aangeeft iso-8859-5 te gebruiken, moet dat toch goed zitten lijkt me.

[ Voor 17% gewijzigd door Soultaker op 12-05-2006 15:54 ]


Verwijderd

Topicstarter
Soultaker schreef op vrijdag 12 mei 2006 @ 15:54:
Eerst eens onderzoeken of de source codering wel klopt. Dump je HTML pagina (op de server, of met een client die géén translatie doet, zoals fetch of wget) eens en bekijk de inhoud met een hex editor. Als het goed is is het een 1-byte codering met alle cyrillische karakters boven de 128.


[...]
code klopt, want de engelse en franse teksten die uit access gehaald worden, worden netjes getoond
Dit stuk kan ik niet volgen. Je haalt een stukje tekst van een site (hoe? met het Windows klembord?) en dan ...?
[...]

Het was een site die gaat over de verschillen in de russische en nederlandse taal. In de source stonden de hexa codes. Als je die in de HTML editor gooit wordt het in de browser netjes russisch.
Maar als de browser aangeeft iso-8859-5 te gebruiken, moet dat toch goed zitten lijkt me.
Dat dacht ik ook, maar blijkbaar niet.

Verwijderd

Topicstarter
André schreef op vrijdag 12 mei 2006 @ 15:46:
Tip: zet _alles_ om in UTF-8 en er zouden geen problemen meer moeten zijn.
dus ook in <meta> UTF-8 als charset?

  • Soultaker
  • Registratie: September 2000
  • Laatst online: 21-02 03:42
Verwijderd schreef op vrijdag 12 mei 2006 @ 16:01:
Het was een site die gaat over de verschillen in de russische en nederlandse taal. In de source stonden de hexa codes. Als je die in de HTML editor gooit wordt het in de browser netjes russisch.
Ik snap nog steeds niet hoe je van hexadecimale codering naar cyrillische tekens komt. Misschien heb je een linkje naar die site?

UTF-8 is trouwens wel aan te raden als je behalve Russische tekst ook Nederlandse of Franse tekst wil weergeven (met de bijbehorende diakrieten als trema's in het Nederlands en accenten en de c-cedille in het Frans).
Verwijderd schreef op vrijdag 12 mei 2006 @ 16:02:
dus ook in <meta> UTF-8 als charset?
Als het in de HTTP-headers staat hoeft het niet meer in de HTML header, maar het kan geen kwaad.

[ Voor 17% gewijzigd door Soultaker op 12-05-2006 16:10 ]


  • André
  • Registratie: Maart 2002
  • Laatst online: 20-02 09:23

André

Analytics dude

Verwijderd schreef op vrijdag 12 mei 2006 @ 16:02:
[...]

dus ook in UTF-8 als charset?
Overal, in je database, in je headers, in je meta, in je editor, op de server, enz ;)

Verwijderd

Topicstarter
Het probleem zit em nu alleen nog in de gegevens die uit de database gehaald worden. In de database zelf (Access) wordt het russisch gewoon weergegeven, maar zodra de gegevens worden aangeroepen vanuit de code worden in de browser alleen ??????? weergegeven.
Ik kan in de editor wel gewoon russische tekst ingeven als ik mijn toetsenbord op russisch zet.

Maar als ik het goed begrijp kan je ook je database instellen op UTF-8? Wij (ik en een devgoeroe) hebben al even gezocht maar we konden het niet vinden.
Iemand een schopje in de goede richting?

  • André
  • Registratie: Maart 2002
  • Laatst online: 20-02 09:23

André

Analytics dude

Het kan zijn dat je Access wel de goede karakters doorgeeft maar dat je ODBC driver geen UTF-8 ondersteund. Ook kan het zijn dat de data op een andere manier in je database gezet moet worden: copy/paste de info naar een editor toe die UTF-8 ondersteund: MS Word bijvoorbeeld. Sla het bestand op als een text-bestand. Schrijf een progje die die info opnieuw in de database zet maar dan via je db connectie.

Verwijderd

Topicstarter
Soultaker schreef op vrijdag 12 mei 2006 @ 16:08:
Ik snap nog steeds niet hoe je van hexadecimale codering naar cyrillische tekens komt. Misschien heb je een linkje naar die site?
http://www.xs4all.nl/~wjsn/russian.htm

als je in de source kijkt worden delen van de russische tekst in hexa waarden weergegeven.

Verwijderd

Ik ben bezig met japans en ben tegen de zelfde problemen aangelopen.
er zijn verschillende oplossingen voor dit probleem.

kijk ook even naar het fonts !! wat je bruikt!!

voorbeeldje van een mogelijke oplossing (kijk naar de source)

<META http-equiv=Content-Type content="text/html; charset=x-sjis">

http://www.xs4all.nl/~henrim/japans/kanji4aa.htm
http://www.xs4all.nl/~henrim/japans/kanijtekens01.HTML

Probleem was dat ik de japanse kanji teken omzet in 2 ascii tekens.
Ook werk het met XML bestanden.

Verwijderd

Topicstarter
Het russische probleem is opgelost! Het cms dat bij de site hoort blijkt als een vertaalmachine te werken....
Pagina: 1