Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien
Toon posts:

aanwijzing in reactietool over unicode tekens of entities

Pagina: 1
Acties:
  • 32 views sinds 30-01-2008

Verwijderd

Topicstarter
Ik heb gezocht in dit forum en bugs, maar wat er nu feitelijk wordt verwacht van iemand die toevallig een vreemd teken in wil voeren is mij vooralsnog niet duidelijk geworden. Het zou IMHO nuttig zijn als bij de aanwijzingen op de popup reactietool iets werd gezegd over dit onderwerp. Bij andere postings over dit onderwerp spreekt men elkaar voordurend tegen, daarom heb ik voor een nieuw topic gekozen.

Ik post hier en niet in bugs omdat er in een posting opgemerkt werd dat aangezien entities html zijn en (kennelijk) voor het invoeren van html tekens een speciale abonnementsvorm is vereist (dit heb ik evenwel in de faq voor abonnementen niet terug kunnen vinden) het niet mogelijk is om speciale tekens in te voeren. Als dat klopt dan zou de mededeling moeten zijn: pas op, je kan geen entities (of unicode) voor speciale tekens invoeren tenzij je een betaalde abonnementsvorm hebt.

Ik kwam op dit onderwerp toen ik argeloos gewoon tekst had ingevoerd met wat voorbeelden van tekens in het Japans, Chinees en Grieks (volledig ontopic), vanzelfsprekend in unicode. Het systeem converteerde de speciale tekens evenwel naar entities, maar converteerde vervolgens de ampersand waarmee de entities nu eemaal starten ook weer naar entities, waardoor de entities letterlijk werden weergegeven. Bij een edit verschijnen wel weer correcte entities, maar na het posten worden het weer letterlijke entities. Dit lijkt toch wel een beetje op een bug...

In de andere threads over dit onderwerp kwam ik ook de suggestie tegen dat tweakers gewoon geen unicode ondersteunt, maar dit lijkt me sterk, aangezien de tekens in mijn reactie correct werden herkend en omgezet in entities (maar daarna verhaspeld). Of anders zou direct in entities posten mogelijk moeten zijn (moderne browsers geven die meen ik altijd goed weer, maakt niet uit welke characterset de pagina nominaal heeft dan). Maar, zoals gezegd, wat de aanpak van tweakers nu feitelijk is op dit punt is mij onduidelijk.

Wel duidelijk is dat die letterlijk weergegeven entities (die ik vaak genoeg voorbij zie komen) geen smoel zijn.

Tenslotte nog even een test: (latin oov) (entities grieks: οον) (entities grieks, hex οον). (unicode: οον)

Bij bekijk bericht werkten althans de decimale entities en zelfs ook de unicode correct (alleen de hexadecimale entities werkten niet). Snel nog een test gedaan in het forum zelf, maar daar werken ook direct ingevoerde entities niet. Bug of feature?

  • Wouter Tinus
  • Registratie: Oktober 1999
  • Niet online

Wouter Tinus

Whee!

Ik begrijp dat dit over het forum gaat, dus ik verschuif dit topic naar React Bugs en Featurerequests :)

Professioneel Hyves-weigeraar


  • moto-moi
  • Registratie: Juli 2001
  • Laatst online: 09-06-2011

moto-moi

Ja, ik haat jou ook :w

Ik vraag me af of er wel grieks in de iso-8859-15specificatie zit ;)
Verder is het voor een gewone user wel mogelijk om entities te gebruiken, alleen zullen degene die niet in deze iso-8859-15 zitten uiteraard niet weergegeven worden zoals je verwacht :)

Verder helpen mijn html-rechten ook maar weinig in dit geval:
Tenslotte nog even een test: (latin oov) (entities grieks: οον) (entities grieks, hex ο ο ν). (unicode: οον)

God, root, what is difference? | Talga Vassternich | IBM zuigt


Verwijderd

Topicstarter
moto-moi schreef op vrijdag 03 maart 2006 @ 00:32:
Ik vraag me af of er wel grieks in de iso-8859-15specificatie zit ;)
Verder is het voor een gewone user wel mogelijk om entities te gebruiken, alleen zullen degene die niet in deze iso-8859-15 zitten uiteraard niet weergegeven worden zoals je verwacht :)
Voor alle duidelijkheid, ik bedoel geen name entities, maar numeric entities. En voor zover ik weet beperkt de ondersteuning daarvan zich in alle moderne browsers zich niet tot de actuele characterset; via numeric entities kun je ook charactes weergeven die daarbuiten zitten. Zie bijvoorbeeld
[url]http://http://www.pemberley.com/janeinfo/latin1.html#noniso88591[/url]

Ik realiseer me nu dat mijn verhaal ook verwarrend kan zijn voor mensen die daadwerkelijk alleen maar latin-1 fonts hebben geinstalleerd in hun os. Ik heb in het verleden gemerkt dat bijvoorbeeld ms-windows heel karig was met standaard internationalisatie. In het verleden zag ik dat pagina's die gedefinieerd zijn met een afwijkende characterset in ms-windows wel waarschuwing opleverden dat een bepaald font noodzakelijk was (als dat nog niet aanwezig was), maar de numeric entities worden niet op die wijze gedetecteerd. Misschien dat er gebruikers zijn die nog geen eens een font hebben met ondersteuning voor de letters van andere EG landen, zoals Griekenland. Ik bedoel, ook voor de duidelijkheid, de test die ik in DIT forum deed met Grieks werkte zowel voor numeric entities in decimale notatie en OOK met pure unicode. Maar dat werkt niet in de frontpagina van tweakers.

Als ik hier tik: unicode: οον, en decimale entities grieks: οον, dan zie ik in mijn browsers correct iets wat lijkt op latin oov. Maar op de frontpage werkt dat niet, dan krijg ik een extra ampersand waardoor de ampersand entities letterlijk worden weergegven. Als je hier niet drie keer oov ziet, dan ontbeert je systeem vermoedelijk minimale internationalisatie.

[ Voor 2% gewijzigd door Verwijderd op 03-03-2006 09:10 . Reden: edit tikfout ]


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Als dat klopt dan zou de mededeling moeten zijn: pas op, je kan geen entities (of unicode) voor speciale tekens invoeren tenzij je een betaalde abonnementsvorm hebt.
Nee, dat klopt niet. Hier op het forum kan je gewoon entities gebruiken in je post (niet in de titel van een bericht), daar is geen abonnement voor nodig.

De frontpage staat echter los van het forum en gebruikt een eigen UBB-parser waarin het invoeren van entities (nog) niet ondersteund wordt.
Als je hier niet drie keer oov ziet, dan ontbeert je systeem vermoedelijk minimale internationalisatie.
Ik zie ze ;) Ik denk echter dat je voorzichtig moet zijn met het veelvuldig gebruik van dergelijke karakters aangezien er inderdaad mensen zullen zijn die het niet zullen zien.

Overigens als je letterlijk unicode karakters invoert en submit dan zal je browser de niet-ondersteunde tekens (adhv de karakterset van de pagina zelf - in ons geval ISO-8859-15) de tekens omzetten naar entities. De server ontvangt dus geen unicode karakters maar deze entities. Op de frontpage wordt daar htmlspecialchars() overheen gehaald waardoor de ampersand nogmaals geencode wordt.

[ Voor 23% gewijzigd door crisp op 03-03-2006 09:40 ]

Intentionally left blank


Verwijderd

Topicstarter
Op de frontpage wordt daar htmlspecialchars() overheen gehaald waardoor de ampersand nogmaals geencode wordt.
Ik heb gemerkt dat dat zowel geldt voor als unicode ingevoerde tekens alsook voor als numeric entitiy ingevoerde tekens.
De frontpage staat echter los van het forum en gebruikt een eigen UBB-parser waarin het invoeren van entities (nog) niet ondersteund wordt.
Met alle respect, de frontpage is dus gewoon brak. ;)

Ik zie de verhaspelte entities al tijden voorbij komen, het is geen fraaie binnenkomer voor een site die prat gaat op het aftrimmen van systemen. Verder zie ik regelmatig nieuwberichten over de internationalisatie van het internet, of problemen met pishing, en die zullen stellig reacties ontlokken die tekens bevatten die dus (nog) niet ondersteund worden.
Ik denk echter dat je voorzichtig moet zijn met het veelvuldig gebruik van dergelijke karakters aangezien er inderdaad mensen zullen zijn die het niet zullen zien.
Wel, voor de frontpage is dit dus een academische kwestie. Als die wel zou werken zou ik het er mee eens zijn. Als uit de context van een reactie niet blijkt dat niet-westerse tekens volgen is een waarschuwing op z'n plaats. Maar ik denk niet dat het gegeven dat bepaalde mensen geen internationele fonts op hun systeem hebben reden is om niet latin1 tekens te vermijden (lots of reasons, maar OT).

Dank je zeer voor je reactie.

  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Verwijderd schreef op vrijdag 03 maart 2006 @ 11:00:
[...]


Ik heb gemerkt dat dat zowel geldt voor als unicode ingevoerde tekens alsook voor als numeric entitiy ingevoerde tekens.
Dat klopt, die beginnen beide met een ampersand ;)
Met alle respect, de frontpage is dus gewoon brak. ;)
Ik vind dat niet brak, zelfs niet eens een echte tekortkoming aangezien het maar triviaal is.
Ik zie de verhaspelte entities al tijden voorbij komen, het is geen fraaie binnenkomer voor een site die prat gaat op het aftrimmen van systemen. Verder zie ik regelmatig nieuwberichten over de internationalisatie van het internet, of problemen met pishing, en die zullen stellig reacties ontlokken die tekens bevatten die dus (nog) niet ondersteund worden.
Ik ben het zelf nog niet veel tegengekomen...
Wel, voor de frontpage is dit dus een academische kwestie. Als die wel zou werken zou ik het er mee eens zijn. Als uit de context van een reactie niet blijkt dat niet-westerse tekens volgen is een waarschuwing op z'n plaats. Maar ik denk niet dat het gegeven dat bepaalde mensen geen internationele fonts op hun systeem hebben reden is om niet latin1 tekens te vermijden (lots of reasons, maar OT).
Aangezien implementatie ook maar triviaal was heb ik dat inmiddels gedaan ;)

Voor GoT heb ik ook support voor de hexadecimale notatie ingebakken; deze zal meekomen als we upgraden naar React 1.9.4 :)
Dank je zeer voor je reactie.
np :)

Intentionally left blank


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

lijkt me opgelost :)

Intentionally left blank

Pagina: 1

Dit topic is gesloten.