Heeft iemand enig idee waarom YouTube haar titels als volgt uitspuugt:

Kies een willekeurige video op YouTube en doe dan view source. Je ziet de ‪ voor de titel en de ‬‏ na de titel? Nou, daar gaat 't nu even om hier. Ook bij eigen video's, waarvan ik dus zelf de titel heb ingevuld, zie ik dit. Even "uitgeschreven" ziet 't er zo uit:
Alle titles (voor zover mijn steekproeven reiken natuurlijk
) zijn op deze manier geëncodeerd.
Ik zie wel wat Left-to-right, right-to-left en directional formatting gaande, mogelijk voor support van Arabisch of andere RTL schriften e.d., maar het doel voor "normale LTR titels" ontgaat me. Ik vermoed dat iemand bij YouTube de bal heeft laten vallen hier
Then again; ze zijn daar ook niet gek 
Sterker: Dit lijkt, voor zover ik kan zien, te zijn ontstaan op (of rond) 2011-07-14 (of mogelijk al de 13e). Van 2011-07-01 tot 2011-07-12 was het Youtube - ‪<titel hier>‬‏ en voor 2011-07-01 was 't "gewoon" YouTube - <titel hier>
Ik ben gewoon nieuwschierig waarom ze dit (als het de bedoeling is en geen bug) zouden doen. Deze karakters zijn non-printable en ze zijn me dus tot op heden domweg gewoon niet opgevallen totdat ik toevallig pas bezig was met een hex-editor op een dump van wat data waarna ik bij YouTube ging kijken wat er loos was.
Ik vraag me ook af, maar dat zal wel met verschillende browsers en support voor bepaalde entities te maken hebben, waarom ze de ene keer hex entities gebruiken (‪ en �x202c;) en de andere keer named entities (‏).
Het enige dat ik kon vinden over deze specifieke karakter(combinatie) was deze vraag, maar de antwoorden gaan dan fijn uitleggen wat entities zijn en doen (d'uh) maar ik kan geen verklaring vinden waar deze karakters vandaan zouden kunnen komen en als ze bewust zijn wat er dan het nut van is ofwel: waarom YouTube dit zou doen.
HTML:
1
2
3
4
| <title> ‪The Most Random Video on Youtube EVER!!!‬‏ - YouTube </title> |
Kies een willekeurige video op YouTube en doe dan view source. Je ziet de ‪ voor de titel en de ‬‏ na de titel? Nou, daar gaat 't nu even om hier. Ook bij eigen video's, waarvan ik dus zelf de titel heb ingevuld, zie ik dit. Even "uitgeschreven" ziet 't er zo uit:
code:
1
2
3
4
| <title> {Left-To-Right Embedding}...Titel hier...{Pop Directional Formatting}{Right-To-Left Mark} - YouTube </title> |
Alle titles (voor zover mijn steekproeven reiken natuurlijk
Ik zie wel wat Left-to-right, right-to-left en directional formatting gaande, mogelijk voor support van Arabisch of andere RTL schriften e.d., maar het doel voor "normale LTR titels" ontgaat me. Ik vermoed dat iemand bij YouTube de bal heeft laten vallen hier
Sterker: Dit lijkt, voor zover ik kan zien, te zijn ontstaan op (of rond) 2011-07-14 (of mogelijk al de 13e). Van 2011-07-01 tot 2011-07-12 was het Youtube - ‪<titel hier>‬‏ en voor 2011-07-01 was 't "gewoon" YouTube - <titel hier>
Ik ben gewoon nieuwschierig waarom ze dit (als het de bedoeling is en geen bug) zouden doen. Deze karakters zijn non-printable en ze zijn me dus tot op heden domweg gewoon niet opgevallen totdat ik toevallig pas bezig was met een hex-editor op een dump van wat data waarna ik bij YouTube ging kijken wat er loos was.
Ik vraag me ook af, maar dat zal wel met verschillende browsers en support voor bepaalde entities te maken hebben, waarom ze de ene keer hex entities gebruiken (‪ en �x202c;) en de andere keer named entities (‏).
Het enige dat ik kon vinden over deze specifieke karakter(combinatie) was deze vraag, maar de antwoorden gaan dan fijn uitleggen wat entities zijn en doen (d'uh) maar ik kan geen verklaring vinden waar deze karakters vandaan zouden kunnen komen en als ze bewust zijn wat er dan het nut van is ofwel: waarom YouTube dit zou doen.
offtopic:
Dezelfde vraag heb ik op SO gesteld
in het Dunglish
waar mijn topic question gesloten is
Bastards
Blij dat 't hier een discussieforum is i.p.v. een dumpbak 
Dit heb ik gedaan zodat ik een linkje met de tekst-en-uitleg bij YouTube kon neerleggen i.p.v. heel omslachtig in "ASCII" een bugreport indienen (onderaan de pagina: report a bug) zonder linkjes of een idee te hebben of & en andere entities aan "hun kant" wel of niet escaped worden etc. Ik verwacht dat ze niet erg hard lopen voor nederlandstalige bugreports, anders kregen ze wel een link naar dit topic
Ik heb 't dus wél bij YT (ook) al aangekaart, maar verwacht van hun niet al te snel al een antwoord.
Dezelfde vraag heb ik op SO gesteld

Dit heb ik gedaan zodat ik een linkje met de tekst-en-uitleg bij YouTube kon neerleggen i.p.v. heel omslachtig in "ASCII" een bugreport indienen (onderaan de pagina: report a bug) zonder linkjes of een idee te hebben of & en andere entities aan "hun kant" wel of niet escaped worden etc. Ik verwacht dat ze niet erg hard lopen voor nederlandstalige bugreports, anders kregen ze wel een link naar dit topic
edit:
En de eerste die komt met The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) krijgt een mep
En de eerste die komt met The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) krijgt een mep
[ Voor 9% gewijzigd door RobIII op 20-07-2011 01:57 ]
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij