[HTML] YouTube vage karakters in titel

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Topicstarter
(overleden)
Heeft iemand enig idee waarom YouTube haar titels als volgt uitspuugt:
HTML:
1
2
3
4
<title>
    &#x202a;The Most Random Video on Youtube EVER!!!&#x202c;&rlm;
  - YouTube
</title>

:?

Kies een willekeurige video op YouTube en doe dan view source. Je ziet de &#x202a; voor de titel en de &#x202c;&rlm; na de titel? Nou, daar gaat 't nu even om hier. Ook bij eigen video's, waarvan ik dus zelf de titel heb ingevuld, zie ik dit. Even "uitgeschreven" ziet 't er zo uit:
code:
1
2
3
4
<title>
    {Left-To-Right Embedding}...Titel hier...{Pop Directional Formatting}{Right-To-Left Mark}
  - YouTube
</title>


Alle titles (voor zover mijn steekproeven reiken natuurlijk :+ ) zijn op deze manier geëncodeerd.

Ik zie wel wat Left-to-right, right-to-left en directional formatting gaande, mogelijk voor support van Arabisch of andere RTL schriften e.d., maar het doel voor "normale LTR titels" ontgaat me. Ik vermoed dat iemand bij YouTube de bal heeft laten vallen hier :? Then again; ze zijn daar ook niet gek :+

Sterker: Dit lijkt, voor zover ik kan zien, te zijn ontstaan op (of rond) 2011-07-14 (of mogelijk al de 13e). Van 2011-07-01 tot 2011-07-12 was het Youtube - &#x202a;<titel hier>&#x202c;&rlm; en voor 2011-07-01 was 't "gewoon" YouTube - <titel hier>

Ik ben gewoon nieuwschierig waarom ze dit (als het de bedoeling is en geen bug) zouden doen. Deze karakters zijn non-printable en ze zijn me dus tot op heden domweg gewoon niet opgevallen totdat ik toevallig pas bezig was met een hex-editor op een dump van wat data waarna ik bij YouTube ging kijken wat er loos was.

Ik vraag me ook af, maar dat zal wel met verschillende browsers en support voor bepaalde entities te maken hebben, waarom ze de ene keer hex entities gebruiken (&#x202a; en &#0x202c;) en de andere keer named entities (&rlm;).

Het enige dat ik kon vinden over deze specifieke karakter(combinatie) was deze vraag, maar de antwoorden gaan dan fijn uitleggen wat entities zijn en doen (d'uh) maar ik kan geen verklaring vinden waar deze karakters vandaan zouden kunnen komen en als ze bewust zijn wat er dan het nut van is ofwel: waarom YouTube dit zou doen.

offtopic:
Dezelfde vraag heb ik op SO gesteld O-) in het Dunglish :P waar mijn topic question gesloten is :( Bastards :+ Blij dat 't hier een discussieforum is i.p.v. een dumpbak :Y)
Dit heb ik gedaan zodat ik een linkje met de tekst-en-uitleg bij YouTube kon neerleggen i.p.v. heel omslachtig in "ASCII" een bugreport indienen (onderaan de pagina: report a bug) zonder linkjes of een idee te hebben of &amp; en andere entities aan "hun kant" wel of niet escaped worden etc. Ik verwacht dat ze niet erg hard lopen voor nederlandstalige bugreports, anders kregen ze wel een link naar dit topic :P Ik heb 't dus wél bij YT (ook) al aangekaart, maar verwacht van hun niet al te snel al een antwoord.

[ Voor 9% gewijzigd door RobIII op 20-07-2011 01:57 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Bosmonster
  • Registratie: Juni 2001
  • Laatst online: 10-09 08:45

Bosmonster

*zucht*

Dat zorgt er volgens mij voor dat tekst niet alleen van rechts naar links komt, maar ook juist wordt geformat mbt leestekens. Dan komt het vraagteken aan de andere kant van de zin en dat soort dingen.

Meer dan dat kan ik er ook niet over zeggen, zie het zelden toegepast :P

[ Voor 24% gewijzigd door Bosmonster op 20-07-2011 08:21 ]


Acties:
  • 0 Henk 'm!

Verwijderd

Dat zorgt er volgens mij voor dat bij rtl er YouTube - links naast komt te staan in plaats van rechts. Ik heb eerlijk gezegd geen idee hoe arabische browsers/besturingssystemen tabs en dergelijke weergeven. Ik vermoed dat het daarmee te maken heeft. Zo te zien doet Windows/Firefox dat in elk geval al verkeerd.

Acties:
  • 0 Henk 'm!

  • Barleone
  • Registratie: Maart 2009
  • Laatst online: 16:52
offtopic:
Ik weet niet of het heel spannend is, maar dit werkt (logisch) ook door op GoT bij het posten van een YT linkje.
vb: YouTube: ‪Ik heb de hele dag lopen plakken - Albert Heijn / 3e Zomerhit ( MUSIC VIDEO )‬‏ - YouTube

Tweakers.net 6 nostalgie! - Wayback Machine
Have you tried turning it off and on again?


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Topicstarter
(overleden)
Barleone schreef op woensdag 20 juli 2011 @ 11:30:
offtopic:
Ik weet niet of het heel spannend is, maar dit werkt (logisch) ook door op GoT bij het posten van een YT linkje.
vb: YouTube: ‪Ik heb de hele dag lopen plakken - Albert Heijn / 3e Zomerhit ( MUSIC VIDEO )‬‏ - YouTube
Omdat het forum dus de title ophaalt. Maar ik zie het nut niet van die karakters; als het nou (bijv.) het "YouTube" deel vooraan in de titel zou zetten in een tab/window title/link maar dat doet 't dus niet. Dan zou 't alleen in arabische (en andere(?) rtl) schriften werken, maar dan zie ik weer niet waarom je YT links/rechts zou willen hebben als 't in andere talen "aan 't eind" staat (wat dat dan ook moge zijn qua links/rechts).

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • OkkE
  • Registratie: Oktober 2000
  • Laatst online: 04-09 08:16

OkkE

CSS influencer :+

Misschien was het altijd al zo en is het me nooit eerder opgevallen, maar nu ik na het lezen van dit topic, in Chrome/XP een Youtube video bekijk, zie ik in de titel in de tab ook deze tekens (nouja, een vierkantje-kan-juiste-char-niet-weergeven).

Zou het niet een wijziging (foutje?) van Youtube zijn? Het was me gister thuis (Chrome/OSX) iedergeval niet opgevallen...


@RobIII

Vreemd... Lijkt een WinXP probleem dan.
Afbeeldingslocatie: http://azwart.nl/tmp/youtube-char.png

Dan zal dat dus waarschijnlijk niets met het probleem uit dit topic te maken hebbenn. :)

[ Voor 22% gewijzigd door OkkE op 20-07-2011 15:20 ]

“The best way to get the right answer on the Internet is not to ask a question, it's to post the wrong answer.”
QA Engineer walks into a bar. Orders a beer. Orders 0 beers. Orders 999999999 beers. Orders a lizard. Orders -1 beers.


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Topicstarter
(overleden)
Dat ligt dan aan of XP of een (oude versie van) Chrome of, most likely, aan een "gebrekkig" font want ik kan 't hier op Win7 niet reproduceren.

edit:
Hang on, even een XP bakkie proberen :P

edit:
Jep, confirmed. Op XP zie ik de blokjes ook; Chrome is up-to-date dus daar ligt 't niet aan

edit:
Op XP gaan een aantal van deze titles "mis", maar ik vermoed dat die tekens gewoon niet in 't gebruikte font aanwezig zijn; hebreeuws en japans werken bijv. wel; dus 't lijkt me stug dat 't aan (gebrek aan) unicode support voor windowtitles/tabs zou liggen. Op Win7/64 werken alle titles in Chrome/Fx/Safari/Opera/IE correct.

[ Voor 87% gewijzigd door RobIII op 20-07-2011 14:25 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • BtM909
  • Registratie: Juni 2000
  • Niet online

BtM909

Watch out Guys...

Ik heb er maar een tweet over getweet :P

http://twitter.com/#!/djBOtheMan/status/94024978185461760 (retweet maar een eind weg :P)

Benieuwd of er een reactie komt :)

[ Voor 10% gewijzigd door BtM909 op 21-07-2011 16:33 ]

Ace of Base vs Charli XCX - All That She Boom Claps (RMT) | Clean Bandit vs Galantis - I'd Rather Be You (RMT)
You've moved up on my notch-list. You have 1 notch
I have a black belt in Kung Flu.


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Topicstarter
(overleden)
BtM909 schreef op donderdag 21 juli 2011 @ 16:18:
Ik heb er maar een tweet over getweet :P

http://twitter.com/#!/djBOtheMan/status/94024978185461760 (retweet maar een eind weg :P)

Benieuwd of er een reactie komt :)
Ik heb dus al een "bugreport" ingediend ;) Als je dan toch twittert (en dank daarvoor overigens), zet dan even http://riii.nl/mn5ak in je tweet :Y)

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • BtM909
  • Registratie: Juni 2000
  • Niet online

BtM909

Watch out Guys...

Zie 't meer als een sociaal experimentje of ze dat actief checken en opvolging op geven :)

Ace of Base vs Charli XCX - All That She Boom Claps (RMT) | Clean Bandit vs Galantis - I'd Rather Be You (RMT)
You've moved up on my notch-list. You have 1 notch
I have a black belt in Kung Flu.


Acties:
  • 0 Henk 'm!

  • CoolGamer
  • Registratie: Mei 2005
  • Laatst online: 06-09 16:59

CoolGamer

What is it? Dragons?

Dit filmpje (YouTube: ‫كاظم الساهر ,,, حركت الروح‬‎ - YouTube) gebruikt &#x202b;...&#x202c;&lrm; i.p.v. &#x202a;...&#x202c;&rlm;. Dus het zorgt er dus voor de de titel altijd in de juiste tekstrichting staat. Zo kunnen ze code misschien makkelijker hergebruiken of de data makkelijker cachen. Dit is zo, want in de html-tag staat de richting gedefinieerd. Vervolgens zou je dan overal die tekstrichting moeten controleren op plekken waar tekst voor zou kunnen komen met een andere richting (zoals bijvoorbeeld in titels).

Alleen waarvoor die &lrm;/&rlm; wordt gebruikt in dit geval weet ik zo snel niet. Een mark direct achter een pop is een beetje vreemd. Aangezien de mark gaat over de voorgaande teken(s?).

[ Voor 26% gewijzigd door CoolGamer op 21-07-2011 23:44 ]

¸.·´¯`·.¸.·´¯`·.¸><(((º>¸.·´¯`·.¸><(((º>¸.·´¯`·.¸.·´¯`·.¸.·´¯`·.¸<º)))><¸.·´¯`·.¸.·´¯`·.¸.·´¯`·.¸

Pagina: 1