[HTML] YouTube vage karakters in titel

woensdag 20 juli 2011 01:35

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Html

Topicstarter

Heeft iemand enig idee waarom YouTube haar titels als volgt uitspuugt:

HTML:

<title>
    &#x202a;The Most Random Video on Youtube EVER!!!&#x202c;&rlm;
  - YouTube
</title>

Kies een willekeurige video op YouTube en doe dan view source. Je ziet de ‪ voor de titel en de ‬&rlm; na de titel? Nou, daar gaat 't nu even om hier. Ook bij eigen video's, waarvan ik dus zelf de titel heb ingevuld, zie ik dit. Even "uitgeschreven" ziet 't er zo uit:

code:

<title>
    {Left-To-Right Embedding}...Titel hier...{Pop Directional Formatting}{Right-To-Left Mark}
  - YouTube
</title>

Alle titles (voor zover mijn steekproeven reiken natuurlijk

) zijn op deze manier geëncodeerd.

Ik zie wel wat Left-to-right, right-to-left en directional formatting gaande, mogelijk voor support van Arabisch of andere RTL schriften e.d., maar het doel voor "normale LTR titels" ontgaat me. Ik vermoed dat iemand bij YouTube de bal heeft laten vallen hier

Then again; ze zijn daar ook niet gek

Sterker: Dit lijkt, voor zover ik kan zien, te zijn ontstaan op (of rond) 2011-07-14 (of mogelijk al de 13^e). Van 2011-07-01 tot 2011-07-12 was het Youtube - ‪<titel hier>‬&rlm; en voor 2011-07-01 was 't "gewoon" YouTube - <titel hier>

Ik ben gewoon nieuwschierig waarom ze dit (als het de bedoeling is en geen bug) zouden doen. Deze karakters zijn non-printable en ze zijn me dus tot op heden domweg gewoon niet opgevallen totdat ik toevallig pas bezig was met een hex-editor op een dump van wat data waarna ik bij YouTube ging kijken wat er loos was.

Ik vraag me ook af, maar dat zal wel met verschillende browsers en support voor bepaalde entities te maken hebben, waarom ze de ene keer hex entities gebruiken (‪ en &#0x202c;) en de andere keer named entities (&rlm;).

Het enige dat ik kon vinden over deze specifieke karakter(combinatie) was deze vraag, maar de antwoorden gaan dan fijn uitleggen wat entities zijn en doen (d'uh) maar ik kan geen verklaring vinden waar deze karakters vandaan zouden kunnen komen en als ze bewust zijn wat er dan het nut van is ofwel: waarom YouTube dit zou doen.

offtopic:
Dezelfde vraag heb ik op SO gesteld

in het Dunglish

waar mijn topic question gesloten is

Bastards

Blij dat 't hier een discussieforum is i.p.v. een dumpbak

Dit heb ik gedaan zodat ik een linkje met de tekst-en-uitleg bij YouTube kon neerleggen i.p.v. heel omslachtig in "ASCII" een bugreport indienen (onderaan de pagina: report a bug) zonder linkjes of een idee te hebben of & en andere entities aan "hun kant" wel of niet escaped worden etc. Ik verwacht dat ze niet erg hard lopen voor nederlandstalige bugreports, anders kregen ze wel een link naar dit topic

Ik heb 't dus wél bij YT (ook) al aangekaart, maar verwacht van hun niet al te snel al een antwoord.

edit:
En de eerste die komt met The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) krijgt een mep

[ Voor 9% gewijzigd door RobIII op 20-07-2011 01:57 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

woensdag 20 juli 2011 08:18

Acties:

Bosmonster

*zucht*

Html

Dat zorgt er volgens mij voor dat tekst niet alleen van rechts naar links komt, maar ook juist wordt geformat mbt leestekens. Dan komt het vraagteken aan de andere kant van de zin en dat soort dingen.

Meer dan dat kan ik er ook niet over zeggen, zie het zelden toegepast

[ Voor 24% gewijzigd door Bosmonster op 20-07-2011 08:21 ]

woensdag 20 juli 2011 08:33

Acties:

Verwijderd

Dat zorgt er volgens mij voor dat bij rtl er YouTube - links naast komt te staan in plaats van rechts. Ik heb eerlijk gezegd geen idee hoe arabische browsers/besturingssystemen tabs en dergelijke weergeven. Ik vermoed dat het daarmee te maken heeft. Zo te zien doet Windows/Firefox dat in elk geval al verkeerd.

woensdag 20 juli 2011 11:30

Acties:

Barleone

offtopic:
Ik weet niet of het heel spannend is, maar dit werkt (logisch) ook door op GoT bij het posten van een YT linkje.
vb: YouTube: ‪Ik heb de hele dag lopen plakken - Albert Heijn / 3e Zomerhit ( MUSIC VIDEO )‬‏ - YouTube

Tweakers.net 6 nostalgie! - Wayback Machine
Have you tried turning it off and on again?

woensdag 20 juli 2011 11:39

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Html

Topicstarter

Barleone schreef op woensdag 20 juli 2011 @ 11:30:

offtopic:
Ik weet niet of het heel spannend is, maar dit werkt (logisch) ook door op GoT bij het posten van een YT linkje.
vb: YouTube: ‪Ik heb de hele dag lopen plakken - Albert Heijn / 3e Zomerhit ( MUSIC VIDEO )‬‏ - YouTube

Omdat het forum dus de title ophaalt. Maar ik zie het nut niet van die karakters; als het nou (bijv.) het "YouTube" deel vooraan in de titel zou zetten in een tab/window title/link maar dat doet 't dus niet. Dan zou 't alleen in arabische (en andere(?) rtl) schriften werken, maar dan zie ik weer niet waarom je YT links/rechts zou willen hebben als 't in andere talen "aan 't eind" staat (wat dat dan ook moge zijn qua links/rechts).

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

woensdag 20 juli 2011 12:34

Acties:

OkkE

CSS influencer :+

Misschien was het altijd al zo en is het me nooit eerder opgevallen, maar nu ik na het lezen van dit topic, in Chrome/XP een Youtube video bekijk, zie ik in de titel in de tab ook deze tekens (nouja, een vierkantje-kan-juiste-char-niet-weergeven).

Zou het niet een wijziging (foutje?) van Youtube zijn? Het was me gister thuis (Chrome/OSX) iedergeval niet opgevallen...

@RobIII

Vreemd... Lijkt een WinXP probleem dan.
Afbeeldingslocatie: http://azwart.nl/tmp/youtube-char.png

Afbeeldingslocatie: http://azwart.nl/tmp/youtube-char.png

Dan zal dat dus waarschijnlijk niets met het probleem uit dit topic te maken hebbenn.

[ Voor 22% gewijzigd door OkkE op 20-07-2011 15:20 ]

“The best way to get the right answer on the Internet is not to ask a question, it's to post the wrong answer.”
QA Engineer walks into a bar. Orders a beer. Orders 0 beers. Orders 999999999 beers. Orders a lizard. Orders -1 beers.

woensdag 20 juli 2011 13:53

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Html

Topicstarter

Dat ligt dan aan of XP of een (oude versie van) Chrome of, most likely, aan een "gebrekkig" font want ik kan 't hier op Win7 niet reproduceren.

edit:
Hang on, even een XP bakkie proberen

edit:
Jep, confirmed. Op XP zie ik de blokjes ook; Chrome is up-to-date dus daar ligt 't niet aan

edit:
Op XP gaan een aantal van deze titles "mis", maar ik vermoed dat die tekens gewoon niet in 't gebruikte font aanwezig zijn; hebreeuws en japans werken bijv. wel; dus 't lijkt me stug dat 't aan (gebrek aan) unicode support voor windowtitles/tabs zou liggen. Op Win7/64 werken alle titles in Chrome/Fx/Safari/Opera/IE correct.

[ Voor 87% gewijzigd door RobIII op 20-07-2011 14:25 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

donderdag 21 juli 2011 16:18

Acties:

BtM909

Watch out Guys...

Ik heb er maar een tweet over getweet

http://twitter.com/#!/djBOtheMan/status/94024978185461760 (retweet maar een eind weg

)

Benieuwd of er een reactie komt

[ Voor 10% gewijzigd door BtM909 op 21-07-2011 16:33 ]

Ace of Base vs Charli XCX - All That She Boom Claps (RMT) | Clean Bandit vs Galantis - I'd Rather Be You (RMT)
You've moved up on my notch-list. You have 1 notch
I have a black belt in Kung Flu.

donderdag 21 juli 2011 16:53

Acties:

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Html

Topicstarter

BtM909 schreef op donderdag 21 juli 2011 @ 16:18:
Ik heb er maar een tweet over getweet

http://twitter.com/#!/djBOtheMan/status/94024978185461760 (retweet maar een eind weg )

Benieuwd of er een reactie komt

Ik heb dus al een "bugreport" ingediend

Als je dan toch twittert (en dank daarvoor overigens), zet dan even http://riii.nl/mn5ak in je tweet

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij

donderdag 21 juli 2011 17:00

Acties:

BtM909

Watch out Guys...

Zie 't meer als een sociaal experimentje of ze dat actief checken en opvolging op geven

Ace of Base vs Charli XCX - All That She Boom Claps (RMT) | Clean Bandit vs Galantis - I'd Rather Be You (RMT)
You've moved up on my notch-list. You have 1 notch
I have a black belt in Kung Flu.

donderdag 21 juli 2011 22:59

Acties:

CoolGamer

What is it? Dragons?

Dit filmpje (YouTube: ‫كاظم الساهر ,,, حركت الروح‬‎ - YouTube) gebruikt ‫...‬&lrm; i.p.v. ‪...‬&rlm;. Dus het zorgt er dus voor de de titel altijd in de juiste tekstrichting staat. Zo kunnen ze code misschien makkelijker hergebruiken of de data makkelijker cachen. Dit is zo, want in de html-tag staat de richting gedefinieerd. Vervolgens zou je dan overal die tekstrichting moeten controleren op plekken waar tekst voor zou kunnen komen met een andere richting (zoals bijvoorbeeld in titels).

Alleen waarvoor die &lrm;/&rlm; wordt gebruikt in dit geval weet ik zo snel niet. Een mark direct achter een pop is een beetje vreemd. Aangezien de mark gaat over de voorgaande teken(s?).

[ Voor 26% gewijzigd door CoolGamer op 21-07-2011 23:44 ]

¸.·´¯`·.¸.·´¯`·.¸><(((º>¸.·´¯`·.¸><(((º>¸.·´¯`·.¸.·´¯`·.¸.·´¯`·.¸<º)))><¸.·´¯`·.¸.·´¯`·.¸.·´¯`·.¸

Onderwerpen