Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[bug] Signature too long -> niet waar

Pagina: 1
Acties:

  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Ik wilde zojuist mijn signature wijzigen en ik kreeg deze melding:
code:
1
2
3
4
Er is iets fout gegaan. Probeer het later nog eens, of ga terug.

De ongeparsede signature is langer dan het maximum van 255 tekens.
(interne identificatie: user::edit_user::signature_raw_too_long)


Terwijl wat ik ingevoerd had, maar 94 tekens lang is :?

日本!🎌


  • D4NG3R
  • Registratie: Juli 2009
  • Laatst online: 22:03

D4NG3R

kiwi

:)

Wat probeerde je in te voeren dan? Want spaties, komma's etc zijn ook tekens ;) .

(Teminste ik neem aan dat dat ook geld in de signature box op t.net)

Komt d'r in, dan kö-j d’r oet kieken


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Het lijkt me handig als je hier dan even aangeeft wat je precies ingevuld had ;)

Intentionally left blank


  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Ah ja, ik was er al bang voor... Japanofiel dat ik ben, probeerde ik dit:
わたしは にせんじゅうにねんに にほんに いきましょう ♡
watashi wa nisenjuuninen yongatsu ni nihon ni ikimashou! yay!
Dat is inclusief de BR-tag 94 tekens in mijn wereld :)

[ Voor 7% gewijzigd door _Thanatos_ op 28-11-2011 15:09 ]

日本!🎌


  • Hahn
  • Registratie: Augustus 2001
  • Laatst online: 06:23
わたしは にせんじゅうにねんに にほんに いきましょう ♡[br]watashi wa nisenjuuninen yongatsu ni nihon ni ikimashou! yay!
Dat zijn een stuk meer dan 94 tekens ;)

The devil is in the details.


  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Hoe wordt er dan precies geteld? Ieder teken keer 5 ofzo :?

Oh zo... Maar, waarom doet-ie het dan zo :?

[ Voor 28% gewijzigd door _Thanatos_ op 28-11-2011 15:10 ]

日本!🎌


  • Snake
  • Registratie: Juli 2005
  • Laatst online: 07-03-2024

Snake

Los Angeles, CA, USA

Unicode *O*
Of UTF-8?

* Snake gaat Joel's blog nog eens nalezen :')

[ Voor 75% gewijzigd door Snake op 28-11-2011 15:10 ]

Going for adventure, lots of sun and a convertible! | GMT-8


  • Notna
  • Registratie: November 2002
  • Nu online

Notna

Moderator General Chat / Wonen & Mobiliteit

Where are you?®

_Thanatos_ schreef op maandag 28 november 2011 @ 15:09:
Hoe wordt er dan precies geteld? Ieder teken keer 5 ofzo :?

Oh zo... Maar, waarom doet-ie het dan zo :?
Heb je die break erin gezet als spaties of met [ br ] ?

Ow never mind :P
_Thanatos_ schreef op maandag 28 november 2011 @ 15:09:
Hoe wordt er dan precies geteld? Ieder teken keer 5 ofzo :?

Oh zo... Maar, waarom doet-ie het dan zo :?
Omdat het gaat om invoer, niet om display?

[ Voor 34% gewijzigd door Notna op 28-11-2011 15:13 ]

Xbox Live ID:Notna8310


  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Ja heel fijn, maar een teken is een teken. Hoe moet ik nou ruiken of het gewoon tekens zijn die geteld worden,of dat het eerst wordt omgezet naar eoa gekke encoding? "Ongeparst" staat er toch? Dan is ieder teken nog gewoon 1 teken, iyam.

Die break is gewoon een [br]

日本!🎌


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

unicode en PHP is nog steeds :'(

Wij draaien dus nog op latin-9, en daardoor stuurt je browser unicode characters die niet in latin-9 zitten dus als entiteiten op. Dergelijke karakters nemen dus zo 8 bytes per stuk in beslag (en feitelijk kunnen wij serverside niet zien of dit letterlijk zo bedoelt was of dat het gaat om unicode omgezet naar entities).

Er wordt gesproken over 'tekens' omdat dat doorgaans begrijpelijker is dan 'bytes met inachtname van de door ons gebruikte characterset voor opslag' :P

[ Voor 17% gewijzigd door crisp op 28-11-2011 15:14 ]

Intentionally left blank


  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Maar je wilt neem ik aan controleren of het in jullie database-veld past... dan gaat het er om wat dáárin past, niet hoe PHP de boel interpreteert. Als je het dus eerst omzet naar UTF-8 (wat neem ik aan toch wel de encoding is voor jullie database??) en d/an pas gaan tellen hoeveel karakters het zijn...?

Ik heb niet zoveel verstand van PHP, maar ik mag toch hopen dat ie wel kan tellen in een utf-8 string?

/edit
En anders kun je altijd nog een enctype aan het formulier geven...
Maar sowieso is latin-9 niet echt meer van deze tijd. Als je alles utf-8 maakt, zijn er geen problemen meer, maar dan moet je dat wel in je php, uhm, dingesen :)

[ Voor 22% gewijzigd door _Thanatos_ op 28-11-2011 15:17 ]

日本!🎌


  • Sir_Hendro
  • Registratie: Augustus 2006
  • Laatst online: 18-11 23:09
Misschien moet je maar Kanji gebruiken ipv Kana. Dan past het vast wel :P (alleen zal vast niemand het kunnen lezen haha)

GTA VI - All aboard the hype train!!


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

_Thanatos_ schreef op maandag 28 november 2011 @ 15:15:
Maar je wilt neem ik aan controleren of het in jullie database-veld past... dan gaat het er om wat dáárin past, niet hoe PHP de boel interpreteert. Als je het dus eerst omzet naar UTF-8 (wat neem ik aan toch wel de encoding is voor jullie database??) en d/an pas gaan tellen hoeveel karakters het zijn...?

Ik heb niet zoveel verstand van PHP, maar ik mag toch hopen dat ie wel kan tellen in een utf-8 string?

/edit
En anders kun je altijd nog een enctype aan het formulier geven...
Maar sowieso is latin-9 niet echt meer van deze tijd. Als je alles utf-8 maakt, zijn er geen problemen meer, maar dan moet je dat wel in je php, uhm, dingesen :)
Onze database is dus ook latin, en betreffende veld kan maar 255 bytes bevatten.

PHP6 zou naar verluidt volledig unicode-compliant moeten worden; het wachten is dus daarop want ook wij willen niets liever dan volledig overstappen op unicode (UTF8).

Intentionally left blank


  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Topicstarter
Ah. Zonde.
Nouja, vooruit dan maar :)

Misschien wel een idee om de melding aan te passen, want Japanse tekens zijn niet de enige die een entity veroorzaken. In mijn wereld is een unicode-teken nml gewoon 1 teken, hooguit 2 bytes, en slechts in extreme gevallen 3 bytes. Dus zoveel bytes per karakter verdient wel een waarschuwing van 't een of ander, denk ik ;)

/edit
Of het maximum ophogen naar 2000 ofzo :P

[ Voor 6% gewijzigd door _Thanatos_ op 28-11-2011 17:27 ]

日本!🎌


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Ik zie op zich geen goede reden om die limiet zomaar op te rekken eerlijk gezegd. Bijna iedereen kan er prima mee uit de voeten. Natuurlijk heb je altijd mensen die liever 'ietsje meer' zouden willen, maar die houd je waarschijnlijk ook wel met een ruimere limiet terwijl je aan de andere kant het risico op te intrusieve signatures wel weer verhoogt.

Intentionally left blank


  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

_Thanatos_ schreef op maandag 28 november 2011 @ 15:08:
わたしは にせんじゅうにねんに にほんに いきましょう ♡
watashi wa nisenjuuninen yongatsu ni nihon ni ikimashou! yay!
FYI, ik zie yongatsu er niet tussenstaan, je schrijft にせんじゅうにねん en daarna direct ににほんに. :P

Als je 't trouwens helemaal in 't にほんご wildan kanje やった schrijven in plaats van yay :). En april is しがつ eerder dan よんがつ als mijn woordenboek me niet in de steek laat :).

Leuk dat je naar japan gaat trouwens, ben jaloers. Hoe vlot is je Japans?

[ Voor 25% gewijzigd door Borromini op 28-11-2011 21:57 ]

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Hier thuis op mijn pc zie ik alleen maar blokjes trouwens :( - nog een reden waarom bijvoorbeeld Japanse tekens niet handig zijn - niet iedereen heeft de fonts met de benodigde unicode glyphs geinstalleerd staan.

Intentionally left blank


  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

crisp schreef op maandag 28 november 2011 @ 21:52:
Hier thuis op mijn pc zie ik alleen maar blokjes trouwens :( - nog een reden waarom bijvoorbeeld Japanse tekens niet handig zijn - niet iedereen heeft de fonts met de benodigde unicode glyphs geinstalleerd staan.
Probeer je browser es in UTF-8 te zetten ;).

Ik kon Japanse tekens lezen hier vóór ik een Japans lettertype geïnstalleerd had.

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje


  • fsfikke
  • Registratie: Maart 2003
  • Niet online

fsfikke

* * * *

Ik ben er voor de ondertitel ook al eens tegenaan gelopen. Hier zijn ook al vaker topics over geweest met de conclusie dat er mogelijk ooit eens naar gekeken zou worden :/ Zo belangrijk is het natuurlijk ook niet.

Zijn spaties in de aanbieding ofzo? www.spatiegebruik.nl


  • --MeAngry--
  • Registratie: September 2002
  • Laatst online: 19-11 09:49

--MeAngry--

aka Qonstrukt

crisp schreef op maandag 28 november 2011 @ 21:28:
Ik zie op zich geen goede reden om die limiet zomaar op te rekken eerlijk gezegd. Bijna iedereen kan er prima mee uit de voeten. Natuurlijk heb je altijd mensen die liever 'ietsje meer' zouden willen, maar die houd je waarschijnlijk ook wel met een ruimere limiet terwijl je aan de andere kant het risico op te intrusieve signatures wel weer verhoogt.
Je zou natuurlijk ook alleen de veldlengte kunnen verhogen, en vervolgens met mb_strlen de juiste stringlengte kunnen bepalen om hem vervolgens alsnog op 255 tekens af te kappen. :)

Tesla Model Y RWD (2024)


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

Borromini schreef op maandag 28 november 2011 @ 21:55:
[...]

Probeer je browser es in UTF-8 te zetten ;).

Ik kon Japanse tekens lezen hier vóór ik een Japans lettertype geïnstalleerd had.
Dat maakt niet uit hoor, ik heb hier simpelweg geen 'supplemental language support' geinstalleerd staan (winXP), dus mijn fonts missen gewoon die glyphs.
--MeAngry-- schreef op maandag 28 november 2011 @ 22:00:
[...]

Je zou natuurlijk ook alleen de veldlengte kunnen verhogen, en vervolgens met mb_strlen de juiste stringlengte kunnen bepalen om hem vervolgens alsnog op 255 tekens af te kappen. :)
Waarom mb_strlen? Omdat onze pagina's latin-9 zijn ontvangen we ook alleen maar latin-9 geëncodeerde data (waarbij double- en triplebyte character references zijn omgezet naar numerieke entities). We zouden dan entities als 1 karakter moeten laten tellen.

Intentionally left blank


  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

crisp schreef op maandag 28 november 2011 @ 22:06:
[...]

Dat maakt niet uit hoor, ik heb hier simpelweg geen 'supplemental language support' geinstalleerd staan (winXP), dus mijn fonts missen gewoon die glyphs.
Ok. Linux hier :P.

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje


  • --MeAngry--
  • Registratie: September 2002
  • Laatst online: 19-11 09:49

--MeAngry--

aka Qonstrukt

crisp schreef op maandag 28 november 2011 @ 22:06:
[...]

Dat maakt niet uit hoor, ik heb hier simpelweg geen 'supplemental language support' geinstalleerd staan (winXP), dus mijn fonts missen gewoon die glyphs.


[...]

Waarom mb_strlen? Omdat onze pagina's latin-9 zijn ontvangen we ook alleen maar latin-9 geëncodeerde data (waarbij double- en triplebyte character references zijn omgezet naar numerieke entities). We zouden dan entities als 1 karakter moeten laten tellen.
Je zult de tekst inderdaad ook nog eerst door iconv oid moeten halen om het rechtstreeks te kunnen gebruiken idd. Maar in principe is er multibyte support in PHP aanwezig is eigenlijk wat ik wil zeggen. :)
Het gaat alleen wel wat moeite kosten om alles om te zetten, dat is waar. Is het de moeite waard? Hangt er vanaf, ik vraag me best af hoe lang PHP 6 nog op zich laat wachten. Maar goed, dit gaat offtopic denk ik. :P

Tesla Model Y RWD (2024)


  • crisp
  • Registratie: Februari 2000
  • Nu online

crisp

Devver

Pixelated

--MeAngry-- schreef op dinsdag 29 november 2011 @ 01:38:
[...]

Je zult de tekst inderdaad ook nog eerst door iconv oid moeten halen om het rechtstreeks te kunnen gebruiken idd. Maar in principe is er multibyte support in PHP aanwezig is eigenlijk wat ik wil zeggen. :)
Het gaat alleen wel wat moeite kosten om alles om te zetten, dat is waar. Is het de moeite waard? Hangt er vanaf, ik vraag me best af hoe lang PHP 6 nog op zich laat wachten. Maar goed, dit gaat offtopic denk ik. :P
Op dit moment vinden wij het de moeite niet waard. Het is waar dat de huidige situatie ook aardig wat workarounds nodig heeft (veel externe input is UTF-8 en moet dus expliciet omgezet worden), maar de huidige situatie inwisselen voor een die ook nog niet ideaal is heeft niet onze voorkeur, we doen het dan liever in één keer goed. Het is in ieder geval niet bepaald triviaal en op dit moment is er simpelweg de tijd niet voor.

Intentionally left blank


  • Maasluip
  • Registratie: April 2002
  • Laatst online: 19-11 16:25

Maasluip

Frontpage Admin

Kabbelend watertje

crisp schreef op maandag 28 november 2011 @ 21:52:
Hier thuis op mijn pc zie ik alleen maar blokjes trouwens :( - nog een reden waarom bijvoorbeeld Japanse tekens niet handig zijn - niet iedereen heeft de fonts met de benodigde unicode glyphs geinstalleerd staan.
Mijn lynx tekstbrowser geeft dat weer als
watasiha nisen5ziyUu5ninen5ni nihon5ni i5kimasiyOu5 cH
watashi wa nisenjuuninen yongatsu ni nihon ni ikimashou! yay!
Ongekende vooruitstrevendheid van zo'n low-tech browsertje.
Maar mijn firefox laat de eerste regel wel netjes in het Japans zien.

Signatures zijn voor boomers.


  • Borromini
  • Registratie: Januari 2003
  • Niet online

Borromini

Mislukt misantroop

Net even geprobeerd met links, dat transcribeert inderdaad netjes :D.

Elinks geeft dan weer goed de Japanse karakters weer :).

Afbeeldingslocatie: http://i.imgur.com/vs0TF.png

Got Leenucks? | Debian Bookworm x86_64 / ARM | OpenWrt: Empower your router | Blogje

Pagina: 1