Letters met accenten

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Ik ben nieuwsgierig of anderen het volgende ook opgemerkt hebben:
Tot gisteren waren we gewend om html-teksten voor een website net zo te typen als gewone tekstdocumenten, dus voor een á eerst een ' en daarna de a. Voor andere symbolen gebruiken we de ascii-code op het numerieke toetsenbordje in combinatie met de alt-toets.

Dat ging goed met alle browsers die we aan boord hebben waarmee we het resultaat op correct weergeven controleren. Te weten Edge, IE en Chrome. Na grote update 1909 zagen we dat dit plotseling was veranderd. Oudere pagina's zijn nog steeds zoals bedoeld, maar bij nieuwe is dit alleen bij Chrome het geval. De beide andere vertonen voor die á een á.

Geen ramp, want eigenlijk moet je voor die letters met een accent Unicode gebruiken, maar tot nu toe was dat geen punt.

Kortom geen vraag van "hoe moet dat nu" want dat is wel duidelijk, maar hebben anderen dit ook opgemerkt? Het kan zijn dat het al is verschenen na de update 1903. maar die is op de een of andere manier overgeslagen.

Alle reacties


Acties:
  • 0 Henk 'm!

  • smekkos
  • Registratie: Februari 2013
  • Laatst online: 22-05 22:27
Toevallig vroeg mijn vrouw hier ook naar.

Ze had 2 toetsenborden geïnstalleerd staan. NL en EN. Na hem op NL gezet te hebben werken haar speciale tekens weer. Ligt waarschijnlijk aan je toetsenbordinstellingen.

Acties:
  • +6 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
smekkos schreef op maandag 2 december 2019 @ 17:32:
Ligt waarschijnlijk aan je toetsenbordinstellingen.
Ik mag hopen van niet 8)7

The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

Sla je document op met de UTF-8 encoding en serveer het ook met diezelfde encoding.

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • smekkos
  • Registratie: Februari 2013
  • Laatst online: 22-05 22:27
Techneut schreef op maandag 2 december 2019 @ 17:20:

Dat ging goed met alle browsers die we aan boord hebben waarmee we het resultaat op correct weergeven controleren. Te weten Edge, IE en Chrome. Na grote update 1909 zagen we dat dit plotseling was veranderd. Oudere pagina's zijn nog steeds zoals bedoeld, maar bij nieuwe is dit alleen bij Chrome het geval. De beide andere vertonen voor die á een á.
excusez moi, te snel gelezen. Zoals @RobIII aangeeft heeft dit te maken met de encoding van je document.

Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
RobIII schreef op maandag 2 december 2019 @ 17:49:
[...]
Sla je document op met de UTF-8 encoding en serveer het ook met diezelfde encoding.
Wat bedoel je daarmee precies? Opslaan met die code en tevens serveren. Is gewoon die codering gebruiken zoals voor é de code é of é niet voldoende.

Acties:
  • 0 Henk 'm!

  • jeroen3
  • Registratie: Mei 2010
  • Laatst online: 21:59
Is dit dan precies het effect waar de laatste alinea in het door @RobIII gedeelde artikel over gaat?

Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Accoord, ik begrijp het, best nuttige informatie Wat ik er nu van begrijp dienen we boven in de header de tag
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
te plaatsen. Alleen lopen we dan denk ik tegen de consequentie aan dat de oudere gedeelten van de inhoud misschien niet meer correct worden weergegeven om dat die nog in Ascii-code (dus 8 bits) zijn geplaatst. Om alles door te spitten is vrij veel werk en nu worden ze gewoon wel juist weergegeven. Zowel Nederlands- als Engelstalige gedeelten. De kans dat ze ook gelezen moeten worden in b.v. Rusland is denken we nihil. Dus denk ik dat het weinig kwaad kan om die vermelding in de header charset=utf-8 toch maar achterwege te laten.

Acties:
  • +4 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op maandag 2 december 2019 @ 21:56:
Accoord, ik begrijp het, best nuttige informatie Wat ik er nu van begrijp dienen we boven in de header de tag
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
te plaatsen
Nou... ja... en nee.

Sowieso dient je bestand ook daadwerkelijk opgeslagen te zijn in utf8 als je die header gebruikt. Iedere zichzelf respecterende text editor / IDE biedt de mogelijkheid om die encoding aan te geven bij 't opslaan of anderszins in te stellen. Sla je je bestand op in ‎ISO 8859-1‎ en zet je in de meta tag utf-8 dan ga je, uiteraard, alsnog vreemde dingen krijgen. De "meta http-equiv" is een poor-mans solution waarbij je "achteraf" zegt: "oh, dit document had eigenlijk met de volgende content-type (en charset) geserveerd moeten worden, maar dat punt zijn we al voorbij dus probeer hier maar iets van te bakken". Het heet dan ook niet voor niets http-equiv. Het helpt vóóral om de juiste HTTP headers mee te sturen en niet zo zeer om dat, als het te laat is, alsnog proberen recht te breien met een metatag. En dat doe je doorgaans in je webserver software of op applicatie niveau. Let wel: dat zijn dus al 3 zaken:
  1. Document encoding (Visual Studio, Sublime, Notepad, Notepad++, VS Code, Vim ...)
  2. HTTP headers
  3. Meta tag
En als je met databases te maken hebt zul je daar óók nog eens te maken krijgen met encoding velden/tabellen en in het geval van MySQL specifiek ook nog eens een encoding voor je connectie (waar utf8 dan eigenlijk weer utf8mb4 heet 8)7 |:( ). Heb je dat allemaal niet op een rijtje dan gaat het 200% zeker weten eventually mis.

Het is zaak dat je doorgrondt wat het verschil tussen punt 1, 2 en 3 is en dat je weet wat waar voor dient. Je reactie hierboven laat zien dat je nog steeds niet goed snapt wat je gelezen hebt. Lees dit eens. En lees die lange link zéker nog eens. Geloof me, als je dit goed snapt heb je er de rest van je carrière plezier van.

[ Voor 44% gewijzigd door RobIII op 03-12-2019 01:22 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Allereerst, mijn carrière ligt op een geheel ander (technisch) terrein, maar dat even terzijde. Voor mij is het alleen maar hobby. :)

Wat ik uit jouw verhaal en eerder uit die overigens heel interessante Engelstalige uiteenzetting begrijp is dat als ik echt de header zo instel met utf-8 de onherroepelijke consequentie is dat we alle letters die daarvoor komen moeten aanpakken omdat het anders een onleesbaar ratjetoe wordt. Dat zou een enorme klus worden, en dat roer je ook aan. Voorheen had ik namelijk nooit met utf-8 oftewel unicode te maken omdat we de broncode altijd typten alsof het een gewone tekstfile was. Dat betekende voor speciale karakters de Ascii-code en dat werkte tot voor kort probleemloos.

Maar goed, we laten die metatag zoals die staat aangegeven dus voorlopig achterwege. Uit controle met de browsers die we aan boord hebben gaat dat ogenschijnlijk goed, maar volgens jou gaat dit gegarandeerd 200 % zeker ooit een keer verkeerd. Wanneer dan? Ik kan me voorstellen dat computers in b.v. Griekenland er niet veel van bakken. Is er dan wel een andere metatag te bedenken waarmee we alle denkbare problemen op dit gebied alsnog kunnen omzeilen? Indien niet, dan lopen we dus dat risico ooit.

Bedenk wel dat de doelgroep alleen maar in West-Europa zit en de niet nader te noemen site tweetalig is, Nederlands en Engels dat geen letters met accenten kent. Tevens bevat de site geen databases en andere speciale attributen. Je noemt ook kladblok, welnu we gebruiken het gewone Kladblok dat bij Windows is geleverd.

Lees "wij" als mijn vrouw voor de inhoud en mij voor de technische ondersteuning. We zijn heel lang geleden zo begonnen en mijn vrouw heeft eind jaren '90 in korte tijd zich de html-taal eigen gemaakt, maar ondanks zachte drang van mij zich nooit willen verdiepen in daarna nieuwe technieken.

[ Voor 6% gewijzigd door Techneut op 03-12-2019 17:40 ]


Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Als je gewoon statische HTML hebt zijn die bestanden in no-time geconverteerd naar UTF-8. Dus ik zie 't probleem niet zo. Kun je aangeven waar (je denkt dat) eventueel je probleem ligt?
Techneut schreef op dinsdag 3 december 2019 @ 17:31:
maar volgens jou gaat dit gegarandeerd 200 % zeker ooit een keer verkeerd. Wanneer dan?
Euh, is dit topic niet al getuige daarvan? ;)

[ Voor 40% gewijzigd door RobIII op 03-12-2019 17:48 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
RobIII schreef op dinsdag 3 december 2019 @ 17:47:
Als je gewoon statische HTML hebt zijn die bestanden in no-time geconverteerd naar UTF-8. Dus ik zie 't probleem niet zo. Kun je aangeven waar (je denkt dat) eventueel je probleem ligt?
Dat had ik in mijn startbericht al aangegeven, namelijk dat oudere inhoud ondanks dat de letters met accenten nog in de 8-bits Ascii-code staan correct worden weergegeven. Met nieuwere inhoud gaat het mis en daarom gebruiken we probleemloos die UTF-8 zoals &aacute ; voor á. Voor ons is er dus niet meer een probleem, het wekte alleen mijn nieuwsgierigheid.

(PS:
Ik zette hier in &aacute ; een spatie er tussen. want zonder dat zou er ook gewoon á staan, De utf-8 code wordt dus blijkbaar ook hier in de forumberichten gebruikt. Niet zo heel verwonderlijk trouwens, want dit is ook websiteverkeer.
).

Acties:
  • 0 Henk 'm!

  • Room42
  • Registratie: September 2001
  • Niet online
Techneut schreef op dinsdag 3 december 2019 @ 18:40:
[...]
(PS:
Ik zette hier in &aacute ; een spatie er tussen. want zonder dat zou er ook gewoon á staan, De utf-8 code wordt dus blijkbaar ook hier in de forumberichten gebruikt. Niet zo heel verwonderlijk trouwens, want dit is ook websiteverkeer.
).
Nee, hoor: &aacute; :z

"Technological advancements don't feel fun anymore because of the motivations behind so many of them." Bron


Acties:
  • 0 Henk 'm!

  • mcDavid
  • Registratie: April 2008
  • Laatst online: 22:24
Techneut schreef op dinsdag 3 december 2019 @ 18:40:
[...]
Dat had ik in mijn startbericht al aangegeven, namelijk dat oudere inhoud ondanks dat de letters met accenten nog in de 8-bits Ascii-code staan correct worden weergegeven. Met nieuwere inhoud gaat het mis en daarom gebruiken we probleemloos die UTF-8 zoals &aacute ; voor á. Voor ons is er dus niet meer een probleem, het wekte alleen mijn nieuwsgierigheid.
"Oude" ascii tekst wordt in utf8 gewoon goed weergegeven. De &aacute; die jij aanhaalt is een html-entity en dat heeft weer helemaal niets met charsets te maken. Dat is een manier om speciale html-karakters te escapen. Al kun je het idd ook gebruiken om speciale karakters die niet in je charset zitten, toch in een HTML document te proppen.
Alleen is dat niet echt de "oplossing" voor je probleem, maar eerder een workaround.

[ Voor 4% gewijzigd door mcDavid op 03-12-2019 18:52 ]


Acties:
  • +3 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op dinsdag 3 december 2019 @ 18:40:
Met nieuwere inhoud gaat het mis en daarom gebruiken we probleemloos die UTF-8 zoals &aacute; voor á.
Afbeeldingslocatie: https://tweakers.net/ext/f/9c3JDi1n9NJL6qvey5stDG9f/full.gif


Stop. Hier klopt echt niks van. Sorry.

&aacute; heeft geen drol met UTF-8 te maken maar is een html character entity. Ook dat is een plakmiddel om in encoding X een character te gebruiken dat niet in die encoding voorkomt. Ik vrees toch écht dat je die links nog allemaal eens goed door moet lezen want hier is een joekel van een klok/klepel gaande :X

Zoals @mcDavid al aangeeft UTF-8 is juist dusdanig opgezet zodat 'standaard ASCII' in de eerste 127 codepoints voorkomt en dus "compatible". De vraag is of jij je documenten hebt opgeslagen in "standaard ASCII" of, veel waarschijnlijker, ISO-8859-15 / Windows-1252 of iets dergelijks. Whatever it is, de 'conversie' stelt niets voor (als je het goed doet en een fatsoenlijke teksteditor gebruikt), maar je moet wél weten waar je mee bezig bent.
Techneut schreef op dinsdag 3 december 2019 @ 18:40:
[...]
(PS:
Ik zette hier in &aacute ; een spatie er tussen. want zonder dat zou er ook gewoon á staan, De utf-8 code wordt dus blijkbaar ook hier in de forumberichten gebruikt. Niet zo heel verwonderlijk trouwens, want dit is ook websiteverkeer.
).
Ook hier weer: Nee, nee en nog eens nee. Sorry maar ook hier weer een klok-klepel verhaal. Hier op Tweakers zijn we nog niet eens zo heel lang over op utf-8 (waarom is een ander irrelevant verhaal); tot 14-1-2019 zaten we nog op ISO-8859-15 en dat werkte prima met letters met diakrieten ;) :> Ook zonder HTML character entities te gebruiken.

[ Voor 56% gewijzigd door RobIII op 03-12-2019 19:05 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké dan werd ik even op een verkeerd spoor gezet, mede door dat op zich toch wel interessante Engelstalige bericht dat RobIII plaatste wat betreft de benaming en de interpretatie ervan. Maar hoe het ook wel mag heten, ik ga even terug naar het begin van dit topic. Dat begon met dat we altijd gewend waren om in website editing gewoon tekst te typen zoals we dat ook doen in Word, kladblok etc. Dus wederom voor á eerst de ' en daarna de a. Of bij een andere PC met toevallig een andere toetsenbord instelling Alt-160. Die 160 wel te verstaan op het numerieke toetsenbord.

Echter na de laatste Windows update werd dat niet meer correct weergegeven. Er kwam gewoon iets heel anders te staan. Laat het dan anders heten, de essentie blijft gelijk, het lukte wel met die andere karakterset met &#nnn; Daarmee blijft dus de vraag van hoe dit komt als het helemaal niets met utf-8 heeft te maken.

[ Voor 79% gewijzigd door Techneut op 03-12-2019 21:47 ]


Acties:
  • +2 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op dinsdag 3 december 2019 @ 19:44:
Laat het dan anders heten, de essentie blijft gelijk, het lukte wel met die andere karakterset waarvan voor á &aacute ; of &#225 ; wordt gebruikt.
Er klopt steeds minder van...
&aacute; of &#225; is géén karakterset maar een "notatie methode" om een bepaald karakter in een willekeurige andere karakterset te duiden. In ASCII heb je geen emoji's dus kun je door bijvoorbeeld &#127866; te schrijven alsnog een 🍺 duiden.
Een "charset" (character set, character encoding) bepaalt welke code (ofwel: welke combinatie van enen-en-nullen) hoort bij een bepaalde letter/leesteken/emoji/... Afhankelijk van een charset kan een document (ofwel: een hele bult enen-en-nullen) een totaal andere betekenis krijgen. Jij en ik kunnen afspreken dat 01000001 de letter A is en Pietje en Jantje kunnen afspreken dat diezelfde combinatie staat voor ⌘. Zonder te weten welke encoding van toepassing is kun je dus niet zonder meer zeggen wat 01000001 betekent. Als je die encoding niet aangeeft bij het serveren van een webpagina, of de verkeerde, dan krijg je dus dat je browser bepaalde tekens in een document verkeerd interpreteert (en browsers doen hun best om de juiste charset te bepalen, maar dat gaat natuurlijk ook wel eens mis).
Techneut schreef op dinsdag 3 december 2019 @ 19:44:
Daarmee blijft dus de vraag van hoe dit komt als het niets met utf-8 heeft te maken.
Je probleem is dat je je documenten nu, klaarblijkelijk, in een andere encoding opslaat dan eerst. Of dat komt door een windows update of omdat je toevallig ergens in je editor (welke dat is heb je nog stééds niet genoemd...) de standaard encoding hebt gewijzigd of misschien betreft het alleen dat éne document dat je in een andere / verkeerde encoding hebt opgeslagen. Je moet beseffen dat we geen glazen bol hebben en je geeft bitter weinig (nieuwe) informatie.

Linksom of rechtsom; érgens wordt er een 'verkeerde' (of anders-dan-gewenste) encoding gebruikt. Of dat in je document zit of dat het document onder de verkeerde encoding geserveerd wordt of wat-dan-ook; dat kunnen wij niet zien of ruiken. Als je het document opent in je teksteditor; dan is het 'speciale karakter' nog goed neem ik aan? Wat geeft je editor aan welke encoding gebruikt is voor het document? Welke encoding gebruikt je webserver (ofwel: wat staat er in de Content-Type header in de response op je pagina request)? Allemaal dingen die je had nader kunnen bekijken. Ik doe ontzettend mijn best je te verwijzen naar talloze bronnen met uitgebreide informatie, zie de vele linkjes in mijn posts, maar uiteindelijk zul je het toch zélf moeten doen.
Give a man a fish and feed him for a day. Teach a man how to fish and feed him for a lifetime.
Je zult dus van begin tot eind (document, webserver, webbrowser) moeten controleren of overal de juiste encoding gebruikt wordt en, zo niet, aanpassen waar nodig. Voor "het minste gezeik" ga je 't best voor overal UTF-8. Dat kan even werk zijn maar daar pluk je, uiteindelijk, zeker weten de vruchten van. Ben je liever eigenwijs en gebruik je liever ISO-8859-15 dan moet je dat vooral lekker zelf weten en dat kan ook; maar dan geldt nog stééds hetzelfde: Je zult o-ve-ral de juiste encoding (be it utf-8, ISO-8859-15 of één van de vele andere) moeten gebruiken (en dus controleren).

[ Voor 33% gewijzigd door RobIII op 05-12-2019 22:19 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
Ik denk dat je http daemon (apache/nginx) hier ook een rol speelt.
Deze kan onderwater ook de Content-Type meesturen.

Check alles en maak alles het zelfde.

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Daarmee moet ik het dus in een heel andere richting zoeken. Ik denk dan b.v. aan web editors. Heel nuttige en handige stukjes gereedschap, die je heel wat denkwerk uit handen nemen

Maar tot nu toe heeft mijn vrouw het er altijd zonder gedaan en gebruikt ze nog steeds het ouderwetse kladblok. En eerlijk gezegd is ze daar bijzonder handig in In een van de antwoorden werd gezegd dat vertalen in utf-8 code automatisch wordt gedaan (als dat in de <head> door die genoemde meta-tag wordt aangegeven. Ik las dat aanvankelijk als door de hoster maar dat gebeurt niet. Nu vermoed ik dat hier de web editor wordt bedoeld? Omdat er niet één reactie van herkenning op mijn bericht kwam en de meesten tegenwoordig dat "gereedschap" wel gebruiken zou daarmee voor mij alles verklaard zijn. Zolang we niet een web editor aanschaffen zijn we dus denk ik genoodzaakt om die kunstgreep van &#nnn; codes toe te passen voor die accentekens.

Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op dinsdag 3 december 2019 @ 21:56:
Daarmee moet ik het dus in een heel andere richting zoeken.
Zoals? Ik zou niet weten welke richting je op doelt?
Je moet 't, zoals we al 't hele topic aangeven, in de richting van encoding zoeken. Document, webserver (http headers) en browser. Die hele 'chain' moet je nalopen. C'est tout. Van elk kijk je welke encoding gebruikt / gedetecteerd wordt.
Techneut schreef op dinsdag 3 december 2019 @ 21:56:
Zolang we niet een web editor aanschaffen zijn we dus denk ik genoodzaakt om die kunstgreep van &#nnn; codes toe te passen voor die accentekens.
Néén! Allereerst linkte ik je notabene al naar een artikel dat uitlegt dat notepad (kladblok) prima overweg kan met UTF-8. En wie heeft 't over aanschaffen? Er zijn talloze teksteditors (notepad++, notepad2, notepad3 en dat zijn alleen nog maar de editors met een gelijknamige naam) die "(originele)notepad on steroids" zijn en helemaal gratis zijn. Maar waarom je nog met zo'n middeleeuwse zooi zou willen werken is me een raadsel als er ook een VS Code of Visual Studio of één van de vele andere die beschikbaar zijn die nét zo gratis zijn maar honderduizendmiljoen keer krachtiger dan kladblok. Dan hoef je nog steeds niet "WYSIWYG" te werken (waar je in je eerste alinea op lijkt te duiden) maar kun je prima lekker zelf <anglebrackets>typen</anglebrackets> naar hartelust ;) Op wat syntax highlighting na (wat ook een geweldige toevoeging is) is dat gewoon een veredelde kladblok in de meeste gevallen.
Techneut schreef op dinsdag 3 december 2019 @ 21:56:
In een van de antwoorden werd gezegd dat vertalen in utf-8 code automatisch wordt gedaan (als dat in de <head> door die genoemde meta-tag wordt aangegeven.
Néén! Waar lees je dat dan? Dat is nergens gezegd? Het heeft geen kont met de meta-tag in de head te maken; het wordt niet "automatisch" gedaan. Het gebeurt "automatisch" als jij bij het opslaan aangeeft wat de encoding is/moet zijn. Zolang je van ASCII naar UTF-8 gaat gaat er niets verloren en dus is de conversie voor (andere) oude bestanden geen probleem en dus makkelijk te doen. En de probleemdocumenten zul je dan even moeten nalopen, maar voor zover ik je begreep is dat dat nu één (of hooguit een handvol).

Er is geen enkele text editor (en this is gonna bite me in the ass...er komt nu geheid een wijsneus met een uitzondering) die zich iets aantrekt van wat jij ergens <tussen> <haakjes> <typed> en die gaat 'kijken' of er ergens een <meta http-equiv> element aanwezig is en daar dan de charset uit pulken en dan op basis daarvan de encoding van je document bepaalt bij 't opslaan. Je zult zélf de encoding moeten aangeven bij opslaan.
Browsers zijn een ander beest; die kijken wel naar de <meta http-equiv> omdat ze.... browsers zijn en dat element relevant is voor ze. Maar ze geven nog altijd voorrang aan de http headers; ze gebruiken die http-equiv dan ook alleen als de encoding ontbreekt / onzeker is op basis van de http headers. Precies waarom ik aangaf dat de <meta http-equiv> een poor-man's http header is.

[ Voor 88% gewijzigd door RobIII op 03-12-2019 22:55 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké ik denk dat ik je zo langzamerhand wel begrijp, ik zal mijn vrouw toch zover moeten krijgen dat ze voor haar web-werkzaamheden een web-editor moet nemen. Het zal enige overredingskracht van me vergen :).

Dat "aanschaffen" moet je niet al te letterlijk nemen, ik ben ook wel op de hoogte van diverse gratis producten. Wat ik natuurlijk ook best weet is dat utf-8 niet wat ik per ongeluk een karakterset noemde dat niet is, maar alleen maar een set codes om alle karakters weer te geven.

Wat ik nu uit je betoog opmaak is wat ik als een vermoeden van me aangaf, advies om zo'n web-editor nemen. Ik neem inmiddels aan dat dit op al deze vragen antwoord gaat geven. En dat we daarmee het typen van de web-inhoud gewoon kunnen blijven doen zoals we dat gewend waren en zoals denk ik de meesten doen,

Wat wel blijft is de constatering dat wat jarenlang gewoon kon, nu plotseling niet meer.

Acties:
  • +2 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op dinsdag 3 december 2019 @ 23:23:
Wat ik nu uit je betoog opmaak is wat ik als een vermoeden van me aangaf, advies om zo'n web-editor nemen.
Ik adviseer je om een (fatsoenlijke) text editor te nemen, of een IDE. Ik heb je nooit geadviseerd een web-editor te nemen en zal dat ook nooit doen ;)

Maar wat ik óók stééds blijf aangeven is dat kladblok/notepad nog steeds prima volstaat als je daar per sé bij wil blijven. Ik snap niet hoe je daar overheen blijft lezen. Kladblok/notepad ondersteunt óók prima UTF-8.

Afbeeldingslocatie: https://tweakers.net/ext/f/HSSQvSLav6DU19zU2mtBpRcD/thumb.png
Techneut schreef op dinsdag 3 december 2019 @ 23:23:
En dat we daarmee het typen van de web-inhoud gewoon kunnen blijven doen zoals we dat gewend waren en zoals denk ik de meesten doen,
Voor een text editor is er niet zoiets als "web inhoud". Ja, je kunt context-afhankelijke (en dus ook HTML, JS, CSS etc.) syntax-highlighting krijgen enz. maar, onder de streep: tekst = tekst. Simple as that.
Techneut schreef op dinsdag 3 december 2019 @ 23:23:
Wat wel blijft is de constatering dat wat jarenlang gewoon kon, nu plotseling niet meer.
8)7 Het kan nog stééds en hééft altijd gekund. Het enige wat er "recent" gewijzigd is aan notepad (nogmaals: daar heb ik inmiddels ettelijke keren naar gelinked) is dat je nu zónder BOM kunt opslaan. Maar opslaan als/in UTF-8 mét BOM) heeft zo lang ik me kan heugen gekund. Dat je (vrouw) altijd in ANSI of whatever heeft opgeslagen en dat nu niet meer / anders doet is vers 2.

Of je draait een lokale webserver (dat had je dan wel even mogen melden) en die heeft e.o.a. update gehad waardoor de default encoding veranderd is. Maar ook dat lijkt me verdomde stug; dat is bij geen enkele bekende / veelgebruikte webserver in recente jaren veranderd en áls dat al zo is dan gebeurt dat niet zonder daar een dikke waarschuwing over te geven want zo'n verandering maakt alles stuk als je dat als gebruiker onwetend installeert.

Dus long story short: is er nu iets anders? Vast. Dat wil ik nog wel geloven. Lag/ligt het aan een recente update? Ik geloof er geen barst van. Ik vermoed eerder dat iemand (jij, je vrouw, een kaboutertje) ergens iets aangepast heeft (zonder het wellicht te weten). Dit soort dingen worden niet "zomaar" gewijzigd door updates en al helemaal geen "defaults".

[ Voor 19% gewijzigd door RobIII op 04-12-2019 00:03 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
Wat jij al jaren "kon", kan ik al ruim 15 jaar niet meer (de nukken van MySQL 3/4 Latin1 na dan).
En waarom? Omdat ik al 20 jaar geen notepad gebruik omdat notepad ruzie heeft met unicode en BOM.
En dat heeft Microsoft blijkbaar opgelost.

Verder heeft niemand het over web-editor.
Een text editor is text (of het nou: plain, xml, html, xhtml, js, css, json, python, perl, bash, c++, c#, D, swift, objective-c, lua, etc. etc. is)

Ik gebruik zelf Geany op GNU/Linux, maar het kan ook met pen en papier (daarna wel inscannen met OCR)

[ Voor 11% gewijzigd door DJMaze op 04-12-2019 00:01 ]

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Ik geloof dat ik het antwoord heb gevonden.
Aangezien ik niet meer in kaboutertjes geloof heb ik even de tijd genomen om wat te zitten experimenteren. Allereerst nog met de gewone notepad met de tekst á é í ó die ik opsloeg als een html-file. Offline werd deze met Chrome correct weergegeven, met IE en Edge werd het á é í ó, complete wartaal dus. Geen kaboutertjes dus maar echt! Dat bleek vervolgens ook met het online-resultaat, maar daar was het fout op alle browsers en ten overvloede op beide computers.

Met de gewone notepad vond ik, ondanks dat werd gezegd dat het nog steeds kan, geen mogelijkheid tot het benodigde opslaan met utf-8. Dus volgde ik het advies op om een andere meer geavanceerde teksteditor te kiezen, downloade ik notepad++ en die bood deze optie wel. Het resultaat was, wat ik er inmiddels van verwachtte, compleet goed. Kortom, probleem opgelost.

[ Voor 21% gewijzigd door Techneut op 05-12-2019 18:25 ]


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Bij nader inzien, het liet me nog niet los omdat oudere files nog wel correct bleken te zijn, zag Ik dat de mogelijkheid van opslaan wel in de gewone Notepad wordt geboden, maar default is het UTF-8, dus zonder BOM. Daardoor ging het voorheen altijd goed, maar nu lijkt het dat de bom opnieuw is gevallen. D.w.z. dat alles inderdaad gewoon zo kan blijven, echter schijnt het nu toch weer met BOM te moeten. Doet men dit niet, dan gaat het alleen goed met Chrome. IE en Edge ondersteunen het "Zonder BOM" dus nog niet. Mogelijk dat dit nog niet is opgemerkt door bij velen de impopulariteit van Edge en het nauwelijks meer gebruiken van IE. De klassieke Notepad kan dus (als men dat wil) met dit aandachtspunt nog steeds.

[ Voor 17% gewijzigd door Techneut op 05-12-2019 18:26 ]


Acties:
  • +2 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op donderdag 5 december 2019 @ 16:41:
Bij nader inzien, het liet me nog niet los omdat oudere files nog wel correct bleken te zijn, zag Ik dat de mogelijkheid van opslaan wel in de gewone Notepad wordt geboden, maar default is het UTF-8, dus zonder BOM. Daardoor ging het voorheen altijd goed, maar nu lijkt het dat de bom opnieuw is gevallen. D.w.z. dat alles inderdaad gewoon zo kan blijven, echter schijnt het nu toch weer met BOM te moeten. Doet men dit niet, dan gaat het alleen goed met Chrome. IE en Edge ondersteunen het "Zonder BOM" dus nog niet. Mogelijk dat dit nog niet is opgemerkt door bij velen de impopulariteit van Edge en het nauwelijks meer gebruiken van IE. De klassieke Notepad kan dus (als men dat wil) met dit aandachtspunt nog steeds.
8)7 8)7 8)7 Je trekt echt de meest wazige conclusies op basis van ervaring=1. Zélfs al wordt IE / Edge niet heel veel gebruikt, dan nog zijn het miljoenen gebruikers, en, trust me, die waren hier al lang tegenaan gelopen. En IE/Edge ondersteunt, evenals alle andere browsers, prima "zonder BOM". Dat hebben ze altijd gedaan en doen ze nog steeds. Je trekt je conclusies gewoon op incomplete informatie, een verkeerd begrip van de materie en, wat onderhand lijkt op, een gebrek aan enige wil om de materie te begrijpen noch te lezen wat je allemaal verteld wordt.

Ik ben er langzamerhand klaar mee; je leest verdomde selectief en lijkt sowieso maar schuin te lezen wat je verteld wordt. Heb je nou, bijvoorbeeld, al eens gekeken naar de content-type http-header met diens gespecificeerde charset die gestuurd wordt (if any at all!) door je webserver? Want ik acht de kans groot dat daar je probleem zit. Luister nou voor deze keer eens en scroll terug naar het begin van dit topic en neem alles nog eens rustig door want er is nog stééds een enorme klok/klepel gaande hier en je conclusie(s) klopt echt werkelijk waar geen hol van.

[ Voor 8% gewijzigd door RobIII op 05-12-2019 17:47 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Ja, dat kan dan best zo zijn, maar ik vertel ondertussen wel onze bevindingen. En die zijn dat het altijd probleemloos werkte en sinds kort niet meer. Dat dit gegeven iets met die content-type http-header te maken heeft lijkt me dan ook sterk, want dan zou het ook voorheen fout hebben moeten gaan, en dat was echt niet het geval. Dit was echt van het ene moment op het andere.

Daar zoek ik nu een verklaring voor. Wat ik in mijn laatste bericht vertel zijn ook bevindingen en deze keer van alle kanten positief, alles functioneert weer als vanouds. Natuurlijk kan ik nog best content-type http-header toevoegen. Maar wat doe of zie ik dan nog verkeerd?

[ Voor 3% gewijzigd door Techneut op 05-12-2019 18:22 ]


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op donderdag 5 december 2019 @ 18:20:
Natuurlijk kan ik nog best content-type http-header toevoegen. Maar wat doe of zie ik dan nog verkeerd?
Ik vrees dat je nu doelt op de meta tag en ik heb het over een http header die je webserver stuurt "los" van je document. Maar ik krijg heel erg het idee dat je sowieso lokaal zit te prutsen met het document openen als bestand in je browser ipv het door een webserver te laten serveren. Dat zou veel verklaren...

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké, ik nam inderdaad zoals we met alles doen eerst de proef offline, dat ging met succes. Uiteraard daarna online en dat gaf hetzelfde succes-resultaat. De webhoster Vevida geeft hier geen aanwijzingen over en voegt ook niets toe aan de header die ik hier even compleet weergeef:

<HTML><HEAD><TITLE>websitenaam</TITLE>
<LINK REL="shortcut icon" HREF="nnnn.ico">
<FONT FACE="Times New Roman">
</HEAD

En ten overvloede, de url is https://websitenaam.nl

Geen metatags voor eventuele zoekmachines, want i.v.m. de doelgroep heeft de site dat niet nodig, Dus vertel maar wat we hier nog aan toe zouden moeten toevoegen als het niet die geadviseerde meta-tag is. Is dit wat je bedoelt en kunnen we daarmee volstaan?:
Content-Type: text/html; charset=UTF-8

[ Voor 10% gewijzigd door Techneut op 05-12-2019 19:34 ]


Acties:
  • +1 Henk 'm!

  • orf
  • Registratie: Augustus 2005
  • Laatst online: 23:15

orf

Techneut schreef op donderdag 5 december 2019 @ 19:12:
Oké, ik nam inderdaad zoals we met alles doen eerst de proef offline, dat ging met succes. Uiteraard daarna online en dat gaf hetzelfde succes-resultaat. De webhoster Vevida geeft hier geen aanwijzingen over en voegt ook niets toe aan de header die ik hier even compleet weergeef:

<HTML><HEAD><TITLE>websitenaam</TITLE>
<LINK REL="shortcut icon" HREF="nnnn.ico">
<FONT FACE="Times New Roman">
</HEAD

En ten overvloede, de url is https://websitenaam.nl

Geen metatags voor eventuele zoekmachines, want i.v.m. de doelgroep heeft de site dat niet nodig, Dus vertel maar wat we hier nog aan toe zouden moeten toevoegen als het niet die geadviseerde meta-tag is. Is dit wat je bedoelt en kunnen we daarmee volstaan?:
Content-Type: text/html; charset=UTF-8
In topics over elektra vind ik je veel methodischer dan in dit topic.
  • Heb je het bestand opgeslagen met UTF8 coderingsstandaard?
  • Wat voor codering zie je als het bestand hebt geüpload naar de webserver?
Dat laatste kun je controleren door de headers van je URL te bekijken. Hier zie je hoe je headers bekijkt in Chrome

Zie je dit?
code:
1
content-type: text/html; charset=utf-8

Super, dan moeten je accenten nu goed werken. Zie je een andere charset zoals iso-8859-1? Dan moet je ervoor zorgen dat de webserver je bestanden met de juiste charset gaat serveren. Als Apache gebruikt wordt, dan kun je met .htacess de charset setten voor alle .html files:
code:
1
AddCharset UTF-8 .html

Zie hier wat uitleg: https://www.w3.org/Intern...tions/qa-htaccess-charset

Kom je er dan nog niet uit? Deel dan een URL met ons waar het niet goed gaat.

Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
orf schreef op donderdag 5 december 2019 @ 19:59:
[...]
In topics over elektra vind ik je veel methodischer dan in dit topic.
Dat komt omdat ik daarvoor uitgebreid voor gestudeerd heb en dat het mijn vakgebied is en dat websites bijhouden alleen maar hobby is. Veel over gelezen, maar je kan als niet professional onmogelijk alles weten.
Zie je dit?
code:
1
content-type: text/html; charset=utf-8

Super, dan moeten je accenten nu goed werken.
Kijk even naar mijn reactie boven die van jou.

Acties:
  • 0 Henk 'm!

  • orf
  • Registratie: Augustus 2005
  • Laatst online: 23:15

orf

Ik snap het niet. Heb je nu nog een probleem of niet?

Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op donderdag 5 december 2019 @ 19:12:
De webhoster Vevida geeft hier geen aanwijzingen over en voegt ook niets toe aan de header die ik hier even compleet weergeef:

<HTML><HEAD><TITLE>websitenaam</TITLE>
<LINK REL="shortcut icon" HREF="nnnn.ico">
<FONT FACE="Times New Roman">
</HEAD
Techneut schreef op donderdag 5 december 2019 @ 21:33:
Kijk even naar mijn reactie boven die van jou.
Mijn... God... :F

HTTP headers! Haaaaa Teeeee Teeeee Peeeee Headers. Niet de Head van je HTML bestand. Dat zijn twee totáál verschillende dingen! Dat leg ik je hier al uit. Die linkjes zijn er niet voor niets. -O-

HTTP headers zijn protocol headers die je webserver verstuurt voordat er ook maar 1 byte van je document over de lijn gaat. Meta tags die in je document staan in de <head> zijn hele andere dingen. Dat de <meta http-equiv> een vervanging/alternatief/aanvulling op de HTTP headers zijn bij gebrek aan beter leg ik je in die post uit.

Als je document er dus uit ziet als:

code:
1
2
3
4
5
6
7
8
<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    blaat
  </body>
</html>

...en het wordt opgevraagd door een webbrowser aan je webserver dan verstuurt je webserver:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
HTTP/1.1 200 OK
Date: Thu, 5 Dec 2019 19:51:53 GMT
Last-Modified: Wed, 22 Jul 2019 19:15:56 GMT
Content-Type: text/html; charset=iso-8859-1

<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    blaat
  </body>
</html>

Regels 1-4 zijn de HTTP headers. Vanaf regel 6 volgt pas daadwerkelijk je document. Als regel 4 niet aanwezig is in de headers, of niet overeenkomt met de encoding van je document of niet overeenkomt met de encoding die in regel 8 wordt aangegeven dan krijg je rare dingen. Dat vertel ik je pas vanaf hier.

Dat "meta http-equiv" element (of "tag" zo je wil) is, zoals ik al aangaf, een poor-mans oplossing voor iemand die niets aan de webserver kan wijzigen. Heel dat element wil je helemaal niet in je document hebben; je wil gewoon dat je webserver de juiste content-type met charset serveert. Alléén als de webserver de charset niet specificeert én als je dat écht niet kunt aanpassen dan zou je dat meta element ("tag") kunnen overwegen. Maar spreekt dat een daadwerkelijke http-header tegen dan ga je dus rare dingen krijgen.

Los van dat alles: wat doet een <font> element in je <head>? 8)7

[ Voor 67% gewijzigd door RobIII op 06-12-2019 00:24 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
orf schreef op donderdag 5 december 2019 @ 21:38:
Ik snap het niet. Heb je nu nog een probleem of niet?
Naar mijn inschatting was dat probleem opgelost, maar RobIII vindt dat er nog wat ontbreekt en dat hij die content-type: text/html; charset=utf-8 in de header blijkbaar niet bedoelde, m.a.w. dat dit nog niet voldoende is. Ik ben dus genoodzaakt om nog even verder te zoeken, Maar volgens jou zou wat ik heb gedaan voldoende moeten zijn?

Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op donderdag 5 december 2019 @ 22:01:
[...]
Naar mijn inschatting was dat probleem opgelost, maar RobIII vindt dat er nog wat ontbreekt en dat hij die content-type: text/html; charset=utf-8 in de header blijkbaar niet bedoelde
Afbeeldingslocatie: https://tweakers.net/ext/f/s1nAEFeraoCzvERBnavqRF5Q/full.gif

Je haalt dingen door elkaar. Die content-type: text/html; charset=utf-8 moet je niet in de HEAD van je HTML plakken maar moet door je webserver als HTTP header verstuurd worden. Dat leg ik je hier uit.

[ Voor 46% gewijzigd door RobIII op 05-12-2019 22:10 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Ja, maar dan is het cirkeltje weer rond, wat de webserver doet zie ik niet. Volgens mij kan ik daar weinig of niets aan doen. Overigens hoezo webserver, ik ken de webhoster Vevida en het html en inhoud invoeren doen we zelf. Dus waar zou ik die content-regel moeten plaatsen? Boven in de body?

Wat ik nog even wil toevoegen is dat ik aanvankelijk even op de PC van mijn vrouw met blijkbaar een oudere versie van notepad werkte en daardoor het correct kiezen van de karakterset utf-8 niet kon vinden.Misschien verklaart dat veel. Op de veel nieuwere PC van mij was dat wel mogelijk.

Ik stelde je de vraag of Content-Type: text/html; charset=UTF-8 in de header voldoende is. Dit omdat nu alles goed functioneert en nu nogmaals doordat orf dit ook voorstelde en wat ik ten overvloede al had had gedaan. Kortom, wat ontbreekt er nu dan toch nog aan wat ik zelf wel kan doen? Begrijp me goed, op dit gebied ben ik niet een professional.

Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op donderdag 5 december 2019 @ 23:25:
Ja, maar dan is het cirkeltje weer rond, wat de webserver doet zie ik niet.
Druk eens op F12 in je browser en ga eens naar de "Network" tab. Laad dan je pagina en klik de request van het HTML document aan (bovenste regel). Vervolgens kijk je in de response tab naar de request en zoek je de bijbehorende response headers. Jazéker kun je zien wat de webserver doet.
Techneut schreef op donderdag 5 december 2019 @ 23:25:
Overigens hoezo webserver, ik ken de webhoster Vevida
Dus :? Vevida gebruikt een webserver. Als jij een webpagina bezoekt stuurt je browser een verzoek naar een webserver. De hoster kan dan wel Vevida zijn, de webserver die ze gebruiken zal Apache, NGinx, IIS of whatever zijn.
Techneut schreef op donderdag 5 december 2019 @ 23:25:
en het html en inhoud invoeren doen we zelf.
...dus :?
Techneut schreef op donderdag 5 december 2019 @ 23:25:
Dus waar zou ik die content-regel moeten plaatsen? Boven in de body?
NIET. Jij / je vrouw moet dat nergens plaatsen. Dat doet de webserver.
Echter, als de webserver (bijvoorbeeld) ISO-8859-15 stuurt i.p.v. utf-8 dan zul je dat moeten wijzigen. HOE je dat doet hangt van de gebruikte webserver software af en de (on)mogelijkheden die Vevida biedt om dat aan te passen. Aangenomen dat Vevida Apache gebruikt dan zul je waarschijnlijk een .htaccess bestand moeten aanpassen zoals orf in "Letters met accenten" al aangaf. Maar gebruiken ze iets anders of is er geen .htaccess bestand aanwezig dan kan het goed zijn dat je 't op een andere manier moet aanpassen. Nogmaals: we hebben geen glazen bol.
Techneut schreef op donderdag 5 december 2019 @ 23:25:
Ik stelde je de vraag of Content-Type: text/html; charset=UTF-8 in de header voldoende is.
Neeeeeeheeeeee want de "header" waar jij op doelt bevindt zich in de HTML (en is helemaal geen header maar heet "head" (zonder ER) en IS DUS GEEN HEADER) en de header waar ik op doel is een HTTP header. Nogmaals, voor de 400ste keer: Dat zijn twee héél verschillende dingen en dat leg ik je hier uit met een voorbeeld notabene. Kijk nogmaals goed naar regels 1-4 (HTTP headers) en 6-13 (je HTML document).

Nogmaals:

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
HTTP/1.1 200 OK
Date: Thu, 5 Dec 2019 19:51:53 GMT
Last-Modified: Wed, 22 Jul 2019 19:15:56 GMT
Content-Type: text/html; charset=iso-8859-1

<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body>
    blaat
  </body>
</html>


Regels 1 t/m 4: HTTP headers die je webserver stuurt; NIETS wat jij in je document zet.
Regels 6 t/m 13: De content (ofwel: je HTML document; wat jij/je vrouw maken/typen)
Regels 7 t/m 9: De HEAD (en dus géén "header") van je HTML document. GEEN HEADER. Ondanks dat de 4 letters HEAD overeenkomen met HEADER hebben ze niets met elkaar te maken.
Regel 8: Een META tag in je HTML HEAD die, bij gebrek aan informatie* in regels 1 t/m 4 vanwege een verkeerd geconfigureerde webserver KAN dienen als alternatief (equivalent) voor regel 4. In dit voorbeeld spreekt regel 8 (again: een meta element in de head van je html) echter regel 4 (een http header) tegen; regel 4 beweert iso-8859-1 en regel 8 beweert utf-8. En dat geeft wazige zaken. (* = als regel 4 bijvoorbeeld volledig zou ontbreken).

Regel 8 is optioneel en KAN aanwezig zijn. Regel 4 is er (normaalgesproken) altijd, maar het charset deel kán ontbreken; dat is (ook) optioneel. Beide zaken kunnen dus wel/niet aanwezig zijn en als ze allebei aanwezig zijn KUNNEN ze elkaar tegenspreken.

[ Voor 98% gewijzigd door RobIII op 06-12-2019 00:24 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
Ergens in 2005 had ik een php script online gezet om deze discussie niet 1000x te hoeven voeren als iemand er over begon.

Het script antwoorde met wat goed/fout was.
Zoek ff op duckduckgo/google of zo'n "content type validator" nog bestaat. Zo ja, probeer die eens.

Maak je niet druk, dat doet de compressor maar


Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
DJMaze schreef op vrijdag 6 december 2019 @ 00:09:
Ergens in 2005 had ik een php script online gezet om deze discussie niet 1000x te hoeven voeren als iemand er over begon.

Het script antwoorde met wat goed/fout was.
Tot hier zie ik de toegevoegde waarde niet... leuk dat je dat ooit had maarre... Wat heeft TS daar aan? Wat hebben wij er aan?
DJMaze schreef op vrijdag 6 december 2019 @ 00:09:
Zoek ff op duckduckgo/google of zo'n "content type validator" nog bestaat. Zo ja, probeer die eens.
Of je geeft TS gewoon even een linkje. Ik ben overigens benieuwd of jij er een vindt die het probleem van TS zal aanwijzen (en al helemaal in jip-en-janneke taal die TS duidelijk wel nodig heeft).

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
RobIII schreef op vrijdag 6 december 2019 @ 00:21:
Of je geeft TS gewoon even een linkje. Ik ben overigens benieuwd of jij er een vindt die het probleem van TS zal aanwijzen (en al helemaal in jip-en-janneke taal die TS duidelijk wel nodig heeft).
Ik kon niet zo 1-2-3 een linkje vinden. Heb dus zelf maar even snel een script in elkaar geflanst.
https://dragonflycms.org/content-check.php
Kan @Techneut in ieder geval ff het resultaat posten.

[ Voor 6% gewijzigd door DJMaze op 06-12-2019 11:38 ]

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
DJMaze schreef op vrijdag 6 december 2019 @ 11:34:
[...]

Ik kon niet zo 1-2-3 een linkje vinden. Heb dus zelf maar even snel een script in elkaar geflanst.
https://dragonflycms.org/content-check.php
offtopic:
Voor https://www.reddit.com/ klopt 'ie al niet ;) Daar geeft 'ie aan dat er geen meta http-equiv is (is er wel) en komt 'ie met ASCII als uitkomst?

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
RobIII schreef op vrijdag 6 december 2019 @ 11:43:
offtopic:
Voor https://www.reddit.com/ klopt 'ie al niet ;) Daar geeft 'ie aan dat er geen meta http-equiv is (is er wel) en komt 'ie met ASCII als uitkomst?
offtopic:
die heeft een <meta charSet="utf-8"/> niet de <meta http-equiv> ik zal het aanpassen.
En hij detecteert ASCII want er is blijkbaar geen unicode character in de eerste 16384 bytes op de pagina (https://gathering.tweakers.net/ wel).

[ Voor 4% gewijzigd door DJMaze op 06-12-2019 11:58 ]

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
DJMaze schreef op vrijdag 6 december 2019 @ 11:56:
offtopic:
die heeft een <meta charSet="utf-8"/> niet de <meta http-equiv>
offtopic:
Ik zie een <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> :?
Edit: Oh, ik default naar de oude reddit (probeer https://old.reddit.com maar); dat verklaart het.
DJMaze schreef op vrijdag 6 december 2019 @ 11:56:
offtopic:
want er is blijkbaar geen unicode character in de eerste 16384 bytes
offtopic:
Dat maakt 't nog geen ASCII ;)

[ Voor 37% gewijzigd door RobIII op 06-12-2019 12:01 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • DJMaze
  • Registratie: Juni 2002
  • Niet online
RobIII schreef op vrijdag 6 december 2019 @ 11:58:
offtopic:
Dat maakt 't nog geen ASCII ;)
offtopic:
Aangepast naar 65536 bytes, nu detecteert ie het wel ;)
Niet perfect, maar moet ergens een grens trekken. Straks gaan mensen grappig doen met een 1GB bestand...

Bedankt voor het testen. Zo komen we ergens

[ Voor 6% gewijzigd door DJMaze op 06-12-2019 12:10 ]

Maak je niet druk, dat doet de compressor maar


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké bedankt voor het geduld!
Even een verkeerd lezen begrijpen van head en header doordat ik met dit onderwerp nooit aanleiding heb gehad om me in te verdiepen. Maar goed, in de header van de betreffende website zie ik inderdaad die regel staan:
Content-Type: text/html; charset=UTF-8
Alles lijkt me dus nu opgelost, het werkt naar behoren. Is die aanvullende metatag in de head dan nog wel nodig? Ik meen begrepen te hebben van niet perse.

Wat ik echter nog steeds vreemd vind (daar blijf ik toch bij) is dat het met gebruik van notepad++ helemaal niets uitmaakt of we de upload utf-8 met of zonder BOM doen, dat klopt inderdaad met eerdere berichten hierover, maar dat het bij de gewone notepad wel verschil maakt, althans bij de beide browsers van Microsoft. Hoe ik de proef ook voor alle zekerheid opnieuw doe, ik kan er niets anders van maken. Maar het moet wel de verklaring zijn van het sinds kort misgaan als we keken via een van die beide browsers. En dat op twee onafhankelijk van elkaar werkende computers vlak na die grote Windows update 1903 op alle twee vlak na elkaar. Overigens niet meer zo belangrijk, het probleem is opgelost.

Maar ondertussen heb ik er weer wat bijgeleerd, waarvoor dank! :)

[ Voor 6% gewijzigd door Techneut op 06-12-2019 19:39 ]


Acties:
  • 0 Henk 'm!

  • MueR
  • Registratie: Januari 2004
  • Laatst online: 01:28

MueR

Admin Tweakers Discord

is niet lief

Techneut schreef op vrijdag 6 december 2019 @ 14:45:
Content-Type: text/html; charset=UTF-8
Alles lijkt me dus nu opgelost, het werkt naar behoren. Is die aanvullende metatag in de head dan nog wel nodig? Ik meen begrepen te hebben van niet perse.
Het is een "better safe than sorry" ding. De webserver hoort de goede header te sturen, maar het kan geen kwaad. Het is maar een paar bytes.

Anyone who gets in between me and my morning coffee should be insecure.


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké, al met al een hele discussie die uiteindelijk terugvoert naar twee aspecten te weten het misverstand tussen de begrippen head en header en de upload. De site als zodanig blijkt gewoon in orde. Voor de upload hebben we het advies gevolgd en inmiddels voor de inderdaad betere Notepad++ gekozen.

Blijft nog één vraag onbeantwoord, die is of het toevoegen van die metatag in de head
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
nog iets toevoegt of niet.

Edit:
Drie aspecten dan, de derde was uitleg over utf-8.

[ Voor 5% gewijzigd door Techneut op 08-12-2019 11:50 ]


Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op zondag 8 december 2019 @ 11:47:

Blijft nog één vraag onbeantwoord, die is of het toevoegen van die metatag in de head
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
nog iets toevoegt of niet.
8)7 Hoe slecht lees jij in hemelsnaam? Die vraag wordt lét-ter-lijk boven je post beantwoord door MueR in "Letters met accenten"
Techneut schreef op zondag 8 december 2019 @ 11:47:
Voor de upload hebben we het advies gevolgd en inmiddels voor de inderdaad betere Notepad++ gekozen.
Voor de upload :? 8)7 Je bedoelt voor 't bewerken van HTML? Of ben je nu naar Notepad++ geswitched omdat daar (klaarblijkelijk) ook een FTP plugin voor te krijgen is? Uploaden kun je gewoon blijven doen waarmee je 't al die tijd hebt gedaan; switchen kan ook. Whatever. Maar je zegt echt dingen die van de hak-op-de-tak zijn en als een tang op een varken slaan. Uploaden heeft niets te maken met je document encoding en waar het dit hele topic al om draait.


Afbeeldingslocatie: https://tweakers.net/ext/f/1RPqP7GkLQSf1AW6hYX9RzO4/full.jpg

Zeg... ik bedenk nu... gezien jullie nog <font face... e.d. gebruiken (wat obsolete is): jullie gebruiken toch niet ook nog framesets he? En het is toch niet zo dat je die wijzigingen alleen maar op het frameset document toepast he? Want de daadwerkelijke inhoud van de frames trekt zich natuurlijk niets aan van de content encoding van de frameset. Het is niet alsof je dat "hoofddocument" fixed alle "onderliggende" documenten óók gefixed zijn. Je zult in je browser in "view source" de metatag van de frameset zien maar niet van de frames zelf...

Edit: Overigens, beter gebruik je <meta charset="utf-8" /> i.p.v. <meta http-equiv="Content-Type" content="text/html; charset=utf-8">. Whatever je kiest; als je 't écht goed doet zorg je dat 't in de eerste 1024 bytes staat. Maar zoals gezegd; al die onzin voorkom je door gewoon de juiste http-headers te gebruiken; die metatag is dan enkel een 'aanvulling' (mits die de http header niet tegenspreekt) en dus een "better safe than sorry" ding.
Use character encoding declarations in HTTP headers if it makes sense, and if you are able, for any type of content, but in conjunction with an in-document declaration.
Overigens jammer dat ik die link (en deze) nu pas tegen kom; die beantwoordt zo'n beetje alles wat we hier ook met veel pijn en moeite aan je verstand hebben trachten te peuteren :X

[ Voor 86% gewijzigd door RobIII op 08-12-2019 12:31 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Sorry, is inderdaad mijn fout, ik las dat ten onrechte als een antwoord op die vermelding in de header, blijkbaar was mijn aandacht daar alleen maar op gericht doordat het vetgedrukt was. Opletten zij de schoolmeester vroeger tegen ons. :). Alles duidelijk nu, ik houd het op wat hij zegt "better safe than sorry". Niet zo heel beslist voorgeschreven, maar oké het is inderdaad maar een kleine moeite. bedankt.

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op zondag 8 december 2019 @ 12:22:
Sorry, is inderdaad mijn fout, ik las dat ten onrechte als een antwoord op die vermelding in de header, blijkbaar was mijn aandacht daar alleen maar op gericht doordat het vetgedrukt was. Opletten zij de schoolmeester vroeger tegen ons. :). Alles duidelijk nu, ik houd het op wat hij zegt "better safe than sorry". Niet zo heel beslist voorgeschreven, maar oké het is inderdaad maar een kleine moeite. bedankt.
Mocht je het gemist hebben: lees vooral even mijn edit (en volg de link erin)

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Bedankt voor de toevoeging:
Maar waarom denk je dat we in de website die fontface en framesets gebruiken, ik kan me niet herinneren dat ik een url van de website heb genoemd. De upload deden en doen we nog steeds met een ftp-programma. We kozen nu toch voor Notepad++ omdat we die op meerdere fronten beter vinden. Die tip waarderen we gewoon.

Die tip over de metatag <meta charset="utf-8" /> nemen we ook ter harte, die tag komt dan als eerste regel te staan. Rest je opmerking "de juiste http-headers te gebruiken". Kunnen we daar dan zelf nog wat aan doen, ik begreep dat die door de hoster worden geplaatst

Acties:
  • +1 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Techneut schreef op zondag 8 december 2019 @ 12:49:
Maar waarom denk je dat we in de website die fontface
...omdat je dat hier toont :?
Dat denk ik niet, dat vraag ik je hier. Vandaar het vraagteken aan 't eind van de zin: "jullie gebruiken toch niet ook nog framesets he?" Dat zou namelijk een hoop verklaren. En dus heb ik een vermoeden en stel ik een vraag om dat vermoeden te bevestigen.
Techneut schreef op zondag 8 december 2019 @ 12:49:
De upload deden en doen we nog steeds met een ftp-programma.
8)7 Lees mijn post nou eens goed! Je zegt zélf "voor de upload hebben we [...] voor [...] Notepad++ gekozen" en dat is precies waarom ik zeg dat je van-de-hak-op-de-tak gaat en dat je post als een tang op een varken slaat. Notepad++ kan (met een plugin) namelijk óók uploaden.
Techneut schreef op zondag 8 december 2019 @ 12:49:
We kozen nu toch voor Notepad++ omdat we die op meerdere fronten beter vinden. Die tip waarderen we gewoon.
Helemaal goed en geweldig d:)b , maar dat zei je dus niet. Je zei: "voor de upload hebben we [...] voor [...] notepad++ gekozen".
Techneut schreef op zondag 8 december 2019 @ 12:49:
Die tip over de metatag <meta charset="utf-8" /> nemen we ook ter harte, die tag komt dan als eerste regel te staan.
:F Die meta hoort in je HEAD. Dat is dus niet de eerste regel.
Techneut schreef op zondag 8 december 2019 @ 12:49:
Rest je opmerking "de juiste http-headers te gebruiken". Kunnen we daar dan zelf nog wat aan doen
Zeer waarschijnlijk wel. Maar ook dat werd je hier al verteld (.htaccess aanpassen waar/als nodig). Maar, zoals je óók al werd verteld kun je prima zien wat die headers op 't moment zijn en of je 't überhaupt moet aanpassen of dat ze al goed staan.
Techneut schreef op zondag 8 december 2019 @ 12:49:
ik begreep dat die door de hoster worden geplaatst
Die worden door je webserver geplaatst. Dat de hoster de webserver beheert is vers twee. Maar leer verdorie nou eens gewoon zeggen wat je bedoelt en leer verdorie de verschillen (zie header/head, hoster/webserver, texteditor/webeditor, ...). Dit wordt écht, écht heel vermoeiend en vervelend zo. Je zaait constant verwarring en telkens als ik denk dat je 't eindelijk snapt kom je een post later weer met wat aanzetten dat totaal niet logisch is.

[ Voor 9% gewijzigd door RobIII op 08-12-2019 14:23 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • AW_Bos
  • Registratie: April 2002
  • Laatst online: 01:28

AW_Bos

Liefhebber van nostalgie... 🕰️

Is het misschien niet zinvol voor @Techneut zinvoller om eens de basis-beginselen van een HTML5 document te bekijken, voordat er geen bal van klopt....?

Daarna is het zinvol om in de wereld van UTF-8 te duiken.

☀️ Goedemorgen zonneschijn! ☀️
☀️Ja, je maakt me zo gelukkig, en door jou voel ik me fijn! ☀️


Acties:
  • 0 Henk 'm!

  • Techneut
  • Registratie: September 2007
  • Niet online
Oké, dat is inhoudelijk voor de site zelf, dat regelt mijn vrouw, ik zal haar wel even deze tip geven. Framesets zijn op de site niet van toepassing.
[...]
voor de upload[/url] hebben we [...] voor [...] Notepad++ gekozen" en dat is precies ........
Natuurlijk niet alleen maar als upload, het is uiteraard de teksteditor voor de nieuw toegevoegde inhoud. Vanzelfsprekend kan de upload naar keuze ook nog steeds via het ftp-programma gebeuren, daar is niets aan veranderd.
[...]
Die meta hoort in je HEAD. Dat is dus niet de eerste regel.
Uiteraard bedoelde ik de eerste regel de HEAD. De HEAD als plaats hiervoor had ik een eerdere vraag al aangegeven. Het was zelfs de aanleiding tot de spraakverwarring met de header.
Zeer waarschijnlijk wel. Maar ook dat werd je hier al verteld (.htaccess aanpassen waar/als nodig). Maar, zoals je óók al werd verteld kun je prima zien wat die headers op 't moment zijn en of je 't überhaupt moet aanpassen of dat ze al goed staan.
Oké
[...]
Die worden door je webserver geplaatst. Dat de hoster de webserver beheert is vers twee. Maar leer verdorie nou eens gewoon zeggen wat je bedoelt en leer verdorie de verschillen (zie header/head, hoster/websever, texteditor/webeditor, ...). Dit wordt écht, écht heel vermoeiend en vervelend zo. Je zaait constant verwarring en telkens als ik denk dat je 't eindelijk snapt kom je een post later weer met wat aanzetten dat totaal niet logisch is.
Laatste misverstaan, ik meende begrepen te hebben dat de hoster altijd de webserver beheerde, ook een gevolg van dat we ons nooit met deze kant hoefden te bemoeien en nu wel, maar niettemin is het nu allemaal in orde. De andere verschillen die je noemt had ik wel begrepen.

[ Voor 6% gewijzigd door Techneut op 08-12-2019 19:10 ]

Pagina: 1