WP: WH-MDC05J3E5,WH-MDC07J3E5, WPB: Atlantic Explore v4, PV: Solaredge (6,8kW) en SMA (4,3kW), 2 x Heishamon OT v3.1, Rpi v5, Rpi v4, 2 x Rpi v3, ESP32, Domoticz
Typisch geval van chinese tekens is als latin-1-encoded tekst als utf-16 wordt geïnterpreteerd (Bush hid the facts).
[ Voor 6% gewijzigd door ValHallASW op 09-06-2015 10:35 ]
Mailserver is Exchange?
[ Voor 36% gewijzigd door Fairy op 09-06-2015 10:35 ]
Ik heb niet meer informatie aangegeven omdat ik vermoedde dat het een universeel probleem is en niet persé gelinked aan een pakket.
Onder een voorbeeld van de tekst (werkelijke tekst is E-mail Body 1):
⼀∀䔀ⴀ洀愀椀氀 䈀漀搀礀 ∀ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ
WP: WH-MDC05J3E5,WH-MDC07J3E5, WPB: Atlantic Explore v4, PV: Solaredge (6,8kW) en SMA (4,3kW), 2 x Heishamon OT v3.1, Rpi v5, Rpi v4, 2 x Rpi v3, ESP32, Domoticz
Ik zou de link naar mojibake hebben gebruikt. Daar staat namelijk de meest waarschijnlijke verklaring.ValHallASW schreef op dinsdag 09 juni 2015 @ 10:34:
[...]
Typisch geval van chinese tekens is als latin-1-encoded tekst als utf-16 wordt geïnterpreteerd (Bush hid the facts).
The problem with common sense is that sense never ain't common - From the notebooks of Lazarus Long
GoT voor Behoud der Nederlandschen Taal [GvBdNT
Apart: er wordt ergens een fout gemaakt met endianness. utf-16 gebruikt twee bytes per karakter[1], en die twee bytes worden in de verkeerde volgorde ingelezen:Aziona schreef op dinsdag 09 juni 2015 @ 15:15:
Onder een voorbeeld van de tekst (werkelijke tekst is E-mail Body 1):
⼀∀䔀ⴀ洀愀椀氀 䈀漀搀礀 ∀ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ䔀ⴀ洀愀椀氀 䈀漀搀礀 ഀ
u'⼀∀䔀ⴀ洀愀椀氀 䈀漀搀礀'.encode('utf-16-le').decode('utf-16-be')
'/"E-mail Body'
Vervolgens is vraag 1) waarom utf-16?! en 2) waarom gaat er iets mis met de endianness.
Dan kom ik terug op mijn eerdere vraag:
Daarnaast zou het handig zijn als je de headers van de e-mail die je ontvangt (of liever nog: de hele mail, inclusief headers) zou kunnen posten.Wat stuur je precies naar de server?
[1] behalve bij karakters buiten het basic multilingual plane
[ Voor 7% gewijzigd door ValHallASW op 09-06-2015 16:48 ]
Ik gebruik Windows 10, inclusief het mailprogramma.
Onderstaand, een deel van de e-mail.
楈䠠湥Ⱬഠ䈊湥搠楲敫牥渠慡敤戠湡敧敷獥⁴浯朠汥極⁴敤䄠䵔琠慨敬䔠歬敫牥渠摡瑡椠汫慡敢敭⁴敤栠汥牴湡慳瑣敩欠浯⁴敨⁴慫牡橴整畲敭⁴敤洠摥摥汥湩㩧椠癮污摩挠牡歉搠湥歩朠‴景㔠⁘捡瑨牥攠歬慡Ⱳ洠瑥␠〴‰汥敫欠敥敢歩欠慬牡戠橩搠〲瑳ഠ䴊慡敨⁴汢橩瑦漠浮杯汥橩敚⁴敨⁴慭牡漠⁰馀敲敫楮杮䠠湥Ⱬ†整楺敪樠牥愠档整慫潫敭慷⁴敨⁴牰扯敬浥椠䤠敨⁴慰獳潣敤渠浵敭業獳档敩敶慲摮牥Ɽ漠獩攠胢溘渠敩睵慫牡
慭牡洠牯敧獩栠瑥愠睬敥敤ㄠ搸ⱥ搠獵
Hoe kan dit? Iemand een idee?
Email is in UTF-8 opgeslagen en wordt nu in UTF-16 weergegeven. Hoe dat kan? Geen idee. Je zou de rest van die mails in mijn tooltje kunnen pasten met hoe ik 'm heb ingesteld om het origineel terug te halen.
Maar dit heeft vrij weinig met softwareontwikkeling te maken. Daar je een 5 jaar oud topic kickt, sluit ik die voor nu maar even.
[ Voor 3% gewijzigd door .oisyn op 08-01-2021 14:43 ]
Give a man a game and he'll have fun for a day. Teach a man to make games and he'll never have fun again.
Dit topic is gesloten.