Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[phpMyAdmin] csv import utf8

Pagina: 1
Acties:

  • Saven
  • Registratie: December 2006
  • Laatst online: 21-11 09:51

Saven

Administrator

Topicstarter
Hola,

Er is een probleempje waar ik al vaker tegenaan ben gelopen, maar ik wil t gewoon goed hebben :P Ik heb een CSV bestand met wat data, waar ook speciale tekens als é en ë e.d. in voorkomen.

Als ik deze importeer in phpmyadmin via de csv import functie dan worden de rare tekens vervangen in ??
Ik dacht hmm oke, de charset van de databasevelden stonden op latin_1. Daarna geleegd en alle velden op utf8_default gezet. Import opnieuw gedraaid.

Echter nog hetzelfde probleem dat deze waardes niet goed worden meegenomen :X

Iemand enig idee wat ik dan fout doe? Ik dacht dat het aan het charset lag, maar dat heeft dus niet geholpen

  • Spinal
  • Registratie: Februari 2001
  • Laatst online: 18-11 15:23
Staat het in je CSV-bestand wél goed, of gaat het daar al fout?

Full-stack webdeveloper in Groningen


  • Herko_ter_Horst
  • Registratie: November 2002
  • Niet online
Het ligt tóch aan de charset :)

Met welke charset is de CSV ge-encode? MySQL heb je nu blijkbaar qua tabel-structuur op UTF-8 gezet. V.z.i.w. moet je daar ook in de connectie-opbouw iets voor veranderen (of is dat tegenwoordig niet meer?).

Even opgezocht en ja dus: http://superuser.com/ques...tf8-from-mysql-phpmyadmin

Verder zou het nog kunnen zijn dat het gebruikte font in je browser geen glyphs heeft voor die tekens.

Voor de compleetheid deze nog maar even: http://www.joelonsoftware.com/articles/Unicode.html

"Any sufficiently advanced technology is indistinguishable from magic."


  • Saven
  • Registratie: December 2006
  • Laatst online: 21-11 09:51

Saven

Administrator

Topicstarter
Hmm thanks herko even kijken :)

@spinal, in het excel bestand staat het wel goed idd :P

  • Janoz
  • Registratie: Oktober 2000
  • Laatst online: 20-11 22:59

Janoz

Moderator Devschuur®

!litemod

Als je csv in Excel goed getoond wordt is de csv geen UTF-8, maar Windows-1252 (ook wel CP-1252 geheten). Zie verder de joel link van Herko

Ken Thompson's famous line from V6 UNIX is equaly applicable to this post:
'You are not expected to understand this'


  • Saven
  • Registratie: December 2006
  • Laatst online: 21-11 09:51

Saven

Administrator

Topicstarter
Ah het probleem is inderdaad dat excel de csv niet als utf8 opslaat. heb nu een workaround door het in notepad te openen, daarna copy en dan paste in Notepad++ te gooien met encoding op utf8.

Voor 8000 rijen gaat dat nog wel. Maar ik heb straks 40.000 rijen, denk niet dat notepad(++) dat trekt? :P

  • Merethil
  • Registratie: December 2008
  • Laatst online: 21:36
Saven schreef op donderdag 14 augustus 2014 @ 11:09:
Ah het probleem is inderdaad dat excel de csv niet als utf8 opslaat. heb nu een workaround door het in notepad te openen, daarna copy en dan paste in Notepad++ te gooien met encoding op utf8.

Voor 8000 rijen gaat dat nog wel. Maar ik heb straks 40.000 rijen, denk niet dat notepad(++) dat trekt? :P
Notepad++ zal daar geen problemen mee hebben hoor, wordt veel meer rotzooi in gedumpt.

  • Janoz
  • Registratie: Oktober 2000
  • Laatst online: 20-11 22:59

Janoz

Moderator Devschuur®

!litemod

Je hebt twee oplossingsrichtingen:
1. Zelf converteren naar UTF-8 (zoals je nu doet, maar je zou ook rechtstreeks in kunnen laden in notepad++ met de juiste encoding en dan opslaan met UTF-8 en er moeten vast ook wel andere tools zijn die kunnen converteren)

2. Zorgen dat je bij de import aangeeft dat de input in CP-1252 formaat is zodat de juiste conversie bij het importeren gebeurt.

Ken Thompson's famous line from V6 UNIX is equaly applicable to this post:
'You are not expected to understand this'


  • Saven
  • Registratie: December 2006
  • Laatst online: 21-11 09:51

Saven

Administrator

Topicstarter
Janoz schreef op donderdag 14 augustus 2014 @ 11:20:
Je hebt twee oplossingsrichtingen:
1. Zelf converteren naar UTF-8 (zoals je nu doet, maar je zou ook rechtstreeks in kunnen laden in notepad++ met de juiste encoding en dan opslaan met UTF-8 en er moeten vast ook wel andere tools zijn die kunnen converteren)

2. Zorgen dat je bij de import aangeeft dat de input in CP-1252 formaat is zodat de juiste conversie bij het importeren gebeurt.
Ah die 2e had ik nog niet aan gedacht :) Ga ik ook even naar kijken, thanks

  • cbr600f4i
  • Registratie: Augustus 2005
  • Laatst online: 20-11 19:26
Ik snap nog steeds niet waarom Microsoft die utf-8 optie uit Excel heeft gesloopt. Ik gebruik sinds een tijdje ook notepad om csv bestanden in utf-8 op te slaan.

Ryzen 7 9800x3D / RX7900XTX OC / 32 GB Corsair Vengeance 6000 Mhz RGB DDR5 / ASUS TUF Gaming B650-Plus WiFi


  • johnkeates
  • Registratie: Februari 2008
  • Laatst online: 04-07 16:30
Je hebt ook commandline UTF8 converters. Die vreten alle soorten tekstbestanden en poepen UTF8 uit. Scheelt weer een heleboel onzin geklik.
Pagina: 1