In een tooltje die ik aan het schrijven ben doe ik ontzettend veel met het verwerken van CSV files. Aangezien ik een paar honderd Mb aan data moet inlezen wil ik dit het liefst op de snelst mogelijke manier doen.
Op dit moment blijft mijn code steken op circa 6.5Mb/sec inlezen.
Snelste tot nu toe is openCSV ( http://opencsv.sourceforge.net/ ) en daarmee per regel uitlezen en uitkomst stoppen in een String[].
Wat ik heb geprobeerd:
- SuperCSV library ( http://supercsv.sourceforge.net/ ). Qua opzet heel mooi alleen trager (4,3Mb/sec )
- openCSV in plaats van per regel bestand in 1x inlezen in een List en dan verder verwerken. Is ook trager ( 5Mb/sec )
- BufferedReader gebruiken per regel verwerken en data met split() in een String[] plaatsen. ( 4,3Mb/sec )
Iemand enig idee wat de snelste methode is om CSV informatie te verwerken? Het moet toch sneller kunnen?
Op dit moment blijft mijn code steken op circa 6.5Mb/sec inlezen.
Snelste tot nu toe is openCSV ( http://opencsv.sourceforge.net/ ) en daarmee per regel uitlezen en uitkomst stoppen in een String[].
Wat ik heb geprobeerd:
- SuperCSV library ( http://supercsv.sourceforge.net/ ). Qua opzet heel mooi alleen trager (4,3Mb/sec )
- openCSV in plaats van per regel bestand in 1x inlezen in een List en dan verder verwerken. Is ook trager ( 5Mb/sec )
- BufferedReader gebruiken per regel verwerken en data met split() in een String[] plaatsen. ( 4,3Mb/sec )
Iemand enig idee wat de snelste methode is om CSV informatie te verwerken? Het moet toch sneller kunnen?
Duurzame nerd. Veel comfort en weinig verbruiken. Zuinig aan doen voor de toekomst.