Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

Automatisch gegevens uit PDF halen

Pagina: 1
Acties:

  • MrPepper
  • Registratie: Februari 2009
  • Laatst online: 23-11 12:45
Hey tweakers,

Ik heb momenteel een best interessant vraagstuk. Ik heb een PDF file met ongeveer 200 bladzijden met op elke bladzijde een product beschreven. Op elke pagina is de indeling gelijk. Ik zal even een voorbeeldje geven.
Header Datum

Cathegorie-ID Product-ID Naam-product

*Variërende inhoud*
Nu wil ik graag deze producten in een database gaan zetten, maar om van elke bladzijde de ID gegevens te gaan overnemen en op te slaan in bijvoorbeeld een excel bestand is vrij veel werk. Bestaat er ook een manier om dit te automatiseren? Dus dat ik bijvoorbeeld opgeef dat ik van elke bladzijde de gegevens op de vierde regel wil kopiëren?

Ik ben best benieuwd, zelf heb ik nog nooit van een dergelijk iets gehoord.

Als het gemakkelijk was had iemand anders het wel gedaan!


  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 19:06

CAPSLOCK2000

zie teletekst pagina 888

Niks makkelijks.
Je zou kunnen proberen de pdf eerst naar platte tekst om te zetten en dan met wat regexpen de juiste stukken er uit knippen.

This post is warranted for the full amount you paid me for it.


  • MrPepper
  • Registratie: Februari 2009
  • Laatst online: 23-11 12:45
Het is me gelukt! Ik heb het bestand op advies van hierboven omgezet in een excel bestandje, hierna een VBA scriptje eroverheen gegooid welke alle kolommen verwijdert als ze niet met een Cathegorie-ID beginnen. :)

Als het gemakkelijk was had iemand anders het wel gedaan!