Toon posts:

[PDF] Van pdf naar excel

Pagina: 1
Acties:
  • 359 views sinds 30-01-2008
  • Reageer

Verwijderd

Topicstarter
Ik heb een paar duizend pdf bestanden welke ik wil omzetten naar excel. De pdf bestanden zijn echter redelijk moeilijk te converteren.

Het gaat om vijf kolommen met gegevens. met daarboven een kop met nutteloze info.

Wat ik al geprobeerd heb:

Copy Paste => kolomen worden gescheiden door een spatie echter in de kolommen zelf staan al spaties. Verdere verwerking dus onmogelijk

PdfGrabber => Fantastisch conversie proggie, ik was zo enthausiast dat ik het onmiddelijk heb laten aanschaffen door mijn baas. Echter deze probeerd de layout mee te nemen en plaatst de kolommen niet correct onderelkaar en alsnog gaan dus de kolommen verloren.

Adobe Acrobat Export => alle mogelijke exports geprobeerd met adobe acrobat 5 en 6. de resultaten komen bijna elke keer neer op de platte text gescheiden door spaties net als bij de copy paste test.

Ik heb heeeel veel tijd besteed aan het schrijven van een parser voor de excel files die pdfgrabber aanmaakt. dit lukt aardig echter er zijn zoveel kleine inconsistenties in in de hoofd pdf file dat dit toch niet goed gaat worden.

Wie o wie kan er nog meer methodes bedenken om de originele data weer uit de pdf te toveren?

(de copy paste optie werkt nog het beste als de spaties tussen de kolommen maar een ander teken zouden worden zoals een ; of een tab)


en nee het is echt niet mogelijk om aan andere files te komen dan de pdf files. Het programma dat deze pfd files genereert kan niet iets anders generen :(

Het gaat trouwens om Onderdeellijsten gegenereerd uit een ontwerp applicatie.

  • Bever
  • Registratie: Maart 2001
  • Laatst online: 16:28
Als je naar word kopieerd wat doet ie dan? Als je daar wel tabellen krijgt kopieer je het vanuit word weer naar excel. Weet niet of het werkt maar ik gebruik ook vaak zulke omwegen.

Verwijderd

Topicstarter
Nope, ook in word zet hij alle tekst achter elkaar voorbeeld:
code:
1
2
3
4
5
6
7
8
1 1,00 PCS BEARING 2305 FILLED WITH GREASE 614240
2 1,00 PCS STUFFING BOX A30X62X7 DIN 3670 614237
3 1,00 PCS STUFFING BOX A25X52X7 DIN 3670 614043
                                          ^kolom 4
           ^kolom 4
       ^kolom 3
  ^ kolom 2
^ kolom 1

de kolommen zijn variabel in lengte

  • Falcon
  • Registratie: Februari 2000
  • Laatst online: 21-11 10:36

Falcon

DevOps/Q.A. Engineer

http://www.library.mcgill.../PDFtoXLS/PDFtoExcel.html

Lees dit es

www.google.nl -> pdf to excel .. in 1 keer .. Goed he ? :)

[ Voor 24% gewijzigd door Falcon op 14-10-2003 15:07 ]

"We never grow up. We just learn how to act in public" - "Dyslexie is a bitch"


Verwijderd

Topicstarter
wauw :) dat helpt al behoorlijk! echter nog niet geweldig, "de table" wordt nogsteeds door adobe geparsed, en daar maakt ze fouten mee om de een of andere reden.

(sommige rijen hebben plotseling een extra kolom met daarin een stuk van de omschrijving)

Is er geen manier om de achterliggende data uit de pdf te vissen? met de copy paste truck heb ik geleerd dat de pdf file wel de correcte data inzich heeft...

[ Voor 27% gewijzigd door Verwijderd op 14-10-2003 15:37 ]


  • Falcon
  • Registratie: Februari 2000
  • Laatst online: 21-11 10:36

Falcon

DevOps/Q.A. Engineer

vast wel .. maar heb je al even gezocht? :)

"We never grow up. We just learn how to act in public" - "Dyslexie is a bitch"


Verwijderd

Topicstarter
heb je m'n startpost misschien niet gelezen?

  • Batsies
  • Registratie: Mei 2002
  • Laatst online: 27-01-2022

Batsies

E-Developing

Is het niet mogelijk om bever zegt de tekst te kopieren naar word, daar alle text te selecteren en dan op insert table te drukken. Alle text zal dan in een tabel verschijnen en met een beetje geluk alles in een aparte cell, nu export naar excel en werken ermee. Of werkt dit niet?

E-Developing


  • Montana
  • Registratie: Juni 2001
  • Laatst online: 10:56

Montana

Apple and X-H2 ..what else !

Misschien een optie, bij mij werkte het in ieder geval, ik heb een excel sheet naar > PDF gezet. Deze weer ingelezen als file in Omnipage 12 > en laten lezen als sheet toen weggeschreven als een Excel "97 /2000 bestand. Ging prima

Apple Studio Max M2 and Apple Studio Display | Macbook Air 15" M2 | FUJIFILM X-H2 | XF200 F2 | XF1.4x TC F2 |XF 2xTC | XF500 f5.6 | XF150-600 | XF80 | XF16-80 | Viltrox 27mm f1.2 PRO X-Mount


Verwijderd

Topicstarter
Batsies schreef op 14 oktober 2003 @ 17:29:
Is het niet mogelijk om bever zegt de tekst te kopieren naar word, daar alle text te selecteren en dan op insert table te drukken. Alle text zal dan in een tabel verschijnen en met een beetje geluk alles in een aparte cell, nu export naar excel en werken ermee. Of werkt dit niet?
Nee, de velden worden dan gescheiden door spaties welke ook in de waardes van de velden voorkomen. Daarmee gaat (helaas) alle kolom informatie verloren.
Montana schreef op 14 October 2003 @ 22:09:
Misschien een optie, bij mij werkte het in ieder geval, ik heb een excel sheet naar > PDF gezet. Deze weer ingelezen als file in Omnipage 12 > en laten lezen als sheet toen weggeschreven als een Excel "97 /2000 bestand. Ging prima
Omnipage 12, ik ga kijken of we die software hebben of dat ik er een trial van kan downloaden. Ik ben heel benieuwd :)

  • M4RTiN
  • Registratie: Augustus 2000
  • Laatst online: 24-11-2024
kan je niet exporteren met kommagescheiden waarden text bestand, en daarin evt in kladblok wat zooi weghalen en vervolgend excel importen en de komma als teken gebruiken tussen elke cel...
Pagina: 1