Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien
Toon posts:

Een PDF-document controleren op teksten en waarden

Pagina: 1
Acties:

Verwijderd

Topicstarter
Hallo,
Door een PDF- bestand van je rapport te maken zorg je ervoor dat alle teksten die het rapport bevat selecteerbaar zijn.

Hierbij heb ik een rapport die in pdf- bestand omgezet is en die wil ik op bepaalde vaste plekken laten controleren door stukje programma. met andere woorden "stukje digitale controle".

Weet iemand misschien hoe ik moet beginnen en hoe ik het beste kan aanpakken? (welke taal of programma)


Alvast bedankt

  • Spider.007
  • Registratie: December 2000
  • Niet online

Spider.007

* Tetragrammaton

Ik snap vrij weinig van je verhaal; wellicht dat je je topicstart kunt uitbreiden met behulp van de tips in Policy: Alle regels die op het forum gelden? Wil je controleren of op bepaalde plekken bepaalde teksten voorkomen; of wil je een soort spellingscontrole uitvoeren oid? Graag wat meer toelichting dan haal ik de uitroeptekens uit je titel :)

---
Prozium - The great nepenthe. Opiate of our masses. Glue of our great society. Salve and salvation, it has delivered us from pathos, from sorrow, the deepest chasms of melancholy and hate


Verwijderd

Topicstarter
Nou ik wil controleren op bepaalde tekst die in het rapport voorkomt. het gaat hier om een reeks rapporten die zelfde uiterlijk hebben. daarbij moet er gecontroleerd worden op waarden die voor ieder titel staat. Voorbeeld:

Machinenummer: 2
Programma: Test
Opmerkingen: De besturing heeft geen fouten geconstateerd

Dit zijn vaste titels die in het rapport vastgelegd zijn. hierbij wil ik bijvoorbeeld controleren op machinenr, programma-naam, of opmerkingen.

Wat ik met controleren bedoel is dat hij bijvoorbeeld alle rapporten die van machine 2 afkomstig zijn bij elkaar moet houden.

Ik hoop dat ik hiermee duidelijker ben geweest.

Verwijderd

Voor mij is het nog steeds heel onduidelijk :P

Dat rapport is een PDF bestand als ik het goed begrijp en je wil met een programma of tool de PDF files doorzoeken en op basis van bepaalde keywords moet hij het rapport (pdf bestand) verplaatsen naar een bepaalde map? Verder, op welk besturingssysteem moet dit gebeuren? Als het Linux is zou je kunnen proberen met een bash scriptje & grep

Verwijderd

Topicstarter
Verwijderd schreef op maandag 02 november 2009 @ 13:34:
Voor mij is het nog steeds heel onduidelijk :P

Dat rapport is een PDF bestand als ik het goed begrijp en je wil met een programma of tool de PDF files doorzoeken en op basis van bepaalde keywords moet hij het rapport (pdf bestand) verplaatsen naar een bepaalde map? Verder, op welk besturingssysteem moet dit gebeuren? Als het Linux is zou je kunnen proberen met een bash scriptje & grep
ja precies, jij snapt hem helemaal correct. alleen het gaat hierom een windows app. dus heb je misschien een een windows oplossing. eigenlijk ben ik opzoek naar een soort scipt maar programma mag ook wel:P

  • sam.vimes
  • Registratie: Januari 2007
  • Laatst online: 08-06 08:44
PDF is niet echt geschikt voor dit doel: het is een opmaakformaat waar de tekst ongestructureerd in staat. Grote kans dat er ook interne compressie plaatsgevonden heeft. Dan kun je de teksten helemaal niet terug vinden.

Ik zou een stap terug gaan: het rapport wordt met behulp van bepaalde data gegenereerd. Die data kun je ook gebruiken als bron om je controles op uit te voeren.

Je zou "if all else fails" kunnen proberen pstotext (http://pages.cs.wisc.edu/~ghost/doc/pstotext.htm) te scripten: met pstotext kun je de tekst grotendeels terug krijgen en daar kun je dan in zoeken en selecteren.
pstotext reads one or more PostScript or PDF files, and writes to standard output a representation of the plain text that would be displayed if the PostScript file were printed.
Pagina: 1