Onderscheid PDF: doorzoekbaar/niet doorzoekbaar

Pagina: 1
Acties:

Vraag


Acties:
  • 0 Henk 'm!

  • pastafan
  • Registratie: Februari 2013
  • Laatst online: 20:05
Ik heb een grote verzameling PDF bestanden.
Een deel daarvan is doorzoekbaar, en een ander deel niet.

Ik zoek een tooltje dat mij in een overzicht aan kan geven welk PDF bestand doorzoekbaar is of niet.
Visueel een beetje zoals je bijvoorbeeld in Windows verkenner een kolom kan toevoegen wat de bestandgrootte is en daarop kan filteren/sorteren.

Het achterliggende idee is dat ik een grote verzameling PDF bestanden heb (archief) waarvan ik niet 1 voor 1 de bestanden wil openen en handmatig controleren op doorzoekbaarheid, maar dit in een overzicht wil zien, zodat ik snel kan zien welke bestanden ik moet converteren naar doorzoekbaar PDF formaat.

Ik werk met Windows 10.

Ik hoop dat het duidelijk is wat ik bedoel, anders geef ik graag meer toelichting.

Is er iemand die mij kan helpen met een betrouwbaar en virusvrij tooltje / mij verder op weg kan helpen?

Alle reacties


Acties:
  • 0 Henk 'm!

  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Je zou een script kunnen schrijven dat per bestand het bestand opent met bijv. pdftotext en kijkt of er dan tekst terug komt. Zo nee, is het niet doorzoekbaar.

zoeken bij google naar 'find pdf that has no ocr' geeft wat opties.

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)