Toon posts:

Onderscheid PDF: doorzoekbaar/niet doorzoekbaar

Pagina: 1
Acties:

Vraag


  • pastaliefhebber
  • Registratie: Februari 2013
  • Laatst online: 24-05 11:07
Ik heb een grote verzameling PDF bestanden.
Een deel daarvan is doorzoekbaar, en een ander deel niet.

Ik zoek een tooltje dat mij in een overzicht aan kan geven welk PDF bestand doorzoekbaar is of niet.
Visueel een beetje zoals je bijvoorbeeld in Windows verkenner een kolom kan toevoegen wat de bestandgrootte is en daarop kan filteren/sorteren.

Het achterliggende idee is dat ik een grote verzameling PDF bestanden heb (archief) waarvan ik niet 1 voor 1 de bestanden wil openen en handmatig controleren op doorzoekbaarheid, maar dit in een overzicht wil zien, zodat ik snel kan zien welke bestanden ik moet converteren naar doorzoekbaar PDF formaat.

Ik werk met Windows 10.

Ik hoop dat het duidelijk is wat ik bedoel, anders geef ik graag meer toelichting.

Is er iemand die mij kan helpen met een betrouwbaar en virusvrij tooltje / mij verder op weg kan helpen?

Alle reacties


  • F_J_K
  • Registratie: Juni 2001
  • Niet online

F_J_K

Moderator CSA/PB

Front verplichte underscores

Je zou een script kunnen schrijven dat per bestand het bestand opent met bijv. pdftotext en kijkt of er dan tekst terug komt. Zo nee, is het niet doorzoekbaar.

zoeken bij google naar 'find pdf that has no ocr' geeft wat opties.

'Multiple exclamation marks,' he went on, shaking his head, 'are a sure sign of a diseased mind' (Terry Pratchett, Eric)



Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee