Ik ben even met een hobby projectje bezig en in het kort is het de bedoeling dat ik een globale dir blijf controleren voor nieuwe PDF's. Vervolgens moet ik checken of er in dat PDF een specifieke pagina is met bijvoorbeeld een vooraf gedefinieerd woord/teken/plaatje (hoe of wat het word maakt niet uit).
Indien er zo'n pagina is, dan wordt het PDF bestand daarop gesplitst, en uiteraard valt die specifieke scheidingspagina in het niet
Nu heb ik gewoon de basis al klaar en loop ik door de PDF's heen, maar het 'probleem' is dat het altijd ingescande PDF's zijn. Oftewel je kunt niet zomaar 'tekst' lezen. Immers is het eigenlijk een plaatje en geen digitaal document.
Ik loop nu eigenlijk een beetje vast op hoe ik nu verder moet gaan. Ik wil liever niet het wiel opnieuw uitvinden en m'n C# kennis is gewoon miniem. Waar ik zelf aan zit te denken is dat het 'schutblad' een tekst bevat met een bepaalde grootte zodat ik deze dan kan vergelijken als een image. Het andere waar ik aan dacht is een barcode. Ik ga er vanuit, al helpt google hierin niet echt; dat dit relatief gezien makkelijk te parsen moet zijn.
Hebben jullie wat pointers waar ik naar kan kijken, of domweg een voorbeeld van iemand die het zelfde wil/doet?
Indien er zo'n pagina is, dan wordt het PDF bestand daarop gesplitst, en uiteraard valt die specifieke scheidingspagina in het niet
Nu heb ik gewoon de basis al klaar en loop ik door de PDF's heen, maar het 'probleem' is dat het altijd ingescande PDF's zijn. Oftewel je kunt niet zomaar 'tekst' lezen. Immers is het eigenlijk een plaatje en geen digitaal document.
Ik loop nu eigenlijk een beetje vast op hoe ik nu verder moet gaan. Ik wil liever niet het wiel opnieuw uitvinden en m'n C# kennis is gewoon miniem. Waar ik zelf aan zit te denken is dat het 'schutblad' een tekst bevat met een bepaalde grootte zodat ik deze dan kan vergelijken als een image. Het andere waar ik aan dacht is een barcode. Ik ga er vanuit, al helpt google hierin niet echt; dat dit relatief gezien makkelijk te parsen moet zijn.
Hebben jullie wat pointers waar ik naar kan kijken, of domweg een voorbeeld van iemand die het zelfde wil/doet?