Beste dames en heren,
Mijn vraag is als volgt. Ik heb een database met pdf rapporten. Nu wil ik een programma hebben/laten maken wat op basis van de inhoud de auteur, het rapportnummer/kenmerk en de opleverdatum kan genereren. Dus een tool die pdf rapporten kan categoriseren door ze te "lezen" en op basis van bovenstaande kenmerken een rapport kan waarderen/opslaan.
Nu zijn een deel van de pdfs oude scans/kopieën van analoge rapporten. Dus mogelijk moet er eerst nog een OCR tekst conversie plaatsvinden.
Ik neem aan dat dit wel bestaat of redelijk makkelijk te maken is. Ik ben zelf geen programmeur, maar ik begrijp het wel redelijk dus ben benieuwd of er goede ideeën of mogelijk al voorbeelden zijn van zo'n soort programma.
Alvast bedankt, alle tips zijn welkom.
Mijn vraag is als volgt. Ik heb een database met pdf rapporten. Nu wil ik een programma hebben/laten maken wat op basis van de inhoud de auteur, het rapportnummer/kenmerk en de opleverdatum kan genereren. Dus een tool die pdf rapporten kan categoriseren door ze te "lezen" en op basis van bovenstaande kenmerken een rapport kan waarderen/opslaan.
Nu zijn een deel van de pdfs oude scans/kopieën van analoge rapporten. Dus mogelijk moet er eerst nog een OCR tekst conversie plaatsvinden.
Ik neem aan dat dit wel bestaat of redelijk makkelijk te maken is. Ik ben zelf geen programmeur, maar ik begrijp het wel redelijk dus ben benieuwd of er goede ideeën of mogelijk al voorbeelden zijn van zo'n soort programma.
Alvast bedankt, alle tips zijn welkom.