Is er een tool om pdf te waarderen op basis van de inhoud?

Pagina: 1
Acties:
  • 290 views

Onderwerpen

Vraag


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Beste dames en heren,

Mijn vraag is als volgt. Ik heb een database met pdf rapporten. Nu wil ik een programma hebben/laten maken wat op basis van de inhoud de auteur, het rapportnummer/kenmerk en de opleverdatum kan genereren. Dus een tool die pdf rapporten kan categoriseren door ze te "lezen" en op basis van bovenstaande kenmerken een rapport kan waarderen/opslaan.

Nu zijn een deel van de pdfs oude scans/kopieën van analoge rapporten. Dus mogelijk moet er eerst nog een OCR tekst conversie plaatsvinden.

Ik neem aan dat dit wel bestaat of redelijk makkelijk te maken is. Ik ben zelf geen programmeur, maar ik begrijp het wel redelijk dus ben benieuwd of er goede ideeën of mogelijk al voorbeelden zijn van zo'n soort programma.

Alvast bedankt, alle tips zijn welkom.

Alle reacties


Acties:
  • 0 Henk 'm!

  • Rmg
  • Registratie: November 2003
  • Laatst online: 17-09 15:31

Rmg

Dat heet een Document Management System of DMS, je hebt een aantal open source versies hier van OpenKM bijvoorbeeld is een een open source DMS die ook een OCR engine heeft.

Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Ik weet niet wat je doel is met dit topic, maar "Nu wil ik een programma hebben/laten maken" doet mij je toch even wijzen op Devschuurder werven? Gebruik Vraag & Aanbod!.

Verder zie ik niet wat dit met Programming van doen heeft; we hebben 't hier over zélf maken en (concrete!) programmeervragen zijn dan ook van harte welkom hier. Je vraag, zoals 'ie nu is, is echter veel te breed (en je geeft veel te weinig informatie). En, zolang je geen programmeur bent, moet je ook geen uitspraken (willen) doen over "redelijk makkelijk te maken". Hersenchirurgie ziet er ook vrij simpel uit ;)

Tot slot mis ik nogal wat zaken uit onze Quickstart; ik mis o.a. wat je zélf al gezocht / gevonden / geprobeerd hebt, waar je strandde, wat er niet werkte etc. Al met al genoeg redenen om dit topic te sluiten. Open gerust een nieuw topic (kijk dan even of Programming welk de juiste plek is: Waar hoort mijn topic?) maar hanteer dan wel even voorgenoemde quickstart a.u.b.

[ Voor 3% gewijzigd door RobIII op 10-10-2018 13:18 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Dit topic is gesloten.