Cookies op Tweakers

Tweakers is onderdeel van DPG Media en maakt gebruik van cookies, JavaScript en vergelijkbare technologie om je onder andere een optimale gebruikerservaring te bieden. Ook kan Tweakers hierdoor het gedrag van bezoekers vastleggen en analyseren. Door gebruik te maken van deze website, of door op 'Cookies accepteren' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt? Bekijk dan ons cookiebeleid.

Meer informatie
Toon posts:

Is er een tool om pdf te waarderen op basis van de inhoud?

Pagina: 1
Acties:
  • 217 views

Onderwerpen

Vraag


  • Evrona
  • Registratie: oktober 2018
  • Laatst online: 10-10-2018
Beste dames en heren,

Mijn vraag is als volgt. Ik heb een database met pdf rapporten. Nu wil ik een programma hebben/laten maken wat op basis van de inhoud de auteur, het rapportnummer/kenmerk en de opleverdatum kan genereren. Dus een tool die pdf rapporten kan categoriseren door ze te "lezen" en op basis van bovenstaande kenmerken een rapport kan waarderen/opslaan.

Nu zijn een deel van de pdfs oude scans/kopieën van analoge rapporten. Dus mogelijk moet er eerst nog een OCR tekst conversie plaatsvinden.

Ik neem aan dat dit wel bestaat of redelijk makkelijk te maken is. Ik ben zelf geen programmeur, maar ik begrijp het wel redelijk dus ben benieuwd of er goede ideeën of mogelijk al voorbeelden zijn van zo'n soort programma.

Alvast bedankt, alle tips zijn welkom.

Alle reacties


  • Rmg
  • Registratie: november 2003
  • Nu online
Dat heet een Document Management System of DMS, je hebt een aantal open source versies hier van OpenKM bijvoorbeeld is een een open source DMS die ook een OCR engine heeft.

  • RobIII
  • Registratie: december 2001
  • Laatst online: 19:46

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Ik weet niet wat je doel is met dit topic, maar "Nu wil ik een programma hebben/laten maken" doet mij je toch even wijzen op Devschuurder werven? Gebruik Vraag & Aanbod!.

Verder zie ik niet wat dit met Programming van doen heeft; we hebben 't hier over zélf maken en (concrete!) programmeervragen zijn dan ook van harte welkom hier. Je vraag, zoals 'ie nu is, is echter veel te breed (en je geeft veel te weinig informatie). En, zolang je geen programmeur bent, moet je ook geen uitspraken (willen) doen over "redelijk makkelijk te maken". Hersenchirurgie ziet er ook vrij simpel uit ;)

Tot slot mis ik nogal wat zaken uit onze Quickstart; ik mis o.a. wat je zélf al gezocht / gevonden / geprobeerd hebt, waar je strandde, wat er niet werkte etc. Al met al genoeg redenen om dit topic te sluiten. Open gerust een nieuw topic (kijk dan even of Programming welk de juiste plek is: Waar hoort mijn topic?) maar hanteer dan wel even voorgenoemde quickstart a.u.b.

[Voor 3% gewijzigd door RobIII op 10-10-2018 13:18]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Roses are red Violets are blue, Unexpected ‘{‘ on line 32.

Over mij


Dit topic is gesloten.



Apple iPad Pro (2021) 11" Wi-Fi, 8GB ram Microsoft Xbox Series X LG CX Google Pixel 5a 5G Sony XH90 / XH92 Samsung Galaxy S21 5G Sony PlayStation 5 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2021 Hosting door True