Toon posts:

Is er een tool om pdf te waarderen op basis van de inhoud?

Pagina: 1
Acties:
  • 233 views

Onderwerpen

Vraag


  • Evrona
  • Registratie: Oktober 2018
  • Laatst online: 10-10-2018
Beste dames en heren,

Mijn vraag is als volgt. Ik heb een database met pdf rapporten. Nu wil ik een programma hebben/laten maken wat op basis van de inhoud de auteur, het rapportnummer/kenmerk en de opleverdatum kan genereren. Dus een tool die pdf rapporten kan categoriseren door ze te "lezen" en op basis van bovenstaande kenmerken een rapport kan waarderen/opslaan.

Nu zijn een deel van de pdfs oude scans/kopieën van analoge rapporten. Dus mogelijk moet er eerst nog een OCR tekst conversie plaatsvinden.

Ik neem aan dat dit wel bestaat of redelijk makkelijk te maken is. Ik ben zelf geen programmeur, maar ik begrijp het wel redelijk dus ben benieuwd of er goede ideeën of mogelijk al voorbeelden zijn van zo'n soort programma.

Alvast bedankt, alle tips zijn welkom.

Alle reacties


  • Rmg
  • Registratie: November 2003
  • Laatst online: 16:08
Dat heet een Document Management System of DMS, je hebt een aantal open source versies hier van OpenKM bijvoorbeeld is een een open source DMS die ook een OCR engine heeft.

  • RobIII
  • Registratie: December 2001
  • Laatst online: 14:17

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

Ik weet niet wat je doel is met dit topic, maar "Nu wil ik een programma hebben/laten maken" doet mij je toch even wijzen op Devschuurder werven? Gebruik Vraag & Aanbod!.

Verder zie ik niet wat dit met Programming van doen heeft; we hebben 't hier over zélf maken en (concrete!) programmeervragen zijn dan ook van harte welkom hier. Je vraag, zoals 'ie nu is, is echter veel te breed (en je geeft veel te weinig informatie). En, zolang je geen programmeur bent, moet je ook geen uitspraken (willen) doen over "redelijk makkelijk te maken". Hersenchirurgie ziet er ook vrij simpel uit ;)

Tot slot mis ik nogal wat zaken uit onze Quickstart; ik mis o.a. wat je zélf al gezocht / gevonden / geprobeerd hebt, waar je strandde, wat er niet werkte etc. Al met al genoeg redenen om dit topic te sluiten. Open gerust een nieuw topic (kijk dan even of Programming welk de juiste plek is: Waar hoort mijn topic?) maar hanteer dan wel even voorgenoemde quickstart a.u.b.

[Voor 3% gewijzigd door RobIII op 10-10-2018 13:18]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Roses are red Violets are blue, Unexpected ‘{‘ on line 32.

Over mij


Dit topic is gesloten.


Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee