Verwijderd

Topicstarter
Dit topic heb ik hier geplaatst omdat het niet zozeer om een server OS gaat maar wel om het bouwen van een server / service.


Voor ons bedrijf ben ik op zoek naar een OCR / DMS oplossing. Ons bestaande archief (papier) met facturen willen we omzetten naar een digitaal archief met onze scanner.

Onze HP scanner hebben we zo ver dat deze documenten direct scanned naar een folder op een virtuele XP machine. Via OCR software willen we deze documenten leesbaar en doorzoekbaar maken en via een systeem dat deze documenten terug kunnen vinden. Dit alles in PDF formaat.

Nu heb ik een aantal OCR pakketten geprobeerd (gratis tools, betaalde tools en ReadIris Pro) alleen kom ik niet tot een mooie oplossing. Dit proces moet volledig automatisch gaan. De meeste pakketten werken niet automatisch of zijn erg duur.

Dan moet er nog een DMS systeem aan worden gekoppeld. het lastige is het doorzoeken. Gezien de scanner geen duidelijke bestandsnamen creëert wordt het archief dus niet logisch (op filename) browsable dus moeten de PDF's doorzocht kunnen worden. Dit wordt vermoedelijk te langzaam / resource afhankelijk als alle tekst in alle PDF's moet worden doorzocht. Vandaar dat het mij verstandiger lijkt als er een oplossing komt die keywords aan de PDF's toevoegt en het DMS daar op kan zoeken.

Kortweg:
Document (papier) => HP scanner => OCR software => Keywords toevoegen => DMS => Document (PDF, doorzoekbaar)

Mijn vraag is nu:
Is hier een kant en klare oplossing voor?
Is hier eventueel een open-source of gratis oplossing voor?



Zelf heb ik heel wat pakketten getest maar de pakketten werken niet volledig automatisch of de trials kan ik niet goed genoeg uit testen (missende functies). Omdat ik niet graag op marketing praat af ga (vooral niet als ik bedragen van rond de 500 tot 1000 euro moet neerleggen) zou ik graag gebruikers ervaringen willen horen. En mogelijk andere oplossingen. Het lijkt me niet dat ik het wiel hier opnieuw moet uitvinden ;)

Het geheel moet binnen een domein draaien (en hoeft enkel daar beschikbaar te zijn). We hebben beschikking over een virtuele XP machine, Linux oplossing mag eventueel ook. Resource technisch is dit niet ideaal maar zodra het gehele archief digitaal is gaat het hoogstens om 5 scans per dag. Toch staan we open voor een compleet andere oplossing, dit mag ook met een andere scanner zijn.


Alvast bedankt.

Verwijderd

Topicstarter
Uiteindelijk is er gekozen om of een OCR pakket te kopen voor het verwerken of een scanner die dit automatisch kan. Het benaderen van de documenten gaan we vanuit Sharepoint Services doen. Echter is dat wat te specifiek om verder over te gaan in dit topic. Het gaat nog niet helemaal goed, meer hierover:

Map doorzoekbaar maken in Sharepoint Services 3