Acties:
  • 0 Henk 'm!

  • FailFr8er
  • Registratie: Juli 2001
  • Laatst online: 21-04 21:57
Tegenwoordig moet alles digitaal en zo ook ons papieren archief bij ons thuis. Nu is mijn vriendin heel dapper begonnen met scannen maar al snel kwam ik erachter dat ze bezig was om files >11MB per stuk te scannen. Dit resulteerd natuurlijk in een hele grote hoeveelheid data die imho lang niet zo groot hoeft te zijn.

Op werk gebruik ik een bulkscanner die heel makkelijk een document scant middels de feeder en binnen 1,5 sec een ±300kB PDF plant in mijn directory; OCR'ed en wel. Dit wil ik dus ook.

Ik ben gaan spelen met ReadIris en OmniPage maar beide programma's laten toch enige steken vallen met betrekking tot de nauwkeurigheid. Hier heb ik op zich geen problemen mee gezien het voor mij alleen doorzoekbaar moet zijn en de resultaten zaten >99%. Ik zit alleen met de issues van bruikbaarheid.

Stel hier vliegt alles in de hens en ik heb alleen nog maar mijn digitale archief dan dan kan ik niet aankomen zetten met uitgeprinte documenten waarbij het € is vervangen door een ander teken. Hiervoor moet ik gewoon de 1:1 afbeelding hebben. Op werk gebeurd dit door een vorm van overlay over de originele tekst heen, je ziet dus een originele afbeelding maar daar overheen ligt een layer met selecteerbare, herkende tekst.

Ik kan dit in geen enkel product (voor OS X) terugvinden en toch wil ik het heel graag hebben. Nu ben ik zelf niet bekend in de wereld van OCR en weet ik dus ook niet goed hoe deze feature heet; Overlay's etc. zijn volgens Google niet echt goede zoektermen, ook in alle preference panes van ReadIris en Omnigpage kan ik het niet terugvinden.

Acties:
  • 0 Henk 'm!

  • tafkaw
  • Registratie: December 2002
  • Laatst online: 11:07
Zelf gebruikte ik altijd de dienst van Evernote hiervoor. Zij bieden gratis storage (x aantal mb per maand) aan en doen dan automagisch OCR over je documenten die doorzoekbaar is met de search-functie. Ook ik zou dit graag vervangen door een map met (PDF?)documenten die doorzoekbaar is door Spotlight. Een optie zoals jij die voorstelt is natuurlijk een hele mooie optie hiervoor (en wss ook de techniek die Evernote gebruikt, alleen dan niet standalone...)

Acties:
  • 0 Henk 'm!

  • Dysmael
  • Registratie: Januari 2002
  • Laatst online: 01-08-2019
Omnipage kan dat prima hoor. Die maakt prima doorzoekbare PDF's met behoud van originele scan.

Acties:
  • 0 Henk 'm!

  • FailFr8er
  • Registratie: Juli 2001
  • Laatst online: 21-04 21:57
Inmiddels ben ik erachtergekomen dat ReadIris het ook kan, zij het met een vrij wazige optie.

Daarnaast ben ik ook achter DevonThink gekomen, dit lijkt te voldoen aan al mijn eisen (de Pro Office versie). Dan zit ik alleen nog te kijken of ik naar 1 database kan connecten met 2 clients (mijn vriendin en ik moeten allebei bij de database moeten komen en dan wil ik eigenlijk alles draaien op een MacMini).
Gr0wLiThE schreef op zondag 02 mei 2010 @ 20:15:
Zelf gebruikte ik altijd de dienst van Evernote hiervoor. Zij bieden gratis storage (x aantal mb per maand) aan en doen dan automagisch OCR over je documenten die doorzoekbaar is met de search-functie. Ook ik zou dit graag vervangen door een map met (PDF?)documenten die doorzoekbaar is door Spotlight. Een optie zoals jij die voorstelt is natuurlijk een hele mooie optie hiervoor (en wss ook de techniek die Evernote gebruikt, alleen dan niet standalone...)
In een aantal reviews wordt DevonThink gezien als de locale variant van Evernote.

[ Voor 44% gewijzigd door FailFr8er op 05-05-2010 14:37 ]


Acties:
  • 0 Henk 'm!

  • bollewolle
  • Registratie: Januari 2002
  • Laatst online: 14-04 07:33
Misschien is Prizmo van Creaceed ook een optie. Vorige week toevallig op dit product uitgekomen en dacht eens terug te gaan kijken naar de eigenschappen. Bij features staat "Export of Image with Hidden Text (Spotlight Indexable) as PDF" en een van de screencasts op hun site lijkt het ook te tonen.