Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

[C#] Opzoek naar OCR libraries, weet jij er nog een paar?

Pagina: 1
Acties:

  • CodeAsm
  • Registratie: Februari 2012
  • Laatst online: 11-11 19:59
Voor een opdracht voor stage ben ik opzoek naar OCR mogelijkheden binnen C#.
Uiteraard zou het stom vervelend zijn als ik jullie aan het werk zet en zelf lui op mn stoel op facebook zou hangen. Dus ik heb zelf al op NuGet en Google gezocht en heb de volgende al gevonden.

Selectie zal later plaats vinden dus alles wat maar OCR doet is welkom, ik zal dit topic updaten met voorkeuren, licensies en eventueel kosten. Het bedrijf waarvoor ik dit doe wil dat ik vanuit een brede selectie er een paar kies om daar nader naar te kijken. Je zult vast ook begrijpen dat ik jullie vraag om er in de hoop veels te veel te hebben en uiteindelijk er wel met 3 goede uit te komen.

Ik zoek een library die een A4 papiertje vol tekst in een bepaalde template staat kan OCRen (korrecte term? ocren?) primair zal het Nederlands zijn, maar straks ook anders talig (zoals Duits, Vietnamees en Grieks). De modules die ik tot nu toe noem zoude dat aan moete kunnen.

(toegevoegd: 3-12-2014)
Het bedrijf waar ik onderzoek voor doe heeft ook documenten die niet "openbaar" mogen zijn of gedeelt met derde. Dus deze documenten zoude het liefst het bedrijf (ons) niet verlaten.
Het gaat dan bijvoorbeeld over ingescande documenten van een klant (groot, bekend bedrijf) die in een doorzoekbaar, leesbaar document in een redactie systeem gezet zou moeten worden voor deze klant.
Maar ik moet binnekort de duidelijkere specificaties bespreken, afhankelijk van het aanbod van ocr mogelijkheden.
prijs per pagina's is mogelijk, dus ik heb ook comerciele producten als oplossing)

De volgende heb ik al gevonden, ongesorteerd:;) ik post het hier zodat iemand anders er mischien iets aan heeft of zodat ik iets nieuws ondek via jullie kennis.
http://www.codeproject.co...r-Recognition-OCR-applica
geeft mooi weer dat je ook zelf een OCR oplossing kan maken, maar daar gaat zoveel werk inzitten.

Jullie nu al dankbaar _/-\o_ voor de reacties

[ Voor 15% gewijzigd door CodeAsm op 03-12-2014 10:58 . Reden: Thx voor reacties en iets meer details ]


  • labee
  • Registratie: November 2002
  • Laatst online: 10-09-2022
Wat wil je uiteindelijk gaan doen.
Er zijn namelijk ook standaard pakketten op de markt waarmee je uitgebreide regels kunt opgeven om classificatie van documenten en extractie van gegevens te doen.

http://www.kofax.com/document-capture-software/
http://www.opentext.com/w...n/opentext-capture-center

http://www.labee.nl


  • markvt
  • Registratie: Maart 2001
  • Laatst online: 20-11 23:59

markvt

Peppi Cola

Als het een vast formaat is kan je eens bij de (cloud) oplossingen van dit bedrijf kijken:
http://www.readsoft.com/s...cument-process-automation

van-tilburg.info -=- meka (sega emulator) - Proud MEDION fanclub member - KOPPIG VOLHOUDEN !


  • CodeAsm
  • Registratie: Februari 2012
  • Laatst online: 11-11 19:59
hartelijk dank voor jullie reacties,
Ik ben zelf nog veder aan het zoeken en neem ook jullie aanbevelingen mee, zelf ervaring met deze?

Zelf nog een aantal gevonden maar er zijn ook een heleboel bedrijfjes (1mans?) die eigenlijk een wrapper geschreven hebben om een al gratis of opensource module (welke zij soms aangeven of je vind het in hun sample pas)

Ik doe dit voor stage (had ik nog niet verteld) en zal een aantal resultaten delen (ik hou van informatie delen :P )

Wat mij aan jullie maar ook een aantal andere bedrijfen opval is dat uiteraard het OCR gedeelte vaak word uitbesteed, maar dat kan op verschillende niveaus. En het bedrijf waar ik dit onderzoek voor doe wil eigenlijk dat verwerken in eigen handen hebben. Aangezien ik nu nog wel in het begin van het zoeken en onderzoeken zit neem ik kleine zelfbouw ocr pakketen en ook zo die readsoft cloud oplossing mee.

Ik zal mijn eerste post ook met het volgende updated:
Het bedrijf waar ik onderzoek voor doe heeft ook documenten die niet "openbaar" mogen zijn of gedeelt met derde. Dus deze documenten zoude het liefst het bedrijf (ons) niet verlaten. Het gaat dan bijvoorbeeld over ingescande documenten van een klant (groot, bekend bedrijf) die in een doorzoekbaar, leesbaar document in een redactie systeem gezet zou moeten worden voor deze klant.
Maar ik moet binnekort de duidelijkere specificaties bespreken, afhankelijk van het aanbod van ocr mogelijkheden (prijs per pagina's is mogelijk, dus ik heb ook comerciele producten als oplossing)

Binnekort vul ik de lijst aan met wat ik meer heb gevonden, met wat basis informatie over de module/oplossing.