Toon posts:

OCR-software onder linux

Pagina: 1
Acties:
  • 138 views sinds 30-01-2008
  • Reageer

Verwijderd

Topicstarter
Voor een bedrijf moet ik onder linux met behulp van OCR software een code van een plaatje aflezen. Deze code staat altijd op de zelfde plaats van het op het plaatje. Ik heb al verschillende OCR programma's voor linux gevonden, maar geen van deze programma's werkt naar behoren. Dit zal wel komen door het feit dat het plaatje een zwarte achtergrond heeft en de code die ik moet uitlezen uit witte cijfers bestaat.
Bij die verschillende OCR programma's onder linux moet gebruik worden gemaakt van PBM bestanden of PNM bestanden. Nu is het wel mogelijk om met behulp van netpbm de JPEG die ik binnen krijg om te zetten naar dit formaat, alleen is dit een hele omslachtige manier. Zou er geen OCR software zijn onder Linux die gewoon met het JPEG formaat overweg kan??
Ik heb tevens al onder Windows het een en ander geprobeerd met OCR software, maar deze software was ook niet in staat om de code uit te lezen. Heb ook al geprobeerd om het plaatje te inversen zodat de letters zwart. Dit heeft nog niet tot een gewenst resultaat geleidt.

  • smokalot
  • Registratie: Juni 2001
  • Laatst online: 15-01 22:00

smokalot

titel onder

gaat het hier niet toevallig om een plaatje dat juist bedoeld is om niet met OCR herkend te worden? dit wordt vaak gebruikt als beveiligingstechniek.

Verder: de meeste OCR software voor *n?x volgt de unix-filosofie, doe 1 ding (pbm/pnm bestanden ocr'en) en doe dat goed. Het omzetten van jpg naar pbm kan geautomatiseerd worden. Het is niet moeilijk om een scriptje te schrijven wat dit voor je doet.

Kun je misschien een voorbeeldje geven van een dergelijk plaatje wat je wilt herkennen?

It sounds like it could be either bad hardware or software


Verwijderd

Topicstarter
Het gaat in dit geval om een echo van een baby. Dus er komt een klant, laat een scan maken en vervolgens moet ze deze terug kunnen vinden op de website. Voor elke scan die gemaakt wordt is er een uniek nummer. Dit nummer moet dus van de JPEG worden uitgelezen en vervolgens worden gekoppeld aan de klant. Als de klant dan inlogt op de website kan zij haar filmpje terug bekijken mbv streaming. Dit is dus niet echt een probleem en kan volledig automatisch worden gedaan. Alleen het uitlezen van dat uniek nummer is nou het probleem. Dit krijg ik dus niet voor elkaar.

[ Voor 9% gewijzigd door Verwijderd op 25-01-2006 13:40 ]


  • zerok
  • Registratie: November 2001
  • Laatst online: 07-02 00:28

zerok

geen

Ik zat laatst ook te kijken naar OCR software voor linux :) toeval.

Oke ik heb geen flauw idee in welke taal of wat dan ook je dit wilt doen. Voor de cli heb je ImageMagick (word door veel meer programmas gebruikt). Die kan iig geval het formaat omzetten. Die kan ook een stukje uit je plaatje knippen met het nr. Dit scheelt weer wat ruis voor je ocr software. IK heb zelf alleen maar gocr uitgetest. hoewel het niet perfect werkt is het denk ik wel genoeg voor dit doel.

"never argue with idiots they drag you down to their level and beat you with experience" dilbert


Verwijderd

Topicstarter
ImageMagick heb ik ook al op die linuxserver draaien, hiermee heb ik het plaatje laten inverten. Waardoor de achtergrond dus grijs is en de tekst zwart van de echo. Ik weet niet of deze grijze achtergrond voor problemen kan zorgen in het OCR pakket.
Maar dan ga ik in ieder geval even proberen GORC te installeren, dit was mij nog niet gelukt, heb het wel geprobeerd, maar hier zal ik wel uit komen denk ik.

  • smokalot
  • Registratie: Juni 2001
  • Laatst online: 15-01 22:00

smokalot

titel onder

Het moet ook wel te doen zijn om dit grijs te veranderen in wit, waarbij je het de OCR software nog makkelijker maakt.

Maar het blijft een beetje een rare methode, kun je dat nummer niet als metadata bij het plaatje krijgen? scheelt je een hoop werk, en het is een stuk minder foutgevoelig.

It sounds like it could be either bad hardware or software


Verwijderd

Topicstarter
Ik denk niet dat het plaatje metadata bevat, aangezien het gewoon een frame is van een echofilmpje dat door een echoapparaat gemaakt wordt.
Maar op welke manier zou ik het grijs dan eventueel nog wit kunnen maken?

  • smokalot
  • Registratie: Juni 2001
  • Laatst online: 15-01 22:00

smokalot

titel onder

ik weet ook niet met welk programma je dat zou kunnen doen, 1 van de dingen die ik me voor kan stellen is simpelweg het plaatje naar 2 kleuren converten, het is alleen te hopen dat de grens dan op de goede plek wordt gelegd. Er zijn ook ongetwijfeld programmaas waarmee je automatisch contrast kunt verhogen. Ik ken alleen gimp, photoshop, enz. maar er moeten ook CLI based programmaas zijn.

Ik snap verder dat er geen metadata bijzit, maar ik zeg juist dat je daar wat aan moet doen. Ik neem aan dat je die plaatjes ergens vandaan haalt waar ze het netjes gearchiveerd hebben, daar hebben ze de metadata, en die zouden ze ook aan jou kunnen geven. Kan zijn dat dat niet kan hier hoor, maar ik kan me eigenlijk weinig workflows voorstellen waarbij dit het geval zou zijn.

Edit:
blijkbaar kan imagemagick zo'n beetje alles wat je wilt. Zie http://www.imagemagick.org/script/convert.php voor de namen van de opties die je kunt gebruiken. Vooral interessant zijn black-treshold, contrast, colors en extract denk ik.

Dit moet prima werken, als de plaatjes een beetje op elkaar lijken kwa contrast, helderheid, plaats van de text, enz. Als dat allemaal op elkaar lijkt heb je een voordeel ten opzichte van OCR software die dit automatisch probeert te doen, en anders een groot nadeel.

(Als het alleen maar om het herkennen van cijfers gaat zou het zelfs niet al te moeilijk zijn om een neuraal netwerk te maken en trainen om dit te herkennen, maar goed, dat is niet nodig denk ik :P)

[ Voor 32% gewijzigd door smokalot op 26-01-2006 13:19 ]

It sounds like it could be either bad hardware or software


Verwijderd

Waarom invert je het plaatje niet voor de ocr... Dan wordt zwart wit en wit zwart... Zou het weer wat makkelijker moeten maken voor de software.

  • smokalot
  • Registratie: Juni 2001
  • Laatst online: 15-01 22:00

smokalot

titel onder

Verwijderd schreef op donderdag 26 januari 2006 @ 16:19:
Waarom invert je het plaatje niet voor de ocr... Dan wordt zwart wit en wit zwart... Zou het weer wat makkelijker moeten maken voor de software.
dat doet ie al. maar grijs blijft grijs.

It sounds like it could be either bad hardware or software


  • Oezie Woezie
  • Registratie: December 1999
  • Niet online

Oezie Woezie

Pim. is de beste

kijk is naar verschillende computevision en maschinevision toepassingen, daar wordt ook vaak gebruik gemaakt van tekst/patroon herkenning. voor het controleren van text op labels enzo.
http://www.activ-vision-t...application.pl?name=metal
http://www.activ-vision-t...s/application.pl?name=can

Halcon van MVTec(http://mvtec.com/halcon/), Labview van National Instruments(http://www.ni.com/vision/), MIL van Matrox(http://www.matrox.com/imaging/products/software.cfm) en Common vision blox van stemmer-imaging(http://en.commonvisionblox.de/).

verschillende maschine vision pakketen

een mooi Tshirt met Pim. is de beste enzo


Verwijderd

ik weet toevallig, dat ABBYY druk bezig is om hun OCR engine geschikt te maken voor linux, wat ze g aan doen met consumenten producten op zich weet ik niet.
maar ff mailtje sturen voor info aanvraag kan je nooit geen kwaad doen.
Pagina: 1