Probleem:
Uit een plaatje wil ik het telefoonnummer omzetten naar tekst. Het plaatje bevat alleen het telefoonnummer.
In Ruby wil ik met behulp van OCR het telefoonnummer uitlezen. Ik had gehoopt dat me dat lukte met alleen ImageMagick, maar dat gaat niet lukken vrees ik.
Al snel kwam ik hierop uit: Tesseract en ImageMasgick.
Als ik doe wat hiier staat krijg ik allerlei foutmeldingen: http://ubuntuforums.org/showthread.php?t=1370827
Een andere optie is gocr gebruiken, maar dat werkt niet helemaakl foutloos. gocr maakt af en toe een foutje en leest een teken verkeerd. Dat kan ik wel handmatig corrigeren, maar dat is niet zo netjes. Dus liever geen gocr.
Afijn, omdat Tesseract o.a. een Segmentation fault geeft, dan Tesser-act maar even zelf compileren aan de hand van deze handleiding: http://code.google.com/p/tesseract-ocr/wiki/ReadMe
Dan ben ik in ieder geval van de segmentation fault af, maar nu krijg ik deze meldingen:
Huh?? Ik heb die libs toch gewoon geinstalleerd? (stap 11)
En ook krijg ik deze foutmelding:
Van deze foutmelding en een zoektocht via Google word ik niet veel wijzer.
Mijn vragen:
1. Kan iemand mij vertellen wat ik fout doe met Tesseract?
2. Weet iemand misschien een andere library voor OCR die goed werkt (behalve gocr)?
3. Zoals ik aangaf schrijf ik het uiteindelijk in Ruby, dus als iemand een oplossing weet waarbij ik alles meteen in Ruby kan coden zonder gebruik te maken van commandline tools, dan hoor ik dat ook graag.
Uit een plaatje wil ik het telefoonnummer omzetten naar tekst. Het plaatje bevat alleen het telefoonnummer.
In Ruby wil ik met behulp van OCR het telefoonnummer uitlezen. Ik had gehoopt dat me dat lukte met alleen ImageMagick, maar dat gaat niet lukken vrees ik.
Al snel kwam ik hierop uit: Tesseract en ImageMasgick.
Als ik doe wat hiier staat krijg ik allerlei foutmeldingen: http://ubuntuforums.org/showthread.php?t=1370827
Een andere optie is gocr gebruiken, maar dat werkt niet helemaakl foutloos. gocr maakt af en toe een foutje en leest een teken verkeerd. Dat kan ik wel handmatig corrigeren, maar dat is niet zo netjes. Dus liever geen gocr.
Afijn, omdat Tesseract o.a. een Segmentation fault geeft, dan Tesser-act maar even zelf compileren aan de hand van deze handleiding: http://code.google.com/p/tesseract-ocr/wiki/ReadMe
code:
1
2
3
4
5
6
7
8
9
10
11
12
| Ik volg de volgende stappen: 1. wget http://tesseract-ocr.googlecode.com/files/tesseract-3.00.tar.gz 2. tar xvfz tesseract-3.00.tar.gz 3. cd tesseract-3.00 4. ./configure 5. make 6. sudo make install 7. sudo ldconfig 8. wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz 9. gzip -d eng.traineddata.gz 10. sudo mv eng.traineddata /usr/local/share/tessdata/ 11. sudo apt-get install libpng12-dev libjpeg62-dev libtiff4-dev libtiff4 zlib1g-dev liblept |
Dan ben ik in ieder geval van de segmentation fault af, maar nu krijg ik deze meldingen:
code:
1
| Warning - no liblept or libtiff - cannot read compressed tiff files |
Huh?? Ik heb die libs toch gewoon geinstalleerd? (stap 11)
En ook krijg ik deze foutmelding:
code:
1
2
3
| name_to_image_type:Error:Unrecognized image type:test.gif IMAGE::read_header:Error:Can't read this image type:test.gif Read of file test.gif failed. |
Van deze foutmelding en een zoektocht via Google word ik niet veel wijzer.
Mijn vragen:
1. Kan iemand mij vertellen wat ik fout doe met Tesseract?
2. Weet iemand misschien een andere library voor OCR die goed werkt (behalve gocr)?
3. Zoals ik aangaf schrijf ik het uiteindelijk in Ruby, dus als iemand een oplossing weet waarbij ik alles meteen in Ruby kan coden zonder gebruik te maken van commandline tools, dan hoor ik dat ook graag.