Dag allen,
Ik werk momenteel aan een stukje OCR code. Voordat men begint te roepen dat dit vooral niet aan PHP toebesteed is; ik ben het er volledig mee eens, maar ben al aardig ver inmiddels. Graag jullie mening over de volgende deelvraag.
Ik heb reeds de informatie over ieder gevonden teken (a-z, 0-9, etc.).
Zie de volgende afbeelding:

De rood omlijnde vlakken representeren pixels.
Ik vertaal 1a (de letter 'a') in een library naar de volgende array:
Merk op dat iedere waarde in de array een verticale column representeert van het teken, waarbij 0=wit en 1=zwart.
Als ik nu een afbeelding inlees en alle karakters vergelijk met de library ( = de arrays in de library), dan kan ik de letter A vrij gemakkelijk vinden, middels een niet al te zwaar proces. Dit gaat uitstekend.
Ik vraag me alleen af hoe ik het beste om kan gaan met grotere/kleinere tekens. Met andere woorden, als de a een factor groter zou zijn (1b), hoe ga ik daarmee om?
Daarbij moet opgemerkt worden dat, in het geval van de "a", het vrij eenvoudig is om te berekenen hoe de array eruit zou zien als het teken een factor groter is, maar dat is niet bij alle tekens het geval! Sommige tekens vertonen kleine verschilen als ze groter zijn.
Eigenlijk is mijn vraag of jullie wellicht referentie materiaal hebben over dit proces. Wellicht benader ik het probleem verkeerd, en dien ik een geheel andere methode te gebruiken.
Graag jullie input
Ik werk momenteel aan een stukje OCR code. Voordat men begint te roepen dat dit vooral niet aan PHP toebesteed is; ik ben het er volledig mee eens, maar ben al aardig ver inmiddels. Graag jullie mening over de volgende deelvraag.
Ik heb reeds de informatie over ieder gevonden teken (a-z, 0-9, etc.).
Zie de volgende afbeelding:

De rood omlijnde vlakken representeren pixels.
Ik vertaal 1a (de letter 'a') in een library naar de volgende array:
PHP:
1
2
3
4
5
| $a = array( "0111", "1010", "0111" ); |
Merk op dat iedere waarde in de array een verticale column representeert van het teken, waarbij 0=wit en 1=zwart.
Als ik nu een afbeelding inlees en alle karakters vergelijk met de library ( = de arrays in de library), dan kan ik de letter A vrij gemakkelijk vinden, middels een niet al te zwaar proces. Dit gaat uitstekend.
Ik vraag me alleen af hoe ik het beste om kan gaan met grotere/kleinere tekens. Met andere woorden, als de a een factor groter zou zijn (1b), hoe ga ik daarmee om?
Daarbij moet opgemerkt worden dat, in het geval van de "a", het vrij eenvoudig is om te berekenen hoe de array eruit zou zien als het teken een factor groter is, maar dat is niet bij alle tekens het geval! Sommige tekens vertonen kleine verschilen als ze groter zijn.
Eigenlijk is mijn vraag of jullie wellicht referentie materiaal hebben over dit proces. Wellicht benader ik het probleem verkeerd, en dien ik een geheel andere methode te gebruiken.
Graag jullie input