Hoi,
Ben bezig met een tokenizer en heb een boel RTF tokens
Voor degene die eerder posts van mij hebben gezien hierover, vergeet dat. Eén groot drama
Anyway... back to business!
Ik heb dus RTF tags zoals \rtf1\ansi\ansicpg1252\uc1\deff0 ... \fi-360\li720 ... en nog een boel meer. Duizenden voor een simpele RTF.
Heb alles netjes in tokens en kan dus door een stack heen stappen. Op dit moment heb ik alleen een Token naam, wat bijvoorbeeld \rtf1 \ansi of \ansicpg1252 is, dus compleet met numerieke waarde (positief/negatief).
De numerieke waarde wil ik eraf halen en in een separate variabele bewaren voor dat token.
Er zijn een aantal manieren waarop ik dit kan doen...
1) Een regex om twee matches te krijgen. Deel 1 bevat dan \[a-z] en deel twee -[0-9]
2) Een string[X] controleren of het een letter is > tot niet letter
3) Een string[X] controleren of het een getal of - teken is > en dat onthouden
Aangezien het om duizenden tokens gaat vraag ik wat jullie denken dat slim is om te doen, of welke andere manieren er mogelijk zijn. Sta voor een boel open
Alvast bedankt!
Ben bezig met een tokenizer en heb een boel RTF tokens
Voor degene die eerder posts van mij hebben gezien hierover, vergeet dat. Eén groot drama
Anyway... back to business!
Ik heb dus RTF tags zoals \rtf1\ansi\ansicpg1252\uc1\deff0 ... \fi-360\li720 ... en nog een boel meer. Duizenden voor een simpele RTF.
Heb alles netjes in tokens en kan dus door een stack heen stappen. Op dit moment heb ik alleen een Token naam, wat bijvoorbeeld \rtf1 \ansi of \ansicpg1252 is, dus compleet met numerieke waarde (positief/negatief).
De numerieke waarde wil ik eraf halen en in een separate variabele bewaren voor dat token.
Er zijn een aantal manieren waarop ik dit kan doen...
1) Een regex om twee matches te krijgen. Deel 1 bevat dan \[a-z] en deel twee -[0-9]
2) Een string[X] controleren of het een letter is > tot niet letter
3) Een string[X] controleren of het een getal of - teken is > en dat onthouden
Aangezien het om duizenden tokens gaat vraag ik wat jullie denken dat slim is om te doen, of welke andere manieren er mogelijk zijn. Sta voor een boel open
Alvast bedankt!