Ik ben op zoek naar een algoritme dat twee strings met elkaar vergelijkt en de toegevoegde, veranderde of verwijderde tekst aangeeft.
Zoekresultaten op dit onderwerp leveren Levenshtein en dergelijke dingen op, maar die berekenen een score.
Het probleem zit in de complexiteit en dus performance, en als delen van de tekst vaker voorkomen in die tekst. Omdat moeilijk uit te drukken is wat ik precies bedoel geef ik hieronder een voorbeeld van wat ik bedoel (in PHP):
De functie aanroep:
Als de input hier is:
1: "Ik woon in Nederland."
2: "Ik heb in Nederland gewoond."
Het resultaat zou bijvoorbeeld kunnen zijn (de vorm van Array is slechts een suggestie):
Ik hoop dat hiermee duidelijk is wat ik bedoel en dat iemand een idee heeft hoe dit op te lossen is.
Zoekresultaten op dit onderwerp leveren Levenshtein en dergelijke dingen op, maar die berekenen een score.
Het probleem zit in de complexiteit en dus performance, en als delen van de tekst vaker voorkomen in die tekst. Omdat moeilijk uit te drukken is wat ik precies bedoel geef ik hieronder een voorbeeld van wat ik bedoel (in PHP):
De functie aanroep:
code:
1
| $result = str_vergelijk($str1, $str2); |
Als de input hier is:
1: "Ik woon in Nederland."
2: "Ik heb in Nederland gewoond."
Het resultaat zou bijvoorbeeld kunnen zijn (de vorm van Array is slechts een suggestie):
code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
| $result = array( [0] => array( [0] => 'normaal', [1] => 'Ik ') [1] => array( [0] => 'veranderd', [1] => 'woon', [2] => 'heb') [2] => array( [0] => 'normaal', [1] => ' in Nederland ') [3] => array( [0] => 'toegevoegd', [1] => 'gewoond')) |
Ik hoop dat hiermee duidelijk is wat ik bedoel en dat iemand een idee heeft hoe dit op te lossen is.
[ Voor 29% gewijzigd door Jurgle op 28-09-2003 20:41 ]
My opinions may have changed but not the fact that I am right ― Ashleigh Brilliant