Hallo,
Ik ben bezig met een script dat Excel bestanden maakt van gegevens uit een database. Dit gaat goed tot ik één bepaald veld gebruik. In dit veld staan meestal elle lange teksten. Deze worden rechtstreeks gekopieerd uit bijv. Word.
Ik heb het vermoeden dat er tekens in zitten die het Excel bestand corrupt maken. Nu wil ik de tekst uit dat foute veld filteren zodat er alleen [a-z][A-Z][0-9] en \n \r \t, enz. dus, de gebruikelijke tekens.
Zoveel weet ik niet van regexp maar hier doe ik een gok:
Zoals jullie waarschijnlijk zelf ook wel zien klopt hier helemaal niets van. Ik ben dan ook een noob wat regexp betreft.
Kan iemand mij vertellen hoe het wel moet?
Ik ben bezig met een script dat Excel bestanden maakt van gegevens uit een database. Dit gaat goed tot ik één bepaald veld gebruik. In dit veld staan meestal elle lange teksten. Deze worden rechtstreeks gekopieerd uit bijv. Word.
Ik heb het vermoeden dat er tekens in zitten die het Excel bestand corrupt maken. Nu wil ik de tekst uit dat foute veld filteren zodat er alleen [a-z][A-Z][0-9] en \n \r \t, enz. dus, de gebruikelijke tekens.
Zoveel weet ik niet van regexp maar hier doe ik een gok:
PHP:
1
2
3
4
5
| $corruptestring = $row->lange_tekst; $corruptestring = preg_replace("!([a-z][A-Z]\\r\\n\\t)", '', $corruptestring); echo $corruptestring; |
Zoals jullie waarschijnlijk zelf ook wel zien klopt hier helemaal niets van. Ik ben dan ook een noob wat regexp betreft.
Kan iemand mij vertellen hoe het wel moet?