In an age that prizes truth our greatest obstacle may be the very mind that seeks it.
Kijk ook eens op google groups
[ Voor 55% gewijzigd door RobIII op 17-12-2006 23:34 ]
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij
Intentionally left blank
In an age that prizes truth our greatest obstacle may be the very mind that seeks it.
Mijn persoonlijke mening is dat zoiets juist niet ("native") in een programmeertaal hoort te zitten en je dat als devver zélf hoort te schrijven; maar da's een andere discussieDanski schreef op zondag 17 december 2006 @ 23:45:
Mja, ik had dus blijkbaar beter strip_tags in google kunnen invullen i.p.v. striptags. Maar de conclusie is dat er inderdaad geen strip_tags functie is. Wel vreemd dat zo'n simpel functietje niet in Python aanwezig is.
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij
Nou, ik ben geen programmeur. Af en toe schrijf ik eens een scriptje en dat is het dan wel. Ik heb trouwens wel zelf zo'n functie geschreven, maar eentje die al standaard in de programmeertaal zit zal vast beter zijn en bovendien handiger toe te passen.RobIII schreef op zondag 17 december 2006 @ 23:46:
Mijn persoonlijke mening is dat zoiets juist niet ("native") in een programmeertaal hoort te zitten en je dat als devver zélf hoort te schrijven; maar da's een andere discussie
In an age that prizes truth our greatest obstacle may be the very mind that seeks it.
Vandaar dat een echte HTML-tokeniser de voorkeur geniet, en HTML5 is de enige HTML-versie die parsing-rules definieerd (overigens gebaseerd op de manier waarop hedendaagse browsers ook daadwerkelijk HTML parsen)Because strip_tags() does not actually validate the HTML, partial, or broken tags can result in the removal of more text/data than expected.
Intentionally left blank
Bleh, Python wordt niet voor niets aangeprezen als Batteries Included!RobIII schreef op zondag 17 december 2006 @ 23:46:
Mijn persoonlijke mening is dat zoiets juist niet ("native") in een programmeertaal hoort te zitten en je dat als devver zélf hoort te schrijven; maar da's een andere discussie
Mijn punt zou eerder zijn dat strip_tags() helemaal niet zo'n eenvoudige functie is, zeker niet als je het goed wil doen. Zelf zou ik echter eerder voor iets als BeautifulSoup gaan, of voor de HTML-parser die bij libxml2 wordt geleverd (via lxml).
Rustacean