Denk om uw spatiegebruik. Dit scheelt Tweakers.net kostbare databaseruimte! | Groninger en geïnteresseerd in Domotica? Kom naar DomoticaGrunn
Het belangrijkste is dus dat je er voor zorgt dat de opmaak in de brondata al aan de eisen voldoet om het om te zetten naar html.
[ Voor 9% gewijzigd door LordSinclair op 19-03-2015 11:22 ]
There's no need to kneel, I'm a very democratic sort of lord.
'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.
De meeste moderne WYSIWYG-editors (inclusief FCK en TinyMCE) hebben een paste-from-Word-knopje, dus laat ze lekker in Word werken als ze willen. Maar dan is het nog steeds "garbage in, garbage out." Als zij na elke twee woorden op enter drukken ga je daar echt niks tegen beginnen met een tooltje.TERW_DAN schreef op donderdag 19 maart 2015 @ 11:42:
Geef ze een WSYWIGeditor in het CMS, en laat ze het daarin tikken ipv in Word. Dan zit je ook niet met die rare opmaak.
'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.
Flight & Race simulation Discord // Mijn YouTube kanaal / Subscribe
'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.
Waarom is dit een probleem?
WYSIWYG editors (die op HTML werken) kunnen alles wat de browser kan. Dus ook de hele site verzieken. "Dat doen ze dan zelf" zou je kunnen zeggen, maar dat is natuurlijk ernstig klantonvriendelijk, dus dat wil je ook niet... Wat dan wel? Een editor die voor het web geschikt is. Een editor die in z'n kern afbakent wat de redacteur allemaal kan. Een editor die géén HTML editor is.
Waarom nog meer is HTML in je database een probleem?
Stel dat je besluit dat een bulleted list anders gerenderd moet worden. Het moet een class krijgen, of een extra elementje eromheen, of whatever. Of een plaatje met onderschrift moet er op een andere manier uitkomen. En "anders" betekent in deze "anders dan wat uit de HTML editor-soep komt" maar ook een wijziging op de site in een later stadium. Maar er zit HTML in je database. Die zit daar en die zit vast. Je kunt wel een of ander scriptsel schrijven om alle blobs met html door een filter heen te trekken, maar dat gaat fout. Als je iets in je database hebt dat niet HTML is, maar HTML wordt bij het renderen, heb je dit probleem niet. Dan kun jij bepalen hoe een lijstje of een linkje of een tabelltje uitgepoept wordt.
En dit los ook het Word-probleem op. Je zegt dan tegen de klant: "ga het maar in deze editor doen". Dan klaagt ie dat het een weirdo editor is die niets kan. Maar dat is goed. Want hoe minder de klant kan, des te beter kun jij een goed-werkende site garanderen. En geen enkele HTML WYSIWYG editor lost dat op. Maar iets anders wel.
Mooi heh, dat Markdown
日本!🎌
sudo apt-get install catdoc
scriptje
1
2
3
4
5
6
7
8
9
10
11
12
13
14
| #!/bin/sh filename="$1" extension=${filename##*.} if [ ${extension} = "doc" ] then # Use cat doc for older document formats catdoc "$filename" else # Unzip the docx file, and grab just the text with sed # This also replaces opening <w:r> tags with newlines # The final `sed G` double spaces the output unzip -p "$filename" | grep '<w:r' | sed 's/<w:p[^<\/]*>/ \ /g' | sed 's/<[^<]*>//g' | grep -v '^[[:space:]]*$' | sed G fi |
je krijgt wel alles in plaintekst , maar als de opbouw van wat ze aanleveren een patroon heeft denk ik dat je dat ook wel via een pipe kan manipuleren naar een goede output.
[ Voor 12% gewijzigd door Aionicus op 01-04-2015 01:13 ]