Tool om teksten op te slaan

Pagina: 1
Acties:

Acties:
  • 0 Henk 'm!

  • MsG
  • Registratie: November 2007
  • Laatst online: 12:18

MsG

Forumzwerver

Topicstarter
Vaak zie je dat iemand een website bouwt en iemand via een los bestand de teksten aanlevert, bijvoorbeeld Microsoft Word. In de praktijk werkt dit m.i. niet handig gezien vaak de teksten niet semantisch worden geschreven in Word, er worden gewoon harde enters gebruikt, kopteksten worden gewoon vergroot, ipv semantisch als Kop aangemerkt, etc. Editors als CKeditor kunnen vaak Word-teksten wel aan, maar door dat onsemantische gebruik zie je vaak dat overal enters komen, waardoor je alsnog veel handwerk hebt.

Wat gebruiken de webbouwers hier eigenlijk voor teksteditors of tools om teksten aan te laten leveren zonder dat je hier nog veel handwerk in hebt? In Notepad, heb je weer net te weinig basisopmaak om dingen als vetgedrukt en cursief mee aan te geven.

Ik heb al even gezocht op Google maar ik kon helaas niet echt iets vinden hiervoor.

Denk om uw spatiegebruik. Dit scheelt Tweakers.net kostbare databaseruimte! | Groninger en geïnteresseerd in Domotica? Kom naar DomoticaGrunn


Acties:
  • 0 Henk 'm!

  • LordSinclair
  • Registratie: Oktober 2014
  • Nu online
Je geeft al aan dat de tekst in de bron (Word) niet goed bewerkt wordt, zo ver ik weet zijn er geen pakketten met kunstmatige intelligentie die er voor zorgen dat de opmaak omgezet wordt naar hoe de gebruiker het bedoeld zou hebben.

Het belangrijkste is dus dat je er voor zorgt dat de opmaak in de brondata al aan de eisen voldoet om het om te zetten naar html.

[ Voor 9% gewijzigd door LordSinclair op 19-03-2015 11:22 ]

There's no need to kneel, I'm a very democratic sort of lord.


Acties:
  • 0 Henk 'm!

  • NMe
  • Registratie: Februari 2004
  • Laatst online: 09-09 13:58

NMe

Quia Ego Sic Dico.

Garbage in, garbage out.

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.


Acties:
  • 0 Henk 'm!

  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Geef ze een WSYWIGeditor in het CMS, en laat ze het daarin tikken ipv in Word. Dan zit je ook niet met die rare opmaak.

Acties:
  • 0 Henk 'm!

  • Barryvdh
  • Registratie: Juni 2003
  • Nu online
Als je een moderne Word versie hebt valt het meestal wel mee toch? Daar is ook standaard een paragraaf gebruikt, tenzij ze ctrl+enter doen. En in een WYSIWYG editor zit vaak ook wel een optie om stijlen te wissen, plakken vanuit word, plain text plakken etc.

Acties:
  • 0 Henk 'm!

  • NMe
  • Registratie: Februari 2004
  • Laatst online: 09-09 13:58

NMe

Quia Ego Sic Dico.

TERW_DAN schreef op donderdag 19 maart 2015 @ 11:42:
Geef ze een WSYWIGeditor in het CMS, en laat ze het daarin tikken ipv in Word. Dan zit je ook niet met die rare opmaak.
De meeste moderne WYSIWYG-editors (inclusief FCK en TinyMCE) hebben een paste-from-Word-knopje, dus laat ze lekker in Word werken als ze willen. Maar dan is het nog steeds "garbage in, garbage out." Als zij na elke twee woorden op enter drukken ga je daar echt niks tegen beginnen met een tooltje.

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.


Acties:
  • 0 Henk 'm!

  • JaPPa03
  • Registratie: April 2011
  • Laatst online: 04-09 08:38
Ik kies en adviseer altijd de tekst te plakken in notepad (Windows of Mac versie) en de tekst om te zetten naar platte tekst en die dan kopieeren naar de website. Dan weet je zeker dat je geen vreemde broncode mee plakt.

Flight & Race simulation Discord // Mijn YouTube kanaal / Subscribe


Acties:
  • 0 Henk 'm!

  • NMe
  • Registratie: Februari 2004
  • Laatst online: 09-09 13:58

NMe

Quia Ego Sic Dico.

Dan heeft je klant net alles lekker opgemaakt, kunnen ze in je WYSIWYG-editor weer opnieuw beginnen... ;) Die paste from <app>-knop is er niet voor niets en voor zover ik weet zit die in alle bekende editors die voor een CMS gebruikt worden.

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.


Acties:
  • 0 Henk 'm!

  • _Thanatos_
  • Registratie: Januari 2001
  • Laatst online: 05-09 14:39

_Thanatos_

Ja, en kaal

Het hele probleem is het hebben van een WYSIWYG editor in de eerste plaats. Dit zijn feitelijk gewoon HTML editors die de layout engine van de browser mishandelen. Dit soort editors laten HTML achter, die in een database komt, die vervolgens meestal in een ongestructeerd blobveld wordt opgeslagen. Dus eenmaal opgeslagen is het haast onmogelijk om met een algoritme nog dingen op die teksten los te laten.

Waarom is dit een probleem?
WYSIWYG editors (die op HTML werken) kunnen alles wat de browser kan. Dus ook de hele site verzieken. "Dat doen ze dan zelf" zou je kunnen zeggen, maar dat is natuurlijk ernstig klantonvriendelijk, dus dat wil je ook niet... Wat dan wel? Een editor die voor het web geschikt is. Een editor die in z'n kern afbakent wat de redacteur allemaal kan. Een editor die géén HTML editor is.

Waarom nog meer is HTML in je database een probleem?
Stel dat je besluit dat een bulleted list anders gerenderd moet worden. Het moet een class krijgen, of een extra elementje eromheen, of whatever. Of een plaatje met onderschrift moet er op een andere manier uitkomen. En "anders" betekent in deze "anders dan wat uit de HTML editor-soep komt" maar ook een wijziging op de site in een later stadium. Maar er zit HTML in je database. Die zit daar en die zit vast. Je kunt wel een of ander scriptsel schrijven om alle blobs met html door een filter heen te trekken, maar dat gaat fout. Als je iets in je database hebt dat niet HTML is, maar HTML wordt bij het renderen, heb je dit probleem niet. Dan kun jij bepalen hoe een lijstje of een linkje of een tabelltje uitgepoept wordt.

En dit los ook het Word-probleem op. Je zegt dan tegen de klant: "ga het maar in deze editor doen". Dan klaagt ie dat het een weirdo editor is die niets kan. Maar dat is goed. Want hoe minder de klant kan, des te beter kun jij een goed-werkende site garanderen. En geen enkele HTML WYSIWYG editor lost dat op. Maar iets anders wel.

Mooi heh, dat Markdown :)

日本!🎌


Acties:
  • 0 Henk 'm!

  • Aionicus
  • Registratie: Februari 2011
  • Laatst online: 08-08-2023
op linux maak ik gebruik van catdoc als ze weer eens een csv in een word document opsturen ... (ja dat heb ik echt een paar keer meegemaakt)

sudo apt-get install catdoc

scriptje

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
#!/bin/sh
filename="$1"
extension=${filename##*.}
if [ ${extension} = "doc" ]
then
# Use cat doc for older document formats
catdoc "$filename"
else
# Unzip the docx file, and grab just the text with sed
# This also replaces opening <w:r> tags with newlines
# The final `sed G` double spaces the output
unzip -p "$filename" | grep '<w:r' | sed 's/<w:p[^<\/]*>/ \
/g' | sed 's/<[^<]*>//g' | grep -v '^[[:space:]]*$' | sed G
fi


je krijgt wel alles in plaintekst , maar als de opbouw van wat ze aanleveren een patroon heeft denk ik dat je dat ook wel via een pipe kan manipuleren naar een goede output.

[ Voor 12% gewijzigd door Aionicus op 01-04-2015 01:13 ]


Acties:
  • 0 Henk 'm!

  • n8n
  • Registratie: Juni 2007
  • Laatst online: 12-10 20:10

n8n

Hier is markdown voor uitgevonden.
Pagina: 1