[xml]xml output data naar platte tekst.

Pagina: 1
Acties:
  • 150 views sinds 30-01-2008
  • Reageer

Acties:
  • 0 Henk 'm!

  • gitaarwerk
  • Registratie: Augustus 2001
  • Niet online

gitaarwerk

Plays piano,…

Topicstarter
Ik weet niet of dit in het goede topic taat. Ik denk het wel.

Ik heb het voglende probleem.

Ik krijg een stuk of 10.000 teksten zoals een klein stukje van het onderstaande.
Dit moet terug in platten tekst,.. de tekens moeten vervangen worden dus.
Hoe dat gebeurd hoef ik niet opgelost te zien. Maar ik zit wel met het probleem waar ik de tekens kan terugvinden (of lijsten) zodat ik deze terug kan converteren.

De tekst lijkt slecht geintrepeteerde html codes en missende tekens, maar blijkbaar werkt het bedrijf waarvan ik het krijg er prima mee (deze bouwt hiervan catalogi)

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<p
class="Zwischenüberschrift"><b&
amp;gt;<u>Toepassing:</u></b>&
lt;/p>
<p class="Liste"><font
face="Gedore Font
2">T</font>	Gecontrolee
rd aandraaien van schroeven in het bereik van 80 - 360 N·m</p>
<p class="Liste"><font
face="Gedore Font
2">T</font>	Toepassing
in vele (industriële) sectoren</p> <p class="Zwischen&
amp;#252;berschrift"><b&
amp;gt;<u>Uitvoering:</u></b>&
lt;/p


Dit is echt een heel klein stukje..
hoe/waar kan ik lijsten vinden die dit de vertaling heeft van dit?

ik heb geen flauw idee waar ik moet beginnen(aangezien ik niet xml of xhtml ken)....
html entiteiten hierop werkt niet echt lekker...en copy & paste in een WYSIWYG xml/php/asp/html editors werkt ook niet (het viel te proberen, want dan is platte tekst makkelijk te copieren)

wat ik wel zie is dat hieronder deprecated html tags zitten (font tags enzo). Waarom ze hier html opmaak meegeven is mij volslagen onduidelijk

[ Voor 17% gewijzigd door gitaarwerk op 12-10-2004 15:12 ]

Ontwikkelaar van NPM library Gleamy


Acties:
  • 0 Henk 'm!

  • alienfruit
  • Registratie: Maart 2003
  • Laatst online: 02:32

alienfruit

the alien you never expected

Als je eerste alle & vervangt door de & dan lukt het al stuk beter. dan krijg je dus < e.d. ipv. &lt; etc. Waarom zou je niet een verschillende fonts willen gebruiken in je catalogus? :)

[ Voor 36% gewijzigd door alienfruit op 12-10-2004 15:25 ]


Acties:
  • 0 Henk 'm!

  • gitaarwerk
  • Registratie: Augustus 2001
  • Niet online

gitaarwerk

Plays piano,…

Topicstarter
:P ik krijg dit aangeleverd, en dit moet allemaal terug naar platte tekst..
dus al die gekke tekens inderdaad naar '&' naar een &-etje.. maarreh... 10.000 artikelen..
waarom font tags genesteld zijn is mij ook een vraag

ik weet ook niet wat de inhoud hiervan is.. .alleen dat ze hetzelfde systeem gebruiken voor catalogi. Misschien is dit gewoon een stukje xml pagina (dit is even een teststukje of het lukt)

maar zoals je ziet staan er verder codes in als lt; en gt; ...

zodra ik een goede lijst heb, kan ik het allemaal in een keer vertalen..

die & vertalen scheelt een hoop... maar nu de rest nog.. god wat een ramp die codes.. en het ergste is dat er zoveel zijn :X

[ Voor 12% gewijzigd door gitaarwerk op 12-10-2004 15:37 ]

Ontwikkelaar van NPM library Gleamy


Acties:
  • 0 Henk 'm!

  • gitaarwerk
  • Registratie: Augustus 2001
  • Niet online

gitaarwerk

Plays piano,…

Topicstarter
nou...mijn vertaling :

code:
1
2
3
4
Toepassing:</u></b></p> <p class="Liste"><font face="Gedore Font 2">&T</font>&
    Gecontrolee rd aandraaien van schroeven in het bereik van 80 - 360 N&·m</p> 
<p class="Liste"><font face="Gedore Font 2">&T</font>&
    Toepassing in vele (industri&ële) sectoren</p> <p class="Zwischen&überschrift"><b><u>Uitvoering:


ik mis nog wat dingen.. ik zie wat over het hoofd

die &T& moet ook nog wat zijn...

edit:
oeps..drukte op quote ipv edit.. :X B) |:(

[ Voor 29% gewijzigd door gitaarwerk op 12-10-2004 15:50 ]

Ontwikkelaar van NPM library Gleamy


Acties:
  • 0 Henk 'm!

  • Genoil
  • Registratie: Maart 2000
  • Laatst online: 12-11-2023
zo kun je het naar html vertalen:

PHP:
1
2
3
4
5
6
7
8
9
10
    function unhtmlspecialchars( $string ) {
        $string = str_replace ( '&amp;', '&', $string );
        $string = str_replace ( ''', '\'', $string );
        $string = str_replace ( '&quot;', '\"', $string );
        $string = str_replace ( '&lt;', '<', $string );
        $string = str_replace ( '&gt;', '>', $string );     
        return $string;
    }
   
    $html = unhtmlspecialchars(html_entity_decode($character_soup));


vervolgens kun je met XSLT of, iets lomper, reguliere expressies, deze $html naar platte tekst converteren.

Acties:
  • 0 Henk 'm!

  • gitaarwerk
  • Registratie: Augustus 2001
  • Niet online

gitaarwerk

Plays piano,…

Topicstarter
Genoil schreef op 12 oktober 2004 @ 15:54:
zo kun je het naar html vertalen:

PHP:
1
2
3
4
5
6
7
8
9
10
    function unhtmlspecialchars( $string ) {
        $string = str_replace ( '&amp;', '&', $string );
        $string = str_replace ( ''', '\'', $string );
        $string = str_replace ( '&quot;', '\"', $string );
        $string = str_replace ( '&lt;', '<', $string );
        $string = str_replace ( '&gt;', '>', $string );     
        return $string;
    }
   
    $html = unhtmlspecialchars(html_entity_decode($character_soup));


vervolgens kun je met XSLT of, iets lomper, reguliere expressies, deze $html naar platte tekst converteren.
wow.. .deze code werkt nog veel beter.. thanks :) (had niet gehoeven hoor O+ thanks again )

Ontwikkelaar van NPM library Gleamy


Acties:
  • 0 Henk 'm!

  • Grijze Vos
  • Registratie: December 2002
  • Laatst online: 28-02 22:17
volgens mij staat die code gewoon in het commentaar van php.net bij de functie htmlspecialchars.

...
...
donwilson at gmail dot com in htmlspecialchars
25-Sep-2004 06:58

To reverse the action of htmlspecialchars(), use this code:

<?php
unhtmlspecialchars( $string )
{
$string = str_replace ( '&', '&', $string );
$string = str_replace ( ''', '\'', $string );
$string = str_replace ( '"', '\"', $string );
$string = str_replace ( '<', '<', $string );
$string = str_replace ( '>', '>', $string );

return $string;
}
?>
inderdaad.

[ Voor 77% gewijzigd door Grijze Vos op 12-10-2004 16:47 ]

Op zoek naar een nieuwe collega, .NET webdev, voornamelijk productontwikkeling. DM voor meer info


Acties:
  • 0 Henk 'm!

  • Genoil
  • Registratie: Maart 2000
  • Laatst online: 12-11-2023
Grijze Vos schreef op 12 oktober 2004 @ 16:44:
volgens mij staat die code gewoon in het commentaar van php.net bij de functie htmlspecialchars.
inderdaad.
goed gecopypaste he B)

Acties:
  • 0 Henk 'm!

  • drm
  • Registratie: Februari 2001
  • Laatst online: 09-06 13:31

drm

f0pc0dert

zo goed in de manual kijken, en niet eens html_entity_decode() tegenkomen :z ;)

Music is the pleasure the human mind experiences from counting without being aware that it is counting
~ Gottfried Leibniz

Pagina: 1