Ik ben bezig met de tweakers.net meuktracker een beetje te parsen voor mn nieuwe active desktop.
Het zal wel helemaal aan mij liggen, maar de handleidingen op php.net zijn niets meer dan absoluut wazig, of het geen ik daadwerkelijk wil vinden, is verrekte goed verstoppeld ofzo.
Ik ben niet handig met xml_parse dus dat gedeelte heb ik maar even voor de makkelijkheid geskipped ...
Ik beschouw het gewoon als een txt bestand, alles lijkt ook vrij leuk te werken, behalve mijn laatste (belangrijkste) stukje:
Ik wil alle zooi eruit halen
ff voor de makkelijkheid mijn code:
Ik wil ALLES van <editor> t/m </reacties> gewoon weghebben.
Klinkt simpel, echter blijkt dat niet zo te zijn
Ik krijg niet eens alles tussen <editor> en </editor> eruit, anders had ik het per object gedaan... Maar ook dat krijg ik niet voor elkaar.
Ik heb inmiddels vanalles geprobeert met die regel ...
$Cmeuk = ereg_replace("<editor[^>]*/editor>", "", $Cmeuk);
Heeft iemand ervaring hiermee, en kan mijn regeltje aanpassen ??
Het zal wel helemaal aan mij liggen, maar de handleidingen op php.net zijn niets meer dan absoluut wazig, of het geen ik daadwerkelijk wil vinden, is verrekte goed verstoppeld ofzo.
Ik ben niet handig met xml_parse dus dat gedeelte heb ik maar even voor de makkelijkheid geskipped ...

Ik beschouw het gewoon als een txt bestand, alles lijkt ook vrij leuk te werken, behalve mijn laatste (belangrijkste) stukje:
Ik wil alle zooi eruit halen
ff voor de makkelijkheid mijn code:
PHP:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
| <? // Tweakers.NET Turbotrekker Parsen :) // link: http://www.tweakers.net/turbotracker.dsp // Backup, testen even braaf lokaal doen, braaf blijven tegen t.net server :) // $Pmeuk = "http://www.tweakers.net/turbotracker.dsp"; // Lokale file pakken $Pmeuk = "./turbotracker.dsp"; $Rmeuk = fopen($Pmeuk,r); if (!$Rmeuk) { die("Kon file <B>" . $Pmeuk . "</B> niet openen :(<BR>"); } $Cmeuk = fread($Rmeuk, filesize($Pmeuk)); $Cmeuk = str_replace("<nieuwsposting>", "<table border=1><tr><td>", $Cmeuk); $Cmeuk = str_replace("<id>", "<A HREF='http://www.tweakers.net/nieuws/", $Cmeuk); $Cmeuk = str_replace("</id>", "'>", $Cmeuk); $Cmeuk = str_replace("<titel>", "", $Cmeuk); $Cmeuk = str_replace("</titel>", "</A>", $Cmeuk); // Dit is de regel die ik niet goed krijg :( $Cmeuk = ereg_replace("<editor[^>]*/editor>", "", $Cmeuk); $Cmeuk = str_replace("</nieuwsposting>", "</table>", $Cmeuk); echo "<PRE>$Cmeuk</PRE>"; |
Ik wil ALLES van <editor> t/m </reacties> gewoon weghebben.
Klinkt simpel, echter blijkt dat niet zo te zijn
Ik krijg niet eens alles tussen <editor> en </editor> eruit, anders had ik het per object gedaan... Maar ook dat krijg ik niet voor elkaar.
Ik heb inmiddels vanalles geprobeert met die regel ...
$Cmeuk = ereg_replace("<editor[^>]*/editor>", "", $Cmeuk);
Heeft iemand ervaring hiermee, en kan mijn regeltje aanpassen ??
[ Voor 13% gewijzigd door Verwijderd op 11-06-2003 11:04 ]