[PHP/XML] headlines naar xml feed

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ik probeer de headlines van bn radio om te zetten in een rss feed. Echter heb ik 2 problemen waar ik niet uit kom.

1. Er onstaat een error bij de <link>
(http://feeds.archive.org/...tp://ww...t/cron/dirk.xml)

Weet iemand wat er verkeerd is aan de link en wat ik hieraan kan doen zodat het goed gaat? & werkt niet. de link is dan nietmeer geldig.

2. Een stuk data moet uit de feed worden gehaald.

http://www.dijksma.net/cron/dirk.php

<?php
<item>
<link>http://www.bnrfm.nl/ShowNieuwsArtikel.asp?Context=N%7C2%2C2%7CS%7C35342d927502ffb2&src=hfd&id=132853</link>
132853:19
<title>PinkRoccade wil begin 2005 gaan reorganiseren in Nederland</title>
<guid>PinkRoccade wil begin 2005 gaan</guid>
</item>
php?>

--> bijv. 132853:19

Deze data staat altijd tussen de volgende tekens.

</link>132853:19<title>

Bestaat er een functie dat je het volgende geeft: wis alles tussen </link> en <title>? Dit zou voor mij de oplossing bieden voor dit probleem


Indien ik meer fouten maak in de output dan hoor ik het graag. Indien inzage in het script nodig is ook.

Alvast bedankt!

Dirk Dijksma

Acties:
  • 0 Henk 'm!

  • dj_tjerk
  • Registratie: Januari 2003
  • Laatst online: 08-09 12:48
Jouw eerste probleem zit in de tekens, je mag volgens mij geen & en = teken in je link hebben.. moeten dus worden vervangen met htmlentities(). Bij je 2e probleem weet ik niet hoe je die lijn er ooit hebt in gekregen.. Je kan misschien via omweg wel eruit halen.. maar dat is zonde.. Je kan hem er beter niet instoppen :)

Acties:
  • 0 Henk 'm!

  • Postman
  • Registratie: Februari 2000
  • Laatst online: 18-09 19:05
Eruit halen kun je doen door een regexp te gebruiken.

Acties:
  • 0 Henk 'm!

Verwijderd

Topicstarter
Ik ga even kijken naar html entities.

andere probleem is dat alles direct gegrabbed wordt van de pagina van bn radio. er zitten dan ook redelijk veel str_replace in.

Probleem is dat het er nog tussen staat. Het is er dus niet weer ingezet.

Kun je me vertellen waarom

http://myrss.com/f/b/l/bloombergDp2fv43.rss

dan wel werkt? er zitten hier ook = en & tekens in de link.

Acties:
  • 0 Henk 'm!

  • dj_tjerk
  • Registratie: Januari 2003
  • Laatst online: 08-09 12:48
Misschien omdat dat een RDF rss feed is, en geen RSS 2.0. Als je jouw rss feed checkt met die validator, zet hij zo'n ^ onder het =-teken. Als er bij de beschrijving staat invalid token, zou dat moeten betekenen dat daar iig een fout zit.

Acties:
  • 0 Henk 'm!

  • LuCarD
  • Registratie: Januari 2000
  • Niet online

LuCarD

Certified BUFH

vervang de & door &amp;

Verder klopt de XML niet, ik mis een </item> en er is een <title> fout geschreven.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
<?xml version="1.0" encoding="UTF-8"?>
<rss version="0.91">
<channel>
<title>Dijksma.net - BN Radio</title>
<link>http://www.dijksma.net/</link>
<description>Het laatste beursnieuws</description>
<copyright>(C)opyright Dijksma.net</copyright>



<item>
<link>http://www.bnrfm.nl/ShowNieuwsArtikel.asp?Context=N%7C2%2C2%7CS%7C3a60536a5a0b6785&amp;src=hfd&amp;id=133224</link>

document.location='http://www.bnrfm.nl/ShowNieuwsArtikel.asp?Context=N%7C2%2C2%7CS%7C3a60536a5a0b6785&amp;src=hfd&amp;id=133223:05
<title>Laurus ziet kostenbesparingen 2005 EUR 46-48 mln</title>
<guid>Laurus ziet kostenbesparingen 2005 EUR</guid>
</item>


</channel>
</rss>
Verwijderd schreef op 15 oktober 2004 @ 12:34:
Ik ga even kijken naar html entities.

andere probleem is dat alles direct gegrabbed wordt van de pagina van bn radio. er zitten dan ook redelijk veel str_replace in.

Probleem is dat het er nog tussen staat. Het is er dus niet weer ingezet.

Kun je me vertellen waarom

http://myrss.com/f/b/l/bloombergDp2fv43.rss

dan wel werkt? er zitten hier ook = en & tekens in de link.
Nee hoor hier zitten geen & kijk maar in de source... Alle & zijn geschreven als &amp;

[ Voor 190% gewijzigd door LuCarD op 15-10-2004 13:39 ]

Programmer - an organism that turns coffee into software.

Pagina: 1