RSS Feeds geven een 403 forbidden terug

Pagina: 1
Acties:

  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Topicstarter
Ik kan de RSS Feeds niet meer uitlezen die geven allemaal een 403 forbidden terug.

Ik vermoed dat er een user-agent check geimplementeerd is, want die wordt in m'n php-script niet meegegeven, terwijl als ik met de browser die rss-feeds open, krijgt ik wel netjes de output op m'n scherm.

En om welke rss-feeds gaat het dan? Alle rss-feeds van de frontpage en van topics op het forum.

Edit:
Hmm.. Als de user-agent niet minimaal 2 tekens bevat krijg je een 403 terug op heel tweakers.net

Als dit een anti-scrape beveiliging is, ben ik daar dus per stom toeval achter gekomen omdat ik rss-feeds met file_get_contents ophaal in PHP

[ Voor 24% gewijzigd door RaZ op 06-07-2025 11:10 ]

Ey!! Macarena \o/


  • CodeCaster
  • Registratie: Juni 2003
  • Niet online

CodeCaster

Stop AI Slop

Wat gebeurt er als je dan wel een user agent meegeeft in je script?

Je moet niet dronken dat ik denken ben.
What seems to be the officer, problem?
Waar is de brand, meester?


  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Topicstarter
CodeCaster schreef op zondag 6 juli 2025 @ 08:42:
Wat gebeurt er als je dan wel een user agent meegeeft in je script?
Dan werkt het helemaal prima :P

Dat wil niet zeggen dat het geen bug is, of het is by design en stiekem een feature :P

edit:
Stuur ik een lege user-agent mee dan krijg ik een 403, met 2 karakters in de user agent nergens last van ;)

[ Voor 24% gewijzigd door RaZ op 06-07-2025 08:57 ]

Ey!! Macarena \o/


  • RaZ
  • Registratie: November 2000
  • Niet online

RaZ

Funky Cold Medina

Topicstarter
Tweakers heeft meer feeds dan de link die onderaan de pagina's staan

Rss-feeds linkt naar de https://tweakers.net/feeds/mixed.xml ipv naar de pagina waar alles feeds op staan.

Voor de mensen die de mixed feed niet fijn vinden, dan kan je ook deze gebruiken:

https://tweakers.net/feeds/nieuws.xml
https://tweakers.net/feeds/reviews.xml
https://tweakers.net/feeds/plan.xml
https://tweakers.net/feeds/meuktracker.xml

https://tweakers.net/feeds/redactieblogs.xml

[ Voor 12% gewijzigd door RaZ op 06-07-2025 09:36 ]

Ey!! Macarena \o/


  • Kees
  • Registratie: Juni 1999
  • Laatst online: 11:33

Kees

Serveradmin / BOFH / DoC
RaZ schreef op zondag 6 juli 2025 @ 08:48:
[...]
Stuur ik een lege user-agent mee dan krijg ik een 403, met 2 karakters in de user agent nergens last van ;)
Klopt, dat is een verandering die ik laatst heb aangezet; Een user-agent is handig zodat wij ongeveer weten welk programma wat aan het doen is. en er was een nu een irritante security scanner bezig die ook geen user-agent gebruikte. De makkelijkste oplossing was dus door gewoon een 'if length($userAgent) < 2 return403()' te doen :)

"Een serveradmin, voluit een serveradministrator, is dan weer een slavenbeheerder oftewel een slavendrijver" - Rataplan


  • crisp
  • Registratie: Februari 2000
  • Laatst online: 11:42

crisp

Devver

Pixelated

Het is good practice om in ieder geval iets van een naam, url of doel in je user-agent string te zetten als je gewoon te goeder trouw geautomatiseerde requests doet :)

Intentionally left blank


  • phizzie
  • Registratie: Juni 2000
  • Laatst online: 05-06 11:53

phizzie

always look on the bright side

Ah, was dus niet de enige met storing.
Worden dit soort updates/upgrades aangekondigd en indien ja, waar kan ik dat vinden?
Zal een heldere Useragent meegeven met mijn php scriptje.

aw snap, was dat het alweer?


  • crisp
  • Registratie: Februari 2000
  • Laatst online: 11:42

crisp

Devver

Pixelated

phizzie schreef op maandag 7 juli 2025 @ 14:16:
Ah, was dus niet de enige met storing.
Worden dit soort updates/upgrades aangekondigd en indien ja, waar kan ik dat vinden?
Nee, dingen die wij doen om ongewenste scrapers te blocken hangen we niet aan de grote klok ;)

Intentionally left blank


  • phizzie
  • Registratie: Juni 2000
  • Laatst online: 05-06 11:53

phizzie

always look on the bright side

crisp schreef op maandag 7 juli 2025 @ 14:27:
[...]

Nee, dingen die wij doen om ongewenste scrapers te blocken hangen we niet aan de grote klok ;)
Right, gaat iig nu opvallen in de logs, lekkere bogus UA.

aw snap, was dat het alweer?

Pagina: 1