Crawler vind valide order ID in magento

Pagina: 1
Acties:

Onderwerpen


Acties:
  • 0 Henk 'm!

  • Obiter dictum
  • Registratie: Augustus 2008
  • Niet online

Obiter dictum

Zwart, geen suiker.

Topicstarter
Voor een klant kreeg ik laatst de mededeling dat één hij iets raars had gespot. Magento biedt de mogelijkheid online klanten te bekijken, en op welke URL zij zich bevonden. Dit IP-adres bevond zich op;

http://www.domein.nl/ideal/ideal/return/order_id/meestrecenteordernummer/order_code/codehier/

Waarbij "meestrecenteordernummer" dus het ordernummer was van de meest recente bestelling geplaatst op de webshop. Het IP-adres van afkomstig uit Japan, van TrendMicro. Een copy/paste van de url levert een 404 op.

Desondanks verontrust het ons dat een crawler op de één of andere manier inzage heeft in wat de laatst geplaatste order is geweest. Hoe is het mogelijk dat een crawler hier achter is gekomen?

Mijn meest recente productreview.
GoT; een haast oneindige bron van technologische kennis. Experts die elkaar helpen, en ik ben trots, hieraan een bijdrage -nsfw- te mogen leveren!


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
Obiter dictum schreef op maandag 12 september 2011 @ 23:15:
Hoe is het mogelijk dat een crawler hier achter is gekomen?
Dat moeten wij in onze glazen bol zien? Je zult toch echt zelf in je site op zoek moeten gaan of er nergens linkjes worden geplaatst naar die pagina('s) en het zou me niets verbazen als een ("gare") crawler hidden input values waarin zich URL's bevinden ook gewoon indexeert.
Het zou overigens ook goed mogelijk zijn dat, bijv., in een bevestigingsmail linkjes door een (mail)virusscanner opgepikt worden en gescand worden (misschien wel door een centrale service ofzo (ik roep maar wat) wanneer 't een smartphone betreft bijvoorbeeld) of gewoon een virusscanner op een desktop-pc die 'meekijkt' tijdens het browsen om te scannen op malafide zaken.

[ Voor 29% gewijzigd door RobIII op 12-09-2011 23:26 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Obiter dictum
  • Registratie: Augustus 2008
  • Niet online

Obiter dictum

Zwart, geen suiker.

Topicstarter
Nouja, het hoeft niet per sé in een glazen bol te zijn, maar als het een bekend fenomeen is bij een mede Tweaker dan zou het leuk zijn als hij die kennis zou willen delen...

Jij vermoedt dus die twee dingen, dat geeft al iets om mee te beginnen te bekijken. Bedankt!

Als we dan toch aan het editen gaan :P ; dat is erg goed mogelijk, temeer omdat de crawler afkomstig is van Trendmicro. Helaas is het gebruikte e-mailadres één van een eigen domein, dus niet te achterhalen of deze (standaard) een virusscan heeft.

[ Voor 31% gewijzigd door Obiter dictum op 12-09-2011 23:29 ]

Mijn meest recente productreview.
GoT; een haast oneindige bron van technologische kennis. Experts die elkaar helpen, en ik ben trots, hieraan een bijdrage -nsfw- te mogen leveren!


Acties:
  • 0 Henk 'm!

  • Bosmonster
  • Registratie: Juni 2001
  • Laatst online: 10-09 08:45

Bosmonster

*zucht*

Alles wat niet beveiligd is, maar wel een publieke URL heeft, daar moet je vanuit gaan dat het ooit in google terecht gaat komen.

Dit kan van alles zijn, een linkje in GMail, een geïnstalleerde Google Toolbar, etc. De complete bedrijfsvoering van Google is gericht op maar 1 ding: het verzamelen van gegevens.

[ Voor 17% gewijzigd door Bosmonster op 13-09-2011 07:25 ]


Acties:
  • 0 Henk 'm!

  • frickY
  • Registratie: Juli 2001
  • Laatst online: 15:10
Ga er maar van uit dat een bezoeker die bij de klant bestelde virus-beveiliging van Trend Micro heeft.
Die wil dan wel eens url's submitten voor analyse.

Zou bouwen ze een gehele database op van unsafe pages.

Acties:
  • 0 Henk 'm!

  • mocean
  • Registratie: November 2000
  • Laatst online: 04-09 10:34
Wel interessant om rekening mee te houden als developer, de bekende e-mail in de trant van "Klik op deze link om uw registratie & e-mail te bevestigen" wordt dan al door de virus-scanner bezocht.

Koop of verkoop je webshop: ecquisition.com


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
mocean schreef op dinsdag 13 september 2011 @ 14:11:
Wel interessant om rekening mee te houden als developer, de bekende e-mail in de trant van "Klik op deze link om uw registratie & e-mail te bevestigen" wordt dan al door de virus-scanner bezocht.
Keyword: Idempotentie / GET/POST :)
(Hoewel dat, als je afhankelijk bent van gare zut als iDeal (light), wat lastiger is...)

[ Voor 11% gewijzigd door RobIII op 13-09-2011 15:34 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • OkkE
  • Registratie: Oktober 2000
  • Laatst online: 04-09 08:16

OkkE

CSS influencer :+

Is indexering van zulke mappen/URLs niet eenvoudig tegen te gaan met een robots.txt?
RobIII schreef op dinsdag 13 september 2011 @ 15:52:
[...]

Moet een crawler zich daar wel aan houden; daar is 0 garantie op (en zelfs malafide crawlers die juist dat soort bestanden/directories gaan doorzoeken). Doorsnee zoekmachines als google, bing, weet-ik-het zullen de robots.txt respecteren, de rest is vrij spel.
Oeps, mijn fout. Had even niet door dat het om juist die malafide crawlers ging. Inderdaad erg irritant dat zulke zicht niet aan de richtlijnen houden. :(

[ Voor 74% gewijzigd door OkkE op 13-09-2011 16:02 ]

“The best way to get the right answer on the Internet is not to ask a question, it's to post the wrong answer.”
QA Engineer walks into a bar. Orders a beer. Orders 0 beers. Orders 999999999 beers. Orders a lizard. Orders -1 beers.


Acties:
  • 0 Henk 'm!

  • RobIII
  • Registratie: December 2001
  • Niet online

RobIII

Admin Devschuur®

^ Romeinse Ⅲ ja!

(overleden)
OkkE schreef op dinsdag 13 september 2011 @ 15:49:
Is indexering van zulke mappen/URLs niet eenvoudig tegen te gaan met een robots.txt?
Moet een crawler zich daar wel aan houden; daar is 0 garantie op (en zelfs malafide crawlers die juist dat soort bestanden/directories gaan doorzoeken). Doorsnee zoekmachines als google, bing, weet-ik-het zullen de robots.txt respecteren, de rest is vrij spel.

[ Voor 12% gewijzigd door RobIII op 13-09-2011 15:52 ]

There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.

Je eigen tweaker.me redirect

Over mij


Acties:
  • 0 Henk 'm!

  • Bosmonster
  • Registratie: Juni 2001
  • Laatst online: 10-09 08:45

Bosmonster

*zucht*

mocean schreef op dinsdag 13 september 2011 @ 14:11:
Wel interessant om rekening mee te houden als developer, de bekende e-mail in de trant van "Klik op deze link om uw registratie & e-mail te bevestigen" wordt dan al door de virus-scanner bezocht.
Sowieso moet je dus altijd linken naar een pagina met een actie en niet direct een actie uitvoeren.

Zelfde voor die leuke delete-knopjes die je soms hebt die direct iets weggooien :+

  • mocean
  • Registratie: November 2000
  • Laatst online: 04-09 10:34
Bosmonster schreef op dinsdag 13 september 2011 @ 16:44:
[...]


Sowieso moet je dus altijd linken naar een pagina met een actie en niet direct een actie uitvoeren.

Zelfde voor die leuke delete-knopjes die je soms hebt die direct iets weggooien :+
Dat klopt, binnen sites gaat alles netjes per POST als er een verandering moet optreden. Maar bij veel bevestigings-links in e-mails is dat zeker niet zo.

Koop of verkoop je webshop: ecquisition.com

Pagina: 1