Mijn meest recente productreview.
GoT; een haast oneindige bron van technologische kennis. Experts die elkaar helpen, en ik ben trots, hieraan een bijdrage -nsfw- te mogen leveren!
Dat moeten wij in onze glazen bol zien? Je zult toch echt zelf in je site op zoek moeten gaan of er nergens linkjes worden geplaatst naar die pagina('s) en het zou me niets verbazen als een ("gare") crawler hidden input values waarin zich URL's bevinden ook gewoon indexeert.Obiter dictum schreef op maandag 12 september 2011 @ 23:15:
Hoe is het mogelijk dat een crawler hier achter is gekomen?
Het zou overigens ook goed mogelijk zijn dat, bijv., in een bevestigingsmail linkjes door een (mail)virusscanner opgepikt worden en gescand worden (misschien wel door een centrale service ofzo (ik roep maar wat) wanneer 't een smartphone betreft bijvoorbeeld) of gewoon een virusscanner op een desktop-pc die 'meekijkt' tijdens het browsen om te scannen op malafide zaken.
[ Voor 29% gewijzigd door RobIII op 12-09-2011 23:26 ]
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij
Jij vermoedt dus die twee dingen, dat geeft al iets om mee te beginnen te bekijken. Bedankt!
Als we dan toch aan het editen gaan
[ Voor 31% gewijzigd door Obiter dictum op 12-09-2011 23:29 ]
Mijn meest recente productreview.
GoT; een haast oneindige bron van technologische kennis. Experts die elkaar helpen, en ik ben trots, hieraan een bijdrage -nsfw- te mogen leveren!
Dit kan van alles zijn, een linkje in GMail, een geïnstalleerde Google Toolbar, etc. De complete bedrijfsvoering van Google is gericht op maar 1 ding: het verzamelen van gegevens.
[ Voor 17% gewijzigd door Bosmonster op 13-09-2011 07:25 ]
Die wil dan wel eens url's submitten voor analyse.
Zou bouwen ze een gehele database op van unsafe pages.
Koop of verkoop je webshop: ecquisition.com
Keyword: Idempotentie / GET/POSTmocean schreef op dinsdag 13 september 2011 @ 14:11:
Wel interessant om rekening mee te houden als developer, de bekende e-mail in de trant van "Klik op deze link om uw registratie & e-mail te bevestigen" wordt dan al door de virus-scanner bezocht.
(Hoewel dat, als je afhankelijk bent van gare zut als iDeal (light), wat lastiger is...)
[ Voor 11% gewijzigd door RobIII op 13-09-2011 15:34 ]
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij
Oeps, mijn fout. Had even niet door dat het om juist die malafide crawlers ging. Inderdaad erg irritant dat zulke zicht niet aan de richtlijnen houden.RobIII schreef op dinsdag 13 september 2011 @ 15:52:
[...]
Moet een crawler zich daar wel aan houden; daar is 0 garantie op (en zelfs malafide crawlers die juist dat soort bestanden/directories gaan doorzoeken). Doorsnee zoekmachines als google, bing, weet-ik-het zullen de robots.txt respecteren, de rest is vrij spel.
[ Voor 74% gewijzigd door OkkE op 13-09-2011 16:02 ]
“The best way to get the right answer on the Internet is not to ask a question, it's to post the wrong answer.”
QA Engineer walks into a bar. Orders a beer. Orders 0 beers. Orders 999999999 beers. Orders a lizard. Orders -1 beers.
Moet een crawler zich daar wel aan houden; daar is 0 garantie op (en zelfs malafide crawlers die juist dat soort bestanden/directories gaan doorzoeken). Doorsnee zoekmachines als google, bing, weet-ik-het zullen de robots.txt respecteren, de rest is vrij spel.OkkE schreef op dinsdag 13 september 2011 @ 15:49:
Is indexering van zulke mappen/URLs niet eenvoudig tegen te gaan met een robots.txt?
[ Voor 12% gewijzigd door RobIII op 13-09-2011 15:52 ]
There are only two hard problems in distributed systems: 2. Exactly-once delivery 1. Guaranteed order of messages 2. Exactly-once delivery.
Je eigen tweaker.me redirect
Over mij
Sowieso moet je dus altijd linken naar een pagina met een actie en niet direct een actie uitvoeren.mocean schreef op dinsdag 13 september 2011 @ 14:11:
Wel interessant om rekening mee te houden als developer, de bekende e-mail in de trant van "Klik op deze link om uw registratie & e-mail te bevestigen" wordt dan al door de virus-scanner bezocht.
Zelfde voor die leuke delete-knopjes die je soms hebt die direct iets weggooien
Dat klopt, binnen sites gaat alles netjes per POST als er een verandering moet optreden. Maar bij veel bevestigings-links in e-mails is dat zeker niet zo.Bosmonster schreef op dinsdag 13 september 2011 @ 16:44:
[...]
Sowieso moet je dus altijd linken naar een pagina met een actie en niet direct een actie uitvoeren.
Zelfde voor die leuke delete-knopjes die je soms hebt die direct iets weggooien
Koop of verkoop je webshop: ecquisition.com