Toon posts:

Apache logs

Pagina: 1
Acties:
  • 449 views sinds 30-01-2008
  • Reageer

Verwijderd

Topicstarter
Een wellicht simpele vraag, die ikzelf niet 1,2,3 beantwoord kreeg.

Ik lease een dedicated server bij Strato. Deze leveren 2.000GB aan bandbreedte, en de mogelijkheid tot het reinstallen van het OS, compleet gratis. Leuk dus om mee rond te kloten. Ik heb het systeem zelf niet echt aangepast, enkel een PHP update gedraaid en wat rondgekeken.

Mijn kennis van Linux is vrij beperkt, echter ben ik er mee bezig om dit wat te vergroten.
/me streelt zachtjes zijn Fedora 7 guide van ongeveer 14kilo
Anyway, we dwalen af.

Ik heb dus 2000GB aan bandbreedte, en het leek mij een enorme sonde als deze bandbreedte niet verbruikt word. Wat doe je dan? Juist, je gaat maar eens wat content aanbieden. De server zelf is geinstalleerd met SuSE 10.2, draait Apache 2.nogwat, PHP5.2 en kan door mij beheerd worden via Plesk. Ik heb zelf één echte functionele website draaien op deze bak, nog een aantal andere websites dienen als speelgoed.

Voor de website in kwestie word er de mogelijkheid geboden om een Japanse TV serie te downloaden van een krappe 300MB. Iedere week is er een nieuwe episode, dus iedere week valt er een andere episode te downloaden. 2000/0.3=6666 (slecht voorteken?) dus ik kan per maand ongeveer 6666 mensen blij maken met deze file.

MIjn website is niet bekend bij veel mensen, als ik 1.000 unieke visitors heb per maand dan is er een reden tot een feestje, so to speak. Mijn forum heeft 28 members die redelijk actief zijn, dus daarover valt niet te klagen.

Nu opende ik eergisteren mijn trouwe webstats en viel mijn mond open van verbazing.
Wat wil het geval? Dit:

Afbeeldingslocatie: http://brian.morningmusume.nl/stats1.jpg

3TB, niet verkeerd voor 16 dagen. Toch? :+
Ik haalde mijn schouders op en besloot er weinig aandacht aan te besteden. Webalizer heeft mij al eens eerder weten te vertellen dat ik ruim 59.000 visits had.

Omdat ik toch zeker wou weten dat er geen problemen waren besloot ik nog even om te kijken wat Plesk mij kon vertellen. Op dat moment sloeg de schrik mij om mijn hart:

Afbeeldingslocatie: http://brian.morningmusume.nl/stats2.jpg

Ook Plesk gaf aan dat ik bijna 3TB aan data had verzet.

Als final check ingelogd in mijn Stratowebpanel, en gelukkig, daar stond dat ik slechts 20GB had verbruikt deze maand. Om er zeker van te zijn dat ik niet genaaid ging worden en ik 500 euro extra moet betalen deze maand toch maar even de helpdesk gebeld, waar ik enorm vriendelijk ben geholpen en mij toegezegd werd dat de usage die op de switch genoteerd word telt. Gelukkig, maar dat lost slechts 1 probleem op. Namelijk de schrik dat ik een enorme bijbetaling moet doen. Ook heeft de vriendelijke helpdesk meneer mij een aantal tips gegeven wat ik kan doen om dit in het vervolg te voorkomen, en de meneer heeft ook een support ticket aangemaakt, om te kijken of iemand mijn lieve servertje plat wou krijgen.

Nu is het probleem dus als volgt, waarom geven zowel Plesk als Webalizer aan dat ik zoveel data getransferred heb? Het lijkt mij dat Plesk deze data uit de apache logs haalt, en van webalizer weet ik dit zeker.

Nu zie ik webalizer dit staan:
Afbeeldingslocatie: http://brian.morningmusume.nl/stats3.jpg
Schattig, de volks republiek van China vind Japanse TV blijkbaar erg leuk.

Een eenzame Chinees zou dus mijn episode ongeveer 5000 keer hebben aangevraagd, en dus ook 5000 hebben gedownload. Iets wat mij vrijwel onmogelijk lijkt. En zo komen we na een lang verhaal aan bij de hamvraag waar het allemaal om draait (sorry voor het lange verhaal):

Ziet Apache een HTTP GET command als verstuurde data?
Dus stel dat ik zie:
code:
1
GET /hm/Haromoni@ (080113 1024x576).avi HTTP/1.1" 403 960 "http://www.helloproject.nl/index.php?nav=hm" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

En deze download wordt halverwege afgebroken, Apache alsnog noteert dat het complete bestand is gedownload?

Dit zou voor mij alles ophelderen, aangezien de vorige lijn in kwestie ongeveer 300 keer voorkomt.
Om je een klein idee te geven kun je hier een gedeelte van mijn log zien.

Uiteraard wil dit probleem in de toekomst voorkomen, dus ik denk dat ik maar eens aan de slag ga met mod evasive. En desnoods de episodes als .rar aanbieden, om te voorkomen dat er gestreamed word.

  • Bob
  • Registratie: Mei 2005
  • Laatst online: 30-11 08:00

Bob

Testje met wget toont aan dat de volledige bestandsgrootte in de apache log verschijnt wanneer apache de inkomende request geprocessed heeft en de transfer start.
En deze download wordt halverwege afgebroken, Apache alsnog noteert dat het complete bestand is gedownload?
Yep dus.

  • GlowMouse
  • Registratie: November 2002
  • Niet online
Zie ook dit topic met uitleg over dit fenomeen.

Verwijderd

Topicstarter
Bedankt voor beide antwoorden. d:)b
/me die het schaamrood van zijn kaken probeert te halen omdat hij zelf het antwoord niet op tweakers kon vinden via de search functie. :+