Dat idee had ik zelf ook; we hebben zelf ook getest namelijk.
Ok, wat was er aan de hand. We zochten een speld en wisten niet welke kleur kop deze moest hebben.
We hebben een vrij strak draaiende ring tussen telecity 1, telecity 2 en redbus, ondertussen hier en daar 2Gbit en komende weken overal naar 2Gbit.
Toch, ondanks de ruime overcapaciteit, 'voelde' het hier en daar niet goed, voornamelijk op het newsplatform. Er zou capaciteit moeten staan voor ruim 2.5Gbit
Vorige week, na het bijplaatsen van een 5e caching reader, nam de totale capaciteit plotseling niet noemingswaardig toe.
De trunk tussen het newsplatform en de ring op Redbus is toen verhoogd naar 3Gbit; toen dit niet uitmaakte is de Allied 9812T switch (zie eerdere posts) ritueel verwijderd.
Een mooie nieuwe HP-switch, welke we hadden besteld op de groei (HP-3400CL) voor alleen het newsplatform, was op de plaats gehangen.
Ook toen nam de capaciteit niet toe.
Onze verwachting was dat het bij de Loadbalancer lag; dat was de conclusie na afgelopen weekend. Eigenlijk al weken aan het zoeken naar de speld, maar wel de verkeerde.
Voor tweakdsl hebben we de snelste caching reader apart geschakeld, buiten de loadbalancer om. Voor alleen het DSL netwerk zou dat meer dan voldoende moeten zijn; traagheid voor tweakers snap ik dan ook niet helemaal, zeker niet omdat we daar zelf op testen.
Eigenlijk om een nieuwe loadbalancer te bouwen, had ik aan onze vaste transit leverancier (trueserver) gevraagd of zij een oude alpine hadden om mee te testen. (Alpine's kunnen loadbalancing en doen dat in hardware).
Om een lang verhaal kort te maken; ik heb een Alpine geleend met 2 4-poorts gbic-blades en hoopte dat hij een 16 poorts blade had liggen. Doodleuk zegt hij: dat red je niet met jou hoeveelheid verkeer... 16 poort blades hebben een overboekingsfaktor.... Dat hebben ... switches ook (mijn alternatievenlijst)
Het engelse woord hiervoor is overcommitted en googlen op 'overcommitted extreme gm-16' gaf resultaten. Leverancier gebeld en nadat ik uitgeraasd was heb ik maar opgehangen. Dat leek me redelijk.
Daarna een goede bak koffie gedronken en een grondige blik op ons netwerk geworpen. Waar zouden knelpunten kunnen zitten, naast ons newsplatform.
Op telecity 2 hebben we rond circa 1700 wat omgeprikt, wat een korte hikje gaf en waar wat mensen over geschreven hebben. Daarnaast hebben we wat spul voor de newsfeeder verdeeld; denk dat we daar achteraf geen last hadden.
Vervolgens naar RedBus gegaan en daar wat dingen verplaatst naar andere switches en ook daar de verdeling aangepast. In de loop van de avond, bleef de boel steken op een bepaalde limiet en uiteindelijk zijn we met een twee man sterke delegatie rond een uurtje of half elf vanavond op de colo gaan testen. De nieuwe HP switch deed na wat fysieke aandacht de trunk naar core5 wel goed en vanaf dat moment loopt tweaknews ook weer helemaal strak.
Nu de grote vraag: waren er capaciteitsproblemen? Wij zagen ze niet en hopen het nu gefixed te hebben. Ook nu weet ik nog steeds niet hoe ik dit zou moeten zien. Ook voor mij is het de eerste keer dat een leverancier spreekt van 'overboeking' op groepen interfaces op een switch.
Concreet: wie hebben er last van gehad:
Voor de RedBus locatie:
- het newsplatform
Voor het TweakDSL netwerk:
Nog geen terugmelding van de gamers of het netwerk strakker is
Ok, ook voor mij is het nu nachtrust en ga de komende week afbouwen naar een verdiende vakantie.