Een volledige nieuwsfeed is grofweg een terabyte per dag. Dat komt binnen. Dat moet je opslaan. Je moet bijhouden hoe oud artikelen zijn, en je moet ze weggooien als ze te oud zijn. Dat moet je doen op een stel schijven. Hoe meer terabytes hoe beter. Verder zit je nogal met de snelheid. Je moet namelijk niet alleen schrijven, de gebruikers van de nieuwsserver willen ze ook nog lezen. Behalve die terabyte in, heb je dus ook nog een veel(of heel veel!) verkeer uit, naar je gebruikers toe. Vervolgens moet je, om een posting te kunnen vinden, ook nog een index bijhouden. Da's een database met artikel-nummers en de bijbehorende bestandsnaam.
Nou heb je twee oplossingen. Je begint met een array van een goed merk, van zeg 20Tbyte. Daar hang je een aantal dual-Xeon's aan, met FCAL ofzo. Verder regel je een RAM-diskje van een paar honderd gigabyte voor de index. Oh. En een loadbalancer die weet wat news is met een paar gigabit links. Linux of FreeBSD erop, diablo, tornado of gewoon INN, en dan een paar weken tot maanden laten roeren door een admin die dat al jaren doet.
Voor de gebruikers regel je een behoorlijk aantal goeie machines. Wat maakt niet eens veel uit, een P4 volstaat. Veel RAM is het enige criterium. En goeie links (ook FCAL?) met de storage-array en de RAM-disk. Die richt je in als readers. De loadbalancer gebruik je om in- en uitgaand verkeer alle kanten op netjes over de diverse machines te verdelen.
Inmiddels zijn we een ton of twee en een paar maanden verder. Die 200.000 euro moet je door de gebruikers van je newsserver terug laten betalen. Je schrijft 'm in 2 jaar af. (onrealistisch, want over een jaar is 'ie te klein, te traag en te oud). Dan moet je het salaris van 3 helpdeskers per maand in je nieuwsserver steken. En dat moet je terughalen via DSL-lijnen die (dankzij de recente prijzenoorlog) een paar euro netto per maand per lijn opbrengen.
Iemand heeft het zo al eens
geprobeerd, en
google kan je vertellen of dat een succesvolle aanpak is.
Indrukwekkend is het wel.
De andere manier, het maximale halen uit wat je hebt en af en toe een stukje nieuwe hardware kopen, en buiten de kantooruren om onbetaald doorsleutelen aan je oplossing ken je al. Die kost weinig, het wordt steeds beter, maar het kost tijd.
Als je bereid bent iets van 20 euro per maand te lappen en je vind nog een paar duizend anderen die er zo over denken, dan is er best een betaalde nieuwsserver op te zetten. Succes is echter niet gegarandeerd, en je gokt dan wel met de nieuwprijs van een redelijk huis.
(Je bent zelfs vereeuwigd (en ik ook..) op
http://www.nutz.nl/pubdoc/techniek/newsproblemen )
[
Voor 6% gewijzigd door
burne op 26-05-2004 01:48
]
I don't like facts. They have a liberal bias.