Toon posts:

Advies gevraagd mbt clusteren

Pagina: 1
Acties:

Verwijderd

Topicstarter
Ik moet een cluster gaan bouwen voor een newsserver (usenet). Waarschijnlijk zal er een blade server gebruikt worden met zo'n 20 blades.

Iedere node in de cluster heeft een deel van de newsartikelen op zijn schijf staan. Dus de bestanden moeten voor iedere node leesbaar en schrijfbaar zijn. Kan dit bijv. met GPFS?

De speerpunten liggen op geheugengebruik en op de schijfruimte. Dit moet met behulp van de cluster schaalbaar zijn.

Iemand een advies hoe ik dit het beste kan aanpakken? Zijn er misschien zelfs standaard oplossingen? Dingen als Mosix of een beowulf werken niet echt volgens mij, want die zijn niet toepasbaar voor een newsserver.

  • JMW761
  • Registratie: Oktober 2001
  • Laatst online: 13:42
Verwijderd schreef op 03 februari 2004 @ 15:06:
Ik moet een cluster gaan bouwen voor een newsserver (usenet). Waarschijnlijk zal er een blade server gebruikt worden met zo'n 20 blades.

Iedere node in de cluster heeft een deel van de newsartikelen op zijn schijf staan. Dus de bestanden moeten voor iedere node leesbaar en schrijfbaar zijn. Kan dit bijv. met GPFS?

De speerpunten liggen op geheugengebruik en op de schijfruimte. Dit moet met behulp van de cluster schaalbaar zijn.

Iemand een advies hoe ik dit het beste kan aanpakken? Zijn er misschien zelfs standaard oplossingen? Dingen als Mosix of een beowulf werken niet echt volgens mij, want die zijn niet toepasbaar voor een newsserver.
Waarom wil je de artikelen over de nodes verdelen? ik zou een SAN regelen en de Nodes puur gebruiken voor rekenkracht, daar zijn node-servers ook voor ontworpen en niet voor snelle diskaccess.

Hoe wil je bij gaan houden waar ieder artikel staat?

Ik zou de nodes puur gebruiken als frontend en als backend een "normaal" opslagmedium als bijvoorbeeld een SAN gebruiken.

  • ANdrode
  • Registratie: Februari 2003
  • Niet online
Het schema van newszilla (.xs4all.nl):
Afbeeldingslocatie: http://www.xs4all.nl/~scorpio/news.jpg *klik*

Waarom neem je blades? Storage is wat je nodig hebt, en een SAN lijkt me dus geen overdreven oplossing.
De rekenkracht haal je wel met wat pizzadozen. Storageruimte neemt veel ruimte in.
(een paar TB kost je heel wat SCSI schijven)

[ Voor 57% gewijzigd door ANdrode op 03-02-2004 15:59 ]


Verwijderd

Topicstarter
naja, het 'leuke' van storage met behulp van nodes zou zijn dat makkelijk schaalbaar is. Opslagruimte te kort? Wat nodes erbij, probleem opgelost. Maar met een Nas of San zit je vast aan een bepaalde grote.

Waarom blades? Omdat die goedkoper zijn dan 1u pizzadozen :)

  • JMW761
  • Registratie: Oktober 2001
  • Laatst online: 13:42
Verwijderd schreef op 03 februari 2004 @ 17:24:
naja, het 'leuke' van storage met behulp van nodes zou zijn dat makkelijk schaalbaar is. Opslagruimte te kort? Wat nodes erbij, probleem opgelost. Maar met een Nas of San zit je vast aan een bepaalde grote.

Waarom blades? Omdat die goedkoper zijn dan 1u pizzadozen :)
Blades zijn ontworpen om goed te kunnen rekenen, niet om snel data te serven of op te kunnen slaan...

Blades gebruik je dus als frontend. Inderdaad is je frontend dan makkelijk schaalbaar, alleen als backend lijken ze me totaal ongeschikt (tenminste de blades die ik ken)

Hoeveel clients wil je kunnen handelen/hoe groot is de datastream die je aan wilt kunnen?

en hoe wil je gaan indexen?

[ Voor 3% gewijzigd door JMW761 op 03-02-2004 17:35 . Reden: verduidelijking ]


  • Arfman
  • Registratie: Januari 2000
  • Laatst online: 22-02 10:54

Arfman

Drome!

Verwijderd schreef op 03 februari 2004 @ 17:24:
naja, het 'leuke' van storage met behulp van nodes zou zijn dat makkelijk schaalbaar is. Opslagruimte te kort? Wat nodes erbij, probleem opgelost. Maar met een Nas of San zit je vast aan een bepaalde grote.
Correct me if I'm wrong, maar volgens mij kun je met een SAN juist heel easy opschalen. Schijven erbij, management software opstarten, storage toekennen en hoppa, je cluster heeft er weer HDD space bij.
Waarom blades? Omdat die goedkoper zijn dan 1u pizzadozen :)
Ik weet niet hoeveel rekenkracht een newsserver vraagt, maar als je nu (ik noem maar wat) 4 HP Proliant DL360 G3 machines clustert ? Die rust je per stuk uit met 2 x 36 GB (RAID 1) voor het OS, en de rest van de storage haal je van het SAN. Een DL360 heeft tegenwoordig standaard al een Intel XEON 3.0 GHz aan boord, met de mogelijkheid tot dual processor. Is dat niet voldoende ?

DRoME LAN Gaming | iRacing profiel | Kia e-Niro 64kWh | Hyundai Ioniq 28kWh | PV 5.760Wp |


  • Coen Rosdorff
  • Registratie: Januari 2000
  • Niet online
1 disk per blade schiet niet natuurlijk niet op voor een paar TB aan storage. Geeft ook een overdaad aan cpu power die je niet nodig hebt.

Je hebt meer aan een paar storage servers met per server 72 of meer ide disks. Er zijn bedrijven die die machines zo leveren. (1 server met een paar disk cabinets eraan waar ide disks in gaan) Koppeling naar je spoolserver is dan scsi of fiberchannel.

Voor de reader services heb je veel rekenkracht en nauwelijks disk ruimte nodig.

Voor het gehele plaatje maakt het trouwens nogal flink uit of je een text server moet maken voor 10.000 gebruikers, of een binary server voor dezelfde group. In het eerste geval kom je er met een paar Dual cpu doosjes en 100GB storage wel. Voor het laatste wordt het hele andere koek.

Verwijderd

Topicstarter
De blades zijn al in bezit en worden nu niet gebruikt... een SAN zou aangeschaft moeten worden. Het wordt idd een text EN binary newsserver. Uit ervaring weet ik dat de readers best wel wat CPU en memory vragen. Vandaar dat dus ook gekozen wordt voor blades.

Een blade heeft 2 cpu's (kweet zo niet wat precies) en 2 schijven van 146 gig. Er zit 2 gig ram in.

Een idee is misschien om alle schijven in de blades te mounten met NFS. We willen dnews gaan gebruiken en dat hoeft niet te werken met 1 array (zoals INN) geloof ik. CPU en memory zouden dan geclusterd kunnen worden. Toch? :)

  • Equator
  • Registratie: April 2001
  • Laatst online: 13:08

Equator

Crew Council

#whisky #barista

offtopic:
2x 146Gb in een blade. |:(

IMO is dat een verschrikkelijke overkill. Die blades zijn juist bedoeld als CPU power voor bijvoorbeeld een citrix farm. 2x36Gb in MIRROR zou voldoende moeten zijn. Voor Storage heb je andere zaken. (NAS/SAN)


Wat wil je nu precies bereiken met je cluster:?
High Availibilty
Load Balancing (CPU / Network)
(en welke andere vormen er dan ook zijn)

Welk OS wil je gebruiken op je nodes.
Windows / Unix / Linux

NLB (etwork Load Balancing) Van Windows 2003 is natuurlijk een optie. Maar of deze ook de "Load" van een systeem meeneemt in een election is mij onbekend.

Er zijn natuurlijk ook hardware loadbalancers. Maar hoe deze de election doen weet ik ook niet.

De kosten van een 20 x Windows Server 2003 (enterprise) rijzen ook aardig de pan uit, dus zou je beter voor liux kunnen kiezen.
Hou je weer geld over voor een SAN/NAS.
Misschien zijn de disken uit die blades te gebruiken in een SAN oplossing.
Haal je uit elke blade 1 disk, en heb je een SAN van 18x146GB. ( RAID5 + 1 Hot Spare is totaal overhead van 2 disken) => 2.6TB Lijkt me ruim voldoende.

Natuurlijk ben je er dan nog niet. Glas controllers / GBit Ethernet etc. voor je SAN/NAS.
Je zal IIG nog even doormoetne denken op welke manier je verder wilt gaan.

Suc6.

Verwijderd

Topicstarter
ja, ho, ik heb die blades niet gekocht :) 2 x 146gb vind ik ook iets te, magoed het zit er nou eenmaal in. Er komt linux op die blades te staan, dat is nou eenmaal een bedrijfsregel enzo. Persoonlijk ben ik het daar ook helemaal mee eens trouwens :)

Ik ga gewoon eens wat dingen op een rijtje zetten en eventueel testen. De meeste reacties geven toch aan dat ik een SAN of NAS moet gebruiken. Dit zal ik ook meenemen. Bedankt iig :)
Pagina: 1