geschikte database gezocht...

woensdag 4 april 2012 22:40

Quia Ego Sic Dico.

piet konijn schreef op woensdag 04 april 2012 @ 21:43:
MsSQL blijkt daarvoor te traag

Blijkt of lijkt? MSSQL is een van de betere DBMS'en en zou echt totaal geen probleem mogen hebben met de situatie die je omschrijft.

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.

Acties:

Styxxy

NMe schreef op woensdag 04 april 2012 @ 22:37:
[...]
Blijkt of lijkt? MSSQL is een van de betere DBMS'en en zou echt totaal geen probleem mogen hebben met de situatie die je omschrijft.

Mits het datamodel goed is, de juiste indexen, datatypes, ... (name it) gebruikt worden; en dat de database natuurlijk ook goed geconfigureerd is.

donderdag 5 april 2012 10:32

Acties:

TheNephilim

Wtfuzzle

Volgens mij kan dat ook prima met MySQL, je moet inderdaad wel de goede db structuur hebben met de juiste indexes.

donderdag 5 april 2012 10:44

Acties:

jopitan

It's just a fact

De hardware waar jij je MSSQL op hebt getest is ook belangrijk. Als jij denkt het te kunnen draaien op een Atom servertje heb je het wel mis. Wat ik vaak zie bij klanten die denken goedkoop uit te zijn en toch de performance denken te krijgen is dat ze er ver naast zitten.

Ik draai voor de MSSQL server een Intel i7 hexacore en die voert een aantal miljoenen queries uit zonder probleem. Daarnaast zit er overigens 16 Gig aan geheugen in en 2x Caviar Black 2TB. (sata-600)

donderdag 5 april 2012 11:44

Acties:

TJHeuvel

MsSQL blijkt daarvoor te traag,

Defineer te traag. Wat zijn je benchmarks, waarmee heb je getest? Zoals eerder vermeld zijn hier heel veel factoren belangrijk, zoals de opzet van je database (indexes, datatypes) maar ook hardware (SSD's zijn veel sneller dan normale HDD's). Wat is het streven, hoeveel writes/s en reads/s is je maximaal?

Misschien kan je is naar MySQL kijken, door zijn Storage Engines. Dit zijn verschillende manieren om de data op te slaan, waaronder Memory. In plaats van de data op te slaan op een hardeschijf wordt het in je tijdelijke geheugen gestored.
Dit kan je eens in de zoveeltijd voor de zekerheid wel naar een permanente storage opslaan, maar het is iig een stuk sneller dan een klassieke HDD.

(Misschien hebben andere RDMS systemen ook wel zo'n oplossing, even zoeken dus).

[ Voor 33% gewijzigd door TJHeuvel op 05-04-2012 11:47 ]

Freelance Unity3D developer

donderdag 5 april 2012 13:02

Acties:

creator1988

Wat de rest zegt. Wij draaiden een systeem waarop live queries werden uitgevoerd, en die ook nog 70 million inserts deed op dezelfde indexen op een 32 bits systeem met 4GB memory en MSSQL 2005. Kost wat optimalisatiewerk maar kan best.

donderdag 5 april 2012 13:17

Acties:

GlowMouse

TJHeuvel schreef op donderdag 05 april 2012 @ 11:44:
[...]

Misschien kan je is naar MySQL kijken, door zijn Storage Engines. Dit zijn verschillende manieren om de data op te slaan, waaronder Memory. In plaats van de data op te slaan op een hardeschijf wordt het in je tijdelijke geheugen gestored.
Dit kan je eens in de zoveeltijd voor de zekerheid wel naar een permanente storage opslaan, maar het is iig een stuk sneller dan een klassieke HDD.

Memory is juist vaak trager omdat het veel optimalisaties mist.

Ik mis even of de zoekstring elke keer anders is, of dat alleen bepaalde parameters veranderen (dus altijd in de vorm "Material=? & size IN (?) & model.Category=? & asset.Color=?" is).

Je hebt 100k products maar ook 100k updates. Verandert je hele inventory zo snel?

Je kunt kijk naar Sphinx (sphinxsearch.com) met een realtime index.

donderdag 5 april 2012 15:19

Acties:

Grijze Vos

Overigens maakt het bij MSSQL ook nog uit of je een express editie draait of een betaalde editie, qua performance. Kwam ik toevallig gisteren achter.

Op zoek naar een nieuwe collega, .NET webdev, voornamelijk productontwikkeling. DM voor meer info

donderdag 5 april 2012 17:51

Acties:

donderdag 5 april 2012 17:56

Topicstarter

hardware bij de klant is gevirtualiseerd, al is de database server fysiek (12/16 cores, 30+GB ram). mijn tests doe ik op een thinkpad w520 met i7-2820QM, 16GB ram en een vertex 3, dus da's wel ok. SQL is 2008 R2, OS is windows 7.

denk dat het niet echt van toepassing is, daar het product dat we gebruiken niet door ons wordt ontwikkelt (maar draait op SQL server). denk dat het te specifiek is en dat misschien ook hun API de bottleneck is. misschien moeten we kiezen om de metadata in aparte, geoptimaliseerde tabellen te steken, dan kan zou ik een zinnig antwoord op jullie andere vragen kunnen geven

.

alle ui search functionaliteit wordt sowieso door solr opgeknapt, waar we inderdaad alles gaan platkloppen in één document per branch of zoiets.

zijn er ervagingen met neo4j of couchbase clients? liefst vanuit .NET perspectief, de API's waar ik mee werk missen precies cruciale stukken... (voor beide solutions)

Acties:

donderdag 5 april 2012 18:03

Quia Ego Sic Dico.

Overstappen naar een andere databaseserver omdat je ddatamodel of indices rammelen lijkt me weinig productief. Nogmaals, je aantallen zijn weinig wereldschokkend, dus geen enkele courante databaseserver zou hier problemen mee mogen hebben. Dus nogmaals: wat is precies "traag", hoe meet je dat, en wat zegt de query analyzer van de management studio over je execution plan?

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.

Acties:

beany

Meeheheheheh

piet konijn schreef op donderdag 05 april 2012 @ 17:51:
zijn er ervagingen met neo4j of couchbase clients? liefst vanuit .NET perspectief, de API's waar ik mee werk missen precies cruciale stukken... (voor beide solutions)

.NET loopt een beetje achter op het gebied van NoSQL, zelfs wat betreft client libraries. Het merendeel is Java.

Er was een native .Net graph database(Sones) maar die is failliet, al zijn er geruchten dat er weer wat geld in gepompt wordt.

En wat betreft Neo4j: kijk HEEL GOED naar de licentie voorwaarden. Je zit namelijk maar zo aan 6000 dollar(en dat is de goedkoopste optie) licentie kosten, per jaar... per server.

Dagelijkse stats bronnen: https://x.com/GeneralStaffUA en https://www.facebook.com/GeneralStaff.ua

donderdag 5 april 2012 18:35

Acties:

leuk_he

1. Controleer de kabel!

Je zult inderdaad ook goed naar de API naar die database moeten kijken. 100K records updaten met een enkele SQL is bij de meestte databases die genoemd zijn geen probleem. 100.000 statementes parsen en excuten kan al wat spannderer worden. Een database die remote staat is weer een ander verhaal als een database die die op hetzelfde ijzer staat.

Voor de keuze is je architectuur veel belangrijker. Multiuser? zoja, dan maakt het wel uit of het 3 gebruikers zijn, of 100.000 gebruikers, die ookook nog eens allemaal updaten of enkel querien.

Als je verder dure hardware hebt, en die voldoet niet, dat zou ik ook een heel kritische blik werpen op de virtualsatie laag. Als die een aanzienlijk deel van de perfonmance wegneemt, (kan in bepaalde scenario's) dan is het wellicht handig een os te nemen zonder virtualisatie.

Need more data. We want your specs. Ik ben ook maar dom. anders: forum, ff reggen, ff topic maken
En als je een oplossing hebt gevonden laat het ook ujb ff in dit topic horen.

donderdag 5 april 2012 19:18

Acties:

PolarBear

TJHeuvel schreef op donderdag 05 april 2012 @ 11:44:
[...]

Defineer te traag. Wat zijn je benchmarks, waarmee heb je getest? Zoals eerder vermeld zijn hier heel veel factoren belangrijk, zoals de opzet van je database (indexes, datatypes) maar ook hardware (SSD's zijn veel sneller dan normale HDD's). Wat is het streven, hoeveel writes/s en reads/s is je maximaal?

Misschien kan je is naar MySQL kijken, door zijn Storage Engines. Dit zijn verschillende manieren om de data op te slaan, waaronder Memory. In plaats van de data op te slaan op een hardeschijf wordt het in je tijdelijke geheugen gestored.
Dit kan je eens in de zoveeltijd voor de zekerheid wel naar een permanente storage opslaan, maar het is iig een stuk sneller dan een klassieke HDD.

(Misschien hebben andere RDMS systemen ook wel zo'n oplossing, even zoeken dus).

MS SQL heeft gewoon een zeer goede cache manager aan boord. Kan mij niet voorstellen dat met de juiste indexen (en configuratie, tempdb, log & data aparte schijven etc, de best practises) MS SQL de bottleneck is in dit verhaal. Gewoon niet. MS SQL wordt in omgevingen gebruikt die vele malen groter zijn dan de hier geschetste (wat andere mensen ook aangeven). Switchen naar MySQL lijkt mij in dit geval een achteruitgang.

donderdag 5 april 2012 20:02

Acties:

zondag 8 april 2012 11:44

piet konijn schreef op donderdag 05 april 2012 @ 17:51:
alle ui search functionaliteit wordt sowieso door solr opgeknapt, waar we inderdaad alles gaan platkloppen in één document per branch of zoiets.

Wat is dan precies het probleem qua traagheid?

Solr levert (neem ik aan, hangt van je instellingen af maar ok) toch simpelweg id's op waarvan je enkel nog de bijbehorende info hoort te geven? Het fysieke filteren etc regelt solr toch allemaal?

Zo richt ik het in ieder geval altijd in. Solr regelt zo goed als alles intern en levert id's terug aan de server die dan de info ophaalt en weergeeft. Met een beetje paging hoeft je dbase enkel maar 10 id's op te zoeken en wat facet-namen te produceren. Dat kan niet traag zijn imho.

Acties:

zondag 8 april 2012 12:08

Topicstarter

NMe schreef op donderdag 05 april 2012 @ 17:56:
Overstappen naar een andere databaseserver omdat je ddatamodel of indices rammelen lijkt me weinig productief. Nogmaals, je aantallen zijn weinig wereldschokkend, dus geen enkele courante databaseserver zou hier problemen mee mogen hebben. Dus nogmaals: wat is precies "traag", hoe meet je dat, en wat zegt de query analyzer van de management studio over je execution plan?

zoals eerder vermeld, we werken met een third party product bovenop SQL dus kunnen we aan de queries of de database structuur helaas niks veranderen. een update voor één "record" rammelt al gauw in 15-20 tabellen en manipuleert mogelijks honderden rijen, dus het is niet zomaar één update.

de getallen zijn niet echt wereldschokkend, maar met die aantallen wordt het wat realistisch wat betreft verdeling van de metadata en zo. in het totaal komen we dikwijls aan 10-50x zoveel uit, wat nog steeds niet iets is om achterover van te vallen. in de database echter worden dat (door de manier waarop het third party product ontworpen is) 100-1000x zoveel rijen...

"te traag" is voor mij wanneer het ernaar begint uit te zien of het vooropgestelde aantal updates binnen een bepaalde tijdspanne niet gehaald zal worden.

Acties:

zondag 8 april 2012 13:23

Maar als je middle-ware het probleem is, waarom zit je dan naar een andere db te kijken?

Je db gaat niet je probleem met je midde-ware oplossen als je middle-ware simpelweg inefficient as hell is.

Ga gewoon eens praten met de maker van de middle-ware...

Wat ik trouwens niet begrijp is dat je niets aan de database structuur zou kunnen veranderen, maar dat je er wel een andere db (neodb / couchdb) eventjes onder kan plaatsen. Dat klinkt mij een beetje tegenstrijdig in de oren...

Acties:

zondag 8 april 2012 14:07

Quia Ego Sic Dico.

Sterker nog: als de software gebruik maakt van SQL-constructies die alleen in T-SQL werken dan ben je ook de lul als je overstapt op een ander database-systeem. En je bent trouwens nog steeds erg vaag.

"te traag" is voor mij wanneer het ernaar begint uit te zien of het vooropgestelde aantal updates binnen een bepaalde tijdspanne niet gehaald zal worden.

Wat doet zo'n set query's? Hoeft niet in detail, maar het is handig om te weten wat voor query's het zijn, zodat wij weten óf het überhaupt sneller kan. En hoe lang verwacht je zelf dat die set query's erover doet om klaar te zijn? Want misschien zijn je verwachtingen niet goed.

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.

Acties:

Verwijderd

Post eerst eens je hardware specs en je datamodel. Ik vind het vrij raar dat MSSQL te traag zou zijn aangezien het hier om zo'n kleine hoeveelheid data gaat ...

zondag 8 april 2012 15:34

Acties:

maandag 9 april 2012 11:13

NMe schreef op zondag 08 april 2012 @ 13:23:
Sterker nog: als de software gebruik maakt van SQL-constructies die alleen in T-SQL werken dan ben je ook de lul als je overstapt op een ander database-systeem. En je bent trouwens nog steeds erg vaag.

Dat is dus het stukje wat ik niet begrijp. Of je hebt er een extra heel moeilijk stuk middleware tussengeplaatst of couchdb ondersteunt nog niet eens sql.

Simpel voorbeeldjes van de couchdb site zelf : http://guide.couchdb.org/draft/cookbook.html

Ik vind het heel knap als je couchdb hebt kunnen testen (inclusief performance testen) zonder query's aan te passen...

Verwijderd schreef op zondag 08 april 2012 @ 14:07:
Post eerst eens je hardware specs en je datamodel. Ik vind het vrij raar dat MSSQL te traag zou zijn aangezien het hier om zo'n kleine hoeveelheid data gaat ...

Als ik het goed begrijp is het niet MSSQL dat te traag is, enkel de middleware.

[ Voor 20% gewijzigd door Gomez12 op 08-04-2012 15:36 ]

Acties:

maandag 9 april 2012 11:56

Topicstarter

ik had niet echt goed nagedacht toen ik de topic opende: no way dat een document store of een graph db sql op 1, 2, 3 zou kunnen vervangen, daarvoor dienen ze te verschillende doelen.

feit is inderdaad dat de middleware rond sql is gebakken, dus er kan helemaal niet simpelweg een andere database onder gepropt worden (active record implementatie).

ik beweer niet dat ik alles wat ik geprobeerd heb in een ranking heb staan, ik hou gewoon de nummertjes in het oog en zie waar ik een uur verder ben gekomen.

de middleware wordt constant geupdate en we werken heel nauw samen, maar het zou fout zijn om te verwachten dat ze op de kwaliteit en features van hun product zouden compromitteren om de performance wat op te krikken voor te specifieke scenario's.

feit is ook dat ons vorig project specification-wise eerder gedreven werd door het off-shore test-team dan door de business, waardoor het zo'n soep geworden was.

Acties:

maandag 9 april 2012 12:36

Quia Ego Sic Dico.

Waarom geef je nou niet gewoon een keer antwoord op de vragen die we stellen? Met elke vage reply die je hier post wordt het topic nóg nuttelozer...

'E's fighting in there!' he stuttered, grabbing the captain's arm.
'All by himself?' said the captain.
'No, with everyone!' shouted Nobby, hopping from one foot to the other.

Acties:

maandag 9 april 2012 12:56

Wat is dan momenteel nog je vraag? Want ik zie op dit moment door de bomen het bos niet meer.
- Couchdb kan nu opeens geen mssql vervangen, maar in TS had je dit gedaan en te langzaam bevonden?
- Je middleware is langzaam maar je TS gaat over dbase en je gaat niet aan je middle-ware leverancier vragen om het aan te passen?

Wat ik denk dat je bedoelt is :
- Je hebt een crappy stuk middleware zonder uitgebreide rapportage functie.
- Je hebt een aantal rapportage functies / query's gemaakt en die performen bagger maar het resultaat is wel handig dus chef / leiding / collega's heeft aan jou gevraagd of je die niet sneller kan krijgen
- Vanwege de traagheid ben je aan het kijken naar andere db's om een dump van de data periodiek in te zetten zodat je daar op kan rapporteren

Zit ik hier enigszins juist mee?

Want in je TS heb je het over 100k updates, dat is puur een afhandeling van je middleware en als dat te traag is dan moet je gewoon je middleware leverancier eruit donderen.

En qua db-server die je dump / rapportage db kan huisvesten : Je MS-SQL Server die je al hebt staan.

Acties:

maandag 9 april 2012 13:09

Topicstarter

NMe schreef op maandag 09 april 2012 @ 11:56:
Waarom geef je nou niet gewoon een keer antwoord op de vragen die we stellen? Met elke vage reply die je hier post wordt het topic nóg nuttelozer...

middleware product is Adam: de basis container heet daar een Record en daarop zitten fields gedefinieerd. een field kan date time zijn, text, hiërarchische links naar andere records, enz. records worden geclassificeerd in een classification tree: die is (vanzelfsprekend) ook hiërarchisch en daar kan security worden geconfigureerd op usergroup level.

zoeken gebeurt met search expressions: da's een soort query language eigen aan adam en dat vertaalt zich dan in sql queries. een record aanpassen kan dus een hoop veranderingen in 1 keer geven.

het spijt me van jullie tijd, maar dit topic gaat helaas nergens naartoe omdat ik zelf geen antwoord kan geven op de vraag wat ik ervan verwachtte. het zou "wat is jullie ervaring met couchbase/neo4j" moeten heten: dat laat het wat open en interessant.

Gomez12 schreef op maandag 09 april 2012 @ 12:36:
Wat is dan momenteel nog je vraag? Want ik zie op dit moment door de bomen het bos niet meer.
- Couchdb kan nu opeens geen mssql vervangen, maar in TS had je dit gedaan en te langzaam bevonden?
- Je middleware is langzaam maar je TS gaat over dbase en je gaat niet aan je middle-ware leverancier vragen om het aan te passen?

ik had geprobeerd om de implementatie die we op adam gemaakt hebben beperkt na te bouwen in zowel neo4j als couchbase, maar dus niet om sql in adam te vervangen door één van deze twee.

ik weet goed genoeg dat sql zich niet verslikt in databases met honderden miljoenen rijen, het zou triestig zijn als het in die tientallen jaren slechts zover was gekomen.

Acties: