Stel ik wil een grote hoeveelheid berichten (miljarden) betrouwbaar opslaan voor langere tijd, wat voor oplossingen zijn hier dan voor beschikbaar?
Enkele requirements:
Zelf zat ik te denken aan een key-value store die de opslag op het filesystem doet, bestaande uit meerdere nodes die onderling gesynchroniseerd worden.
Enkele kandidaten:
• LevelDB, geschreven door google. Ik weet alleen niet of deze uit meerdere nodes op te bouwen is
• Een van de Hadoop databases (HBase?), hoewel dit misschien overkill is in features
• Kafka, van LinkedIn, toch een queueing product, wel specifiek geschikt voor veel berichten op verschillende nodes (in combinatie met zookeeper)
Denk ik in de goede richting? Zijn er andere oplossingen of producten?
Enkele requirements:
- De volgorde van de berichten is belangrijk, dit kan eventueel met een sequence nummer die meteen de key is.
- Het gaat vooral om opslag, incidenteel moet een reeks berichten kunnen worden teruggehaald uit de store.
- De aanvoer is ongeveer 50 m/s
- Berichten zijn klein ( < 1 MB)
- Berichten mogen niet verloren gaan
Zelf zat ik te denken aan een key-value store die de opslag op het filesystem doet, bestaande uit meerdere nodes die onderling gesynchroniseerd worden.
Enkele kandidaten:
• LevelDB, geschreven door google. Ik weet alleen niet of deze uit meerdere nodes op te bouwen is
• Een van de Hadoop databases (HBase?), hoewel dit misschien overkill is in features
• Kafka, van LinkedIn, toch een queueing product, wel specifiek geschikt voor veel berichten op verschillende nodes (in combinatie met zookeeper)
Denk ik in de goede richting? Zijn er andere oplossingen of producten?