Mijn vraag
Ik ben mij aan het verdiepen in data pipelines waarmee ik met een queue heel veel JSON-bestanden wil verwerken. Ik vraag mij af of er een goede (open) databronnen zijn die je kan gebruiken om veel data binnen te halen. Idealiter in de vorm van JSON/XML-bestanden, maar dat mag ook bijvoorbeeld data uit een API zijn.
Relevante software en hardware die ik gebruik
Ik gebruik een zelfgemaakt Python-script om wat JSON-bestanden met sample data te genereren, maar ben op zoek naar meer "real life data" idealiter in de vorm van bestanden.
Wat ik al gevonden of geprobeerd heb
Het bovenvermelde Python-script.
Ik ben mij aan het verdiepen in data pipelines waarmee ik met een queue heel veel JSON-bestanden wil verwerken. Ik vraag mij af of er een goede (open) databronnen zijn die je kan gebruiken om veel data binnen te halen. Idealiter in de vorm van JSON/XML-bestanden, maar dat mag ook bijvoorbeeld data uit een API zijn.
Relevante software en hardware die ik gebruik
Ik gebruik een zelfgemaakt Python-script om wat JSON-bestanden met sample data te genereren, maar ben op zoek naar meer "real life data" idealiter in de vorm van bestanden.
Wat ik al gevonden of geprobeerd heb
Het bovenvermelde Python-script.
MacBook Pro 2021 - 16 inch - M1 Pro - 32 GB memory - 1 TB storage